★4 LLM EN Hugging Face Blog by Synapse Flow 編集部

StarCoder: コードに特化した最先端LLM

StarCoder: A State-of-the-Art LLM for Code

記事のポイント

📰ニュース

Hugging Faceがコード生成に特化した大規模言語モデル「StarCoder」を発表しました。

🔍注目ポイント

8000億トークン以上のコードデータで学習し、HumanEvalでGPT-3.5を上回る性能を示しています。

🔮これからどうなる

開発者はより高品質なコードを効率的に生成・補完できるようになり、生産性が向上します。

StarCoderは、GitHubの公開リポジトリから収集された8000億トークン以上のコードデータで学習された、155億パラメータを持つ大規模言語モデルです。
特にPython、Java、JavaScriptなどの主要言語において高い性能を発揮し、コード生成、コード補完、バグ修正などのタスクで利用可能です。
商用利用も可能なオープンモデルとして提供されています。
💡
編集部の視点

コード特化のLLMでGPT-3.5を超えるってすごいね!開発者の間でかなり話題になりそうだよ。オープンモデルなのも嬉しいポイントだね!

元記事を読む →

関連記事