LLM - Synapse Flow

Transformerモデルを用いたテキスト生成における様々なデコーディング手法が解説されています。

Hugging FaceがTransformersとTokenizersを用いた言語モデルのスクラッチ学習方法を解説しました。

ニューラル言語モデルの性能が、モデルサイズ、データセットサイズ、計算量によってどのように変化するか…

モデルサイズ、データサイズ、訓練時間が増加すると、性能が一度悪化し、その後再び向上する「ダブルディ…

OpenAIがGPT-2の最大モデル（15億パラメータ）をコードと重みと共に公開しました。

OpenAIがGPT-2を人間のフィードバックでファインチューニングし、人間の好みに合わせた出力を実現しました…

OpenAIが大規模言語モデルGPT-2の7.74億パラメータ版を公開しました。

MicrosoftがOpenAIに10億ドルを投資し、AGI開発のためのパートナーシップを締結しました。

OpenAIが、テキスト・画像・音声の次を予測するスパーストランスフォーマーを開発しました。

OpenAIが教師なし学習で、一貫性のある文章を生成する大規模言語モデルを開発しました。

ロバスト分類器の訓練には、従来の分類器よりもはるかに多くの計算資源が必要となることが判明しました。

勾配ノイズスケールという統計指標が、ニューラルネットワーク訓練の並列化可能性を予測することを発見し…