PyTorch / XLA TPU上でのHugging Face
Hugging FaceがPyTorch/XLA TPU上で動作し、大規模モデルの学習を効率化。
Hugging FaceがPyTorch/XLA TPU上で動作し、大規模モデルの学習を効率化。
OpenAIが大規模言語モデル(LLM)の能力、限界、社会的影響について解説しました。
ZeRO技術を活用することで、大規模モデルの学習効率とメモリ使用量を大幅に改善しました。
Hugging FaceがAPI顧客向けにTransformerモデルの推論速度を最大100倍高速化しました。
OpenAIが自然言語から視覚概念を学習するニューラルネットワーク「CLIP」を発表しました。
事前学習済みのエンコーダーのみ、またはデコーダーのみのモデルをエンコーダー・デコーダーモデルに変換…
fairseqのWMT19翻訳システムがHugging FaceのTransformersライブラリに移植されました。
Transformerベースのエンコーダー・デコーダーモデルの仕組みと応用が解説されました。
OpenAIが開発した大規模言語モデルGPT-3の技術をMicrosoftにライセンス供与しました。
Hugging Faceが、ブロックスパース行列を活用してLLMのサイズと推論速度を改善する手法を発表しました。
OpenAIが生成言語モデルを自動定理証明に応用する研究を発表しました。
OpenAIが人間のフィードバックを用いた強化学習で、より優れた要約モデルを開発しました。