Hugging Faceのtransformers、accelerate、bitsandbytesを用いた大規模Transformer向け8ビット行列乗算のやさしい入門
大規模Transformerモデルのメモリ効率を大幅に向上させる8ビット行列乗算が導入されました。
大規模Transformerモデルのメモリ効率を大幅に向上させる8ビット行列乗算が導入されました。
Hugging FaceがSentence Transformersモデルの訓練とファインチューニングに関するガイドを公開しました。
Transformerの自己注意メカニズムをNyström法で近似し、計算量とメモリ使用量を線形に削減しました。
OpenAIが、テキストの途中の欠落部分を埋める言語モデルの効率的なトレーニング手法を発表しました。
TensorFlowとXLAを組み合わせることで、テキスト生成の速度が大幅に向上しました。
OpenAIがコード合成LLMの潜在的な危険性を評価するハザード分析フレームワークを公開しました。
強化学習アルゴリズムであるA2Cは、Actor-Critic手法を効率化したものです。
敵対的データを使ってモデルを動的に訓練する手法が紹介されました。
大規模言語モデルBLOOMのトレーニングに使われた技術的詳細が公開されました。
Hugging Faceが世界最大のオープン多言語大規模言語モデル「BLOOM」を発表しました。
Hugging FaceのTransformersライブラリと事前学習済みモデルを使って、Twitterデータのセンチメント分析を…
Hugging Face AccelerateがDeepSpeedとの統合を強化し、大規模モデルのトレーニングを高速化しました。