日本語LLM向けオープンリーダーボードの紹介!
Hugging Faceが日本語LLMの性能を評価するオープンリーダーボードを公開しました。
Hugging Faceが日本語LLMの性能を評価するオープンリーダーボードを公開しました。
Hugging FaceがLLMの評価能力をベンチマークする「Judge Arena」を発表しました。
Hugging Faceが機械学習のオープンデータセット共有を呼びかけています。
OpenAIが言語モデルの事実性評価ベンチマーク「SimpleQA」を発表しました。
Hugging Faceが、あらゆるアシスタントモデルと連携し、LLMの推論速度を向上させる「ユニバーサルアシスト…
Hugging Faceが多言語対応の大規模言語モデル「Aya Expanse」を発表しました。
OpenAIが連続時間コンシステンシーモデルを簡素化・安定化・スケーリングし、拡散モデルと同等の画像品質…
CinePile 2.0が、敵対的洗練を用いてより高品質なデータセットを構築しました。
Hugging FaceがTransformers.js v3をリリースし、WebGPUサポートを導入しました。
OpenAIが推論モデル「o1」を発表し、コーディングや戦略立案、研究分野での活用法を公開しました。
Hugging Faceが、勾配蓄積の一般的な実装における潜在的なバグと、その修正方法を解説しました。
OpenAIがChatGPTがユーザー名に基づいて応答を差別するかをAI研究アシスタントを用いて分析しました。