研究

2728件

日本語LLM向けオープンリーダーボードの紹介！

Hugging Faceが日本語LLMの性能を評価するオープンリーダーボードを公開しました。

ジャッジアリーナ：評価者としてのLLMのベンチマーク

Hugging FaceがLLMの評価能力をベンチマークする「Judge Arena」を発表しました。

Hugging Face HubでオープンなMLデータセットを共有しよう！

Hugging Faceが機械学習のオープンデータセット共有を呼びかけています。

SimpleQAの紹介

OpenAIが言語モデルの事実性評価ベンチマーク「SimpleQA」を発表しました。

ユニバーサルアシスト生成：あらゆるアシスタントモデルで高速デコーディングを実現

Hugging Faceが、あらゆるアシスタントモデルと連携し、LLMの推論速度を向上させる「ユニバーサルアシスト…

Aya Expanseの深掘り：多言語性の最前線を推進

Hugging Faceが多言語対応の大規模言語モデル「Aya Expanse」を発表しました。

★4 画像生成 EN

連続時間コンシステンシーモデルの簡素化、安定化、およびスケーリング

OpenAIが連続時間コンシステンシーモデルを簡素化・安定化・スケーリングし、拡散モデルと同等の画像品質…

CinePile 2.0 - 敵対的洗練によるより強力なデータセットの作成

CinePile 2.0が、敵対的洗練を用いてより高品質なデータセットを構築しました。

Transformers.js v3: WebGPUサポート、新モデルとタスクの追加など

Hugging FaceがTransformers.js v3をリリースし、WebGPUサポートを導入しました。

OpenAI o1モデルによる複雑な問題解決

OpenAIが推論モデル「o1」を発表し、コーディングや戦略立案、研究分野での活用法を公開しました。

勾配蓄積の修正

Hugging Faceが、勾配蓄積の一般的な実装における潜在的なバグと、その修正方法を解説しました。

★3 AI倫理 EN

ChatGPTにおける公平性の評価

OpenAIがChatGPTがユーザー名に基づいて応答を差別するかをAI研究アシスタントを用いて分析しました。