研究

2732件

★4 AI倫理 EN

OpenAI、AIの危険性評価フレームワークを更新

OpenAIが、最先端AIの潜在的な危険性から保護するための評価フレームワークを更新しました。

DolphinGemma：Google AIがイルカのコミュニケーション解読を支援

Googleが開発した大規模言語モデル「DolphinGemma」が、イルカのコミュニケーション研究に活用されていま…

Visual Salamandra：マルチモーダル理解の限界を押し広げる

Hugging Faceがマルチモーダル理解の新たなベンチマーク「Visual Salamandra」を発表しました。

BrowseComp：ブラウジングエージェントのためのベンチマーク

OpenAIがブラウジングAIエージェントの性能を評価する新しいベンチマーク「BrowseComp」を発表しました。

★3 ビジネス EN

OpenAIパイオニアプログラム

OpenAIがモデル性能向上と実世界評価のための「パイオニアプログラム」を開始しました。

アラビア語リーダーボード：指示追従モデルの導入とAraGenの更新

Hugging Faceがアラビア語LLMの性能を評価する新しいリーダーボードを公開しました。

Gradioユーザー100万人達成への道のり！

Hugging Faceが開発するGradioが、ユーザー数100万人を突破しました。

NLPコースがLLMコースへ進化

Hugging Faceの人気のNLPコースが、大規模言語モデル（LLM）に特化した内容に刷新されます。

効率的なリクエストキューイング – LLMパフォーマンスの最適化

Hugging FaceがLLMの効率的なリクエストキューイング手法を公開しました。

★4 AI倫理 EN

AGIへの責任ある道筋を辿る

Google DeepMindが汎用人工知能（AGI）開発において、安全性とリスク評価を最優先する方針を発表しました。

PaperBench：AI研究の再現能力を評価するベンチマーク

OpenAIがAIエージェントのAI研究再現能力を評価するベンチマーク「PaperBench」を発表しました。

★3 ロボット EN

Open R1: アップデート #4

Hugging Faceがオープンソースのロボットプロジェクト「Open R1」の進捗を報告しました。