N
OpenAI、AIの危険性評価フレームワークを更新
OpenAIが、最先端AIの潜在的な危険性から保護するための評価フレームワークを更新しました。
OpenAIが、最先端AIの潜在的な危険性から保護するための評価フレームワークを更新しました。
Googleが開発した大規模言語モデル「DolphinGemma」が、イルカのコミュニケーション研究に活用されていま…
Hugging Faceがマルチモーダル理解の新たなベンチマーク「Visual Salamandra」を発表しました。
OpenAIがブラウジングAIエージェントの性能を評価する新しいベンチマーク「BrowseComp」を発表しました。
OpenAIがモデル性能向上と実世界評価のための「パイオニアプログラム」を開始しました。
Hugging Faceがアラビア語LLMの性能を評価する新しいリーダーボードを公開しました。
Hugging Faceが開発するGradioが、ユーザー数100万人を突破しました。
Hugging Faceの人気のNLPコースが、大規模言語モデル(LLM)に特化した内容に刷新されます。
Hugging FaceがLLMの効率的なリクエストキューイング手法を公開しました。
Google DeepMindが汎用人工知能(AGI)開発において、安全性とリスク評価を最優先する方針を発表しました。
OpenAIがAIエージェントのAI研究再現能力を評価するベンチマーク「PaperBench」を発表しました。
Hugging Faceがオープンソースのロボットプロジェクト「Open R1」の進捗を報告しました。