HELMETの紹介:長文脈言語モデルの包括的評価
Hugging Faceが長文脈言語モデルを包括的に評価する新しいベンチマーク「HELMET」を発表しました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
Hugging Faceが長文脈言語モデルを包括的に評価する新しいベンチマーク「HELMET」を発表しました。
OpenAIが慈善活動を支援するため、非営利委員会に4人の新たな顧問を任命しました。
アグリテック企業eFisheryのCEOが、投資家を欺くために業績を偽装した手口を明かしました。
OpenAIが、最先端AIの潜在的な危険性から保護するための評価フレームワークを更新しました。
OpenAIがAPIを通じて、性能向上した新モデル「GPT-4.1」と初のナノモデルを公開しました。
Hugging FaceがPollen Roboticsを買収し、オープンソースロボットの販売を開始します。
Protect AIとHugging Faceが提携し、400万以上のAIモデルのセキュリティスキャンを実施しました。
Hugging Faceがマルチモーダル理解の新たなベンチマーク「Visual Salamandra」を発表しました。
OpenAIがブラウジングAIエージェントの性能を評価する新しいベンチマーク「BrowseComp」を発表しました。
OpenAIがモデル性能向上と実世界評価のための「パイオニアプログラム」を開始しました。