N
AIの科学研究タスク遂行能力を評価
OpenAIが科学研究におけるAIの推論能力を測る新たなベンチマーク「FrontierScience」を発表しました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
OpenAIが科学研究におけるAIの推論能力を測る新たなベンチマーク「FrontierScience」を発表しました。
OpenAIがAIがウェットラボでの生物学研究を加速する能力を評価するフレームワークを発表しました。
Hugging Faceが、設定可能なAIエージェントフレームワーク「CUGA」を公開しました。
OpenAIが最新モデルGPT-5.2を発表し、科学と数学のベンチマークで新記録を樹立しました。
CodexがAIモデルをオープンソースとして公開しました。
OpenAIが設立10周年を迎え、これまでのAI研究の進展と成果を振り返った。
OpenAIがLinux Foundation傘下のAgentic AI Foundationを共同設立し、AGENTS.mdを寄贈しました。
Hugging FaceがSwift開発者向けの公式クライアントライブラリ「swift-huggingface」をリリースしました。
OpenAIがオーストラリアでAIインフラ構築、労働者スキルアップ、イノベーション加速を目的としたプログラ…
Hugging Faceが軽量な数学推論エージェント「DeepMath」を発表しました。
AnthropicのClaude 3 Opusが、オープンソースLLMのファインチューニングに成功しました。
OpenAIが、AIが間違いや不適切な行動を自白するよう訓練する「自白」という手法をテストしています。