研究 - Synapse Flow

AI&Tech、もう追いかけなくていい。

30秒で読めるニュースダイジェスト

すべて LLM 画像生成ロボット AI倫理ビジネス研究セキュリティプロダクトその他

研究

3305件

BrowseComp：ブラウジングエージェントのためのベンチマーク

OpenAIがブラウジングAIエージェントの性能を評価する新しいベンチマーク「BrowseComp」を発表しました。

★3 ビジネス EN

OpenAIパイオニアプログラム

OpenAIがモデル性能向上と実世界評価のための「パイオニアプログラム」を開始しました。

アラビア語リーダーボード：指示追従モデルの導入とAraGenの更新

Hugging Faceがアラビア語LLMの性能を評価する新しいリーダーボードを公開しました。

Gradioユーザー100万人達成への道のり！

Hugging Faceが開発するGradioが、ユーザー数100万人を突破しました。

NLPコースがLLMコースへ進化

Hugging Faceの人気のNLPコースが、大規模言語モデル（LLM）に特化した内容に刷新されます。

効率的なリクエストキューイング – LLMパフォーマンスの最適化

Hugging FaceがLLMの効率的なリクエストキューイング手法を公開しました。

★4 AI倫理 EN

AGIへの責任ある道筋を辿る

Google DeepMindが汎用人工知能（AGI）開発において、安全性とリスク評価を最優先する方針を発表しました。

PaperBench：AI研究の再現能力を評価するベンチマーク

OpenAIがAIエージェントのAI研究再現能力を評価するベンチマーク「PaperBench」を発表しました。

★3 ロボット EN

Open R1: アップデート #4

Hugging Faceがオープンソースのロボットプロジェクト「Open R1」の進捗を報告しました。

Sentence Transformers v4を用いたRerankerモデルの学習とファインチューニング

Hugging FaceがSentence Transformers v4でRerankerモデルの学習・ファインチューニング方法を公開しまし…

Gemini 2.5: Google DeepMindの最もインテリジェントなAIモデル

Google DeepMindが「思考」機能を内蔵した最新のAIモデルGemini 2.5を発表しました。

★3 ビジネス EN

OpenAIのリーダーシップ更新

OpenAIが組織の成長に伴い、リーダーシップ体制の変更を発表しました。