研究 - Synapse Flow

自律エージェントの評価における既存の課題を解決するため、人間が検証した300のタスクを含む新しい評価ス…

AIエージェントを活用し、NP困難な最適化問題間の変換ルールを大規模に自動生成する手法が開発されました。

LLMベースのエージェントシステムが自己進化し、複雑なタスクを効率的に解決する新プロトコル「Autogenesi…

エージェント型LLMの評価における既存の課題を解決する新しい評価フレームワーク「Grounded Continuous Ev…

PNWモデルがMedMNISTの18の生体医用データセットで100%の分類精度を達成しました。

AIが行動モデルを、行動の観察なしに視覚情報のみから学習する新しいフレームワークが提案されました。

実世界の出来事を予測するAIエージェントの性能を向上させるための新しい強化学習環境「FutureWorld」が発…

半導体製造におけるウェーハ欠陥の視覚的質問応答を、小規模な視覚言語モデルで実現するフレームワークが…

LLMエージェントの強化学習において、報酬が少ない環境でも効率的に学習できる新手法「AEM」が開発されま…

エージェントAIシステムにおいて、LLMとツールを連携させる制御層にベイズの原理を適用すべきだと提唱され…

LLMを用いた進化的探索により、ザランキェヴィッチ数の正確な値3つと、41個の下限が新たに発見されました。

プロセス報酬モデル（PRM）の推論エラー検出能力を評価する新しいベンチマーク「GR-Ben」が発表されました…