研究 - Synapse Flow

在庫管理において、人間、LLM、数理最適化（OR）アルゴリズムが連携することで、単独よりも高いパフォーマ…

LLMエージェントが長期的タスクで計画と実行を分離する新しい階層的学習フレームワーク「HiMAC」が開発さ…

手術中の煙で視界が悪くなる問題を、拡散モデルと強化学習で解決する新手法が開発されました。

LLMなどの汎用AIエージェントの非推移的な相互作用を評価する新しいフレームワークが発表されました。

AIエージェントが自律的に行動すべきか、助けを求めるべきかを判断する能力を測る新しいベンチマーク「HiL…

LLMエージェントが実際のハードウェアバグを修正する能力を評価する大規模ベンチマーク「HWE-Bench」が発…

言語モデルが多様な推論戦略を探索し、より正確な応答を生成する新しい学習フレームワーク「Poly-EPO」が…

AIシステムのガバナンス理論に関する5つの主要な結果と、それらをCoqで機械検証した研究が発表されました。

AIシステムが実行する行動に対するガバナンスが、構造的な欠陥により機能不全に陥る問題を指摘する論文が…

GUI操作を自然言語から視覚座標へマッピングする新しい自己蒸留フレームワークが開発されました。

AIワークフローに構造的なガバナンスを適用しても、内部の計算表現力を損なわないことを形式的に証明しま…

統治された実行の代数的意味論が発表され、ガバナンスが公理化され、構成可能で、表現可能性と共終である…