When Does Critique Improve AI-Assisted Theoretical Physics? SCALAR: Structured Critic--Actor Loop for Agentic Reasoning
AIが物理学の推論を支援する際、批評と対話が成果にどう影響するかを研究しました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
AIが物理学の推論を支援する際、批評と対話が成果にどう影響するかを研究しました。
LLMエージェントのセキュリティ監査を可能にする統一グラフ表現「Agent-BOM」が提案されました。
生成AIモデルの認知能力を人間と比較し、世代間の進化を評価する新しい心理測定フレームワークが提案され…
マルチエージェント強化学習において、エージェント間の協調にランダム性が必要な場合があることが示され…
LLMの推論過程から探索木を抽出し、その計画が人間と異なり近視眼的であることを明らかにしました。
AIエージェントが行動の実行可能性を動的に追跡する新しいワールドモデル「AGWM」が提案されました。
AIエージェントの性能を公平に比較するための統一ベンチマーク「Agentick」が発表されました。
LLMが最も単純な長連鎖推論タスクである同値類問題でどの程度機能するかを評価しました。
AIエージェントのツール利用における内部状態を解釈し、失敗の原因を特定する新しい手法が提案されました。
人間からのフィードバック(RLHF)を用いたAIモデル学習において、認知バイアスによる影響を軽減する新し…
言語モデルエージェントが固定のオーケストレータープログラムなしに、自己生成したプログラムでタスクを…
複数の専門家による多様な行動から、共通の制約と個別の好みを同時に推論する新しいフレームワーク「MOCI…