逆強化学習を用いた多目的制約推論
複数の専門家による多様な行動から、共通の制約と個別の好みを同時に推論する新しいフレームワーク「MOCI…
複数の専門家による多様な行動から、共通の制約と個別の好みを同時に推論する新しいフレームワーク「MOCI…
LLMエージェントがタスクを階層的に分解し、再利用可能なポリシーを学習する新手法が開発されました。
因果効果の特定を最大化する最適な実験の選択手法が開発されました。
生成AIシステムの故障モードを特定する適応型監査手法が提案されました。
LLMの推論プロセスを監視可能にする「行動キュー推論」が開発されました。
LLMエージェントが複雑な環境で効率的に情報を収集するための新しいフレームワークが提案されました。
LLMが自然言語指示から3D構造を構築する際の空間推論エラーを大幅に削減する新手法が開発されました。
役割分離が強制された環境下でのAIエージェントの協調能力を評価する新ベンチマーク「TeamBench」が発表さ…
限られた未知の供給を複数の拠点に事前配置するオンライン割り当て問題に対する新しいアルゴリズムが提案…
化学反応の実現性を予測するAIエージェントフレームワーク「ARMOR」が開発されました。
エージェント型AIシステムが外部ツールを呼び出す際のコストを大幅に削減するAIモデルルーター「Switchcra…
時系列知識グラフ(TKG)の推論において、エンティティの表現を動的に更新する新手法「AdaTKG」が提案され…