AGWM:構成的要件を持つ環境向けアフォーダンスに基づいたワールドモデル
AIエージェントが行動の実行可能性を動的に追跡する新しいワールドモデル「AGWM」が提案されました。
AIエージェントが行動の実行可能性を動的に追跡する新しいワールドモデル「AGWM」が提案されました。
複数の専門家による多様な行動から、共通の制約と個別の好みを同時に推論する新しいフレームワーク「MOCI…
モデルベースのオフライン強化学習において、汎化性能とロバスト性の両立を目指す新しい手法「PSPO」が提…
微分可能なシミュレータにおいて、確率的探索を導入することで、方策最適化の性能を向上させる新しいフレ…
部分観測マルコフ決定過程(POMDP)の多環境版において、有限期間目標に対する最適方策と価値を計算する研…
複数のロボットが協調して移動する経路探索問題において、学習可能な通信モジュールを導入し、効率的な情…
連続領域におけるオンライン目標認識の精度と効率を向上させる新しい手法が開発されました。
複数のエージェントが衝突せずに目標を達成する「ターゲット割り当てと経路探索(TAPF)」問題に対し、新…
視覚特徴ベースの世界モデル「RLA-WM」が、従来の画像生成モデルより高速かつ高精度な未来予測を実現しま…
ニューラルネットワークを用いたハミルトン・ヤコビ・ベルマン方程式の安定化ソルバーが開発されました。
潜在世界モデルの計画性能を向上させるため、予測精度と計画の乖離を補正する新しい補助目標「RC-aux」が…
VLAモデルのポリシー学習をシミュレーションで行う際、既存のワールドモデルの課題を解決する新手法「Swor…