フレームあたり1トークン:VLAポリシー向けワールドモデルにおける視覚帯域幅の再考
VLAモデルのワールドモデルにおいて、フレームごとの視覚情報を1つのセマンティックトークンに圧縮する手…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
VLAモデルのワールドモデルにおいて、フレームごとの視覚情報を1つのセマンティックトークンに圧縮する手…
模倣学習における能動的視覚の性能を評価するための新しいベンチマーク「TAVIS」が発表されました。
ロボットが複数の目標を達成するオフライン強化学習において、目標条件付きデシジョントランスフォーマー…
ロボットが人間の自然な指示を理解し、テーブル上の物体を操作する新しいハイブリッドフレームワーク「UNC…
小型UAV群が重要データを特定位置へ中継する課題を、MARLのスケーリング研究モデルとして提案しました。
強化学習において、厳格な安全制約をほぼゼロの違反で満たしつつタスクを達成する新アルゴリズム「SB-TRPO…
自転車ロボットがユーザー指定の線と向きに従い、様々なスタントを自律的に学習するフレームワークが開発…
人機一体がJRで稼働中の人型重機技術を市販ロボットへ応用する試みを進めています。
家族型ロボット「LOVOT 3.0」が、倒れている人を検知し家族へ通知する新機能を提供開始します。
Preferred RoboticsとJR東日本が鉄道インフラ維持管理ロボットを共同開発しました。
LLMとVLMを連携させ、複雑なマルチモーダル環境でタスクを遂行するPRISMフレームワークが発表されました。
強化学習のQ学習において、長期的な学習の安定性と精度を向上させる「Long-Horizon Q-learning (LQL)」が…