「考えることが見ること」:視覚言語的キュリオシティによるVLMエージェントの探索駆動
VLMエージェントが、視覚と言語の予測と現実の乖離を好奇心として活用し、探索能力を向上させました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
VLMエージェントが、視覚と言語の予測と現実の乖離を好奇心として活用し、探索能力を向上させました。
ロボット倉庫システムで注文割り当てとロボットスケジューリングをリアルタイムで統合最適化する深層強化…
合成拡散計画において、モード平均化問題を解決する新しいガイダンス手法「RCD」が提案されました。
RLDX-1は、複雑な実世界タスクに対応する多機能ロボット政策で、既存のVLAモデルを上回る性能を示しました…
ロボットが未知の物体概念を認識し、大規模な3D空間でマッピングする新技術が開発されました。
ロボット動画ワールドモデルの性能を向上させる新しいフレームワーク「RoboAlign-R1」が発表されました。
固定翼航空機の姿勢制御において、システム対称性を利用した強化学習手法が提案されました。
エンボディドAI研究を加速させるため、低コストで高性能な両腕移動ロボット「AhaRobot」が発表されました。
リハビリテーションロボット開発向けに、様々な歩行条件と非理想的な取得条件を網羅したヒト下肢多モーダ…
ロボット操作の性能を詳細に評価する新しいフレームワーク「RoboEval」が発表されました。
脚付きロボットが深層学習とシミュレーションを活用し、物体を精密に把持する技術を開発しました。
単一のRGB画像から物体の質量を推定する新しい物理的構造化フレームワークが開発されました。