N
マルチエージェントシステムにおける方策表現の学習
OpenAIがマルチエージェントシステムで方策表現を学習する新しい研究を発表しました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
OpenAIがマルチエージェントシステムで方策表現を学習する新しい研究を発表しました。
OpenAIが学習エージェントの損失関数を進化させるメタ学習手法「Evolved Policy Gradients」を発表しまし…
OpenAIがロボット研究用に開発した8つのシミュレーション環境とHERの実装を公開しました。
OpenAIが複数の目標を同時に達成する強化学習の研究を呼びかけています。
OpenAIが階層的強化学習アルゴリズムを開発し、複雑なタスクを高速に解決可能にしました。
OpenAIがシミュレーションで訓練したロボットが、実環境の予期せぬ変化に対応できるようになった。
OpenAIがロボット制御をシミュレーションで学習させ、実世界で高精度に動作させる技術を開発しました。
OpenAIが画像入力からロボットを学習させる新しい手法「非対称アクタークリティック」を発表しました。
OpenAIがロボットの把持能力を向上させる新しいアプローチを発表しました。
シミュレートされたロボットレスリングにおいて、メタ学習エージェントがより強い非メタ学習エージェント…
AIが自己対戦を通じて、タックルやキックなどの複雑な物理スキルを自律的に習得しました。
強化学習において、失敗した経験からも学習を可能にするHERが開発されました。