N
エネルギー関数による概念学習
OpenAIが2D点群から「近い」「上」などの概念を学習するエネルギーベースモデルを開発しました。
OpenAIが2D点群から「近い」「上」などの概念を学習するエネルギーベースモデルを開発しました。
OpenAIがモデルベース強化学習手法「Plan online, learn offline」を発表しました。
OpenAIが人間のようなロボットハンドを訓練し、物理的な物体をかつてない器用さで操作することに成功しま…
OpenAIが強化学習における「オプション」を自動で発見する新しいアルゴリズムを発表しました。
OpenAIが、モンテズマの復讐を単一の人間デモンストレーションから学習し、過去最高のスコアを達成しまし…
OpenAIがマルチエージェントシステムで方策表現を学習する新しい研究を発表しました。
OpenAIが学習エージェントの損失関数を進化させるメタ学習手法「Evolved Policy Gradients」を発表しまし…
OpenAIがロボット研究用に開発した8つのシミュレーション環境とHERの実装を公開しました。
OpenAIが複数の目標を同時に達成する強化学習の研究を呼びかけています。
OpenAIが階層的強化学習アルゴリズムを開発し、複雑なタスクを高速に解決可能にしました。
OpenAIがシミュレーションで訓練したロボットが、実環境の予期せぬ変化に対応できるようになった。
OpenAIがロボット制御をシミュレーションで学習させ、実世界で高精度に動作させる技術を開発しました。