N
Hindsight Experience Replay
強化学習において、失敗した経験からも学習を可能にするHERが開発されました。
強化学習において、失敗した経験からも学習を可能にするHERが開発されました。
OpenAIが、教師モデルが生成したカリキュラムで生徒モデルを効率的に訓練する手法を発表しました。
OpenAIがロボットシミュレーション用の高性能Pythonライブラリをオープンソース化しました。
AIが人間の望む行動を、2つの選択肢からより良い方を選ぶだけで学習するアルゴリズムが開発されました。
OpenAIがAGIへの道としてマルチエージェント環境での学習の重要性を強調しました。
強化学習において、Qアンサンブルを用いてUCB(Upper Confidence Bound)探索を効率化する手法が提案され…
OpenAIが強化学習アルゴリズムの再現実装「OpenAI Baselines」をオープンソース化しました。
シミュレーションで学習したロボットが、一度見ただけで新しいタスクを習得しました。
OpenAIがロボットシミュレーション用のオープンソースソフトウェア「Roboschool」を公開しました。
OpenAIが方策勾配とソフトQ学習という強化学習の二つの主要なアルゴリズムが数学的に等価であることを発見…
OpenAIが階層的強化学習に確率的ニューラルネットワークを導入しました。
OpenAIが教師なし学習でテキストの感情を高い精度で表現するシステムを開発しました。