N
OpenAI Baselines: ACKTR & A2C
OpenAIが強化学習アルゴリズムACKTRとA2Cの新しい実装を公開しました。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
OpenAIが強化学習アルゴリズムACKTRとA2Cの新しい実装を公開しました。
OpenAIのDota 2 AIが、自己対戦学習により人間レベルをはるかに超える性能を達成しました。
OpenAIがDota 2の1対1マッチで世界のトッププロを破るAIボットを開発しました。
OpenAIが、人間からのフィードバックでAIを訓練するオープンソースツール「RL-Teacher」を公開しました。
強化学習アルゴリズムのパラメータにノイズを加えることで性能が向上することが発見されました。
OpenAIが実装と調整が容易な強化学習アルゴリズムPPOを公開しました。
OpenAIが様々な視点やスケールから見てもAIを騙せる画像を開発しました。
強化学習において、失敗した経験からも学習を可能にするHERが開発されました。
OpenAIが、教師モデルが生成したカリキュラムで生徒モデルを効率的に訓練する手法を発表しました。
OpenAIがロボットシミュレーション用の高性能Pythonライブラリをオープンソース化しました。
AIが人間の望む行動を、2つの選択肢からより良い方を選ぶだけで学習するアルゴリズムが開発されました。
OpenAIがAGIへの道としてマルチエージェント環境での学習の重要性を強調しました。