N
近接方策最適化 (PPO)
OpenAIが実装と調整が容易な強化学習アルゴリズムPPOを公開しました。
OpenAIが実装と調整が容易な強化学習アルゴリズムPPOを公開しました。
OpenAIがロボットシミュレーション用の高性能Pythonライブラリをオープンソース化しました。
OpenAIが強化学習アルゴリズムの再現実装「OpenAI Baselines」をオープンソース化しました。
OpenAIがAIの汎用知能を測定・訓練するソフトウェアプラットフォーム「Universe」をリリースしました。
OpenAIが深層学習の進歩にはインフラの質が重要だと強調しています。
強化学習アルゴリズムの開発と比較のためのツールキット「OpenAI Gym」のベータ版が公開されました。
OpenAIが深層ニューラルネットワークの学習を加速する「重み正規化」という手法を発表しました。