研究 - Synapse Flow

シミュレートされたロボットレスリングにおいて、メタ学習エージェントがより強い非メタ学習エージェント…

AIが自己対戦を通じて、タックルやキックなどの複雑な物理スキルを自律的に習得しました。

OpenAIが深層線形ネットワークでも非線形計算が可能であることを発見しました。

OpenAIが、相手も学習していることを考慮し、協力的な戦略を発見するアルゴリズム「LOLA」を発表しました。

AIが相手の学習プロセスを予測し、それに基づいて自身の戦略を調整する新しい学習フレームワークを開発し…

OpenAIが強化学習アルゴリズムACKTRとA2Cの新しい実装を公開しました。

OpenAIのDota 2 AIが、自己対戦学習により人間レベルをはるかに超える性能を達成しました。

OpenAIがDota 2の1対1マッチで世界のトッププロを破るAIボットを開発しました。

OpenAIが、人間からのフィードバックでAIを訓練するオープンソースツール「RL-Teacher」を公開しました。

強化学習アルゴリズムのパラメータにノイズを加えることで性能が向上することが発見されました。

OpenAIが実装と調整が容易な強化学習アルゴリズムPPOを公開しました。

OpenAIが様々な視点やスケールから見てもAIを騙せる画像を開発しました。