N
QアンサンブルによるUCB探索
強化学習において、Qアンサンブルを用いてUCB(Upper Confidence Bound)探索を効率化する手法が提案され…
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
強化学習において、Qアンサンブルを用いてUCB(Upper Confidence Bound)探索を効率化する手法が提案され…
OpenAIが強化学習アルゴリズムの再現実装「OpenAI Baselines」をオープンソース化しました。
シミュレーションで学習したロボットが、一度見ただけで新しいタスクを習得しました。
OpenAIがロボットシミュレーション用のオープンソースソフトウェア「Roboschool」を公開しました。
OpenAIが方策勾配とソフトQ学習という強化学習の二つの主要なアルゴリズムが数学的に等価であることを発見…
OpenAIが階層的強化学習に確率的ニューラルネットワークを導入しました。
OpenAIが教師なし学習でテキストの感情を高い精度で表現するシステムを開発しました。
シミュレーションで学習したAIが、物理ロボットでスパムを検出しました。
OpenAIが、進化戦略(ES)が従来の強化学習(RL)と同等の性能を発揮することを発見しました。
ロボットが一度のデモンストレーションから新しいタスクを学習する「ワンショット模倣学習」が開発されま…
OpenAIが機械学習の成果を伝える新しいジャーナル「Distill」の立ち上げを支援しました。
AIエージェントが独自の言語を開発するOpenAIの新しい研究が発表されました。