★4 ロボット EN OpenAI Blog 2018年11月5日 17:00 by Synapse Flow 編集部

オンラインで計画、オフラインで学習：モデルベース制御による効率的な学習と探索

Plan online, learn offline: Efficient learning and exploration via model-based control

記事のポイント

📰ニュース

OpenAIがモデルベース強化学習手法「Plan online, learn offline」を発表しました。

🔍注目ポイント

環境モデルをオンラインで計画に使い、オフラインで学習することで、少ない実環境インタラクションで効率的な学習を実現します。

🔮これからどうなる

ロボット制御やシミュレーション環境でのAI学習が、より迅速かつ安全に進められるようになります。

この手法は、まず実際の環境で少量のデータを収集し、それを使って環境のモデルを構築します。
次に、このモデル内で計画を立て、その計画から得られた経験をオフラインで学習に利用します。
これにより、実際の環境とのインタラクションを最小限に抑えつつ、効率的にスキルを習得できます。

💡

編集部の視点

モデルベース学習って、実世界での試行錯誤を減らせるから、ロボットとかにはすごく良いアプローチだよね！効率的に賢くなるのがすごい！

元記事を読む →

中国の自動運転配送企業Neolixが中東など主要市場での成長戦略を説明しました。

外科医が遠隔操作する人型ロボットが、生きたブタに対する世界初の手術を成功させました。

自動化展示会「Automate Show」で、ロボットの普及にはまだ長い道のりがあることが示されました。

三菱自動車が東大発スタートアップと協業し、国産人型ロボットの量産体制を2027年までに構築します。