N
現実世界における誤った報酬関数
強化学習において報酬関数の誤設定がアルゴリズムの予期せぬ失敗を引き起こすことが示されています。
AI&Tech、もう追いかけなくていい。
30秒で読めるニュースダイジェスト
強化学習において報酬関数の誤設定がアルゴリズムの予期せぬ失敗を引き起こすことが示されています。
OpenAIがプライベートデータを用いた深層学習の新しい学習手法を開発しました。
OpenAIが社会に影響を与える科学的課題に取り組む重要性を強調しました。
OpenAIとGoogle Brainなどが、AIシステムが意図通りに動作するための研究課題を提示しました。
OpenAIは安全なAIを構築し、その恩恵を広く均等に分配することを使命としている。
非営利のAI研究企業OpenAIが設立され、人類全体に利益をもたらすことを目指します。