LLM - Synapse Flow

OpenAIが、連続正規化フローモデル「FFJORD」を発表しました。

AIが未知の環境を探索し、報酬がなくても学習する「好奇心駆動型学習」を大規模に研究しました。

OpenAIが開催した「レトロコンテスト」の初回が終了しました。

OpenAIが教師なし事前学習とTransformerを組み合わせ、多様な言語タスクで最高性能を達成しました。

OpenAIが定理証明AIの学習環境「GamePad」を発表しました。

OpenAIが強化学習モデルの汎化能力を評価する新しいベンチマーク「Gotta Learn Fast」を発表しました。

OpenAIが強化学習アルゴリズムの汎化能力を測る転移学習コンテストを開催します。

OpenAIが方策勾配法の分散を低減する新しい手法を発表しました。

OpenAIが一次メタ学習アルゴリズムに関する研究を発表しました。

OpenAIが、タスクごとに勾配降下法を繰り返し初期パラメータを更新するメタ学習アルゴリズム「Reptile」を…

OpenAIがメタ強化学習を用いた探索学習の課題と可能性について考察を発表しました。

AIが互いに概念を教え合う際に、人間にも理解しやすい具体例を自動選択する手法が開発されました。