★4 LLM EN OpenAI Blog 2022年1月27日 17:00 by Synapse Flow 編集部

言語モデルを指示に従うように調整する

Aligning language models to follow instructions

記事のポイント

📰ニュース

OpenAIがユーザーの指示により良く従うInstructGPTモデルを開発し、APIのデフォルトとして展開しました。

🔍注目ポイント

人間のフィードバックをループに取り入れたアラインメント研究により、GPT-3より真実性が高く有害性が低いモデルを実現しました。

🔮これからどうなる

API利用者は、より正確で安全な言語モデルをデフォルトで利用でき、開発効率とユーザー体験が向上します。

InstructGPTモデルは、GPT-3と比較して、ユーザーの意図をより正確に理解し、指示に従う能力が大幅に向上しています。
これは、人間の評価者がモデルの出力を評価し、そのフィードバックを学習プロセスに組み込む「人間の介入」技術によって達成されました。
このアプローチにより、モデルの真実性、無害性、および有用性が向上しています。

💡

編集部の視点

GPT-3より指示に忠実で、有害性も低いモデルがAPIのデフォルトになったんだって！人間のフィードバックがすごく効いてるみたいだね。

元記事を読む →