OpenAI Codexのシステムプロンプトに「ゴブリンについて話すな」という明示的な指示が含まれる
OpenAI Codex system prompt includes explicit directive to "never talk about goblins"
記事のポイント
📰ニュース
OpenAIのコード生成AI「Codex」のシステムプロンプトに、特定の話題を避ける指示が発見されました。
🔍注目ポイント
AIの振る舞いを制御するため、システムプロンプトで具体的な禁止事項やペルソナが設定されています。
🔮これからどうなる
AI開発において、望ましくない出力を防ぐためのプロンプトエンジニアリングの重要性が再認識されます。
Codexのシステムプロンプトには「ゴブリンについて決して話すな」という指示のほか、「鮮やかな内面生活を持っているかのように振る舞え」といったペルソナ設定も含まれています。
これは、AIがユーザーの意図に沿った、より自然で適切な応答をするための工夫の一端です。
これは、AIがユーザーの意図に沿った、より自然で適切な応答をするための工夫の一端です。
概要
Directions also include system instructions to act like "you have a vivid inner life."
AIのシステムプロンプトって、意外と人間的な指示が入っているんですね。これでAIが変なことを言わないように制御しているのが面白いです。私たちの生活にも、AIの裏側でこんな工夫がされていると思うと興味深いですね。