再帰的LLMループにおける摂動量反応:アペンド、置換、対話更新時の生スイッチング、確率的フロア、および持続的脱出
Perturbation Dose Responses in Recursive LLM Loops: Raw Switching, Stochastic Floors, and Persistent Escape under Append, Replace, and Dialog Updates
記事のポイント
📰ニュース
再帰的なLLMループが安定したパターンから別の状態へ移行するために必要なテキスト量と、その移行の持続性を調査しました。
🔍注目ポイント
LLMの再帰ループにおいて、コンテキスト更新方法(アペンド、置換、対話)が、モデルの挙動を永続的に変更するのに必要な摂動量に大きく影響することが判明しました。
🔮これからどうなる
LLMの安全な運用や、意図しない挙動からの回復、あるいは特定の挙動への誘導といった制御技術の発展に貢献する可能性があります。
本研究では、gpt-4o-miniとgpt-4.1-nanoを用いて30ステップの再帰ループで実験を行い、モデルとコンテキスト更新ルールを分離して分析しました。
アペンドモードでは、永続的な方向転換がメモリポリシーに依存し、完全な履歴プロトコルでは400トークンでソースからの脱出が50%を超え、1500トークンで75-80%に達しました。
コンテキスト更新ルールがLLMの安全性に関わる設計上の選択肢であることを示唆しています。
アペンドモードでは、永続的な方向転換がメモリポリシーに依存し、完全な履歴プロトコルでは400トークンでソースからの脱出が50%を超え、1500トークンで75-80%に達しました。
コンテキスト更新ルールがLLMの安全性に関わる設計上の選択肢であることを示唆しています。
LLMが一度学習したパターンから抜け出すのがどれだけ難しいか、そしてどうすれば制御できるかを示していますね。今後のAIの信頼性向上に役立ちそうです。