★4 LLM arXiv cs.AI 2026年5月11日 13:00 by Synapse Flow 編集部

More Thinking, More Bias: Length-Driven Position Bias in Reasoning Models

記事のポイント

📰ニュース

推論モデルにおいて、思考の長さが長くなるほど選択肢の順序によるバイアスが増大することが判明しました。

🔍注目ポイント

CoT推論や推論チューニングモデルはバイアスを減らすとされていましたが、実際には推論過程が長いほど位置バイアスが強まるという新たな知見です。

🔮これからどうなる

AIモデルの評価や開発において、推論の長さと選択肢の順序によるバイアスを考慮した設計が求められるようになります。

MMLUなどのデータセットで13種類の推論モデル設定をテストした結果、12のモデルで推論の長さと位置バイアススコアの間に正の相関が見られました。
特に、推論過程の途中で中断し再開すると、後半ほど位置に偏った選択肢を選ぶ傾向が強まることが因果的に示されています。
この結果は、推論モデルがデフォルトで順序に頑健ではないことを示唆しており、新たな診断ツールも提案されています。

💡

編集部の視点

推論モデルは賢くなるほどバイアスが減ると思いきや、思考が長いとむしろ偏りが出るのは意外ですね。今後のAI開発では、このバイアスをどう抑えるかが重要な課題になりそうです。

概要

arXiv:2605.06672v1 Announce Type: new Abstract: Chain-of-thought (CoT) reasoning and reasoning-tuned models such as DeepSeek-R1 are commonly assumed to reduce shallow heuristic biases by thinking carefully. We test this on position bias in multiple-choice QA and find a different story: within any r…

元記事を読む →

★4 LLM

GraphDC: A Divide-and-Conquer Multi-Agent System for Scalable Graph Algorithm Reasoning

大規模言語モデル（LLM）が苦手とするグラフアルゴリズム推論を、GraphDCが分割統治型マルチエージェント…

★4 LLM

State Representation and Termination for Recursive Reasoning Systems

再帰的推論システムの推論状態表現と停止条件に関する研究論文が発表されました。

★4 LLM

CASCADE: Case-Based Continual Adaptation for Large Language Models During Deployment

LLMがデプロイ後も経験から学習し続ける「デプロイ時学習」のフレームワークが発表されました。

★4 LLM

From Storage to Experience: A Survey on the Evolution of LLM Agent Memory Mechanisms

LLMエージェントの記憶メカニズムの進化を「ストレージ」「リフレクション」「経験」の3段階で分類する調…

More Thinking, More Bias: Length-Driven Position Bias in Reasoning Models

記事のポイント

概要

関連記事

GraphDC: A Divide-and-Conquer Multi-Agent System for Scalable Graph Algorithm Reasoning

State Representation and Termination for Recursive Reasoning Systems

CASCADE: Case-Based Continual Adaptation for Large Language Models During Deployment

From Storage to Experience: A Survey on the Evolution of LLM Agent Memory Mechanisms