Claude Codeの「/goals」機能、タスク実行と評価を分離しAIエージェントの早すぎる終了を防ぐ
Claude Code's '/goals' separates the agent that works from the one that decides it's done
記事のポイント
AnthropicのClaude Codeが「/goals」機能を導入し、AIエージェントのタスク実行と完了評価を分離しました。
実行モデルと評価モデルを分けることで、エージェントがタスクを完了したと誤判断し、途中で終了する問題を解決します。
企業はAIエージェントの信頼性が向上し、コード移行や開発作業における手戻りやエラー検出のコストを削減できます。
Claude Codeの「/goals」は、ユーザーが設定した完了条件に基づき、独立した評価モデル(デフォルトはHaiku)が各ステップ後にタスクの達成度をチェックします。
これにより、エージェントは条件が満たされるまで作業を継続し、外部の監視システムへの依存度も低減されます。
概要
A code migration agent finishes its run, and the pipeline looks green. But several pieces were never compiled — and it took days to catch. That's not a model failure; that's an agent deciding it was done before it actually was.Many enterprises are now seeing that production AI agent pipelines fail …
AIエージェントが「終わったつもり」でタスクを中断する問題、多くの企業で頭を悩ませていたでしょう。この機能で、開発現場の生産性が大きく向上しそうです。