★4 LLM EN The Decoder by Synapse Flow 編集部

AIモデルが19日間ノンストップでプログラミング、MirrorCodeタスクに2,600ドルを費やす

An AI model programmed nonstop for 19 days on a single MirrorCode task that cost $2,600 to run

記事のポイント

📰ニュース

AIモデルがMirrorCodeベンチマークで、元のコードなしにプログラムを再構築する能力をテストされました。

🔍注目ポイント

Claude Opus 4.7は16,000行のツールキットを14時間で再構築し、56%の解決率でトップの性能を示しました。

🔮これからどうなる

AIによるコード生成や再構築の精度向上は、ソフトウェア開発の効率化に大きく貢献するでしょう。

Epoch AIのMirrorCodeベンチマークは、AIが既存のプログラムをゼロから再構築できるかを評価します。
最も複雑なタスクでは、どのモデルもまだ成功していません。
あるAIモデルは、単一のMirrorCodeタスクに19日間連続でプログラミングを行い、その実行コストは2,600ドルに達しました。
💡
編集部の視点

AIがこれほど大規模なコードを短時間で再構築できるのは驚きですね。プログラマーの仕事の進め方が大きく変わるかもしれません。

元記事を読む →

関連記事