AIモデルが19日間ノンストップでプログラミング、MirrorCodeタスクに2,600ドルを費やす
An AI model programmed nonstop for 19 days on a single MirrorCode task that cost $2,600 to run
記事のポイント
📰ニュース
AIモデルがMirrorCodeベンチマークで、元のコードなしにプログラムを再構築する能力をテストされました。
🔍注目ポイント
Claude Opus 4.7は16,000行のツールキットを14時間で再構築し、56%の解決率でトップの性能を示しました。
🔮これからどうなる
AIによるコード生成や再構築の精度向上は、ソフトウェア開発の効率化に大きく貢献するでしょう。
Epoch AIのMirrorCodeベンチマークは、AIが既存のプログラムをゼロから再構築できるかを評価します。
最も複雑なタスクでは、どのモデルもまだ成功していません。
あるAIモデルは、単一のMirrorCodeタスクに19日間連続でプログラミングを行い、その実行コストは2,600ドルに達しました。
最も複雑なタスクでは、どのモデルもまだ成功していません。
あるAIモデルは、単一のMirrorCodeタスクに19日間連続でプログラミングを行い、その実行コストは2,600ドルに達しました。
AIがこれほど大規模なコードを短時間で再構築できるのは驚きですね。プログラマーの仕事の進め方が大きく変わるかもしれません。