GLM-5.1オープンソースLLMがSWE-Bench ProでOpus 4.6とGPT 5.4を凌駕し、AIが8時間労働に参入
AI joins the 8-hour work day as GLM ships 5.1 open source LLM, beating Opus 4.6 and GPT 5.4 on SWE-Bench Pro
記事のポイント
中国のZ.aiが、8時間自律稼働可能なオープンソースLLM「GLM-5.1」を公開しました。
GLM-5.1は、従来のモデルに見られた性能の頭打ちを回避し、段階的な最適化で長時間にわたり目標を維持する「階段パターン」技術を特徴とします。
企業はGLM-5.1を商用利用でき、開発者はより複雑なタスクをAIに任せ、生産性を大幅に向上させることが期待されます。
SWE-Bench Proのベンチマークで、Claude Opus 4.6やGPT 5.4を上回る性能を示し、特にVectorDBBenchの最適化タスクでは655回のイテレーションと6,000回以上のツール呼び出しで大幅な性能向上を達成しました。
概要
Is China picking back up the open source AI baton? Z.ai, also known as Zhupai AI, a Chinese AI startup best known for its powerful, open source GLM family of models, has unveiled GLM-5.1 today under a permissive MIT License, allowing for enterprises to download, customize and use it for commercial …
AIが長時間にわたって自律的に作業できるようになるのは画期的な進歩ですね。私たちの仕事のやり方が大きく変わるかもしれません。