★4 LLM EN VentureBeat AI

GLM-5.1オープンソースLLMがSWE-Bench ProでOpus 4.6とGPT 5.4を凌駕し、AIが8時間労働に参入

AI joins the 8-hour work day as GLM ships 5.1 open source LLM, beating Opus 4.6 and GPT 5.4 on SWE-Bench Pro

記事のポイント

📰ニュース

中国のZ.aiが、8時間自律稼働可能なオープンソースLLM「GLM-5.1」を公開しました。

🔍注目ポイント

GLM-5.1は、従来のモデルに見られた性能の頭打ちを回避し、段階的な最適化で長時間にわたり目標を維持する「階段パターン」技術を特徴とします。

🔮これからどうなる

企業はGLM-5.1を商用利用でき、開発者はより複雑なタスクをAIに任せ、生産性を大幅に向上させることが期待されます。

GLM-5.1は7540億パラメータのMixture-of-Expertsモデルで、数千回のツール呼び出しを伴う長時間の実行トレースでも目標アライメントを維持します。
SWE-Bench Proのベンチマークで、Claude Opus 4.6やGPT 5.4を上回る性能を示し、特にVectorDBBenchの最適化タスクでは655回のイテレーションと6,000回以上のツール呼び出しで大幅な性能向上を達成しました。
💡
編集部の視点

AIが長時間にわたって自律的に作業できるようになるのは画期的な進歩ですね。私たちの仕事のやり方が大きく変わるかもしれません。

概要

Is China picking back up the open source AI baton? Z.ai, also known as Zhupai AI, a Chinese AI startup best known for its powerful, open source GLM family of models, has unveiled GLM-5.1 today under a permissive MIT License, allowing for enterprises to download, customize and use it for commercial …

元記事を読む →

関連記事