OpenAIがGPT-5.5を発表、Terminal-Bench 2.0でAnthropicのClaude Mythos Previewを僅差で上回る
OpenAI's GPT-5.5 is here, and it's no potato: narrowly beats Anthropic's Claude Mythos Preview on Terminal-Bench 2.0
記事のポイント
OpenAIが最新の大規模言語モデル「GPT-5.5」を発表し、主要ベンチマークで競合を上回りました。
GPT-5.5は、少ない指示で複雑なタスクを自律的に処理する「エージェント的」性能と、高い知能を維持しつつ低遅延を実現する効率性が特徴です。
開発者や研究者は、より少ない指示で高度なコーディングや科学研究が可能になり、生産性が向上するでしょう。
OpenAIの研究担当副社長によると、ベンチマークとパートナーからのフィードバックの両方で、これまでで最も強力なモデルとのことです。
また、NVIDIA GB200/GB300 NVL72システム上で動作し、AI自身が書いたカスタムヒューリスティックアルゴリズムを用いてハードウェアとソフトウェアの協調設計がなされています。
概要
After months of rumors and reports that OpenAI was developing a new, more powerful AI large language model for use in ChatGPT and through its application programming interface (API), allegedly codenamed "Spud" internally, the company has today unveiled its latest offering under the more formal name…
GPT-5.5の登場で、AIがより自律的に複雑な作業をこなせるようになり、私たちの仕事のやり方が大きく変わるかもしれませんね。特にプログラミングや研究分野での活躍が期待できそうです。