Cohereが初のApache 2.0ライセンスのオープンモデル「Command A+」を発表:ロスレス量子化とネイティブ引用を実現
Cohere cracks lossless quantization and native citations with first full Apache 2.0 licensed open model Command A+
記事のポイント
Cohereが、複雑な推論やマルチモーダル処理に特化した2180億パラメータのオープンな大規模言語モデル「Command A+」を公開しました。
疎なMoEアーキテクチャと4ビット量子化により、性能を維持しつつ計算資源を大幅に削減し、企業が自社環境でAIを運用できる「ソブリンAI」を実現します。
企業や政府は、高性能なAIモデルを自社のセキュアな環境で運用できるようになり、データ主権とセキュリティを確保しながらAI活用を加速できます。
2180億パラメータのうち、一度にアクティブになるのは250億パラメータのみで、推論時の計算コストを大幅に削減します。
特に、MoEエキスパートのみを4ビット量子化することで、複雑な推論能力を損なわずにモデルサイズを圧縮する技術が注目されます。
概要
Canadian AI lab Cohere made waves recently by announcing a merger with German AI startup Aleph Alpha, but now it has even more in store for enterprise builders around the globe: today, the firm co-founded by former Googler and "Attention Is All You Need" co-author Aidan Gomez unveiled Command A+, a…
高性能なAIモデルを自社で運用できるのは、データセキュリティを重視する企業にとって朗報ですね。これで、より多くの企業がAI導入に踏み切りやすくなりそうです。