AMD Instinct MI300 GPUで訓練された超効率的なオープン推論モデル「ZAYA1-8B」が登場
Meet ZAYA1-8B, a super efficient, open reasoning model trained on AMD Instinct MI300 GPUs
記事のポイント
📰ニュース
ZyphraがAMD Instinct MI300 GPUで訓練された、パラメータ数が少なく効率的なオープン推論モデル「ZAYA1-8B」をリリースしました。
🔍注目ポイント
わずか80億パラメータで、GPT-5-HighやDeepSeek-V3.2に匹敵する性能を持ち、AMD GPUのAI訓練における実用性を示しました。
🔮これからどうなる
企業や開発者は、より少ない計算資源で高性能AIモデルを構築・カスタマイズでき、Nvidia以外の選択肢が広がります。
ZAYA1-8Bは、MoE++アーキテクチャを採用し、Compressed Convolutional Attention、ZAYA1 MLP Router、Learned Residual Scalingといった独自技術で効率を高めています。
推論能力を初期段階から組み込む「Reasoning-First Pretraining」も特徴です。
Apache 2.0ライセンスでHugging Faceから無料でダウンロードでき、Zyphra Cloudでテストも可能です。
推論能力を初期段階から組み込む「Reasoning-First Pretraining」も特徴です。
Apache 2.0ライセンスでHugging Faceから無料でダウンロードでき、Zyphra Cloudでテストも可能です。
AMD GPUで高性能なオープンモデルが開発されたのは、AI開発のハードルを下げる大きな一歩ですね。これからのAI競争がさらに面白くなりそうです。