★4 LLM EN VentureBeat AI by Synapse Flow 編集部

AMD Instinct MI300 GPUで訓練された超効率的なオープン推論モデル「ZAYA1-8B」が登場

Meet ZAYA1-8B, a super efficient, open reasoning model trained on AMD Instinct MI300 GPUs

記事のポイント

📰ニュース

ZyphraがAMD Instinct MI300 GPUで訓練された、パラメータ数が少なく効率的なオープン推論モデル「ZAYA1-8B」をリリースしました。

🔍注目ポイント

わずか80億パラメータで、GPT-5-HighやDeepSeek-V3.2に匹敵する性能を持ち、AMD GPUのAI訓練における実用性を示しました。

🔮これからどうなる

企業や開発者は、より少ない計算資源で高性能AIモデルを構築・カスタマイズでき、Nvidia以外の選択肢が広がります。

ZAYA1-8Bは、MoE++アーキテクチャを採用し、Compressed Convolutional Attention、ZAYA1 MLP Router、Learned Residual Scalingといった独自技術で効率を高めています。
推論能力を初期段階から組み込む「Reasoning-First Pretraining」も特徴です。
Apache 2.0ライセンスでHugging Faceから無料でダウンロードでき、Zyphra Cloudでテストも可能です。
💡
編集部の視点

AMD GPUで高性能なオープンモデルが開発されたのは、AI開発のハードルを下げる大きな一歩ですね。これからのAI競争がさらに面白くなりそうです。

概要

Even as leading AI providers like OpenAI and Anthropic battle over the compute to train and release ever larger, more powerful models, other labs are going in a different direction — pursuing the development of smaller, more efficient models and often open sourcing them. The latest worth paying att…

元記事を読む →

関連記事