AMD Instinct MI300 GPUで訓練された超効率的なオープン推論モデル「ZAYA1-8B」が登場
Meet ZAYA1-8B, a super efficient, open reasoning model trained on AMD Instinct MI300 GPUs
記事のポイント
ZyphraがAMD Instinct MI300 GPUで訓練された、パラメータ数が少なく効率的なオープン推論モデル「ZAYA1-8B」をリリースしました。
わずか80億パラメータで、GPT-5-HighやDeepSeek-V3.2に匹敵する性能を持ち、AMD GPUのAI訓練における実用性を示しました。
企業や開発者は、より少ない計算資源で高性能AIモデルを構築・カスタマイズでき、Nvidia以外の選択肢が広がります。
推論能力を初期段階から組み込む「Reasoning-First Pretraining」も特徴です。
Apache 2.0ライセンスでHugging Faceから無料でダウンロードでき、Zyphra Cloudでテストも可能です。
概要
Even as leading AI providers like OpenAI and Anthropic battle over the compute to train and release ever larger, more powerful models, other labs are going in a different direction — pursuing the development of smaller, more efficient models and often open sourcing them. The latest worth paying att…
AMD GPUで高性能なオープンモデルが開発されたのは、AI開発のハードルを下げる大きな一歩ですね。これからのAI競争がさらに面白くなりそうです。