GoogleのDiffusionGemma、256トークンを並列生成し自己修正機能も搭載
Google's DiffusionGemma generates 256 tokens in parallel and self-corrects as it goes
記事のポイント
Googleがテキスト生成に拡散モデルを適用したオープンソースの実験的モデル「DiffusionGemma」を公開しました。
256トークンを並列で生成し、自信のないトークンを自己修正することで、従来のモデルより最大4倍高速なテキスト生成を実現します。
ローカル環境や低並列環境でのAIモデルの推論速度が大幅に向上し、より多くのデバイスで高速なテキスト生成が可能になります。
Gemma 4を基盤とし、vLLM推論プラットフォームでネイティブサポートされます。
初期の出力品質は標準Gemma 4より低いものの、双方向コンテキストと自己修正機能により、特定の制約付き生成タスクに優位性があります。
概要
GenAI image generators like Stable Diffusion do not draw a picture pixel by pixel from left to right. They start with noise and iteratively refine the entire image in parallel until it converges, in a process known as diffusion. For years, applying that same principle to text generation had remaine…
テキスト生成の速度が劇的に向上し、スマホやエッジデバイスでのAI活用がさらに進みそうですね。自己修正機能も面白いです。