Google、「Gemma 4」のテキスト生成を最大3倍高速化する「MTP」をリリース
概要
Googleは、オープンモデル「Gemma 4」向けにテキスト生成を最大3倍高速化するマルチトークン予測ドラフター(MTP)をリリースした。投機的デコーディングを採用し、生成品質を保ちながら推論を並列化する。主要な推論フレームワークに対応し、エッジからクラウドまで多様な環境で実用性を高める技術だ。