NVIDIAがGoogle DeepMindのDiffusionGemmaをローカルAI向けに高速化
NVIDIA Accelerates Google DeepMind’s DiffusionGemma for Local AI
記事のポイント
NVIDIAがGoogle DeepMindの高速テキスト生成モデル「DiffusionGemma」をGeForce RTX GPUなどで最適化し、ローカル環境での実行を加速させました。
DiffusionGemmaは単語単位ではなく、複数の単語を並列生成することで、テキストブロック全体を低遅延で出力する新しい技術を採用しています。
開発者は自身のPC上で高速なテキスト生成AIを体験でき、リアルタイム性が求められるアプリケーション開発が加速するでしょう。
これにより、クラウドからローカルPCまで、様々な環境で高速なテキスト生成が可能になります。
特にシングルユーザーのワークロードにおいて、その低遅延性が大きなメリットとなります。
概要
Today, Google DeepMind released DiffusionGemma — an experimental open model built for exceptionally fast text generation. NVIDIA has optimized DiffusionGemma to run even faster across NVIDIA GeForce RTX GPUs, the NVIDIA RTX PRO platform and NVIDIA DGX Spark systems, from local PCs to the cloud. Ra…
NVIDIAがDeepMindのDiffusionGemmaを高速化してくれたおかげで、私たちのPCでも爆速のテキスト生成が体験できそうですね。個人的な作業効率が格段に上がりそうです。