★4 LLM EN VentureBeat AI by Synapse Flow 編集部

GoogleのオープンソースGemma 4 12B、音声・動画分析を16GBノートPCでローカル実行可能に

Google's new open source Gemma 4 12B analyzes audio, video — and runs entirely locally on a typical 16GB enterprise laptop

記事のポイント

📰ニュース

GoogleがオープンソースのGemma 4 12Bをリリースし、音声・動画分析を一般的な16GBの企業向けノートPCで完全にローカル実行できるようになりました。

🔍注目ポイント

エンコーダ不要の「Unified」アーキテクチャにより、音声波形や視覚データを直接LLMに統合し、低遅延と低メモリ消費を実現しています。

🔮これからどうなる

企業ユーザーはオフライン環境やセキュリティ要件の高い状況でもAIを容易に利用でき、コスト削減とデータプライバシーの向上が期待されます。

Gemma 4 12Bは119.5億パラメータのモデルで、Apache 2.0ライセンスの下で提供されます。
従来のマルチモーダルシステムが使用していたエンコーダを排除し、軽量な線形層でデータを直接LLMに投影することで、VRAM要件を16GBに削減しました。
256Kトークンのコンテキストウィンドウと段階的推論モード、ネイティブなツール利用機能も備えています。
💡
編集部の視点

これはすごいですね!一般的なノートPCで高度なマルチモーダルAIが動くとなると、多くのビジネスシーンで活用が広がりそうです。特にオフラインでの作業効率が格段に上がるでしょうね。

概要

While many AI open source model providers are pursuing larger and more powerful models, Google is still giving attention to the smaller, more local side of the market. Today, the tech giant released Gemma 4 12B, an 11.95-billion-parameter open-weights model with permissive Apache 2.0 license optimi…

元記事を読む →

関連記事