★4 LLM EN TechCrunch AI 2026年5月20日 02:45 by Synapse Flow 編集部

GoogleのGemini Omni、画像・音声・テキストから動画生成を開始

Google’s Gemini Omni turns images, audio, and text into video — and that’s just the start

記事のポイント

📰ニュース

Googleが新しいマルチモーダルモデル「Gemini Omni」を発表しました。

🔍注目ポイント

テキスト、画像、音声、動画を横断的に理解し、会話を通じて動画を生成・編集できます。

🔮これからどうなる

動画制作の敷居が下がり、個人や企業がより手軽に高品質な動画を作成できるようになります。

Gemini Omniは、Googleの最新のマルチモーダルモデルで、特に「Omni Flash」という機能から提供が開始されます。
これにより、ユーザーは複数の異なるメディア形式を組み合わせて、対話的に動画コンテンツを生成・編集することが可能になります。
これは、AIによるコンテンツ生成の新たな一歩を示しています。

💡

編集部の視点

GoogleのGemini Omniは、動画制作の常識を大きく変えそうです。これからは、誰もが簡単にプロ並みの動画をスマホで作れるようになるかもしれませんね。

元記事を読む →