GoogleのGemini Omni、画像・音声・テキストから動画生成を開始
Google’s Gemini Omni turns images, audio, and text into video — and that’s just the start
記事のポイント
📰ニュース
Googleが新しいマルチモーダルモデル「Gemini Omni」を発表しました。
🔍注目ポイント
テキスト、画像、音声、動画を横断的に理解し、会話を通じて動画を生成・編集できます。
🔮これからどうなる
動画制作の敷居が下がり、個人や企業がより手軽に高品質な動画を作成できるようになります。
Gemini Omniは、Googleの最新のマルチモーダルモデルで、特に「Omni Flash」という機能から提供が開始されます。
これにより、ユーザーは複数の異なるメディア形式を組み合わせて、対話的に動画コンテンツを生成・編集することが可能になります。
これは、AIによるコンテンツ生成の新たな一歩を示しています。
これにより、ユーザーは複数の異なるメディア形式を組み合わせて、対話的に動画コンテンツを生成・編集することが可能になります。
これは、AIによるコンテンツ生成の新たな一歩を示しています。
概要
Google's Gemini Omni is a new multimodal model that reasons across text, images, audio, and video to generate and edit videos through simple conversation — starting with Omni Flash.
GoogleのGemini Omniは、動画制作の常識を大きく変えそうです。これからは、誰もが簡単にプロ並みの動画をスマホで作れるようになるかもしれませんね。