Google DeepMindがマルチモーダル生成モデル「Gemini Omni」を発表、自然言語による対話と推論能力による動画生成・編集が可能に
記事のポイント
📰ニュース
Google DeepMindがマルチモーダル生成モデル「Gemini Omni」を発表しました。
🔍注目ポイント
自然言語による対話と推論能力で動画生成・編集が可能になる点が技術的ポイントです。
🔮これからどうなる
ユーザーはより直感的に動画コンテンツを生成・編集できるようになり、クリエイティブ活動が加速するでしょう。
Gemini Omniは、動画を含むあらゆる入力から多様なコンテンツを生成できる新しいモデルファミリーです。
その第一弾として「Gemini Omni Flash」がGeminiアプリ、Google Flow、YouTube Shortsで順次提供開始されます。
これにより、GoogleのAI技術がさらに幅広いアプリケーションに統合されていくことが期待されます。
その第一弾として「Gemini Omni Flash」がGeminiアプリ、Google Flow、YouTube Shortsで順次提供開始されます。
これにより、GoogleのAI技術がさらに幅広いアプリケーションに統合されていくことが期待されます。
概要
GoogleのAI研究開発部門であるGoogle DeepMindがGeminiの新しいモデルファミリーとして、動画をはじめとしたあらゆる入力から様々なものを作り出すことができる新しいマルチモーダル生成モデル「Gemini Omni」を発表しました。その第1弾としてGemini Omni FlashがGeminiアプリ・Google Flow・YouTube Shortsで順次提供され…
Gemini Omniは、動画生成・編集の常識を変える可能性を秘めていますね。YouTube Shortsでの提供は、一般のユーザーがAIで動画を作るきっかけになりそうです。