Googleの新「何でも変換」AIモデルが驚異的
Google’s new anything-to-anything AI model is wild
記事のポイント
📰ニュース
Googleがテキスト、画像、音声、動画などあらゆる入力形式に対応する新しいAIモデルを発表しました。
🔍注目ポイント
このモデルは、多様なモダリティを相互に変換し、テキストから動画生成、画像から音声生成などが可能です。
🔮これからどうなる
クリエイターはコンテンツ制作の幅が広がり、一般ユーザーもより手軽に高度なメディア編集が可能になります。
Googleは昨年、Gemini広告でぬいぐるみを使った動画生成を披露しましたが、今回のモデルはそのような複雑なマルチモーダル変換を可能にするものです。
ユーザーはテキストで指示するだけで、画像や動画、音声など様々な形式のコンテンツを生成・編集できます。
ユーザーはテキストで指示するだけで、画像や動画、音声など様々な形式のコンテンツを生成・編集できます。
概要
Last year I deepfaked my kid's stuffed animal to make it look like his plush deer was on vacation. It was an experiment to see if I could re-create the events depicted in a Gemini ad Google was running, and I never showed the videos of Buddy the deer on his adventures to my four-year-old. […]
Googleの新しいAIモデルは、テキストだけでなく画像や音声も自在に操れるので、あなたのコンテンツ制作が劇的に変わるかもしれませんね。