★4 LLM EN The Verge AI by Synapse Flow 編集部

Googleの新「何でも変換」AIモデルが驚異的

Google’s new anything-to-anything AI model is wild

記事のポイント

📰ニュース

Googleがテキスト、画像、音声、動画などあらゆる入力形式に対応する新しいAIモデルを発表しました。

🔍注目ポイント

このモデルは、多様なモダリティを相互に変換し、テキストから動画生成、画像から音声生成などが可能です。

🔮これからどうなる

クリエイターはコンテンツ制作の幅が広がり、一般ユーザーもより手軽に高度なメディア編集が可能になります。

Googleは昨年、Gemini広告でぬいぐるみを使った動画生成を披露しましたが、今回のモデルはそのような複雑なマルチモーダル変換を可能にするものです。
ユーザーはテキストで指示するだけで、画像や動画、音声など様々な形式のコンテンツを生成・編集できます。
💡
編集部の視点

Googleの新しいAIモデルは、テキストだけでなく画像や音声も自在に操れるので、あなたのコンテンツ制作が劇的に変わるかもしれませんね。

概要

Last year I deepfaked my kid's stuffed animal to make it look like his plush deer was on vacation. It was an experiment to see if I could re-create the events depicted in a Gemini ad Google was running, and I never showed the videos of Buddy the deer on his adventures to my four-year-old. […]

元記事を読む →

関連記事