★4 LLM ITmedia AI+

Google、次世代音声AI「Gemini 3.1 Flash TTS」 自然言語で表現を制御可能に

記事のポイント

📰ニュース

Googleが次世代音声AI「Gemini 3 Flash TTS」を発表し、自然言語で音声表現を制御可能にしました。

🔍注目ポイント

自然言語の指示で話速や感情を細かく調整できる「音声タグ」機能と、電子透かし「SynthID」が技術的ポイントです。

🔮これからどうなる

開発者は高品質で低コストな音声生成をアプリに組み込み、より自然で表現豊かな音声体験を提供できるようになります。

Gemini 3 Flash TTSは、Googleの最新AIモデルGemini 3 Flashを基盤としており、従来の音声合成技術を大きく進化させています。
生成される音声には電子透かし「SynthID」が自動的に適用されるため、AI生成音声の悪用防止や信頼性確保に貢献します。
これにより、次世代の音声アプリケーション開発が加速するでしょう。
💡
編集部の視点

Googleの新しい音声AIは、自然言語で感情や話速を細かく調整できるので、音声アシスタントやオーディオブックの表現力が格段に向上しそうです。私たちの生活にもっと自然なAI音声が浸透するかもしれませんね。

概要

Googleは、自然な音声を生成するAIモデル「Gemini 3 Flash TTS」を発表した。新たに導入された「音声タグ」機能により、自然言語の指示で話速や感情を細かく制御できるのが特徴だ。生成音声には電子透かし「SynthID」が適用され、安全性を確保。高品質で低コストな音声生成によって、次世代の音声アプリ構築を支援する。

元記事を読む →

関連記事