Voice Engineの仕組みと安全性研究の拡大について
Expanding on how Voice Engine works and our safety research
記事のポイント
📰ニュース
OpenAIがテキストから音声を生成する「Voice Engine」の技術詳細と安全性研究について発表しました。
🔍注目ポイント
少量の音声サンプルから、元の話者の声質や感情を保持した自然な音声を生成できる点が特徴です。
🔮これからどうなる
悪用リスクを考慮し、現時点では限定的な提供に留め、AI音声の悪用防止策を重視しています。
Voice Engineは、2022年後半に開発され、既にBe My EyesやLifespanなどのパートナーに提供されています。
この技術は、わずか15秒の音声サンプルから、元の話者の声質を模倣し、様々な言語で自然な音声を生成できます。
しかし、ディープフェイクなどの悪用リスクが高いため、OpenAIは厳格な利用ポリシーと悪用防止技術の開発に注力しています。
具体的には、生成された音声に透かしを埋め込んだり、利用者の身元確認を義務付けたりするなどの対策を検討しています。
この技術は、わずか15秒の音声サンプルから、元の話者の声質を模倣し、様々な言語で自然な音声を生成できます。
しかし、ディープフェイクなどの悪用リスクが高いため、OpenAIは厳格な利用ポリシーと悪用防止技術の開発に注力しています。
具体的には、生成された音声に透かしを埋め込んだり、利用者の身元確認を義務付けたりするなどの対策を検討しています。
概要
Exploring the technology behind our text-to-speech model.
OpenAIのVoice Engine、すごい技術だけど、悪用されないように慎重に進めてるのが好印象だね。ディープフェイク対策は本当に重要だから、今後の動向に注目だよ!