Thinking Machines Labが初のモデルを発表、音声AIにおけるOpenAIの課題は「対話性」と指摘
Thinking Machines Lab ships its first model and argues interactivity is what OpenAI gets wrong about voice
記事のポイント
Thinking Machines Labが初のAIモデルを発表し、音声AIの対話性でOpenAIを上回ると主張しています。
このモデルは音声・動画・テキストを200ミリ秒単位で並列処理し、リアルタイムでの高度な対話性を実現します。
ユーザーはより自然で途切れない音声AIとの会話が可能になり、新しい対話体験が生まれるでしょう。
同社は、音声AIの未来は単なるQ&Aではなく、人間のような自然なインタラクションにあると考えています。
概要
Mira Murati's start-up presents its first AI model and aims to free voice AI from the question-and-answer model. The model processes audio, video and text in 200-millisecond chunks in parallel and aims to beat OpenAI's GPT Realtime 2 and Google's Gemini Live in terms of interaction quality. The art…
音声AIのリアルタイム性と対話性がさらに進化しそうです。私たちのスマートスピーカーとの会話も、より人間らしくなるかもしれませんね。