★4 LLM EN The Decoder by Synapse Flow 編集部

Thinking Machines Labが初のモデルを発表、音声AIにおけるOpenAIの課題は「対話性」と指摘

Thinking Machines Lab ships its first model and argues interactivity is what OpenAI gets wrong about voice

記事のポイント

📰ニュース

Thinking Machines Labが初のAIモデルを発表し、音声AIの対話性でOpenAIを上回ると主張しています。

🔍注目ポイント

このモデルは音声・動画・テキストを200ミリ秒単位で並列処理し、リアルタイムでの高度な対話性を実現します。

🔮これからどうなる

ユーザーはより自然で途切れない音声AIとの会話が可能になり、新しい対話体験が生まれるでしょう。

Thinking Machines Labは、OpenAIのGPT Realtime 2やGoogleのGemini Liveと比較し、質問応答型ではない、より自由な対話モデルを目指しています。
同社は、音声AIの未来は単なるQ&Aではなく、人間のような自然なインタラクションにあると考えています。
💡
編集部の視点

音声AIのリアルタイム性と対話性がさらに進化しそうです。私たちのスマートスピーカーとの会話も、より人間らしくなるかもしれませんね。

概要

Mira Murati's start-up presents its first AI model and aims to free voice AI from the question-and-answer model. The model processes audio, video and text in 200-millisecond chunks in parallel and aims to beat OpenAI's GPT Realtime 2 and Google's Gemini Live in terms of interaction quality. The art…

元記事を読む →

関連記事