OpenAI、スカーレット・ヨハンソンの声のように聞こえない高度な音声モードを開始

現在、数名の有料 ChatGPT ユーザーがアルファ版を楽しんでいます。

TL;DR

OpenAI は音声モードの高度なバージョンを実装します。
より自然な会話を提供し、感情に応えます。
音声ダイアログのサポートは昨年 9 月に開始されました。

OpenAI、の先駆者人工知能は、音声モード機能の改良版の展開を開始しました。当初から限られたユーザーのみが利用可能でしたチャットGPT有料の場合、チャットボットと直接通信する機会が得られます。最終的には、今年の秋までに、すべての ChatGPT Plus メンバーがこの拡張されたツールセットにアクセスできるようになる予定です。

改善されたチャットエクスペリエンス

Xの広告では、会社この音声モードの高度なバージョンは、より自然な会話をリアルタイムで提供することを示しました。「いつでも中断でき、感情を検出して反応することができます。」

私たちは、少人数の ChatGPT Plus ユーザーグループに高度な音声モードの展開を開始しています。高度な音声モードでは、より自然なリアルタイムの会話が可能になり、いつでも中断でき、感情を感知して反応します。pic.twitter.com/64O94EhhXK
— OpenAI (@OpenAI)2024 年 7 月 30 日

よりインタラクティブな音声会話に向けた新たな一歩

AI ユーザーの改善の一環として、昨年 9 月に ChatGPT で音声会話のサポートが実装されました。その後、さらに高度なバージョンが昨年 5 月に公開デモンストレーションを受けました。

段階的な改善

このバージョンでは、チャットGPT-4oは、以前のオーディオソリューションで使用されていた 3 つの個別のモデルではなく、音声機能に単一のマルチモーダルモデルを使用しています。これは、チャットボットとの会話の遅延を軽減するためです。

過去には、OpenAIの5月の発表で、女優スカーレット・ヨハンソンの音声に不気味なほど似ていると思われる音声オプションが公開され、広範囲の反発を引き起こした。同社は、その声はヨハンソンのパフォーマンスを模倣したものではないと主張したにもかかわらず、削除されましたこの事件を受けて、アドバンストボイスモードのリリース日が延期されました。

総括