OpenAI は、無料の GPT-4o モデルが人間のように話し、笑い、歌い、見ることができると主張しています。

同社は ChatGPT 用のデスクトップ アプリも提供しています。

先生

  • OpenAI は、新しい AI モデルである GPT-4o を発表します。
  • テンプレートは、テキスト、音声、画像を入力として受け入れます。
  • 彼は感情を認識し、会話中にほぼ即座に反応します。
  • GPT-4o は、無料ユーザーを含む誰もが利用できるようになります。チャットGPT

会社OpenAI月曜、新型モデルであるGPT-4oの開発を発表した。人工知能。によるとミラ・ムラティOpenAI の CTO である同氏によると、この洗練されたモデルは、「より自然な」人間とコンピューターのインタラクションに向けた大きな前進を表しています。

優れたマルチモーダル機能

以前のバージョンよりも直感的に使用できる GPT-4o は、テキスト、オーディオ、画像入力の組み合わせを処理し、3 つの形式すべてで出力を生成できます。これは、音声をテキストに書き写すため、口調や感情が省略され、対話が遅くなる古い GPT-3.5 および GPT-4 モデルに比べて大幅な改善です。

GPT-4o の感情を認識する驚くべき能力は、ライブ プレゼンテーション中に実証されました。このモデルは、英語からイタリア語へのリアルタイム翻訳、一次方程式の解法、さらには深呼吸のガイドなど、さまざまな状況でテストされました。

オーディオ、ビジョン、テキストをリアルタイムで推論できる新しいフラッグシップ モデルである GPT-4o をご紹介します。https://t.co/MYHZB79UqN

テキストと画像の入力は、本日 API と ChatGPT で音声とビデオを使用して数週間以内に展開されます。pic.twitter.com/uuthKZyzYx

— OpenAI (@OpenAI)2024 年 5 月 13 日

すべての人が利用できるようになり、大規模なリリースが開始される

OpenAI は、GPT-4o が今後数週間以内に無料の ChatGPT ユーザーを含むすべての人に利用可能になることを示しました。 ChatGPT のデスクトップ バージョンは、当初は Mac 向けでしたが、今日から有料ユーザーにも利用できるようになります。

OpenAIの発表は、同社の年次開発者会議の前夜に行われたグーグルGoogle I/O。これは次のことを強調しています激しい対立この 2 つの人工知能の巨人の間で、Google は GPT-4o と同様の機能を備えた独自の AI チャットボットである Gemini のバージョンを発表しました。