xAI の最新バージョンの Grok は画像を処理できます

Grok-1.5V は、同社のマルチモーダル人工知能モデルの第 1 世代を表します。

先生

  • OpenAIの競合企業であるxAIは、視覚情報を処理できるGrok-1.5Vを発表した。
  • 図を Python コードに変換したり、絵からストーリーを伝えたり、ミームを説明したりできます。
  • Grok-1.5 のリリース直後に導入され、数学とプログラミングが改良されました。
  • xAI は、RealWorldQA というベンチマーク データセットも公開しています。

xAI、新しい人工知能モデルである Grok-1.5V を発売

イーロン・マスクによって設立された xAI という会社は、OpenAIは、初のマルチモーダルな第 1 世代人工知能モデルである Grok-1.5V を発表しました。従来のモデルとは異なり、後者はテキストと、図、グラフ、写真などの複雑なドキュメントの両方を処理できます

多用途なAI

同社のリリースによると、Grok-1.5V にはさまざまな機能が搭載されています。アプリケーション可能。たとえば、彼は次のことができます。「組織図を Python コードに変換する」、絵に基づいてストーリーを書いたり、説明したりすることもできます。「あなたから逃れるミーム」。 Grok-1.5V は、複雑なテクノロジーであっても使いやすいことを実証するために構築されており、幸いにもインターネットの台頭でますます一般的になりつつあるビジュアル コンテンツを理解するのに役立ちます。

この新しいモデルは、xAI が Grok-1.5 を発売してからわずか数週間後に登場しました。後者は、数学とプログラミングに優れると同時に、より長いコンテキストを処理できるように特別に設計されているため、特定のクエリをよりよく理解するためにより多くのソースを参照できます。 xAI は、初期テスターと既存ユーザーがすぐに Grok-1.5V の機能の恩恵を受けることができるようになると発表しましたが、その導入に関する具体的なスケジュールは発表されていません。

人工知能の標準を再定義する

Grok-1.5V のプレゼンテーションに加えて、xAI は、と呼ばれる新しい参照データセットも利用可能にしました。RealWorldQA。後者は 700 枚の画像で構成されています「簡単に検証できる質問と回答が付属しています」人工知能モデルの性能評価を可能にします。比較テストでは、xAI のテクノロジーは、OpenAI の GPT-4V やジェミニGoogleプロ1.5。 AI 分野における xAI の支配的な地位を裏付ける注目すべきパフォーマンス。