iaクロールズはウィキペディアのパズルになります

人工知能ボットの乗算に直面して、ウィキペディアは減速とコストの増加に直面し、読者の経験に影響を与えます。

TL;博士

  • ウィキペディアは、人工知能ブーツによって生成されるトラフィックが急激に増加し、人間のユーザーのアクセスの減速を引き起こします。
  • これらのクローラーは大量のリソースを消費し、財団の運用コストを増やします。
  • Wikipediaは、ユーザーに流動的と持続的なアクセスを維持しながら、この大量のトラフィックを管理するソリューションを探しています。

2024年1月以来、ウィキメディア財団のサーバー上のトラフィックは50%増加していますが、この増加は人間のユーザーによるものではありません。現実には、この増加は、ウィキペディアとウィキメディアコモンズの内容を精査するブーツに自動化されたクローラーに授与され、生成的人工知能のモデルを引き起こします。これらのボットは、プラットフォーム上で自由にアクセスできる画像、ビデオ、記事、その他のファイルに大規模にアクセスしています。この状況は、現在の出来事のように、特に需要が高い時期には大きな減速につながる可能性があります。

ユーザーの結果

クローラーは、記事や特定のビデオにアクセスしようとする人間のユーザーに深刻な問題を引き起こしますウィキペディア。ロボットトラフィックの増加により、特に非常に公表されたメディアイベント中に、ページの読み込み時間が大幅に遅くなります。たとえば、2023年12月のジミーカーターの死の際、大統領の議論のビデオを見るという要求が過負荷を生み出しました。通常、ウィキペディアは、人間の読者によって引き起こされるこれらの交通ピークを管理するために装備されていますが、クローラーによって生成されるボリュームは通常予想されるものをはるかに上回ります。

リソースとコスト管理

人気のある要求に迅速に対応するように設計されたウィキペディアキャッシュモデルは、クローラーによって邪魔されます。よく相談されるページは、ローカルデータセンターのキャッシュです。これにより、アクセスが速くなります。一方、要求されていないページは、より多くのリソースを消費し、コストを増やすメインデータセンターから提供する必要があります。最も人気の少ないものを含むさまざまなページにアクセスするクローラーは、財団の追加リソースとコストの過度の使用を引き起こします。

この状況に直面して、ウィキメディア財団は、サイトトラフィックの65%がボットから来ていると報告しました。後者は、サイトの信頼性チームの作業を混乱させます。これは、コンテンツへのアクセスが影響を受けるのを防ぐために、絶えずブロックする必要があります。さらに、財団は、このトラフィックの増加の大部分が適切な割り当てなしで行われていることを強調しており、これは人間のユーザーの可視性とコミットメントを害します。 Wikimedia Foundationは現在、開発者とユーザーが実際の読者の経験を乱すことなくコンテンツにアクセスし続けることができる永続的なソリューションを探しています。

あなたは私たちのコンテンツが好きですか?

最新の出版物を毎日無料で直接メールボックスで受け取ります