このワークショップでは、ソーシャル ネットワーク、コメント、その他のオンライン出版物のスパム検出に関連する取り組みが紹介されました。
この記事は、World Wide Web Conference に関連する記事グループの一部です。www2012私たちは4月16日から20日まで参加しました。詳細はこちら。
たとえば、スパム検出に取り組んでいる Kymin Lee 氏からいくつかの説明を得ることができました。ツイッター、特にトレンドのトピックについて。彼のテクニックにより、彼は Twitter 自体よりもずっと前に、特定のキーワードに関するスパムの割合を把握することに成功しました。この PDF を通じて彼の作品をさらに詳しくご覧ください。
ドメインの品質は、語彙の品質と言語の選択 (主にスペイン語と英語) に関係します。
Web コンテンツを評価する最良の方法は、事実情報に基づいてコンテンツを評価することです。 Web コンテンツを評価するには、次の 3 つの異なる評価アプローチがあります。
- 統計を使用して品質を判断します。たとえば、次の記事でハイライトされています。ウィキペディア他のものより長く、より多くの事実が含まれています。
- 記事間の関係の数を決定します。出版社が多ければ多いほど、事実の密度は高くなります。
- 単語の出現数をカウントすると、記事内の事実の数を評価することもできます。
地図作成とウェブ:
マッピングが歪められ、縮尺が変更されると、精度が低下し、位置評価の効果が低下します。したがって、より多くのデータを残せる改良された仮想カードに切り替える予定です。空間要素の間。
OCR は、地図上の要素を認識するために使用されます。その後、エラーが修正され、物理マップ上で位置が決定されます。次に、位置の値が抽出され、仮想的に再配置された後、空間が再作成されます。この方法はまだ完全には効果的ではありませんが、読みやすさの点で無視できない改善が得られています。