この記事は、4 月 16 日から 20 日まで参加した World Wide Web カンファレンス www2012 に関連する記事グループの一部です。
月曜日の午後、私たちはロマン・ヴィルモ氏、ミハル・ラクラヴィク氏、ヴィトール・カルヴァーリョ氏による次のテーマに関する会議に出席することができました。のメッセージングそしてデータのウェブ。
アルゴリズムを使用して、データから取得したデータを復元し、並べ替えることができると説明されました。ソーシャルネットワーク。これは主に、電子メール アドレス、姓名、ユーザーの所在地に関係します。その後、このデータを、特に友人関係、場所などと相互にリンクすることで、優れたデータベースを非常に迅速かつ簡単に構築できます。
同様に、会社の電子メールの内容をフィルタリングするために他のアルゴリズムを作成することもできます。キーワードを検索してまとめることにより、企業の雰囲気を評価することができます。
さらに良いのは、従業員の通信 (内部) や添付ファイルを追跡できることです。
これらのデモンストレーションはどれも本当に印象的でしたが、いくつかの数字を紹介しましょう。研究者らは、517,377 件の電子メール (2.5 GB) のデータベースから、デジタル化とインデックス作成を経て、次のデータを復元することに成功しました: 167,613 人が検出され、26,013 件の電話番号、4,997 件の住所、162,754 件の追加電子メール アドレス。
この経験は、次のように述べたティム・バーナーズ・リーの宣言と比較されるべきである。接続を通過するパケットを詳細に分析するだけで、興味深い情報が見つかる可能性があります。。 »