Googleによる検索結果からの閲覧情報取得蓄積はいつから始まっていたのか

I support individual rights

id:RIPさんのところへ持ち込んだネタの関連で。

RIPさんがみつけた、「Googleで検索した後、実際にページを見に行った行動について、Googleのサーバにその情報が送られている」という仕組みを読んで、私はゾっとしたのでした。以下。

上記記事だけでもGoogleの処理は確かに気に入らないのですが、検索キーワードと具体的にどのページが見られたかの関連付けは、検索エンジンユーザビリティーをあげる為の統計処理と考えれば、まだ納得できる範囲、というのが大方の見方でしょう。ページランク調整という奴ですな。個人と結びつける意図が薄ければまぁ許容範囲かと。

ところがRIPさんの記事を読んでいたら、つい最近ブックマークレット関連でたまたま見かけた情報が頭をよぎったのです。GoogleCookieにIDが付与されているよ、という記事でした。

両者を結びつければ、Googleスパイウェア一歩手前であるという冷や汗が出たのです。匿名ながら個人別の名寄せが出来てしまうと。そこで、RIPさんの日記のコメント欄でタレこんだのでした。

されど、そこに留まりませんでした。RIPさんの知見により、Gmailアカウントとの関連付けが指摘されたのです。これで、個人との連結が可能なプロファイリングが可能であることが判明したわけです。(もちろん、しているかどうかは決め付けることは出来ません。が、していなければ、なんでCookieにIDが?)

さて、私は読みもしない、後で読もうと放っておく「つんどく」ブックマークがありまして。その中から本日、関連情報を発掘しました。以下に。

私はjavascriptはよくわかりませんが、ルートディレクトリ:ウェブマーケティングの長い尻尾をつかまえろの主宰者のJeff RootさんがGoogleについて発見したものと、RIPさんが発見したものとは深い相似があります。Google側が求める情報は全く同じでしょう。Jeff Rootさんの上記記事は、昨年、2004年01月23日の記事です。少なくとも、その頃からは、追跡していたのでしょう。

一方、Googleのクッキー内に、セッションIDでもないことがわかっているPREF=IDという変なものがあるなぁという気分がしていたのは、いつからかわかりませんけれど、かなり前からです。Cookieの中身を見る癖はありませんが(笑)セキュリティ系の記事を探し回れば何かわかるのかもしれません。…でも私、そのような根性ないなぁ。

23/Jun/2004において、PREF=IDがcookie中にあったことは、Web Security and Mobile Codeで判明しています。もう少し昔のデータはないものかなぁ。ん?October 17, 2003 の記事がありました。BLOGKID: Google PageRankがそれ。Jan 7, 2002 にもあやしげなものが。古くからなのですね(汗)。CAUTION: PRmaster sends unique ID to Google……ふう。2002年までは遡れるわけですね。

なお、■SecuLog - Googleによるユーザ行動追跡には興味深い指摘が。Googleのプライバシーポリシー関連が微妙だというお話と、お仲間のYahooが中国警察に反体制者の個人情報を自発的にタレこんでいる?関連のお話があります。…今回の件、想像以上に嫌な風味がしてきました。