Webビーコンとは、例えば1x1のGif「画像」などを用いて、主にネット利用者の動向を調査する技術。この「画像」を利用することで、複数のサーバーを跨いでユーザーの動向を調査することが可能。

一時は非常に嫌われ、画像をOFFにしてブラウジングしたり、閲覧は殆どオフラインで行ったりする人も多くいました。今ではそんな事をする人は殆どいませんが、Webビーコンの仕込まれたWebページは昔より非常に増え、、、というかWebビーコンだらけの時代になってます。

このサイトにサーバーインストールタイプのアクセス解析を導入した事で、Webビーコンがどのような仕組みで作動しているかが何となく分かってきました。

たかが画像と侮っていましたが、結構色々収集出来てしまいます。
自分が分かるようになった部分だけでも、ここにまとめてみます。

(まだまだ勉強不足で間違った情報があるかも知れませんが、そんな部分には容赦なくツッコミ入れてもらえると嬉しいです)

どこで使われている?

  1. 主にWebページやメールの画像に使われている。
    1x1サイズの透明Gifがよく使われている。
  2. ブログやWebサイトに設置してあるアクセス解析ツールなども、(JavaScriptを利用するものでも)このWebビーコンの一種です。

アクセス解析を導入して収集できるデータ = Webビーコンが収集できるデータ
と考えて差し支えないと思います。
※ JavaScriptを利用しない場合は、収集できるデータは少なめ。
   画像として表示されるタイプのものは、サーバー側でのみプログラムが動いていて、閲覧しているPC側で何かプログラムが動く事も無い

どんな情報を収集していくの?

レンタルタイプの無料アクセス解析ツールも多く存在しているので、そのサンプルを覗くと収集できるデータがどんなものかが分かると思います・

例:忍者アクセス解析 (アクセス解析サンプルから収集情報の閲覧可能)

  1. IPアドレス、プロバイダホスト名、
  2. 閲覧時刻
  3. 閲覧時間
  4. 閲覧したURL
  5. リファラ(そのページの参照元)が分かる。検索してきた場合、検索ワードも調査可能。
  6. Cookieの発行も可能?
  7. JavaScriptを利用すると可能になるもの
    • 利用しているブラウザの種類
    • モニタの解像度

他にも色々と取得できるデータはあるかも知れないけれど、やり過ぎるとセキュリティソフトやブラウザが警告を出して来る。または遮断してくれる。なので普通はこれ以上のデータは収集して来ない。(逆に言うと、セキュリティの甘いPCはこれ以上の情報も収集されているかも)

例えばアフィリエイト大手のリンクシェアのWebビーコンは(何が原因かは分かりませんが)一部機能が多くのブラウザ、セキュリティツールで遮断される様に設計されています。

スポンサー リンク

上記情報で分かること

データベース化を行い、高度な解析ツールを利用する事で、様々な推測が可能。

IPアドレスによって、大まかな所在地まで特定可能。プロバイダによっては、県名まで特定可能。
同じIPで閲覧時刻を集めることで、ユーザーの年齢・性別を推測可能
(昼12時と17時が多い・・・・職場
 9~10時、14時~16時が多い・・・主婦
 20時~21時が多い・・・小・中学生、または女性層
 21時~24時が多い・・・大学生~社会人、主に男性
 などなど)
複数のサーバーにまたがって調査できる場合、URLその利用者の好みを推測できる。
Cookieの発行により、利用者のWebページ利用の追跡

主にWeb広告業者がそのPCに最適な広告を表示したり、効果の高い広告を調べたりするのに使います。

収集できないデータ

  1. 利用者の氏名とか正確な住所
  2. メールアドレス
  3. 電話番号

決定的に個人を特定できるような仕組みはありません。

追記:ビーコンを悪用する場合の方法は?

参考サイト
Webビーコンによるアクセス情報収集 - ぱふぅ家のホームページ
上記ページにWebビーコンの仕組み、ページ下部のリンクから考えられる悪用方法などの解説リンクが貼ってあります。メールにWebビーコンが仕込まれている場合などは、アドレス流出の危険もありますね。。。

Webビーコンの仕組み

画像を表示させただけじゃ、大した情報は取れないよね?
と思っていたら大間違い。Webビーコンは画像のフリをしたcgiとかphpプログラムです。
そんなWebビーコンは以下のような仕組みで作動しています。

Webビーコン発行元のサーバーで、.htaccessに以下の記述

AddHandler myphp-script .php .gif
#こんな風に記載したサーバーでは、GIF画像をphpプログラムとして作動させる事が出来ます。

RewriteEngine on
RewriteCond %{REQUEST_FILENAME} !-f
RewriteRule detail/([0-9a-z]+)\.gif$ /XXXX.php?id=$1
#こんな風に記述すると、gifにアクセスがあった場合はXXXX.phpにリダイレクトできる

そして、上記のような設定をしたサーバーでGIFやphp(cgiでも可)で、

#phpの例。cgiの場合書式は全然違う
<?php
//
//ここに様々な解析用のプログラムを書いて
//
header('Content-Type: image/gif');
// これはGIF画像ですよと宣言して
header('Expires: Mon, 26 Jul 1997 05:00:00 GMT');
header('Last-Modified: ' . gmdate('D, d M Y H:i:s') . ' GMT');
header('Pragma: no-cache');
header('Cache-Control: no-store, no-cache, must-revalidate');
header('Cache-Control: post-check=0, pre-check=0', false);
//その他のヘッダ情報も調整したい場合とか、色々書いて
echo base64_decode("R0lGODlhAQABAIAAAP///wAAACH5BAEAAAAALAAAAAABAAEAAAICRAEAOw==");
//画像のダミーデータを表示
?>

このように記載すれば、画像一つ表示させただけで、その先のサーバーでは色んな解析が可能。だけどWeb閲覧者には「小さな画像がある」または「透明なので画像がある事すら解らない」ぐらいにしか認識できない。

ここから先を詳しく理解しようと思うと、今の私には相当時間のかかるお話なのでこれでおしまい。

でも、ここまで分かっただけで満足。
JavaScriptを利用していない場合は大したデータは取れないけれど、大手広告会社のWebビーコンは様々なサイトに挿入されているので、そういったデータを上手く管理していけば非常に効率的な広告ページを表示する事が可能なのだ。

どこの誰かは解らないけれど、IPアドレスxxx.xxx.xxx.xxxのユーザーはどんな時間に、どんなページを見ているか、は丸分かり。
(↑ 一応補足:大手の広告会社は1日何百万というアクセスを計測しているので、個人を追跡するなんてまずあり得ない。統計を取っているだけ)
「コレ位平気」と思うか「気持ち悪い」と思うか、判断が分かれる微妙なラインですね(^_^;