February 11, 2005

awstatsでのreferer spamに対処する

Posted at February 11, 2005 09:08 AM in .

「今日の井原」では、アクセス解析にawstatというオープンソースソフトウェアを使っている。とても高性能で機能的には文句がない。しかし、最近目に付くようになったのがリファラによるスパムだ。下は「今日の井原」の解析結果のリファラ一覧なのだが、スパムなURLが上位にランクインしていて面白くない。

refererspam.PNG

"crescentarian.net"とか"terashells.com"とか含まれるものがリファラスパムによるもの。こんなサイトからリンクされたことはない。blogや掲示板のようなサイトにはリファラを表示するものが多く(たとえばtDiaryの「本日のリンク元」のように)、リンクが増えることによるSEO効果を目的として行っているのだと思われる。ほんとうに鬱陶しい。spammerは悉く死んで欲しい。

スパムなURLが表示されるのは面白くないので、対策をすることにした。以前コメントスパムに対処したときには、「全角文字を一つも含まないコメントを弾く」という日本語サイトならではのやり方が使えたのだが、このやり方はリファラスパムには使えない。URLには全角文字なんて普通つかわないし。

世間一般ではどのようにしているのか調べたところ、どうもブラックリストを作ってそこに載っているものを集計の対象から外すという、手間の掛かる方法を採る以外には無いようだ。SourceForgeでawstats用のリファラ対策パッチが公開されていたので、今回はこれを使わせていただいた。

 

パッチの当て方を書いておく。

まずはパッチをダウンロード。awstatsの本体(awstats.pl)の存在するディレクトリにパッチを置いて、patchコマンドを実行する。

# patch -b awstats.pl blacklist.patch.txt

続いてブラックリストを取ってくる。以下のURLにある。
http://www.jayallen.org/comment_spam/blacklist.txt

最後にブラックリストの場所を設定ファイルで指定して完了。以下のように追記する。

RefererBlacklist="/path/to/blacklist.txt"
 

以上で完了だが、注意する点がある。リファラスパムの除去は解析データの作成時に行われる。なので、すでに解析したデータからリファラスパムを除去するには、データを作り直す必要がある。



Trackback

You can ping this entry by using http://windy.ac/MT/mt-tb.cgi/704 .

 スパムにもさまざまな種類があって、blogであればコメントスパムやトラックバックスパムが存在するわけですが、リファラースパムと呼ばれるものもあるようです。恥ずかしながら、自分がその目に遭ってみるまで...

Trackbacked from お返しを要求されるプレゼントに、真心はあるのかい? on Blogになった Diary from Flower Park....

Comments

Post a comment










Remember personal info?