designed by www.qrone.org
January
2009
Su Mo Tu We Th Fr Sa
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
INFOMATION
- 自己紹介
- マイミク申請はお気軽に:-)
- いまいち使い方がわかりません
- 気になるURLをクリップ
- Awstats を使っています
RECENT ENTRIES
CATEGORIES
MONTHLY ARCHIVES
HATENA BOOKMARK
BLOG PET
LICENCE
CONTACT
shin at windy dot ac
2005年2月11日
awstatsでのreferer spamに対処する このエントリーを含むはてなブックマーク

「今日の井原」では、アクセス解析にawstatというオープンソースソフトウェアを使っている。とても高性能で機能的には文句がない。しかし、最近目に付くようになったのがリファラによるスパムだ。下は「今日の井原」の解析結果のリファラ一覧なのだが、スパムなURLが上位にランクインしていて面白くない。

refererspam.PNG

"crescentarian.net"とか"terashells.com"とか含まれるものがリファラスパムによるもの。こんなサイトからリンクされたことはない。blogや掲示板のようなサイトにはリファラを表示するものが多く(たとえばtDiaryの「本日のリンク元」のように)、リンクが増えることによるSEO効果を目的として行っているのだと思われる。ほんとうに鬱陶しい。spammerは悉く死んで欲しい。

スパムなURLが表示されるのは面白くないので、対策をすることにした。以前コメントスパムに対処したときには、「全角文字を一つも含まないコメントを弾く」という日本語サイトならではのやり方が使えたのだが、このやり方はリファラスパムには使えない。URLには全角文字なんて普通つかわないし。

世間一般ではどのようにしているのか調べたところ、どうもブラックリストを作ってそこに載っているものを集計の対象から外すという、手間の掛かる方法を採る以外には無いようだ。SourceForgeでawstats用のリファラ対策パッチが公開されていたので、今回はこれを使わせていただいた。

 

パッチの当て方を書いておく。

まずはパッチをダウンロード。awstatsの本体(awstats.pl)の存在するディレクトリにパッチを置いて、patchコマンドを実行する。

# patch -b awstats.pl blacklist.patch.txt

続いてブラックリストを取ってくる。以下のURLにある。
http://www.jayallen.org/comment_spam/blacklist.txt

最後にブラックリストの場所を設定ファイルで指定して完了。以下のように追記する。

RefererBlacklist="/path/to/blacklist.txt"
 

以上で完了だが、注意する点がある。リファラスパムの除去は解析データの作成時に行われる。なので、すでに解析したデータからリファラスパムを除去するには、データを作り直す必要がある。

トラックバック URL :
http://windy.ac/mt/mt-tb.cgi/1031
名前 :

URL :

コメント :

今日の井原. Since 2003.11.12 by Ihara
614 Entries - 0 Comments