designed by www.qrone.org
January
2009
Su Mo Tu We Th Fr Sa
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
INFOMATION
- 自己紹介
- マイミク申請はお気軽に:-)
- いまいち使い方がわかりません
- 気になるURLをクリップ
- Awstats を使っています
RECENT ENTRIES
CATEGORIES
MONTHLY ARCHIVES
HATENA BOOKMARK
BLOG PET
LICENCE
CONTACT
shin at windy dot ac
2004年11月25日
[もぶろげっと]広告画像が鬱陶しいです。なんとかしてください。 このエントリーを含むはてなブックマーク

たとえばこんなのとか。

497.html.dat_0.jpg
http://ad.a8.net/svt/bgt?aid=040823492297&wid=001&
eno=01&mid=s00000000335002015000&mc=1&.gif

この種の広告画像はノイズにしかならないのでもちろん排除したいのだが、どうやって排除するかは難しい問題だ。画像の中身を見て画像工学的にあれこれするというのは容易ではないので、必然、URLからフィルタリングをしようということになる。ここで、どれくらい厳しい基準を適用するかどうかで悩む。

基準として考えられるのはだいたいこれくらいか。

  • そのblogのディレクトリ内に置かれている画像のみを対象とする
  • 広告画像にはほとんどのケースでユーザID(?)が付加されている。なのでURLに'?'や'&'が含まれるものをはじく
  • ブラックリスト(業者のドメイン名のリスト)を持っておき、URLとブラックリストを照合してリストに該当するものをはじく

1つ目のは広告をほぼ完璧に排除できるのだが、ちょっと厳しすぎる。取るべき画像をかなり取り落とすことになるのでやりたくない。3つ目のはブラックリストのメンテナンスが面倒なのでやだ。というわけで今のところ2つ目のやり方で対応している。なにか良いアイディアがあったらお寄せ下さいませ。

トラックバック URL :
http://windy.ac/mt/mt-tb.cgi/1010
名前 :

URL :

コメント :

今日の井原. Since 2003.11.12 by Ihara
614 Entries - 0 Comments