designed by www.qrone.org
January
2009
Su Mo Tu We Th Fr Sa
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
INFOMATION
- 自己紹介
- マイミク申請はお気軽に:-)
- いまいち使い方がわかりません
- 気になるURLをクリップ
- Awstats を使っています
RECENT ENTRIES
CATEGORIES
MONTHLY ARCHIVES
HATENA BOOKMARK
BLOG PET
LICENCE
CONTACT
shin at windy dot ac
2004年6月 9日
spidering hacks このエントリーを含むはてなブックマーク

spideringhacks.jpg

spidering hacks』はWeb上のコンテンツを取得したり加工したりするためのテクニックを集めた本だ。和訳が出たのでさっそくgetしたのだが、評判に違わぬ面白さ。

この本の良いところは、テクニックを単に適当にジャンル分けして羅列するのではなく(もちろんそういう本がダメだってわけじゃないが)、頭から読めば、きちんと段階を踏んでspider作りのノウハウを学んでいけるようになっているところだ。まずspiderとしてのマナー(robots.txtを遵守すべきことや、必要以上に相手のサーバに負担を掛けないこと)について触れ、続いてlib-www-perl や WWW::Mechanizeといったライブラリの使い方を説明し、実践的なテクニックの紹介に移るという流れになっているのだが、これはよくできた構成だとおもふ。

amazonやgoogleの提供しているAPIや、RSSの利用など、新しめの事柄もちゃんとフォローされているのも良い。言語やライブラリを選ばず、適材適所に使い分けるという思想も宜しい(掲載されているコードの多くはperlだが、他にjava, python, PHPが使われている)。すべてのソースコードをダウンロードできるようになってるのも偉い。それにしてもCPANはすごいなぁ。

トラックバック URL :
http://windy.ac/mt/mt-tb.cgi/773
名前 :

URL :

コメント :

今日の井原. Since 2003.11.12 by Ihara
614 Entries - 0 Comments