| Su | Mo | Tu | We | Th | Fr | Sa |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | ||||
| 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 11 | 12 | 13 | 14 | 15 | 16 | 17 |
| 18 | 19 | 20 | 21 | 22 | 23 | 24 |
| 25 | 26 | 27 | 28 | 29 | 30 | 31 |
たとえばこいつら。リンクは貼らないのでお手数ですがこぴぺしてください。
http://course1.blogspot.com/
http://personal3.blogspot.com/
一目してヘンだと思うだろう。定型的で同じような記事ばかりをひたすら書いている。これらのblogは人間が書いているのではない。プログラムによって自動的に作られ、記事が投稿されている。このようなblogを指して"fake blog"と呼ぶ。人間の手はまったく入らない。blogの作成から記事の投稿まですべて自動化されているらしい。
なぜこんなものを作るのかというと、もちろん大量のリンクを貼ることによるSEO効果を狙っている。なんというか、spammerは生きていても人様に迷惑をかけるだけなので死んだ方が世の中のためになるとおもう。googleやyahooがこんなものに騙されるのかと思うが、実際に自然言語処理やその他のテクニックでfake blogを識別しようとすると容易ではないとおもう。このアホの子がちょっと考えたくらいでは、うまいやり方は思いつかない。
この話題も一つ前のエントリと同じく、下にリンクした記事から知った。記事によると、technoratiではすでに9割のfake blogをインデックスから追放したという。どうやったのかが気になる。
State of The Blogosphere, March 2005, Part 1: Growth of Blogs
http://www.sifry.com/alerts/archives/000298.html

