designed by www.qrone.org
January
2009
Su Mo Tu We Th Fr Sa
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
INFOMATION
- 自己紹介
- マイミク申請はお気軽に:-)
- いまいち使い方がわかりません
- 気になるURLをクリップ
- Awstats を使っています
RECENT ENTRIES
CATEGORIES
MONTHLY ARCHIVES
HATENA BOOKMARK
BLOG PET
LICENCE
CONTACT
shin at windy dot ac
2005年11月29日
blog検索についてやや後ろ向きに書いてみるよ。 このエントリーを含むはてなブックマーク

ブログ検索が持つビジネスの可能性--CJICイベント
http://japan.cnet.com/news/media/story/0,2000047715,20091229,00.htm

CNETカンファレンス、Blog検索パネル内容の補足
http://blog.japan.cnet.com/watanabe/archives/002450.html

 あたりをつらつらと読んでの所感です。

 

 今のところ、blog検索にはネガティブな印象を抱いています。blog検索エンジンがこれだけ作られているのは、新しく出てきた分野であるためシェアが固まっていないことと、技術的ハードルが低いことによるものと思います。たぶんみんなこう考えているんですよ。「googleには成れないけど、technoratiになら成れる(かも知れない)」って。

 まず、現状のblog検索について、僕の考えるところを述べます。

 google等の一般的なWeb検索がWeb全体を検索対象としているのに対して、blog検索では広大なWebの中からblogだけを検索対象としています。検索対象を相当に絞り込んでいるわけです。通常、検索エンジンを作るにあたって、検索対象を絞り込むというのは、以下のような場合において為されます。

  • ある特定の対象を検索したいという明確な(あるいは潜在的な)要求がある場合
  • 検索対象を絞り込むことによって、検索対象の平均的な質の向上を図る場合
  • 検索対象に特化した特別な検索機能を提供したい場合

 1点目は、検索対象を限定することによって、特定の検索要求を満たすことができることを指します。具体例としては、yahooオークションの出品情報を検索できる「オークション統計ページ(仮)」の検索機能や、2chの書き込みを検索できる「2ちゃんねる検索」を挙げることができます。

 2点目は、取得可能なデータの中から質の高い(と思われる)ものだけを検索対象とする、あるいは、前処理によって、質の低い(と思われる)ものを予め除外することを指します。具体例としては、google等の多くの検索エンジンがやっているアダルトページやスパムページのフィルタリングを挙げることができます。取捨選択によって検索対象を質の高い(と思われる)ものに限定することで、検索結果の質的向上を図ります。
 (ここで、「質」とはそもそも何かというとても難しい問題がありますが、この記事ではひとまず置いておきます。)

 3点目は、検索対象を限定することによって、その検索対象が共通に持つ属性や性質を検索機能に用いることを指します。1点目で挙げた例で言うと、「オークション統計ページ(仮)」では、価格帯や期間を指定して検索することが可能ですし、「2ちゃんねる検索」では本文やスレタイなど、検索する場所を指定することができます。これにより、より使いやすく便利な検索をユーザに提供しています。また、検索対象に特化した検索結果のインタフェースを提供するケースもここに含まれます。

 では、blog検索はこれらの点についてどうでしょうか。

 1点目ですが、みなさんがインターネットを使う中で、「blogに限定して検索したい」と思うことがどれだけあるでしょう。僕にはほとんどありません。また、「こういう場合にblogに限定して検索すると便利だよ」という意見を見ることもあまりありません。

 上で例として挙げた「オークション統計ページ(仮)」にしろ「2ちゃんねる検索」にしろ、検索対象を特定のジャンルに絞り込むことによって、その有用性を担保しています。ここで「ジャンル」という言葉を使うのは少し抽象的すぎるかも知れませんが、換言すると、何らかの共通した内容や用途を持つ対象に限定して検索できるからこそ有用だってことです。たとえば"iPod"と検索したときに、googleならappleのサイトやニュースサイトの記事が出てきてしまうところですが、「オークション統計ページ(仮)」ならiPodのオークション情報だけが出てくる。特定のユーザにとってはそちらの方が嬉しいわけです。

 翻って、blogというのはWebサイトの形態を指す言葉であって、blogに投稿される記事の内容は極めて多様です。他愛もない個人の日記もあり、政治や経済の問題について論じた論説もあり、プログラムのサンプルコードもあります。blogに投稿される記事に何らかの共通した内容や用途があるかというとあまり思いつきません。よく言われるのは速報性や流行への鋭敏性、個人が書いた文章ゆえの評判情報としての価値、といったところですが、それくらいでしょうか。従って、検索対象をblogに限定することそれ自体には、それほど大きな有用性は無いように思われます。

 2点目については、個人が自由に書いた記事であるために、blogに投稿される記事の平均的な質は決して高いとは言えません。加えて、最近ではfake blog(スパム目的のblog)等の問題もあります。また、質の高いページを検索結果の上位に表示するためのスコアリング手法についても、一般的なWeb検索におけるPageRankのような、性能の良いアルゴリズムはまだ登場していないように思われます。よって、この点に関しても、検索対象をblogに限定することに利点があるとは言えません。

 3点目については、technoratiのリンク解析や、ask.jpのpodcast検索など、blog検索においても面白い試みが出てきています。僕の作った「もぶろげっと」の画像検索機能も、一応ここに加えても良いかも知れません。blog画像検索は、もう他にも提供してるところがあるけど。しかし、現状を見るに、ユーザに「なるほど、こういう便利な機能があるなら、blog検索を使おう」と思わせるだけのものはないように思えます。

 つまり、単純に検索対象をblogに限定しただけでは意味がないし、現状を見る限りではblogならでは検索機能もまったく未成熟なのですね。

 

 続いて、ダメだしだけじゃ面白くないので、blog検索の将来について考えるところを述べます。

 今後、blog検索の採りうる方向性(アプローチ)としては幾つか考えられます。まず前提に置きたいのは、単純にblogの記事を集めてきて、全文検索した結果を時刻順で並べて提示するだけのblog検索エンジンには、あまり有用性はないということ。ですから、blog検索エンジンには、さらにその先に踏み込むことが求められていくでしょう。

 まず挙げられるのが、blogから収集してきた大量の記事データを、何らかの切り口から、思い切り縮約してしまうというアプローチです。現在もっとも成功しているのはこれではないかとおもいます。もっとも典型的なものとして、wadaino.jpというサービスを紹介しましょう。wadaino.jpでは、収集してきたblog記事のデータを解析し、短いタイムスパンでもっともリンクされているURLや、本、DVD等のデータをランキング形式で提供しています。blogwatcherのメタブログなどもこれに含めることができます。

 このアプローチの利点として、blogの特性(wadaino.jpであれば、流行への鋭敏性)をうまく活かすことができることと、縮約によってblogに投稿される記事の平均的な質の低さを覆い隠せるということがあります。ただ、このアプローチは検索というニュアンスからはやや外れますが。

 検索の単位を「記事」からより抽象的なレベルへ持ち上げるというアプローチもあります。たとえば「議論」や、「コミュニティ」といった単位で検索したいという要求は、かなり強くあるのではないかという印象を持っています。blogでは、何らかの話題について、複数のblog間で議論が展開していくということが多々見られますし、同じ趣味や話題を持つ人同士が強い結束を持つということも少なくありません。このような、より高レベルな単位での検索をするには、現状ではリンク解析を用いるのがジェネラルなやり方でしょう。しかし、単純なリンク解析を行ったのでは十分な精度を得ることはできません。コメントスパムやトラックバックスパムなどの問題が抜きがたくありますし、関連するページに必ずしも明示的なリンクがなされるとは限らないからです。よりセマンティックな解析をする、何かしら他のデータを援用するなどの方法が考えられますがなかなか容易ではないと思われます。

 また、これはよく言われることですが、パーソナライゼーションというアプローチを挙げることも出来ます。個々人の嗜好に応じて、それにマッチした検索結果を提示することを指してパーソナライゼーションといいます。blog検索は、通常のWeb検索と比べて、検索結果として適切と感じるページの個人差が大きくなります。具体例を挙げましょう。"ソニー"というキーワードで検索したとき、googleやyahooではソニーのWebサイトがトップに表示されます。これに違和感を抱く人は少ないでしょう。あるキーワードに対してどのような検索結果が上位に提示される"べき"かということについて、通常のWeb検索は比較的に一致を見やすいです。では、blog検索ではどうでしょう。"ソニー"で検索したとき、どんなページがトップに表示されるのが適切と思いますか?

 そんなわけで、blog検索においては、パーソナライゼーションが特に有効に働くのではないかと考えることができます。しかし、これも具体的にどうやるんだというと難しいところではありますが。

 他にもアプローチはあると思うのだけど、僕の考えるのはこんなところです。blog検索には確かに可能性はあるとは思うのですが、現状を見るとblog検索がどれだけ進歩して、どれだけ普及していくのかということには疑問を感じています。長くなりましたが、最後まで読んでくれてどうもありがとうございます。ではでは。

トラックバック URL :
http://windy.ac/mt/mt-tb.cgi/1215
名前 :

URL :

コメント :

今日の井原. Since 2003.11.12 by Ihara
614 Entries - 0 Comments