designed by www.qrone.org
January
2009
Su Mo Tu We Th Fr Sa
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
INFOMATION
- 自己紹介
- マイミク申請はお気軽に:-)
- いまいち使い方がわかりません
- 気になるURLをクリップ
- Awstats を使っています
RECENT ENTRIES
CATEGORIES
MONTHLY ARCHIVES
HATENA BOOKMARK
BLOG PET
LICENCE
CONTACT
shin at windy dot ac
2006年5月30日
SAGOOL: 人の主観・興味を反映した検索結果を提示する国産検索エンジン このエントリーを含むはてなブックマーク

 

sagool.gif

 

 SAGOOLは、チームラボビジネスディベロップメントによって開発されている検索エンジンです。「より主観的なものを大事にした、豊かな検索体験を提供すること」を売りにしており、SAGOOLのWebサイトによると、

新型検索エンジン「SAGOOL」は、独自のアルゴリズム“オモロアルゴリズム”の開発に成功し、Googleに代表される“Webサイトへのリンク数に重きが置かれるロボット型検索エンジン”では抽出することがだんだんに難しくなってきた 「人の主観・興味を反映した検索結果」を抽出することを目指しています。

とのこと。「オモロアルゴリズム」の詳細は明らかにされておらず、「人の主観・興味を反映した検索結果」を抽出することにどれだけ成功しているか判断するのは難しいです。たとえば「横浜市」で検索したときに、横浜市のWebサイトではなく「さるさる日記 - 元挌闘家!戦う横浜市の便利屋!鴨居長太郎!」がトップに表示されるのは確かに面白いのですが、これがオモロアルゴリズムの成果なのかというとそれが良く分からず、単にインデックス数の少なさとスコアリングアルゴリズムの弱さから生まれた偶然なのではないかとも思えます。

 

 ざっと使ってみて感じた点としては、

 1.インデックス数が少ない
 googleとSAGOOLで、適当に選んだ日本語のキーワードで検索し、結果結果の数を比較すると、100程度の差が見られます。たとえば「東京都」で検索した場合、googleの約40,700,000件に対しSAGOOLは561,212件。「萌え」ではgoogleの約16,000,000件に対しSAGOOLは126,983件、などなど。これくらいインデックス数に差があると、検索結果の品質にも響いてくると思われ、インデックス数の増加が求められるところです。

 2.言語の切り分けが出来ていない
 「google」で検索したときにwww.google.co.jpではなくwww.google.comが、「Java」で検索したときにwww.java.com/jaではなくwww.java.comがトップに来るなど、言語の切り分けが十分に出来ていない例が見られます。たぶん日本語圏のユーザに特化して作っていると思うのですが、だとしたらあまり好ましくありません。言語の切り分けは難しい問題ですが、もうちょっと精度を上げて欲しい。

 3.blogの記事やはてなブックマークのページが上位に多く入ってくる
 ……ような気がする。定量的に確認したわけではないけど。何でだろう。

といったところでしょうか。国産モノのロボット型Web検索エンジンは数少ないので頑張って欲しいです。

トラックバック URL :
http://windy.ac/mt/mt-tb.cgi/1238
名前 :

URL :

コメント :

今日の井原. Since 2003.11.12 by Ihara
614 Entries - 0 Comments