designed by www.qrone.org
January
2009
Su Mo Tu We Th Fr Sa
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
INFOMATION
- 自己紹介
- マイミク申請はお気軽に:-)
- いまいち使い方がわかりません
- 気になるURLをクリップ
- Awstats を使っています
RECENT ENTRIES
CATEGORIES
MONTHLY ARCHIVES
HATENA BOOKMARK
BLOG PET
LICENCE
CONTACT
shin at windy dot ac
2004年12月31日
OmniFind: IBMの情報検索プラットフォーム このエントリーを含むはてなブックマーク

OmniFindは、IBMが作っている情報検索プラットフォームである。IBMの日本語Webサイトに、関連資料が置いてあるのを見つけたのでざっと目を通してみた。

~DB2 II OmniFind~ オンデマンド時代の情報検索術
http://www-6.ibm.com/jp/software/data/events/omnifind.html

なかなか面白い。ざっくりとまとめると、エクセルとかメールのデータとかイントラネットのWebサーバとか、幅広いデータを対象として、横断的な検索を提供する。で、より高度なテキストマイニングをするためのフレームワークとしても使える。特に企業だと、部門内、あるいは全社的という規模で情報を統合・検索したいというニーズがあるらしくて、そこを狙っての製品らしい。

この資料では技術的に深い部分にはあまり踏み込んでいないが、それでもいくつか興味を惹く箇所が見付かる。Webとローカルとの統合を強く意識しており、クローラはWebだけを対象とするのではなく、たとえばローカルPCのファイルシステムを相手に情報を収集してくる機能を含んでいる。様々な文書フォーマットを中間的なテキスト・フォーマットに変換するためのコンポーネントを『パーサー& トークナイザー』として独立させている。if-then式の条件式をベースとした分類機能がある。他言語サポートもばっちり(らしい)。

namazuあたりと比べると格段の進歩がある。こういう方向性に進んでいくのもありなのか。

トラックバック URL :
http://windy.ac/mt/mt-tb.cgi/1018
名前 :

URL :

コメント :

今日の井原. Since 2003.11.12 by Ihara
614 Entries - 0 Comments