December 31, 2004

OmniFind: IBMの情報検索プラットフォーム

Posted at December 31, 2004 05:19 PM in .

OmniFindは、IBMが作っている情報検索プラットフォームである。IBMの日本語Webサイトに、関連資料が置いてあるのを見つけたのでざっと目を通してみた。

〜DB2 II OmniFind〜 オンデマンド時代の情報検索術
http://www-6.ibm.com/jp/software/data/events/omnifind.html

なかなか面白い。ざっくりとまとめると、エクセルとかメールのデータとかイントラネットのWebサーバとか、幅広いデータを対象として、横断的な検索を提供する。で、より高度なテキストマイニングをするためのフレームワークとしても使える。特に企業だと、部門内、あるいは全社的という規模で情報を統合・検索したいというニーズがあるらしくて、そこを狙っての製品らしい。

この資料では技術的に深い部分にはあまり踏み込んでいないが、それでもいくつか興味を惹く箇所が見付かる。Webとローカルとの統合を強く意識しており、クローラはWebだけを対象とするのではなく、たとえばローカルPCのファイルシステムを相手に情報を収集してくる機能を含んでいる。様々な文書フォーマットを中間的なテキスト・フォーマットに変換するためのコンポーネントを『パーサー& トークナイザー』として独立させている。if-then式の条件式をベースとした分類機能がある。他言語サポートもばっちり(らしい)。

namazuあたりと比べると格段の進歩がある。こういう方向性に進んでいくのもありなのか。



Trackback

You can ping this entry by using http://windy.ac/MT/mt-tb.cgi/679 .

Comments

ていうか、namazuは作者が認めてるとおり、作られた時点で古くさいシステムだった訳で……

Posted by reservoir at January 1, 2005 06:31 PM

まー、たしかに。
namazuは偉大だとおもうけれど、
もうそろそろ取って代わられても良い時期なのでは。

次のスタンダードは何?

Posted by ぶでいぬ(井原) at January 1, 2005 08:45 PM

Post a comment










Remember personal info?