| Su | Mo | Tu | We | Th | Fr | Sa |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | ||||
| 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 11 | 12 | 13 | 14 | 15 | 16 | 17 |
| 18 | 19 | 20 | 21 | 22 | 23 | 24 |
| 25 | 26 | 27 | 28 | 29 | 30 | 31 |
OmniFindは、IBMが作っている情報検索プラットフォームである。IBMの日本語Webサイトに、関連資料が置いてあるのを見つけたのでざっと目を通してみた。
~DB2 II OmniFind~ オンデマンド時代の情報検索術
http://www-6.ibm.com/jp/software/data/events/omnifind.html
なかなか面白い。ざっくりとまとめると、エクセルとかメールのデータとかイントラネットのWebサーバとか、幅広いデータを対象として、横断的な検索を提供する。で、より高度なテキストマイニングをするためのフレームワークとしても使える。特に企業だと、部門内、あるいは全社的という規模で情報を統合・検索したいというニーズがあるらしくて、そこを狙っての製品らしい。
この資料では技術的に深い部分にはあまり踏み込んでいないが、それでもいくつか興味を惹く箇所が見付かる。Webとローカルとの統合を強く意識しており、クローラはWebだけを対象とするのではなく、たとえばローカルPCのファイルシステムを相手に情報を収集してくる機能を含んでいる。様々な文書フォーマットを中間的なテキスト・フォーマットに変換するためのコンポーネントを『パーサー& トークナイザー』として独立させている。if-then式の条件式をベースとした分類機能がある。他言語サポートもばっちり(らしい)。
namazuあたりと比べると格段の進歩がある。こういう方向性に進んでいくのもありなのか。

