| Su | Mo | Tu | We | Th | Fr | Sa |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | ||||
| 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 11 | 12 | 13 | 14 | 15 | 16 | 17 |
| 18 | 19 | 20 | 21 | 22 | 23 | 24 |
| 25 | 26 | 27 | 28 | 29 | 30 | 31 |
情報検索ということを語るときに、最近のblogやニュースサイトを見ると、Google、yahoo、Microsoft(MSN)の名前を挙げた上で、この3社の三つ巴である、というような状況を描くことが多いです。決して間違っているわけではありませんが、純粋に技術的な視野から状況を概観する場合には、ここにIBMを加えなくてはならないと思います。
情報検索(特にWeb検索エンジン)は様々な要素技術の集合体といえるものですが、IBMはそれに必要なすべての要素技術を高い水準で持ち、かつ優秀な研究者と開発者を大量に抱えており、Googleらとその名をに並べられるのに十分な資格があると言えます。
IBMの名前が挙がってこないのは、IBMがもっぱら企業内検索のニーズを相手にしており、一般向けのサービスを提供していないからでしょう。しかし、IBMがその気になれば、いまGoogleらが提供しているのと同等程度のWeb検索エンジンを作るのは、さほど難しいことではないと思われます(もちろん、単にシステムを構築することと、それをビジネスとして成功させることが全くの別物であることは言うまでもありませんが)。
IBMの持つ具体的な製品やプロジェクトにはどんなものがあるのかというと。まず企業向けの情報検索Suite『OmitFind』があります。ファイルシステムやデータベース(DB2)、クローラ、データマイニングツール等々を統合した良い感じのプラットフォームです。とりあえず比較的わかりやすい感じの資料がこのへんに転がってるんで紹介しておきます。また、データベース『DB2』には、『DB2 Text Extender』、『DB2 Net Search Extender』といった検索用途の拡張パッケージがあります。
Web上のデータを対象として大規模なマイニングを行おうという研究プロジェクト『WebFountain』もよく知られています。WebFountainについてはあっちこっちで記事になっているので、これとかこれとかこれとかをご参照のこと。
また、『PIQUANT(Practical Intelligent QUestion ANswering Technology)』という研究プロジェクトがあります。自然言語処理や知識ベース等の要素技術を統合して、テキストの意味的な構造を解析し、非明示的な意味を取りだすことを目指しているらしいです。どうも最終的には質問応答型の検索システムを作ろうとしてるっぽいです。良く分からないけど :-)
実際、IBMとgoogleとを比較したとき、彼らの考えていることはかなりの程度まで一致しており、技術開発としては見事に競合しているという印象を受けます。ビジネスとして両者が競合しないのは、両者のビジネスモデルの差、相手にしているマーケットの差ということなのでしょう。将来、もし彼らが同じフィールドで戦うことになったらどちらに軍配が上がるのか、興味深いところです。

