| Su | Mo | Tu | We | Th | Fr | Sa |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 | 31 |

これから宣伝をしますよ。宣伝を。ええとですね。
研究室の卒研生であるところの早坂君が、「オープンソースの全文検索エンジンの速度性能比較」という題で、3月に工学院大学で開催される情報処理学会全国大会で発表します。5つの主要なオープンソース全文検索エンジン(Namazu, Lucene, Senna, Estraier, Hyper Estraier)について、登録文書数1万件~500万件の範囲での、インデクシング速度および検索速度を測定した結果と、そこから得られた知見を報告します。
日本語が問題なく扱え、かつオープンソースな(というかタダで使える)全文検索エンジンというと、以前はNamazuが圧倒的で、他にはあまり選択肢がないという状況でした。しかし、最近になって、Hyper Estraier、Senna等が新しく公開されるようになり、開発者やWebサイト制作者はどれを選んだら良いか迷ってしまう状況になっています。
少なくとも僕がWebを検索した限りでは、これらの全文検索エンジンに対して、500万件の規模で性能評価をした事例はないように思われます。これらの全文検索エンジンを使っている人、これから使おうと考えている人にとっては、なかなか興味深い報告になると思います。宜しければ、他の発表を見るついでにでも、足をお運び下さいませ。

