| Su | Mo | Tu | We | Th | Fr | Sa |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | ||||
| 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 11 | 12 | 13 | 14 | 15 | 16 | 17 |
| 18 | 19 | 20 | 21 | 22 | 23 | 24 |
| 25 | 26 | 27 | 28 | 29 | 30 | 31 |
これから宣伝をしますよ。宣伝を。ええとですね。
研究室の卒研生であるところの松田さんが、卒業研究として開発した「CatchPhraser(きゃっちふれいざー)」というシステムを公開しました。CatchPhraserはblogを対象とした検索エンジンです。blog記事の内容を反映したキャッチコピーを自動生成し、検索結果に出力します。 キャッチコピーの表示によって、blogを検索するという行為自体が楽しみとなるようなシステムを目指しています。
通常、Web検索エンジンの検索結果には、そのWebページのスニペット(要約)が表示されます。スニペットの作成には、検索キーワードの周辺部分を取り出すKWIC(KeyWord In Content)という手法が使われることが多いです。GoogleやYahooもKWICを使っていますね。
KWICは有効性の高い手法ですが、問題が無いわけではありません。取り出された周辺部分が意味を成す文とならないことも多いですし、文字数が多く内容を理解するのに手間が掛かります。そこでスニペットとしてキャッチコピーを表示してみたらどうか、というわけです。
CatchPharaserでは、キャッチコピーを「人の注意を惹くように工夫が凝らされた、簡潔な文章」と規定しています。KWICの代わりに、Webページ(blog記事)を解析して作られたキャッチコピーを表示することで、表示される文字数を削減しユーザの負担を軽減する、エンタテインメント性を付加し検索行為自体の面白味を増加させる、といった効果を狙っています。
下図がCatchPharaserの検索結果例です。
というわけで、どうぞ興味を惹かれたなら触ってみてください。表示されるキャッチコピーの質はまだあまり高くない(と思う)のですが、他のblog検索エンジンにはない使用感はあると思います。また、キャッチコピーを生成するのに独自に作成した辞書を使っているのですが、現状、辞書には食べ物関連の語彙しか登録されていません。ですので、食べ物に関連するようなキーワードで検索していただけると、真価を発揮してくれるはずです。
CatchPhraser(きゃっちふれいざー)
http://cp.seman.cs.uec.ac.jp/index.html




いやね、ぼくも常々思っていたんですよ。AdWordsをgoogleの検索結果にだけ表示させておくのは勿体ないって!
Valleywag: Remainders: Polystyrene cups > free lunch
http://www.valleywag.com/tech/remainders/remainders-polystyrene-cups-free-lunch-152203.php

Koizuka(戀塚)'s MovableType blog: Cマガジン休刊の正式連絡
http://www.koizuka.jp/~koizuka/movabletype/archives/000256.html
2週間遅れで話題にしてすんません。しかし、先日の日経バイト休刊に続いてCマガジンまで。高校生の頃から読み始め、途中断続的に購読しない時期があったものの8年くらいのつき合いになります。プログラミング中級者が広く薄い教養を身につけるのに最適な雑誌でした。それにしても、ここ数年でベーシックマガジン、TeckWin、.NETテクノロジー、MSDN Magazine等々と立て続けに休刊に追い込まれており、情報技術の専門誌がいかに厳しい状況にあるかを察することができます。最後には日経コンピュータのような如何にも業界紙といった風の雑誌しか残らないのかも。
やはりWebに喰われたのが最も大きな原因なのだと思いますが、雑誌の持つ「編集」の機能をWebが十分に代替できるかは疑問で、こうやって技術雑誌がどんどん無くなっていく状況はあまり好ましくないと感じます。残念でなりません。
