July 23, 2004
ISEC(セマンティック・コンピューティング研究開発機構)のドキュメントを読んでみた
ISECというNPO法人がある。正式名称は「セマンティック・コンピューティング研究開発機構」。URLはhttp://instsec.org/。設立に至った経緯とかはここに書いてある。
この間のゼミでプロフェッサー・ONAIが、ブラウザでこのURLを開いて、「手前らここにあるドキュメントを読んでおきやがれ、このちんすこう野郎(※意訳)」と仰せになったので、とりあえず読むだけ読んでみた。
いまのところISECのWebサイトでは、3つのpdfドキュメントが公開されている。所在はここ。「セマンティックコンピューティング計画」ではISECの掲げる目標や、SeC計画なるものの概要について述べられている。「SeC計画が実現する知の機能」ではSeC計画の中核をなす"C-L"というコンテンツ記述言語の概要について、「C-L(概念言語)とC-Lシステムの設計と開発」ではC-Lの技術的/理論的背景とその応用について述べられている。
概要をまとめる。簡便のため、ISECで提供されているドキュメントについて、それぞれ以下のように表記する。
光……「セマンティックコンピューティング計画」
海……「SeC計画が実現する知の機能」
風……「C-L(概念言語)とC-Lシステムの設計と開発」
由来は……まああれなんですが、どうでも良いことなのでいちいち説明しません。
で。
SeC計画(ISECがこれから推し進めようとしているプロジェクトの名前)は、Semantic Webの成果を取り入れ、それをさらに発展させるものであるという。Semantic Webはコンテンツにメタデータを付与するものだが、SeC計画では「コンテンツ本体の概念構造の記述」を行う(なんだそりゃ)ことを目的とするという(風, p5)。それを指して、"Semantic Computing"という言葉をつくっている。(光, p2)。また、計画の目標について次のように設定している。
SeC計画においては、「概念」を扱うための言語とソフトウェアシステム、すなわち、概念言語と概念言語システムの研究開発をすべての土台とする(光, p4)
そのためにSeC計画で開発しようとしているのが、C-Lという概念言語だ。このC-Lについては風の中で専門的な議論がなされているのだが、どうもぼくの知識不足のためにいまいち理解しきれない。分かる範囲でまとめる。
C-Lにおける概念は、実体(実体概念)と関係(関係概念)からなる(風, p8)。また、実体をノード、関係をエッジとして、概念構造をネットワーク構造で表現する(風, p4)。ここで、このネットワーク構造が「パイパー有向グラフ」であると述べられているのだが、ハイパー有向グラフってのが何のことかは分かりません。ぐぐってもヒットしないし。ハイパーって何がハイパーなんだろ。まあいいや。概念構造をグラフで表現するというのはRDF+OWLといっしょですな。
推論機構としては論理プログラミングを採用するらしい(風, p12)。論理プログラミングというとPrologくらいしか思い浮かばないしPrologに関して何を知っているというわけでもなく、それ自体の是非については鑑定できない。論理プログラミングについては
論理プログラミング、あるいは、論理プログラミング言語は、1980 年代に日本の主導 により、大きな盛り上がりを見せたが、1990 年代には、対抗するような形で色々な推論 系やAI アルゴリズムが提案されるのと同時に、AI ブームが去るなかで、取組む人々が急 減していった。しかしながら、この十年間も、ヨーロッパを中心に着実な蓄積が行われ、 再評価の動きが始まっている。(風, p12)
と述べられている。再評価が始まっているなんて初めて聞いた。
また、コンテンツへのメタデータの付与について、
そこで、アノテーションという人手による仲介が必要である(風, p14)。
と、あっさりと片づけてしまっていることが気になる。Semantic Webへの批判のなかでもっとも大きいものの一つが「メタデータをどうやって付与するんだ」というもので、つまりアノテーションを自動的に付与するには現在の技術水準はそこまで達していないし、人手でやるにはコストが大きすぎるんじゃないかというわけだが、これに対するソリューションを何も考えていないのだとしたら少し甘いのではないかという感じがする。
(続く)
Trackback
You can ping this entry by using http://windy.ac/MT/mt-tb.cgi/462 .
