August 19, 2004
世界のWebアーカイブの状況(via P2P today氏)
オーストラリア国立図書館がまとめた、世界のWebアーカイブの状況についてのドキュメント。
PADI - Web archiving
http://www.nla.gov.au/padi/topics/92.html
英文な上にやや長いんで、読みながら作ったメモを貼り付けておきます。あまり参考にはならないとおもいますが。
Web archiving
1. このドキュメントの目的
WWW(World Wide Web)の出現によって、云々。比較的どうでもいいので省く。
2. Web archivingの諸モデル
・ぜんぶ丸ごと(Whole domain)
WWWにあるリソースの一切合切をarchivingする。有名なものとしては『Internet Archive(http://www.archive.org/)』がある。
・特定の部分だけ(Selective)
なんらかの特定の基準によって、WWWのある一部分だけをarchivingする。基準としては、リソースの重要性や質の高さ、その扱う話題などが考えられる。
・あるテーマだけ(Thematic)
ある特定の話題やイベントに関するリソースだけをarchivingする。
・デポジット(Deposit)
publishersによってリソースがdepositされる。たぶん青空文庫のような形態を指しているのだと思うがよくわからない。
・ごちゃまぜ(Combined approaches)
上に挙げたものの複合。あるいはまったく新しいアプローチ。
3. ケーススタディ
各国の状況を良くまとめてある。全体的な傾向としては、各国とも、自国のWebリソースをarchivingしておきたいという欲求をわりと持っていて、数多くのプロジェクトが立ち上がっている。その際には、googleの如きロボット型検索エンジンのような、リンクを辿って手当たり次第にリソースを集めてくるというようなものではなく、もうちょっと丁寧なやり方をすることが多いようだ。
新しいアプローチのなかで今後盛り上がってくると思われるのはtopic-basedなものだと思われる。「WWWがこれからますます巨大かつ複雑になっていくと、まるごとarchivingするのは不可能になるだろう」と米国議会図書館のなかの人も言っているそうな。この点について言えば、もうすでに手に負えなくなっているという感じもするが。
日本では国立国会図書館がWARP(http://warp.ndl.go.jp/WARP_Intro.html)というプロジェクトをやっている。知らなかった。手続きの流れが面白い。「推薦または選定」が必要なんだ。

たしかにこれを見ると、電通大のWebサイトがまるごと保存されている。
http://warp.ndl.go.jp/REPOSWP/000000002149/
00000000000006977/www.uec.ac.jp/index.html
大学のオフィシャルサイトなんぞを大事に保存してどうするのかという気はするな。国立国会図書館が扱うからには大切にされて長期間保存されていくのだとおもうが、果たしてこれが後世に残していくべき貴重な情報なのかと考えるといまいち疑問だ。どちらかというと小倉優子のblogを保存したほうがみんなの役に立つような気がするかも。
Trackback
You can ping this entry by using http://windy.ac/MT/mt-tb.cgi/510 .
