August 19, 2004

世界のWebアーカイブの状況(via P2P today氏)

Posted at August 19, 2004 10:25 PM in .

オーストラリア国立図書館がまとめた、世界のWebアーカイブの状況についてのドキュメント。

PADI - Web archiving
http://www.nla.gov.au/padi/topics/92.html

 

英文な上にやや長いんで、読みながら作ったメモを貼り付けておきます。あまり参考にはならないとおもいますが。


Web archiving

1. このドキュメントの目的

WWW(World Wide Web)の出現によって、云々。比較的どうでもいいので省く。

 

2. Web archivingの諸モデル

・ぜんぶ丸ごと(Whole domain)
WWWにあるリソースの一切合切をarchivingする。有名なものとしては『Internet Archive(http://www.archive.org/)』がある。

・特定の部分だけ(Selective)
なんらかの特定の基準によって、WWWのある一部分だけをarchivingする。基準としては、リソースの重要性や質の高さ、その扱う話題などが考えられる。

・あるテーマだけ(Thematic)
ある特定の話題やイベントに関するリソースだけをarchivingする。

・デポジット(Deposit)
publishersによってリソースがdepositされる。たぶん青空文庫のような形態を指しているのだと思うがよくわからない。

・ごちゃまぜ(Combined approaches)
上に挙げたものの複合。あるいはまったく新しいアプローチ。

 

3. ケーススタディ

各国の状況を良くまとめてある。全体的な傾向としては、各国とも、自国のWebリソースをarchivingしておきたいという欲求をわりと持っていて、数多くのプロジェクトが立ち上がっている。その際には、googleの如きロボット型検索エンジンのような、リンクを辿って手当たり次第にリソースを集めてくるというようなものではなく、もうちょっと丁寧なやり方をすることが多いようだ。

新しいアプローチのなかで今後盛り上がってくると思われるのはtopic-basedなものだと思われる。「WWWがこれからますます巨大かつ複雑になっていくと、まるごとarchivingするのは不可能になるだろう」と米国議会図書館のなかの人も言っているそうな。この点について言えば、もうすでに手に負えなくなっているという感じもするが。

日本では国立国会図書館がWARP(http://warp.ndl.go.jp/WARP_Intro.html)というプロジェクトをやっている。知らなかった。手続きの流れが面白い。「推薦または選定」が必要なんだ。

procedure.gif

 

たしかにこれを見ると、電通大のWebサイトがまるごと保存されている。

http://warp.ndl.go.jp/REPOSWP/000000002149/
00000000000006977/www.uec.ac.jp/index.html

大学のオフィシャルサイトなんぞを大事に保存してどうするのかという気はするな。国立国会図書館が扱うからには大切にされて長期間保存されていくのだとおもうが、果たしてこれが後世に残していくべき貴重な情報なのかと考えるといまいち疑問だ。どちらかというと小倉優子のblogを保存したほうがみんなの役に立つような気がするかも。



Trackback

You can ping this entry by using http://windy.ac/MT/mt-tb.cgi/510 .

Comments

もちろんトラックバック込みで保存するのですよね>小倉Blog

Posted by at August 21, 2004 05:22 PM

Post a comment










Remember personal info?