電子新聞データバンクプロジェクト@オランダ

(引き続き、世界中のプロジェクトを見ていくことにしましょう。その後、各プロジェクトの超細部へ切り込んで行きます。)


本日は、「電子(日刊)新聞データバンクプロジェクト@オランダ」のご紹介です。
URLはhttp://www.kb.nl/hrd/digi/ddd/index-en.htmlです。*1
通称、DDDです。
 


「電子(日刊)新聞データバンクプロジェクト@オランダ」は、その名の通り、オランダの(日刊)新聞を電子化しようとする試みであり、オランダ国立図書館(KB、http://www.kb.nl/)が行っているものです。


「電子(日刊)新聞データバンクプロジェクト@オランダ」で公開予定の新聞リストは、こちらで見ることができます。
http://www.kb.nl/hrd/digi/ddd/Selectie%201618-1869%20alfabetisch.pdf
http://www.kb.nl/hrd/digi/ddd/Selectie%20illegale%20pers%2040-45.pdf
http://www.kb.nl/hrd/digi/ddd/Selectie%20legale%20pers%2040-45.pdf
http://www.kb.nl/hrd/digi/ddd/Selectie%20Indonesie%20alfabetisch.pdf


プロジェクトの概要ですが、

Since the publication of the first newspaper in June 1618, more than 7000 newspaper titles have been published in the Netherlands. *2

という感じで、「オランダでは、1618年以来、7,000以上の新聞が出ている」とのこと。その中から、いろいろな基準で選考し、

With the digitization of a selection from the newspaper archives (including the first newspaper from 1618, up to newspapers from the twentieth century) the Databank of Digital Daily newspapers will make eight million pages accessible to everyone, via the Internet, free of charge.*3

というように、「800万ページの公開を目指して」いて、

The project budget is (ユーロマーク)12.5 million.*4

というわけで、「予算は1250万ユーロ(約17億円)」(1ページあたり212.5円くらい)であり、

  • Initiation phase: November 2006 - January 2007
  • First phase: February 2007 - December 2008
  • Second phase: January 2009 - December 2009
  • Third phase: January 2010 - August 2011
  • Conclusion project: September 2011 - December 2011*5

という感じで、5年間(2007年-2011年)かけて、段階を追って進めていく予定ですが、ちょっと、第1段階が遅れているのでしょうか?



現在のところ、DDDの本番データはまだオンライン公開されていないようなので、1999-2004に実施されたパイロットプロジェクトから、一番古い新聞を引っ張りだしてくると、


http://kranten.kb.nl/Exe/tiff2png.exe/1909_0~2.PNG?-i+-r+65+-g+3+E%3A%5CZYDATA%5CDATA%5CKONB03%5CCENTRUM%5CEXPORT%5CTIF%5C132%5F132%5C1909%5F0%7E2.TIF

というものが公開されていて、ヘッダーをアップにしてみると、

となっていて、


日付:1909年9月1日水曜日

というのが確認できます。しかし、http://kranten.kb.nl/index.htmlをご覧になると分かるように、このプロジェクトでは、「1910-1945の新聞を電子化した」と言っているのに、実際は1909年9月1日の記事が載っていて、オランダ人のこういうアバウトなところが好きです。


ちなみに、このプロジェクトでは、保存用画像フォーマットとして非圧縮TIFFを使用し、閲覧用画像フォーマットとしてPNGとPDFを採用していますが、保存用非圧縮TIFFに替わってJPEG2000を採用することに積極的な姿勢を示しています。*6

*1:プロジェクトサイトであり、紙面データの公開サイトではありません。現在、プロジェクトマネージャーのEdwin Klijnさんにどんな状況か聞いていますので、返答があり次第、こちらでご紹介します。

*2:http://www.kb.nl/hrd/digi/ddd/titels-en.html

*3:http://www.kb.nl/hrd/digi/ddd/index-en.html

*4:http://www.kb.nl/hrd/digi/ddd/aanpak-en.html

*5:http://www.kb.nl/hrd/digi/ddd/planning-en.html

*6:http://www.kb.nl/hrd/digi/ddd/RFIanalyse.pdfhttp://www.myopenarchive.org/documents/view/76