2009-10-01から1ヶ月間の記事一覧

新聞電子化にまつわるエコノミー その2

ここで、次の話題(OCR)へ移る前に、ちょっとだけ、新聞電子化の工程について見てみましょう。 本日のお題 1日あたり10万画像 1月あたり300万画像 1年あたり3600万画像 現在の日本において、 平均的な電子化機器(スキャナなど)の性能・価格 平均的な人件費 …

新聞電子化の歩き方 その2

そろそろ、内容が拡充されましたので、前の地図を改訂しておきます。 新聞電子化に興味はあるけれど、道が分からなければ、以下のガイドを参考にしてみてください。 以下のような方に、お勧めです。 はじめて、このサイトへ迷いこんで来た方 これから新聞電…

新聞電子化とJPEG 2000 その6(最終回)

本日のお題画像 引き続き、NDNP(全米電子新聞プロジェクト*1)におけるJPEG2000の詳細を見てみます。概要は、http://d.hatena.ne.jp/denshikA/20091007をご覧ください。 本日は、ズバッと項目15を見て行きます。 項目15は、 15. The JPEG 2000 will use 102…

新聞電子化とJPEG 2000 その5

本日のお題画像 0.1 0.2 0.5 1.0 引き続き、NDNP(全米電子新聞プロジェクト*1)におけるJPEG2000の詳細を見てみます。概要は、http://d.hatena.ne.jp/denshikA/20091007をご覧ください。 しかし、そろそろ、飽きてきた頃でしょうから、あと2回でJPEG2000シ…

新聞電子化とJPEG 2000 その4

本日のお題画像 − = 引き続き、NDNP(全米電子新聞プロジェクト*1)におけるJPEG2000の詳細を見てみます。概要は、http://d.hatena.ne.jp/denshikA/20091007をご覧ください。 本日、説明するのは、項目10だけですので、時間のない人もすっ飛ばずに読んでく…

OCRはどのように間違いを犯すのか?

さて、JPEG2000に関する小難しい話*1が続いていますので、ちょっと休憩です。 本日のお題画像 本日は、OCRについて、お話します。 (http://denshika.cc/faq/faq4.phpも参照してください。) OCRの技術を簡単に説明しますと、こんな紙面の画像があるとします…

新聞電子化とJPEG 2000 その3

本日のお題画像 オリジナル画像提供:http://www.s-hoshino.com/f_photo/syoku/sy_012.html 引き続き、NDNP(全米電子新聞プロジェクト*1)におけるJPEG2000の詳細を見てみます。概要は、http://d.hatena.ne.jp/denshikA/20091007をご覧ください。 本日、最…

新聞電子化とJPEG 2000 その2

本日のお題画像 NDNP(全米電子新聞プロジェクト*1)におけるJPEG2000の詳細を見てみます。このシリーズの概要は、http://d.hatena.ne.jp/denshikA/20091007をご覧ください。 では、さっそく行きまぁす。本日、最も重要なことは、項目5ですので、時間のない…

新聞電子化とJPEG 2000 その1

本シリーズのお題 kdu_compress -i YOURINPUT.pgm -o YOUROUTPUT.jp2 -rate 1,0.84,0.7,0.6,0.5,0.4,0.35,0.3,0.25,0.21,0.18,0.15,0.125,0.1,0.088,0.075,0.0625,0.05,0.0 4419,0.03716,0.03125,0.025,0.0221,0.01858,0.015625 Clevels=6 Stiles={1024,1024…