2010-01-01から1年間の記事一覧

コンピュータに画像はどう見えるのか? その1 Hough変換

本日のお題画像: 人間は、画像を見たときに、その中に写っている文字や形状を見ています。ところが、コンピュータは、画像を見たときに、その中に写っている文字や形状を見ていません。個々の点の色や明るさを見ているだけです。つまり、「木を見て森を見ず…

大容量ファイルSSIM縛りJP2変換に関する雑感

おそらく、最初で最後でしょうが、雑感(私見)を述べてみようと思います。 最近、「SSIM JPEG2000」で検索する人が増えているようです。(と言っても、マニアな領域の話ですので、たかが知れてて、AKB48全員よりも少ないでしょう、きっと) その理由は明ら…

なんでSSIMの計算では、ボケ画像を使うでしょうか?

本日のお題画像: http://cvcl.mit.edu/hybrid_gallery/smile_angry.html お題画像を見てください。ずいぶんと古い話ですが、かつて、この画像が話題になったのを覚えてますか?*1 目を細めてみたり、パソコンの画面から少し離れたところから見てみると、「…

SSIMを計算する時に出てくるディスタンス

本日のお題画像: これまでの流れを整理します。 まず、SSIMとPSNRの比較をし、 SSIMってのは、無限のバリエーションがあるので、SSIM値を指定して電子化発注をする場合、ちゃんと具体的な計算式を指定しないと、いけないよ っぽいことを主張し、その無限の…

SSIMを計算する時に出てくるガウシアンフィルター

本日のお題: window = fspecial('gaussian', 11, 1.5) 昨日、SSIMとPSNRの比較をして、 SSIMってのは、無限のバリエーションがあるので、SSIM値を指定して電子化発注をする場合、ちゃんと具体的な計算式を指定しないと、いけないよ っぽいことを主張しまし…

PSNRとSSIMの違い(総論)

さて、本日は、再びSSIMの話題です。お題は、 後だしジャンケンはやめましょう です。 前にPSNRとSSIMというのを比較しました*1。簡単にまとめると、「PSNRより、SSIMの方が、私たちの感覚に近い結果を出してくれる」というものでした。一般論としては、合っ…

OWRから、再び、OCRへ

本日のお題:所信貫徹 前回、最近のOCRというのは、実はOWRであることを説明しました。ところが、今日は、最近のOCRというのは、実はOWRであるんだけど、さらに、もう一歩進んで、OCRに回帰しているんだよ、という点を見ていきましょう。 さて、ちょっと離れ…

OCRからOWRへ

本日のお題: wordFromDictionary="false" さて、新年なので話題を変えて、OCRについて進めていきましょう。 OCRというのは、本名、Optical Character Recognitionですので、その名前が示すとおり、文字(Character)単位の認識(Recognition)をしていきま…