2010-01-01から1年間の記事一覧
本日のお題画像: 人間は、画像を見たときに、その中に写っている文字や形状を見ています。ところが、コンピュータは、画像を見たときに、その中に写っている文字や形状を見ていません。個々の点の色や明るさを見ているだけです。つまり、「木を見て森を見ず…
おそらく、最初で最後でしょうが、雑感(私見)を述べてみようと思います。 最近、「SSIM JPEG2000」で検索する人が増えているようです。(と言っても、マニアな領域の話ですので、たかが知れてて、AKB48全員よりも少ないでしょう、きっと) その理由は明ら…
本日のお題画像: http://cvcl.mit.edu/hybrid_gallery/smile_angry.html お題画像を見てください。ずいぶんと古い話ですが、かつて、この画像が話題になったのを覚えてますか?*1 目を細めてみたり、パソコンの画面から少し離れたところから見てみると、「…
本日のお題画像: これまでの流れを整理します。 まず、SSIMとPSNRの比較をし、 SSIMってのは、無限のバリエーションがあるので、SSIM値を指定して電子化発注をする場合、ちゃんと具体的な計算式を指定しないと、いけないよ っぽいことを主張し、その無限の…
本日のお題: window = fspecial('gaussian', 11, 1.5) 昨日、SSIMとPSNRの比較をして、 SSIMってのは、無限のバリエーションがあるので、SSIM値を指定して電子化発注をする場合、ちゃんと具体的な計算式を指定しないと、いけないよ っぽいことを主張しまし…
さて、本日は、再びSSIMの話題です。お題は、 後だしジャンケンはやめましょう です。 前にPSNRとSSIMというのを比較しました*1。簡単にまとめると、「PSNRより、SSIMの方が、私たちの感覚に近い結果を出してくれる」というものでした。一般論としては、合っ…
本日のお題:所信貫徹 前回、最近のOCRというのは、実はOWRであることを説明しました。ところが、今日は、最近のOCRというのは、実はOWRであるんだけど、さらに、もう一歩進んで、OCRに回帰しているんだよ、という点を見ていきましょう。 さて、ちょっと離れ…
本日のお題: wordFromDictionary="false" さて、新年なので話題を変えて、OCRについて進めていきましょう。 OCRというのは、本名、Optical Character Recognitionですので、その名前が示すとおり、文字(Character)単位の認識(Recognition)をしていきま…