「ウォーリーをさがせ」で理解するSSIMのスゴい点 その1
本日の課題図書:
- 作者: マーティンハンドフォード,Martin Handford,唐沢則幸
- 出版社/メーカー: フレーベル館
- 発売日: 2000/11/01
- メディア: 大型本
- 購入: 1人 クリック: 48回
- この商品を含むブログ (29件) を見る
ちょっと、小難しい話が続いたので、(私が)ちょっと飽きちゃいました。なので、違った角度からSSIMを眺めてみましょう*1。きっと、SSIMがよりよく理解できて、好きになるかもしれません。
『ウォーリーをさがせ』って知ってますよね。「人が入り乱れた絵の中からウォーリーや仲間たち、巻物などを見つけ出す(wikipedia:ウォーリーをさがせ!)」っていう、ちょっぴり変わった絵本です。
普通、ウォーリーをさがし出すことは、難しいですね。なぜなら、パッと見た感じ、ウォーリーにそっくりな人が入り乱れてるからです。もし、真っ白のキャンパスの上に、ウォーリーがポツンと描かれていたとしたら、すぐに見つかりますね。
このことを、「科学的に」説明すると、
この図を見ると、上図の中からBを探すより、下図の中からBを探す方が、簡単ですね
ということで、難しい言葉で言い換えると、
視覚探索の効率は、妨害刺激の数や性質に依存する
とも言うらしいんですが、そんな小難しく考える必要はなく、要は、「木の葉を隠すなら森の中」ってことですね。
さて、話をSSIMへシフトしていきましょう。
何度かお話していますが、SSIMというのは、
人間が目で見て、似てると感じる度合いを数値化したもの
です。
そして、「似てる」というのは、「似てない」ことの裏返しですね。つまり、http://d.hatena.ne.jp/denshikA/20090921で紹介した例で行くと、
これが元の画像だとして、
(変換A) *4 (変換B)*5
これらのどちらの画像が、元の画像に「似てる」と思いますか?というのは、どちらが「似てない」と思いますか?と質問することと、ほぼ同じ意味になりますね。
この場合、SSIMの数値から判断するに、Aの方が「似てる」ということになったわけですが、単に、Bの方が「似てない」という表現に変えるだけなので、どっちの画像が元の画像に近いのか、ということは分かりますね。
次に、「似てない」ということは、画像内に、何らかの「間違い」があるわけです。本日の課題図書との関係で言うと、
画像内の「ウォーリー(何らかの間違い)をさがせ」ば、その画像の「似てねー」度が分かる
というわけですね。
そして、ここからが重要です。
ウォーリーが人ごみの中に隠れていると分かりにくいのですが、人がほとんどいない場所にポツンとしていれば、すぐに見つかりますね。これを画像に置き換えてみると、
画像内のごちゃごちゃした場所に、間違いがあったとしても、人はあまり気づかないのです。でも、すっきりした場所に、間違いがあったとしたら、目立ってしまうので、気になるのです。
ということです。こういう人間の「心理」をうまく反映してくれないと、「人間が目で見て、似てると感じる度合いを数値化したもの」とは言えません。
そして、細かい話は次回にするとして、おおざっぱに結論だけ言っておきますと、
PSNRは「ウォーリーが人ごみの中に隠れているのか、それとも、人がほとんどいない場所にポツンとしているのかという区別をしない」で「間違い」を計算していきますので、「いろんな場面で、私たちの感覚とは異なる結果を生み出す*6」わけです。
ところが、SSIMというのは、「人ごみの中のウォーリーはあまり重視せず、ポツンと孤立したウォーリーに注目して」計算していきますので、「私たちの感覚により近いと評判*7」なのです。
というわけでまとめますと、意外と知られていないと思うのですが、SSIMがスゴいのは、画像内の間違いを計算するときに、ごちゃごちゃ度合いを考慮して、緩急をつけながら計算しているところなんです。
というわけで、どうですか?SSIMが少し身近になりましたか?
*1:ただし、話をシンプルにするために、厳密な話をしませんので、おおよそあってるかもしれないけど、ちょっと違うよね、くらいの話だと思ってください。
*2:http://upload.wikimedia.org/wikipedia/commons/2/20/VisualSearchDistractors.png
*3:http://r0k.us/graphics/kodak/kodim24.html
*4:http://artst.narod.ru/b/KODIM24X.JPG
*5:http://artst.narod.ru/b/KODIM24F.PNG