2005年度 浅山ゼミ 卒業論文レジュメasayama/www/rejume/2005/sim.pdfa5-2...
TRANSCRIPT
A5-1
画像類似度に関する研究
浅山研究室
I02I123 松若 光一 I01I021 榎本 拓郎 I00N029 鴉 裕孝
1.はじめに
近年,ネットワークやデジタルカメラなどの
普及により,非常に多数の画像データを使うこ
とが一般化している.数枚の画像から目的の画
像を検索することは容易である.しかし,人力
では数百枚もの画像から,目的の画像を検索す
ることは困難である.そこで類似画像検索とい
う技術を利用し,コンピュータで検索を行うこ
とが行われている.しかし,人間とコンピュー
タは画像を認識する原理が異なるため,人間が
検索したい画像をコンピュータも検索するとい
うことは難しい[1].
類似画像検索技術は,次の 2つの技術から成
り立っている.
(1)画像の特徴量を定義し,全ての画像に対し
て特徴量を求める.
(2)その特徴量を元にして画像の類似性の比
較,検索を行う.
我々は,類似画像検索において,より人間の
感覚に近い分類を行える手法を求めることを,
研究の目的とする.
2.特徴量と画像類似度
類似画像を検索するには,特徴量と画像類似
度を定義する必要がある.
特徴量とは,画像の特徴を数値として表現し
たものであり,「色特徴」,「テクスチャ」,「形状」
といった 3種類がある[2].
色特徴とは,画像中で使われている代表色と
その色の割合,色の配置(色分布)などを表す数
値である[2].
テクスチャとは,画像がもつパターンの規則
性,方向性などを表す数値である[2].
形状とは,画像で使われているオブジェクト
(特徴のある形)を表し,オブジェクトの特徴か
ら特徴量を求める[2].
画像類似度とは,比較画像と元画像がどの程
度類似しているかを表す数値である.
3.実験
3.1 類似画像検索の流れ
類似画像検索は,たくさんある画像の中から
1 枚の画像を指定して,画像の特徴量を調べ,
画像データの中から 1枚ずつ画像の特徴量の比
較を行い,両者の類似度を計算して,類似度が
高い順番に並び替えて表示するというものであ
る.
3.2 使用する特徴量
特徴量は複数の種類を同時に検索に用いる
ことも可能であるが,各特徴量から求められた
類似度を 終的に 1つの類似度とする際にどの
ように求めるかが問題となってくる.よって今
回は同時に使用する特徴量は 1種類とすること
にした.
実際に使用する特徴量について説明する.類
似する画像は同じ場所によく似た色があるので
はないかと仮定し,画像を縦横共にほぼ等間隔
に 3分割した 9つの領域に分け,各領域におけ
る代表色を特徴量とすることにした.
領域の数を 9 つとした理由としては,写真等
を撮影する際に明確な対象物がある場合は,そ
の対象物が中心になるように撮影することが多
いと考えられる.よって画像の中心に意味のあ
るものが存在する可能性と特徴量の数値の個数
A5-2
の増加による処理速度の低下を考慮し,中心が
存在する分割数のうち 小となる 9 分割を使用
した.
代表色は 終的に 2種類使用したが,それに
ついては結果と併せて説明する.
3.3 類似度
類似度は特徴量の比較から 終的に 1つの値
として算出されるものであるが,画像 1枚に対
して特徴量の値が複数ある場合,対応する特徴
量同士を比較し一つの数値として統合すること
が必要となる.今回使用した特徴量では,同じ
位置の領域から求められた代表色同士を比較す
る必要がある.
また求める類似度は特徴量のユークリッド距
離を 0から 1の間に収まるように正規化したも
のである.
終的な画像類似度は,9 つの領域別々に類
似度を算出した後,全ての領域の平均を求め,1
から引くことで数値が 1 に近いほど類似性が高
いことを表す値として求めた.
3.4 プログラム
使用したプログラミング言語は Visual Basic
と Borland C である.Visual Basic は GUI を簡
単に作成できるので,検索の操作や結果の表示
を分かりやすくするために使用した.Borland C
はVisual Basicに比べ処理速度が高速であるの
で特徴量と類似度の計算を行った.
4.実験結果
4.1 実験に使用した画像
実験に使用する画像は,主に校内をデジタル
カメラで撮影して回って集めたものである.そ
の一部を紹介する(図 1).
図 1.実験に使用した画像の一部
4.2 RGB平均色による実験
始めに使用した代表色は計算の単純さから平
均色を使用した.これは領域内の画素の R,G,
B の値のそれぞれの平均値を色としたものであ
る.
検索元となる画像を図 2 とした場合の類似画
像検索の結果は図 3である.検索結果は類似度
の高い順に,類似度とファイル名がリストに出
力される.また検索結果の 1位と 2位の画像を
図 4,5に示す.
A5-3
図 2.検索元の画像
図 3.平均色での検索結果
図 4.平均色での検索結果の 1 位
図 5.平均色での検索結果の 2 位
この結果では,1 位に検索元画像とよく似た
消火器が写った画像が出ているので,これにつ
いては非常によい結果であると言える.しかし
2 位にある公衆電話の画像は元画像と比べ人間
の感覚からは大きく外れた画像である.
4.3 色相の平均による実験
上記の公衆電話の結果に違和感があるのは,
中央にある物体の色が検索元の画像では赤色な
のに対して公衆電話が緑色だからである.そこ
で類似度を色の違いのみから算出する実験を行
った.
色の違いから類似度を求めるためには特徴量
を色の種類とする必要がある.そこで用いたの
は HSV 空間[3]における Hue(色相)の値である.
Hue を特徴量とし,検索元の画像を変えずに
類似画像検索を行った結果は図 6,7,8である.
図 6.Hue での検索結果
図 7.Hue での検索結果の 1 位
図 8.Hue での検索結果の 2 位
Hue を用いた場合の結果では,消火器の画像
は出てこなかったものの,1位,2位共に中央に
赤い物体が写っている画像が求められた.
4.4 結論
これらの結果より,9 分割の各領域の RGB 平
均色での類似画像検索では,人間の感覚に近い
結果が得られることが分かった.また Hue を特
A5-4
徴量として用いた検索のほうが,より人間の感
覚と違和感の無い結果を得られる可能性が高い
と言える.しかしどちらの方法においても,違
和感のある画像が上位の結果に含まれることが
あるので,その改善が今後の課題と言える.
5.考察
代表色を RGB 色空間の平均色とした場合の結
果で公衆電話の画像が上位に現れた理由として
は,元画像も公衆電話の画像も周囲の色は灰色
に近い色であることから,9 つの領域の内,類
似度が低いと考えられる中央の縦 3 つ以外の領
域の類似度が非常に高かったため,結果として
9 つの類似度の平均である画像の類似度が高く
なったと考えられる.
また,中央部分についても両画像とも暗めで
あることから,数値的には人間が感じるほど離
れているわけではないと考えられる.
実際に元画像と比較した公衆電話の画像の 9
つの類似度を見てみると,ほぼ考察の通りであ
ることが分かる(表1).よって 終的な類似度
を平均から求める方法では,人間の印象に大き
く影響する色のある領域の類似度が低かったと
しても,画像の類似度が低くなるとは限らない
ため,類似度の算出方法を改善する必要がある
と言える.
表1.図 5 の領域別類似度
0.956214 0.877215 0.968874
0.936686 0.853951 0.959246
0.905421 0.850740 0.849219
次に色の距離について考察を行う.今回使用
した特徴量は RGB 空間のものと HSV 空間の一部
である.このどちらの色空間においても赤色と
緑色の距離と,赤色と青色の距離は等距離と判
断される.色を数値で表現する以上,色の違い
は数値の距離で表すことになるが,ある程度以
上色の距離が離れてしまうと,人間の感覚では
どちらも似ていないとしか判断が出来なくなる.
よって,一定以上の距離がある色については類
似度を求めないようにすれば,人間の感覚から
外れた色のものが検索結果の上位に現れること
が少なくなるのではないかと考えられる.
2 つ目の代表色として HSV 空間の Hue のみを
使用したが,残りの Saturation(彩度)と
Brightness(明度)を使用しないことで,問題点
が生じると考えられる.それは色の種類の違い
でしか類似度を求めないので,暗い赤色も明る
い赤色も同じ赤として扱われるということであ
る.このことは,明るい場所と暗い場所にある
同じ物体を類似度が高いと判断できる可能性が
考えられる一方で,限りなく白に近い緑と青が
存在した場合に,人間なら同じ白だと判断する
ところを,色は緑と青だと扱ってしまい,類似
度を下げてしまうという状況が考えられる.よ
って Hue のみを用いた場合の利点を生かしつつ,
Saturation と Brightness の値を利用する方法
を考案することが出来れば色を用いた類似画像
検索の精度を高めることが出来るのではないだ
ろうか.
参考文献
[1] コンピュータビジョン
http://www.ieice.org/jpn/books/kaishikiji/
200001/20000101.html
[2] MPEG-7 と映像検索 國枝孝之 脇田由喜 高橋望 共著 CQ 出版社
[3] HSV 色空間
http://ja.wikipedia.org/wiki/HSV%E8%89%B2%
E7%A9%BA%E9%96%93