2005年度 浅山ゼミ 卒業論文レジュメasayama/www/rejume/2005/sim.pdfa5-2...

4
A5-1 画像類似度に関する研究 浅山研究室 I02I123 松若 光一 I01I021 榎本 拓郎 I00N029 鴉 裕孝 1.はじめに 近年,ネットワークやデジタルカメラなどの 普及により,非常に多数の画像データを使うこ とが一般化している.数枚の画像から目的の画 像を検索することは容易である.しかし,人力 では数百枚もの画像から,目的の画像を検索す ることは困難である.そこで類似画像検索とい う技術を利用し,コンピュータで検索を行うこ とが行われている.しかし,人間とコンピュー タは画像を認識する原理が異なるため,人間が 検索したい画像をコンピュータも検索するとい うことは難しい[1]. 類似画像検索技術は,次の 2 つの技術から成 り立っている. (1)画像の特徴量を定義し,全ての画像に対し て特徴量を求める. (2)その特徴量を元にして画像の類似性の比 較,検索を行う. 我々は,類似画像検索において,より人間の 感覚に近い分類を行える手法を求めることを, 研究の目的とする. 2.特徴量と画像類似度 類似画像を検索するには,特徴量と画像類似 度を定義する必要がある. 特徴量とは,画像の特徴を数値として表現し たものであり,「色特徴」,「テクスチャ」,「形状」 といった 3 種類がある[2]. 色特徴とは,画像中で使われている代表色と その色の割合,色の配置(色分布)などを表す数 値である[2]. テクスチャとは,画像がもつパターンの規則 性,方向性などを表す数値である[2]. 形状とは,画像で使われているオブジェクト (特徴のある形)を表し,オブジェクトの特徴か ら特徴量を求める[2]. 画像類似度とは,比較画像と元画像がどの程 度類似しているかを表す数値である. 3.実験 3.1 類似画像検索の流れ 類似画像検索は,たくさんある画像の中から 1 枚の画像を指定して,画像の特徴量を調べ, 画像データの中から 1 枚ずつ画像の特徴量の比 較を行い,両者の類似度を計算して,類似度が 高い順番に並び替えて表示するというものであ る. 3.2 使用する特徴量 特徴量は複数の種類を同時に検索に用いる ことも可能であるが,各特徴量から求められた 類似度を最終的に 1 つの類似度とする際にどの ように求めるかが問題となってくる.よって今 回は同時に使用する特徴量は 1 種類とすること にした. 実際に使用する特徴量について説明する.類 似する画像は同じ場所によく似た色があるので はないかと仮定し,画像を縦横共にほぼ等間隔 に 3 分割した 9 つの領域に分け,各領域におけ る代表色を特徴量とすることにした. 領域の数を 9 つとした理由としては,写真等 を撮影する際に明確な対象物がある場合は,そ の対象物が中心になるように撮影することが多 いと考えられる.よって画像の中心に意味のあ るものが存在する可能性と特徴量の数値の個数

Upload: others

Post on 13-Jul-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 2005年度 浅山ゼミ 卒業論文レジュメasayama/www/Rejume/2005/sim.pdfA5-2 の増加による処理速度の低下を考慮し,中心が 存在する分割数のうち最小となる9分割を使用

A5-1

画像類似度に関する研究

浅山研究室

I02I123 松若 光一 I01I021 榎本 拓郎 I00N029 鴉 裕孝

1.はじめに

近年,ネットワークやデジタルカメラなどの

普及により,非常に多数の画像データを使うこ

とが一般化している.数枚の画像から目的の画

像を検索することは容易である.しかし,人力

では数百枚もの画像から,目的の画像を検索す

ることは困難である.そこで類似画像検索とい

う技術を利用し,コンピュータで検索を行うこ

とが行われている.しかし,人間とコンピュー

タは画像を認識する原理が異なるため,人間が

検索したい画像をコンピュータも検索するとい

うことは難しい[1].

類似画像検索技術は,次の 2つの技術から成

り立っている.

(1)画像の特徴量を定義し,全ての画像に対し

て特徴量を求める.

(2)その特徴量を元にして画像の類似性の比

較,検索を行う.

我々は,類似画像検索において,より人間の

感覚に近い分類を行える手法を求めることを,

研究の目的とする.

2.特徴量と画像類似度

類似画像を検索するには,特徴量と画像類似

度を定義する必要がある.

特徴量とは,画像の特徴を数値として表現し

たものであり,「色特徴」,「テクスチャ」,「形状」

といった 3種類がある[2].

色特徴とは,画像中で使われている代表色と

その色の割合,色の配置(色分布)などを表す数

値である[2].

テクスチャとは,画像がもつパターンの規則

性,方向性などを表す数値である[2].

形状とは,画像で使われているオブジェクト

(特徴のある形)を表し,オブジェクトの特徴か

ら特徴量を求める[2].

画像類似度とは,比較画像と元画像がどの程

度類似しているかを表す数値である.

3.実験

3.1 類似画像検索の流れ

類似画像検索は,たくさんある画像の中から

1 枚の画像を指定して,画像の特徴量を調べ,

画像データの中から 1枚ずつ画像の特徴量の比

較を行い,両者の類似度を計算して,類似度が

高い順番に並び替えて表示するというものであ

る.

3.2 使用する特徴量

特徴量は複数の種類を同時に検索に用いる

ことも可能であるが,各特徴量から求められた

類似度を 終的に 1つの類似度とする際にどの

ように求めるかが問題となってくる.よって今

回は同時に使用する特徴量は 1種類とすること

にした.

実際に使用する特徴量について説明する.類

似する画像は同じ場所によく似た色があるので

はないかと仮定し,画像を縦横共にほぼ等間隔

に 3分割した 9つの領域に分け,各領域におけ

る代表色を特徴量とすることにした.

領域の数を 9 つとした理由としては,写真等

を撮影する際に明確な対象物がある場合は,そ

の対象物が中心になるように撮影することが多

いと考えられる.よって画像の中心に意味のあ

るものが存在する可能性と特徴量の数値の個数

Page 2: 2005年度 浅山ゼミ 卒業論文レジュメasayama/www/Rejume/2005/sim.pdfA5-2 の増加による処理速度の低下を考慮し,中心が 存在する分割数のうち最小となる9分割を使用

A5-2

の増加による処理速度の低下を考慮し,中心が

存在する分割数のうち 小となる 9 分割を使用

した.

代表色は 終的に 2種類使用したが,それに

ついては結果と併せて説明する.

3.3 類似度

類似度は特徴量の比較から 終的に 1つの値

として算出されるものであるが,画像 1枚に対

して特徴量の値が複数ある場合,対応する特徴

量同士を比較し一つの数値として統合すること

が必要となる.今回使用した特徴量では,同じ

位置の領域から求められた代表色同士を比較す

る必要がある.

また求める類似度は特徴量のユークリッド距

離を 0から 1の間に収まるように正規化したも

のである.

終的な画像類似度は,9 つの領域別々に類

似度を算出した後,全ての領域の平均を求め,1

から引くことで数値が 1 に近いほど類似性が高

いことを表す値として求めた.

3.4 プログラム

使用したプログラミング言語は Visual Basic

と Borland C である.Visual Basic は GUI を簡

単に作成できるので,検索の操作や結果の表示

を分かりやすくするために使用した.Borland C

はVisual Basicに比べ処理速度が高速であるの

で特徴量と類似度の計算を行った.

4.実験結果

4.1 実験に使用した画像

実験に使用する画像は,主に校内をデジタル

カメラで撮影して回って集めたものである.そ

の一部を紹介する(図 1).

図 1.実験に使用した画像の一部

4.2 RGB平均色による実験

始めに使用した代表色は計算の単純さから平

均色を使用した.これは領域内の画素の R,G,

B の値のそれぞれの平均値を色としたものであ

る.

検索元となる画像を図 2 とした場合の類似画

像検索の結果は図 3である.検索結果は類似度

の高い順に,類似度とファイル名がリストに出

力される.また検索結果の 1位と 2位の画像を

図 4,5に示す.

Page 3: 2005年度 浅山ゼミ 卒業論文レジュメasayama/www/Rejume/2005/sim.pdfA5-2 の増加による処理速度の低下を考慮し,中心が 存在する分割数のうち最小となる9分割を使用

A5-3

図 2.検索元の画像

図 3.平均色での検索結果

図 4.平均色での検索結果の 1 位

図 5.平均色での検索結果の 2 位

この結果では,1 位に検索元画像とよく似た

消火器が写った画像が出ているので,これにつ

いては非常によい結果であると言える.しかし

2 位にある公衆電話の画像は元画像と比べ人間

の感覚からは大きく外れた画像である.

4.3 色相の平均による実験

上記の公衆電話の結果に違和感があるのは,

中央にある物体の色が検索元の画像では赤色な

のに対して公衆電話が緑色だからである.そこ

で類似度を色の違いのみから算出する実験を行

った.

色の違いから類似度を求めるためには特徴量

を色の種類とする必要がある.そこで用いたの

は HSV 空間[3]における Hue(色相)の値である.

Hue を特徴量とし,検索元の画像を変えずに

類似画像検索を行った結果は図 6,7,8である.

図 6.Hue での検索結果

図 7.Hue での検索結果の 1 位

図 8.Hue での検索結果の 2 位

Hue を用いた場合の結果では,消火器の画像

は出てこなかったものの,1位,2位共に中央に

赤い物体が写っている画像が求められた.

4.4 結論

これらの結果より,9 分割の各領域の RGB 平

均色での類似画像検索では,人間の感覚に近い

結果が得られることが分かった.また Hue を特

Page 4: 2005年度 浅山ゼミ 卒業論文レジュメasayama/www/Rejume/2005/sim.pdfA5-2 の増加による処理速度の低下を考慮し,中心が 存在する分割数のうち最小となる9分割を使用

A5-4

徴量として用いた検索のほうが,より人間の感

覚と違和感の無い結果を得られる可能性が高い

と言える.しかしどちらの方法においても,違

和感のある画像が上位の結果に含まれることが

あるので,その改善が今後の課題と言える.

5.考察

代表色を RGB 色空間の平均色とした場合の結

果で公衆電話の画像が上位に現れた理由として

は,元画像も公衆電話の画像も周囲の色は灰色

に近い色であることから,9 つの領域の内,類

似度が低いと考えられる中央の縦 3 つ以外の領

域の類似度が非常に高かったため,結果として

9 つの類似度の平均である画像の類似度が高く

なったと考えられる.

また,中央部分についても両画像とも暗めで

あることから,数値的には人間が感じるほど離

れているわけではないと考えられる.

実際に元画像と比較した公衆電話の画像の 9

つの類似度を見てみると,ほぼ考察の通りであ

ることが分かる(表1).よって 終的な類似度

を平均から求める方法では,人間の印象に大き

く影響する色のある領域の類似度が低かったと

しても,画像の類似度が低くなるとは限らない

ため,類似度の算出方法を改善する必要がある

と言える.

表1.図 5 の領域別類似度

0.956214 0.877215 0.968874

0.936686 0.853951 0.959246

0.905421 0.850740 0.849219

次に色の距離について考察を行う.今回使用

した特徴量は RGB 空間のものと HSV 空間の一部

である.このどちらの色空間においても赤色と

緑色の距離と,赤色と青色の距離は等距離と判

断される.色を数値で表現する以上,色の違い

は数値の距離で表すことになるが,ある程度以

上色の距離が離れてしまうと,人間の感覚では

どちらも似ていないとしか判断が出来なくなる.

よって,一定以上の距離がある色については類

似度を求めないようにすれば,人間の感覚から

外れた色のものが検索結果の上位に現れること

が少なくなるのではないかと考えられる.

2 つ目の代表色として HSV 空間の Hue のみを

使用したが,残りの Saturation(彩度)と

Brightness(明度)を使用しないことで,問題点

が生じると考えられる.それは色の種類の違い

でしか類似度を求めないので,暗い赤色も明る

い赤色も同じ赤として扱われるということであ

る.このことは,明るい場所と暗い場所にある

同じ物体を類似度が高いと判断できる可能性が

考えられる一方で,限りなく白に近い緑と青が

存在した場合に,人間なら同じ白だと判断する

ところを,色は緑と青だと扱ってしまい,類似

度を下げてしまうという状況が考えられる.よ

って Hue のみを用いた場合の利点を生かしつつ,

Saturation と Brightness の値を利用する方法

を考案することが出来れば色を用いた類似画像

検索の精度を高めることが出来るのではないだ

ろうか.

参考文献

[1] コンピュータビジョン

http://www.ieice.org/jpn/books/kaishikiji/

200001/20000101.html

[2] MPEG-7 と映像検索 國枝孝之 脇田由喜 高橋望 共著 CQ 出版社

[3] HSV 色空間

http://ja.wikipedia.org/wiki/HSV%E8%89%B2%

E7%A9%BA%E9%96%93