descriptores visuales y su aplicaci´on a la clasificaci´on...

31
Descriptores visuales y su aplicaci´ on a la clasificaci´ on de granos de caf´ e verde Julio Cesar Mendoza Bobadilla 16 de julio de 2014

Upload: others

Post on 08-Aug-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

Descriptores visuales y su aplicacion a la

clasificacion de granos de cafe verde

Julio Cesar Mendoza Bobadilla

16 de julio de 2014

Page 2: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

Indice general

1. Introduccion 21.1. Contexto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.2. Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.3. Organizacion de la trabajo . . . . . . . . . . . . . . . . . . . . . . 3

2. Descriptores de forma 42.1. Descriptores basados en funciones unidimensionales . . . . . . . . 4

2.1.1. Descriptores basados en momentos . . . . . . . . . . . . . 42.1.2. Descriptores basados en Redes Complejas . . . . . . . . . 5

2.2. Evaluacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62.2.1. Base de datos . . . . . . . . . . . . . . . . . . . . . . . . . 62.2.2. Experimentos . . . . . . . . . . . . . . . . . . . . . . . . . 62.2.3. Resultados y Discusion . . . . . . . . . . . . . . . . . . . . 7

3. Descriptores de textura 93.1. Descriptores evaluados . . . . . . . . . . . . . . . . . . . . . . . . 9

3.1.1. Patrones Binarios Locales convencionales (LBP) . . . . . 93.1.2. Patrones Binares Locales Completos (CLBP) . . . . . . . 12

3.2. Evaluacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133.2.1. Experimentos . . . . . . . . . . . . . . . . . . . . . . . . . 133.2.2. Resultados y Discusion . . . . . . . . . . . . . . . . . . . . 14

4. Descriptores de color 184.1. Histograma diferenciador de color (CDH) . . . . . . . . . . . . . 18

4.1.1. Espacios de Color . . . . . . . . . . . . . . . . . . . . . . 184.1.2. Deteccion de la orientacion de bordes en el espacio L*a*b* 194.1.3. Cuantizacion de la orientacion de los bordes . . . . . . . . 204.1.4. Cuantizacion del color . . . . . . . . . . . . . . . . . . . . 204.1.5. Representacion caracterıstica . . . . . . . . . . . . . . . . 20

4.2. Evaluacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214.2.1. Experimentos . . . . . . . . . . . . . . . . . . . . . . . . . 214.2.2. Resultados y Discusion . . . . . . . . . . . . . . . . . . . . 21

5. Un enfoque para la caracterizacion de granos de cafe usandopatrones binarios locales completos 235.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235.2. Metodo propuesto . . . . . . . . . . . . . . . . . . . . . . . . . . 235.3. Evaluacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

1

Page 3: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

5.3.1. Base de datos . . . . . . . . . . . . . . . . . . . . . . . . . 245.3.2. Experimento . . . . . . . . . . . . . . . . . . . . . . . . . 245.3.3. Resultados y Discusion . . . . . . . . . . . . . . . . . . . . 24

5.4. Consideraciones finales . . . . . . . . . . . . . . . . . . . . . . . . 25

2

Page 4: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

Capıtulo 1

Introduccion

1.1. Contexto

Las cantidad de imagenes digitales crece tan rapido como la necesidad decrear metodos de para la manipulacion de estas. Como muestra del la escala deimagenes que actualmente se muestran por internet se puede afirmar que:

Hasta enero del 2013 Facebook 1 anuncio que almacenaba un total del 240billones de imagenes, con 350 millones de nuevas imagenes subidas pordıa.

Hasta Diciembre del 2012 Yahoo 2, propietario de Flickr 3 anuncio tienemas de 8 billones de imagenes almacenadas en su sitio web.

Hasta Mayo del 2013 Instagram 4 anuncia se suben mas de 40 millones defotos diariamente.

Actualmente el uso de camaras digitales o dispositivos con camaras incorporadastales como smartphones y tablets por millones de usuarios que suben imagenesa internet cada segundo hacen que la cantidad de imagenes almacenadas en laweb crezca.

Como consecuencia es necesario crear metodos que permitan manejar y ac-ceder grandes bases de datos de imagenes tomadas en contextos diferentes deforma eficiente. El metodo de busqueda de imagenes mas usado actualmenteconsiste en relacionar cada imagen con un conjunto de anotaciones que indicanel contexto y entonces hacer la busqueda por palabras clave. Este idea es im-plementada por los buscadores mas populares como Google Images5 y YahooImages 6, no obstante tiene la debilidad de que las anotaciones son subjetivas enel sentido de que no hay garantıa diferentes personas hagan la misma anotacionpara la misma imagen.

Con el desarrollo de la tecnologıa digital, el mundo actualmente experimentauna revolucion digital. Particularmente a causa de la rapida popularizacion de

1https://www.facebook.com

2https://www.yahoo.com

3http://www.flickr.com/

4http://instagram.com

5http://images.google.com/

6http://images.search.yahoo.com/

3

Page 5: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

las camaras digitales y las camaras en celulares, mas y mas informacion actual-mente esta cambiando de forma textual a formas multimedia, especialmente enforma de imagenes y videos [Zhu, 2012].

1.2. Aplicaciones

Actualmente la aplicacion de clasificacion de imagenes en la mejora de pro-cesos industriales ha cobrado mayor importancia con los avances en el areade vision computacional. Existen muchas aplicaciones para la clasificacion deimagenes, entre ellas: Determinacion de grado de fecundidad en imagenes his-tologicas de ovarios de peces.

El analisis de grado de fecundidad de poblaciones de peces es muy importantepara determinar el nivel de productividad y para servir como punto referenciapara determinar la sostenibilidad de las actividades pesqueras.

La importancia de determinar el grado de fecundidad dirige muchos esfuerzosde investigacion que provean metodos de faciles, rapidos y de bajo costo desdehace muchos anos. La estereometrıa es uno de los metodos mas precisos y exactospara determinar el grado de fecundidad en imagenes histologicas, no obstante esun proceso tedioso y requiere de tecnicos especializados, inclusive con el softwareespecializado disponible.

La determinacion automatica de la fecundidad en imagenes histologicas re-quiere de: clasificar las celulas dependiendo de su estado de desarrollo y de medirsus diametros. Los expertos analizan las propiedades de color y textura de lasimagenes para clasificar las celulas. [Gonzalez-Rufino et al., 2013].

Gonzalez-Rufino et al. [2013] evalua descriptores de textura y color parala clasificacion de celulas en imagenes histologicas de ovulos de peces. Otraaplicacion interesante es el analisis de texturas bidimensionales tiene muchasaplicaciones potenciales, por ejemplo, en la inspeccion de superficies industria-les, la teledeteccion y el analisis de imagenes medicas. No obstante existen unlimitado numero de aplicaciones exitosas[Ojala et al., 2002]

1.3. Organizacion de la trabajo

En el capıtulo dos se expone una revision literaria de las principales tecni-cas de descripcion de imagenes por forma.

En el capitulo tres se expone una revision de los principales metodos dedescripcion de imagenes basados en textura.

En el capıtulo cuatro se expone los metodos mas conocidos para la des-cripcion de imagenes basados en color.

En el capıtulo cinco se exponen el metodo propuesto y los resultados.

4

Page 6: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

Capıtulo 2

Descriptores de forma

2.1. Descriptores basados en funciones unidimen-sionales

2.1.1. Descriptores basados en momentos

Los momentos son cantidades escalares usadas para caracterizar un funciony para capturar sus caracterısticas significantes. Estos han sido usado amplia-mente por cientos de anos en estadıstica para la descripcion de la forma de unafuncion de densidad de probabilidad. Desde el punto de vista matematico, losmomentos son proyecciones de una funcion sobre una base polinomial [Flusseret al., 2009].

Formalmente, la definicion general de momento viene dada por:

M (f)pq

=

ZZ

D

ppq

(x, y)f(x, y) dx dy (2.1)

• Momentos Invariantes El metodo de los momentos invariantes deriva deinvariantes algebraicas aplicadas a las funciones generatrices de los mo-mentos bajo una transformacion de rotacion. El conjunto de momentosabsolutos invariantes consiste en un conjunto de combinaciones de los va-lores que quedan invariantes a la rotacion. Hu define siete valores, calcu-lados de los momentos centrales hasta orden tres, estos son invariantes ala escala, posicion y orientacion del objeto [Prokop and Reeves, 1992]. Los

5

Page 7: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

momentos invariantes de Hu vienen dados por:

M1 = ⌘20 + ⌘02 (2.2)

M2 = (⌘20 � ⌘02)2 + 4⌘211 (2.3)

M3 = (⌘30 � 3⌘12)2 + (3⌘21 � ⌘03)

2 (2.4)

M4 = (⌘30 + ⌘12)2 + (⌘21 + ⌘03)

2 (2.5)

M5 = (⌘30 � 3⌘12)(⌘30 + ⌘12)[(⌘30 + ⌘12)2 � 3(⌘21 + ⌘03)

2] (2.6)

+ (3⌘21 � ⌘03)(⌘21 + ⌘03)[3(⌘30 + ⌘12)2 � (⌘21 + ⌘03)

2] (2.7)

M6 = (⌘20 � ⌘02)[(⌘30 + ⌘12)2 � (⌘21 + ⌘03)

2] + 4⌘11(⌘30 + ⌘12)(⌘21 + ⌘03)(2.8)

M7 = (3⌘21 � ⌘03)(⌘21 + ⌘03)[(⌘30 + ⌘12)2 � 3(⌘21 + ⌘03)

2] (2.9)

� (⌘30 � 3⌘12)(⌘30 + ⌘12)[3(⌘30 + ⌘12)2 � (⌘21 + ⌘03)

2] (2.10)

donde ⌘pq

= µpq

/µ�

00 y � = 1 + (p+ q)/2.

Hu demostro la utilidad de los momentos invariantes a traves de unasimple experimentos de reconocimiento de patrones. Los dos primeros pa-trones invariantes fueron usados para representar dıgitos en un espacio decaracterısticas bidimensional.

2.1.2. Descriptores basados en Redes Complejas

En el estado del arte se han desarrollado tecnicas para representacion, cla-sificacion, segmentacion de imagenes basados en teorıa de grafos. En el casoespecifico de representacion, se tiene descriptores que construyen un grafo apartir del contenido del la imagen: textura y color y de la forma. Un enfoqueaplicado para la caracterizacion de formas es usando Redes Complejas(R. C.).Una Red Compleja es un grafo con caracterısticas topologicas especıficas. Costaet al. [2007] exponen una amplia gama de metodos para la caracterizacion deredes complejas.

Estadısticas de grado en Redes Complejas

Backes et al. [2009] proponen metodos de caracterizacion de forma de unaimagen extrayendo estadısticas de grafos construidos a partir de los contorno dela imagen. La redes complejas se construyen asociando cada pixel del contornocon los pixeles cuya distancia al pixel evaluado es menor a un umbral.En lafigura 2.1 se muestran redes complejas construidas a partir del contorno de unahoja usando tres umbrales. El grado nodo representa su nivel de conectividad.

ki

=NX

j=1

aij

(2.11)

Donde aij

es 1 si los nodos i y j estan conectados, 0 en caso contrario. Elgrado promedio y grado maximo de la redes complejas expresan el grado deconectividad del grafo.

=1

N

NX

i=1

ki

(2.12)

6

Page 8: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

Figura 2.1: Evolucion de una red compleja con diferentes umbrales de distancia[Backes et al., 2009]

kM

=N

maxi=1

ki

(2.13)

Siendo Q el numero de umbrales usados para construir las redes complejas, eldescriptor esta formado por sus grados promedio y maximo.

� = [kµ

(t0), kM (t0), kµ(t1), kM (t1), ..., kµ(tQ), kM (tQ

)] (2.14)

2.2. Evaluacion

2.2.1. Base de datos

Para evaluar los resultados de las tecnicas exploradas en este trabajo, seconstruyo una base de datos de imagenes al color de granos de cafe verde ta-mano de 150x150 pıxeles en promedio, clasificados por defectos en las siguientesclases: Normal, inmaduro, cereza seca, negro, negro parcial, brocado leve, bro-cado severo, pergamino, hongo, vinagre, flotador, aconchado, cortado. Teniendo76 imagenes en cada clase.

2.2.2. Experimentos

Para el calculo de los momentos invariantes se extrajo el fondo de cadaimagen usando el metodo de Otsu. El descriptor de forma basado en redes

complejas tiene como entrada el contorno del grano de cafe. Para calcular elcontorno, se utilizo la transformada de Otsu, a la imagen binaria resultante sele aplico el algoritmo Marching Squares. Este algoritmo determinar los pixelesque estan en los bordes del grano de cafe. Para la construccion de las redescomplejas se experimento valores umbrales Q de 10 a 40, obteniendo mejoresresultados con 38. Los umbrales van desde 0.05 a 0.95, uniformemente. Losdescriptores fueron evaluado usando el clasificador de k-vecinos mas cercanos,con k = 5. Se uso 60% de datos para el entrenamiento, 40% para las pruebas.

7

Page 9: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

2.2.3. Resultados y Discusion

El descriptor de momentos invariantes tiene buenos resultados para las clasesPergamino y Negro. Esto muestra que los este descriptor es sensible a la inten-sidad dominante. Dado que el descriptor de momentos invariantes no utilizael contorno como entrada, los resultados para las clases con bordes irregularestales como brocado severo, concha y hongo son malos. El descriptor de gradode redes complejas muestra tiene buenos resultados para las clases con bordesirregulares, en especial para la clase Hongo.

Figura 2.2: Clases de granos de cafe verde por defectos

El descriptor de grado de redes complejas muestra un desempeno resaltantepara la clase hongo, sin embargo los resultados para la clase brocado severo,

parcial cortado y concha cuyas contornos tienen irregularidades similares no loson a causa de que no se consigue diferenciar con exactitud a que clase pertecelas muestras de este subconjunto de tres clases. La matriz de confusion (Figura2.3) evidencia muestras de la clase cortado clasificadas como concha.

8

Page 10: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

Metrica FClase Momentos Inv. Grado de R. C.Brocado leve 0.17 0.31Brocado severo 0.08 0.30Cereza seca 0.21 0.06Concha 0.08 0.23Hongo 0.17 0.86Flotador 0.34 0.13Inmaduro 0.07 0.14Vinagre 0.15 0.13Negro 0.56 0.06Normal 0.23 0.13Negro parcial 0.12 0.05Pergamino 0.71 0.17Parcial Cortado 0.07 0.25

Cuadro 2.1: Resultados de los descriptores de momentos invariantes y de gradode R.C.

(a) Momentos Invariantes (b) Grado de R.C.

Figura 2.3: Matrices de confusion de los descriptores evaluados

9

Page 11: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

Capıtulo 3

Descriptores de textura

3.1. Descriptores evaluados

3.1.1. Patrones Binarios Locales convencionales (LBP)

La idea detras del operador LBP es que una imagen esta compuesta demicro-patrones. Un micro-patron describe unicamente el signo de la diferenciade intensidad de un pıxel respecto a los pıxeles que pertenecen a su vecindadcircularmente simetrica. Esto permite que el descriptor LBP sea invariante a laescala de intensidad. [Nanni et al., 2012] pag 1. Formalmente, el operador LBPse define como:

LBP (P,R) =P�1X

p=0

s(qp

� qc

)2p (3.1)

s(x) =

(1 si x > 0

0 caso contrario(3.2)

donde P es el numero de pıxeles de la vecindad, R es el radio de la vecindad,s(x) es la funcion signo, q

c

= I(xc

, yc

) y qp

= I(xc,p

, yc,p

, siendo I(x, y) el valordel pıxel en la posicion (x, y), y siendo (x

c

, yc

) y (xc,p

, yc,p

las posiciones delpıxel central y su p-esimo pıxel vecino respectivamente. La posicion del p-esimopıxel vecino esta determinada por:

(xc,p

, yc,p

) = (xc

+R cos(2⇡p/P ), yc

+R sin(2⇡p/P )) (3.3)

En la figura 3.1 se muestran vecindades con diferentes radios y numero de pixelesvecinos. Los valores de escalas grises para los pıxeles cuyas posiciones no sonexactas en la imagen puede calcularse usando interpolacion. Suponga que eltamano de la imagen es de MxN . Una vez identificados los patrones de cadapıxel se construye el histograma que representa la textura:

H(k) =MX

i=1

NX

j=1

f(LBPP,R

(i, j), k) (3.4)

f(x, y) =

(1, if x = y

0, caso contrario(3.5)

10

Page 12: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

El histograma tiene una longitud de 2P para un operador LBPP,R

. [Guo et al.,2010] pag 1.

Patrones invariantes a la rotacion

Cuando una imagen es rotada, los valores gp

correspondiente a la vecindadde un pıxel g

c

se mueven a lo largo del perımetro del circulo alrededor de gc

.Ojala et al. [2002] propone remover el efecto de la rotacion asignando el menoridentificador al subconjunto de patrones que son equivalentes bajo diferentesrotaciones, formalmente:

LBP ri

P,R

=P�1mıni=0

(rot(LBPP,R

, i)) (3.6)

donde rot(x, i) realiza una desplazamiento circular de i-bits en sentido derecho.Ojala et al. [2002] indica que ciertos patrones pueden considerarse detectores

de caracteristicas debido a su similitud con micro-caracteristicas de la imagen,por ejemplo puntos negros, puntos brillantes, secciones planas y bordes

Patrones uniformes

Ojala et al. [2002] observa que ciertos patrones binarios locales conservanpropiedades fundamentales de la imagen y actuan como plantillas para micro-estructuras tales como puntos negros, puntos brillantes, secciones planas y bor-des con curvaturas positivas y negativas variantes. Ojala et al. [2002] los denomi-na patrones uniformes debido a que presentan estructuras circulares uniformesque contienen pocas transiciones espaciales(cambios de 0/1).

Ojala et al. [2002] define los patrones uniformes como aquellos aquellos quepresentan 2 o menos transiciones espaciales. Formalmente los patrones binarioslocales invariantes a la rotacion uniformes se definen como

LBP riu2P,R

=

(Pp�1p=0 s(qp � g

c

) si U(LBPP,R

) <= 2

P + 1 caso contrario(3.7)

donde:U(LBP

P,R

) = |s(g0 � gc

)� s(gP�1 � g

c

)|+P

P�1p=1 |s(g

p

� gc

)� s(gp�1 � g

c

)| (3.8)

Figura 3.1: Vecindades circularmente simetricas generadas con diferentes valoresP y R [Zhu, 2012]

11

Page 13: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

La ecuacion 3.7 identifica los patrones uniformes con el numero de bits 1 conte-nidos en el identificador del patron convencional, mientras que los patrones nouniformes son agrupados bajo el identificador P +1. El histograma del operadorLBP riu2

P,R

contiene P+2 diferentes identificadores. [Ojala et al., 2002] Ojala et al.[2002] sostiene que la razon por la que el histograma de patrones uniformes pro-vee un mejor poder discriminativo en comparacion al histograma de todos lospatrones individuales proviene de sus propiedades estadısticas. La proporcionrelativa de patrones no uniformes respecto a todos los patrones acumulados enel histograma es tan pequena que sus propiedades estadısticas no pueden ser es-timadas confiablemente . Ojala et al. [2002] afirma que la inclusion su ruido enel analisis de disimilaridad de la muestra y en el modelo de histogramas puededeteriorar el poder discriminatıvo del descriptor . Es importante notar que estaafirmacion aplica a los patrones uniformes independientemente de agregarle lapropiedad de la invarianza a la rotacion. Los resultados de Nanni et al. [2012]muestran que el poder discriminativo de los patrones uniformes es menor alconsiderar la invarianza a la rotacion.

Medicion de la varianza del contraste de textura invariante a la rota-cion

Por definicion el descriptor LBP considera unicamente el signo de las dife-rencias de cada pıxel respecto de su vecindad, permitiendo que sea invarianteal escalamiento de intensidad y a su vez dejando de considerar el contraste.Ojala et al. [2002] sugiere que si la invarianza al escalamiento de intensidad noes requerida y se desea incorporar el contraste de la textura de la imagen local,podemos medirla con una medida invariante a la rotacion de varianza local ,formalmente:

V ARP,R

=1

P

P�1X

p=0

(gp

� µ)2 (3.9)

donde:

µ =1

P

P�1X

p=0

gp

(3.10)

Dado que el descriptor LBP y V AR son complementarios, juntarlos incrementael poder discriminativo del descriptor [Ojala et al., 2002].

La medida de varianza tiene valores continuos. Ojala et al. [2002] expresaque es necesario cuantizar el espacio de valores posibles. El indica que el numerode intervalos usado para la cuantizacion es de suma importancia ya que histo-gramas con un numero de intervalos pequeno no proporciona la informaciondiscriminativa suficiente. Por otro lado dado, ya que se tiene un numero finitode entradas, un numero grande de intervalos produce histogramas esparsos yinestables. La literatura usualmente propone que un promedio de 10 elementospor intervalo es suficientemente consistente . Es posible llamada regla del pulgar( En un histograma se debe de tener por lo menos 10 entradas por intervalo Oja-la et al. [2002] ) garantice la fiabilidad estadıstica. No obstante en la literatura([Wand, 1997], [Wang and Zhang, 2012]) existen una fuerte base teorica y mu-chos experimentos que muestran formas mas elaboradas de encontrar el numerode elementos por intervalo/ancho de intervalo de un histograma. Es necesarioconsiderar la posibilidad de realizar pruebas para encontrar el mejor parametro.

12

Page 14: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

Analisis multiresolucion

Ojala et al. [2002] sostiene que el analisis multiresolucion se puede lograrcombinando la informacion proporcionada por multiples descriptores LBP conradios y tamanos de vecindad variantes . El trabajo de Ojala et al. [2002] muestrael potencial de realizar el analisis multiresolucion combinando tres descriptoresLBP con vecindades de 8, 16, 24 pıxeles y radios de 1, 2 y 3 pıxeles respectiva-mente.

3.1.2. Patrones Binares Locales Completos (CLBP)

Transformada signo-magnitud de diferencia local

Sea Guo et al. [2010] define el vector de diferencia local [d0..dp�1] para unavecindad circularmente simetrica como la diferencia entre la intensidad del pıxelcentral g

c

y la intensidad de sus vecinos gp

, dp

= gp

� gc

, para p = 0, ..., P � 1.Guo et al. [2010] indica que el vector de diferencias locales caracteriza la estruc-tura local de la imagen alrededor del pixel central. Dado que la intensidad delpıxel central es removida es invariante a cambios de iluminacion . (invariante adesplazamientos de intensidad).Guo et al. [2010] define la transformada signo-magnitud de diferencia local(LDSMT) como la descomposicion de las diferencias locales en signo y mag-nitud. Formalmente:

dp

= sg(dp

) ⇤m(dp

) (3.11)

donde:

sg(x) =

(+1 si x > 0

�1 caso contrario(3.12)

m(x) = |x| (3.13)

Guo et al. [2010] indica que el reconocimiento de textura por emparejamien-to directo de las diferencias es inviable por su sensibilidad a ruido, translacion yrotacion . El operador basico LBP utiliza el componente signo de las diferenciaslocales. Guo et al. [2010] muestra a traves de un ejemplo como considerar unica-mente el componente signo puede llevar a codificar estructuras locales diferentescomo un mismo patron a causa de obviar informacion contenida en la magnitud.Guo et al. [2010] demuestra formalmente que el signo es mas importante que lamagnitud calculando el error de reconstruir la imagen usando un componente ala vez. Para calcular el error de reconstruir una imagen a partir de la magnitudobtiene los valores de signo observando que este sigue la distribucion de bernou-lli. Para calcular el error de reconstruir a partir del signo aprovechando el hechode que las diferencias y las magnitudes de la imagen siguen una distribucionde laplace, se remplazan las magnitudes con la magnitud media de la imagen.Guo et al. [2010] demuestra que el error de reconstruir la imagen al considerarel signo es cuatro veces menor al reconstruirla con la magnitud.

Operadores LBP adicionales

Guo et al. [2010] define operadores que codifican la estructuras locales usan-do las diferencias locales descompuestas en signo y magnitud, y el nivel grispromedio de la imagen.

13

Page 15: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

201 122 35

68 198 112

232 252 119

(a) Vecindad local

3 -76 -163

-130 -86

34 54 -79

(b) Diferencias locales

+ - -

- -

+ + -

(c) Signo

3 76 163

130 0 86

34 54 79

(d) Magnitud

Figura 3.2: Descomposicion signo-magnitud de una vecindad local

Para considerar las diferencias locales en signo y magnitud define el opera-dor CLBP

S

como el operador LBP convencional que considera el signo. Paraconsiderar la magnitud define el operador CLBP

M

comparando la magnitud decada pixel de la vecindad local con un valor magnitud umbral. Formalmente:

CLBP M(P,R) =P�1X

p=0

s(mp

�mt

)2p (3.14)

donde s es definida en la ecuacion 3.2, mp

representa la magnitud los pıxeles dela vecindad local obtenidos a traves de la LDSMT definida en la ecuacion 3.11y m

t

representa la magnitud umbral. Guo et al. [2010] considera la magnitudumbral como la magnitud promedio de toda la imagen.

Para incorporar la informacion discriminativa del nivel gris promedio defineel operador CLBP C comparando el nivel de gris del pıxel central de la vecindadlocal con el nivel de gris promedio de toda la imagen. Formalmente:

CLBP CP,R

= s(gc

� g) (3.15)

donde gc

es el nivel gris del pıxel central de la estructura local y g es el nivelgris promedio de toda la imagen.

Guo et al. [2010] expone formas de construir el histograma de una ima-gen: Una construyendo un histograma conjunto con los valores obtenidos de lostres operadores CLBP S/M/C y otra construyendo un histograma conjunto,CLBP S/M o CLBP M/S y entonces concatenando con el componente restan-te. Los experimentos de Guo et al. [2010] muestran mejores resultados usando elprimer esquema de construccion, pero el segundo produce histogramas pequenossin reducir su capacidad discriminativa de forma considerable.

14

Page 16: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

3.2. Evaluacion

3.2.1. Experimentos

Los descriptores LBP con diferentes criterios de cuantificacion de patronesexpuestos en este capıtulo fueron evaluados en la base de datos expuesta en laseccion 2.2.1. Las imagenes fueron convertidas a escalas grises. Los parametrosP y R de los descriptores fueron 8 y 1 respectivamente. Para calcular los valoresde intensidad en los puntos de la vecindad circular son determinados medianteinterpolacion bilinear. Los descriptores se evaluaron usando el clasificadorK-

vecinos mas cercanos. Se usa la metrica F para comparar los resultados obteni-dos.

3.2.2. Resultados y Discusion

El descriptor LBP tradicional y sus variaciones muestran mejores resulta-dos para las clases hongo, flotador, vinagre, negro y pergamino. Los descriptoresno muestran potencial para clasificar muestras de clase brocado leve, brocadosevero, normal y negro parcial. Las matrices de confusion (Figura 3.3) de lastres variaciones de LBP que obtuvieron mejores resultados evidencian una altacantidad de falsos positivos para las clases brocado leve y brocado severo. Enlos tres descriptores una proporcion considerable inmaduros fueron clasificadoscomo brocados leves, tanto como brocados leves fueron clasificados como inma-duros. Una probable razon es que los granos de clase inmaduro tiene regionesobscuras que aportan patrones similares a los causados por las irregularidadesen granos de clase brocado leve. De forma similar una parte de muestras de cla-se normal y negro parcial son clasificadas como brocado leve y brocado severo

respectivamente por tener cierto grado de similitud. En el primer caso algunosgranos de clase brocado leve tiene irregularidades pequenas que los descriptoresno consiguen percibir. En el caso de la clase negro parcial algunas muestras tie-ne regiones obscuras similares a las imperfecciones de algunas muestras de clasebrocado severo.

El descriptor Completed-LBP y sus variaciones, de manera similar que losdescriptores LBP obtienen mejores resultados para las clases hongo, flotador, vi-nagre, negro y pergamino (Figura 5.2). Sin embargo las tres variaciones CLBP

u

,CLBP

ror

y CLBPnriu

superan a los descriptores LBP equivalentes. El descriptorCLBP

nriu

obtiene los mejores resultados(Cuadro 3.2)

15

Page 17: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

Metrica FClase LBP LBP

u

LBPror

LBPnriu

Brocado leve 0.33 0.22 0.21 0.21Brocado severo 0.16 0.24 0.12 0.17Cereza seca’ 0.33 0.19 0.25 0.24Concha 0.09 0.24 0.2 0.11Hongo 0.50 0.56 0.5 0.52Flotador 0.2 0.39 0.54 0.3Inmaduro 0.07 0.07 0.17 0.07Vinagre 0.34 0.68 0.41 0.42Negro 0.31 0.42 0.4 0.34Normal 0.11 0.11 0.11 0.12Negro parcial 0.18 0.2 0.22 0.12Pergamino 0.35 0.45 0.45 0.32Parcial Cortado 0.3 0.36 0.42 0.3Average 0.25 0.32 0.30 0.25

Cuadro 3.1: Resultados obtenidos usando descriptores LBP.

Metrica FClase CLBP CLBP

u

CLBPror

CLBPnriu

Brocado leve 0.1 0.18 0.19 0.13Brocado severo 0.07 0.16 0.07 0.14Cereza seca’ 0.31 0.42 0.42 0.26Concha 0.32 0.33 0.27 0.19Hongo 0.35 0.50 0.27 0.50Flotador 0.2 0.3 0.38 0.27Inmaduro 0.11 0.24 0.15 0.13Vinagre 0.24 0.61 0.31 0.40Negro 0.54 0.58 0.62 0.83Normal 0.1 0.04 0.09 0.19Negro parcial 0.15 0.23 0.04 0.27Pergamino 0.43 0.40 0.67 0.70Parcial Cortado 0.35 0.36 0.41 0.33Average 0.25 0.34 0.31 0.35

Cuadro 3.2: Resultados obtenidos usando variaciones del descriptor Completed-LBP.

16

Page 18: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

(a) LBP

u

(b) LBP

ror

(c) LBP

nriu

Figura 3.3: Matrices de confusion para las variaciones del descriptor LBP tra-dicional

17

Page 19: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

(a) CLBP

u

(b) CLBP

ror

(c) CLBP

nriu

Figura 3.4: Matrices de confusion para las variaciones del descriptor Completed-LBP

18

Page 20: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

Capıtulo 4

Descriptores de color

4.1. Histograma diferenciador de color (CDH)

Estudios psicofısicos y neurobiologicos indican que el sistema visual humanoes muy sensible a color y la orientacion del borde. La diferencia de color percep-tualmente uniforme entre los colores y orientaciones de bordes brinda una ampliavariedad de informacion visual, que es una informacion muy util y desempenaun papel importante en el analisis de contenido de imagen y su comprension. Sinembargo, para nuestro conocimiento, algunos artıculos han sido publicados sobrecomo aplicar la diferencia de color perceptualmente uniforme entre los colores yorientaciones de borde para la representacion y recuperacion de imagenes. Liuand Yang [2013] proponen un descriptor de recuperacion de imagenes en estedocumento. Este descriptor combina el uso de orientacion y color, considera ladisposicion espacial sin el uso de cualquier segmentacion de imagen o procesode aprendizaje. Al describir la propuesta del histograma de diferencia de color(CDH) primero se describe brevemente el espacio de color L*a*b*.

En segundo lugar, se describe la deteccion de la orientacion del borde. Entercer lugar, se describe la cuantificacion del color que se aplicara en L*a*b*del espacio de color, y por ultimo, se describen las caracterısticas de imagen pormedio la diferencia de color perceptualmente uniforme.

4.1.1. Espacios de Color

Los espacios de color proporcionan un metodo para especificar, ordenar ymanipular colores. Los colores se representan mediante puntos en estos espacios.Existen numerosos espacios de color en la actualidad. La gran mayorıa de ellosse han desarrollado para aplicaciones especıficas, aunque todos parten de unmismo concepto: la teorıa tricromatica de colores primarios rojo, verde y azul.

Modelo RGB

El primero de los modelos de color a comentar y mas comunmente empleadoes el RGB, basado directamente en el modelo triestımulos y sıntesis aditiva.Es un modelo de color dependiente de dispositivo. En el espacio RGB el coloraparece especificado mediante cantidades positivas de rojo, verde y azul, for-mando en el espacio 3D un cubo. El rango de cada coordenada o componente

19

Page 21: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

cromatica RGB suele ser [0,1] aunque en multimedia y procesamiento de image-nes esta mas extendida la especificacion en cantidades discretas presentes en elintervalo [0,255]. El empleo del modelo RGB para el procesamiento de imageneses util cuando estas vienen expresadas en terminos de los tres planos de colores.No es posible evaluar la diferencia observada entre colores con una medida dedistancia a partir de los primarios R, G y B.

Modelo XYZ

El espacio de color XYZ se obtiene por transformacion lineal del sistemaRGB y fue introducido por la CIE para evitar los inconvenientes de los triestımu-los espectrales R, G y B. El espacio formado por los ejes X, Y y Z se puedeconsiderar un espacio tridimensional. En ese espacio cualquier color se repre-senta con un punto concreto y el conjunto de todos los puntos forma un solidotridimensional que es el espacio del triestımulo XYZ. El papel del modelo XYZen procesamiento de imagenes es realmente escaso, si bien, sera requerido comoespacio intermedio para realizar transformaciones del sistema RGB a otras coor-denadas cromaticas como L*a*b*. La matriz de transformacion lineal entre elsistema RGB y el XYZ, para valores en el rango [0,1] se presenta a continuacion:

Espacio L*a*b*

L*a*b* fue disenado para ser perceptivamente uniforme. Debido a su altauniformidad con respecto a la percepcion humana del color. En este espacio,L* indica luminosidad y a* y b* son las coordenadas de cromaticidad. Los trescolores de luz percibidos, rojo, verde y azul, son medidos en el contexto de unailuminacion especıfica y todos los demas son considerados como una combinacionde color iluminacion y superficie reflectante. L* se representa en un rango devalores [0,100], mientras que a* y b* oscilan en [-60, 60].

El espacio de color CLE L*a*b* es una buena opcion para la determinacionde la diferencia entre los colores, y la diferencia entre dos puntos de color puedeser medido como una distancia euclidiana. En el espacio de color CLE L*a*b*;Los componentes L*, a* y b* se calculan a traves de un mapeo no lineal de lascoordenadas XYZ.

Donde Xn

, Yn

, and Zn

son los respectivos valores de X, Y y Z con eliluminante (punto blanco de referencia) que se haya usado para obtener losvalores X, Y y Z de la muestra; en este trabajo se usan [Xn, Yn, Zn] = [0.950450,1.000000, 1.088754] de acuerdo con el iluminante D65. D65 es un iluminante deuso estandar definido por la Comision Internacional de Iluminacion (CIE).

4.1.2. Deteccion de la orientacion de bordes en el espacioL*a*b*

La orientacion de bordes tiene una fuerte influencia en la percepcion humanade las imagenes y puede representar los contornos y estructuras de textura, asıque proveen mucha informacion semantica de la imagen. Una idea sencilla paraobtener la orientacion de los bordes de una imagen seria convertir la imagen decolor a escala gris y calcular la gradiente ( y la orientacion ) en cada punto.

No obstante al convertir a escalas grises se pierde la informacion de color.Zenzo propone una tecnica para el calculo de la gradiente en multi-imagenes:

20

Page 22: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

Se calculan los vectores:

U =@L⇤@x

l +@(a)⇤@(x)

a+@b⇤@x

b (4.1)

Se calculan los coeficientes gxx

, gyy

, gxy

. Siendo gab

no mas que el productoescalar de las derivadas parciales respecto de a y b

Las derivadas parciales requeridas pueden ser calculadas utilizando el ope-rador de sobel.

La direccion del maximo cambio en cada pixel de la imagen esta determinadopor:

Ya que la solucion tan(�+ ⇡) = tan(phi), existen 2 posibles valores para �:�,� + ⇡/2 El valor de la gradiente para cada punto ( x,y ) tambien puede sercalculado con el valor de phi+pi/2.

Ya que el valor de orientacion ( phi ) afecta el valor de la gradiente, lamaxima gradiente es tomada como el valor final.

4.1.3. Cuantizacion de la orientacion de los bordes

Una vez obtenidas orientacion de la maxima gradiente, estas se cuantizanpara facilitar su representacion en las caracterısticas. Liu and Yang [2013] mues-tran que se obtiene una mejor performance cuantizando los angulos en 6 niveles( 0, 60, 120, 180, 240, 300 ), teniendo un total de 18 orientaciones, 6 por cadacanal.

4.1.4. Cuantizacion del color

La cuantizacion del color se utiliza para extraer y manipular facilmente lainformacion del color de una determinada imagen, y consiste en seleccionar unlimitado conjunto de colores para representar los colores de una imagen conmaxima fidelidad. Liu and Yang [2013] cuantiza el espacio de colores L*a*b* en90 colores, dividiendo el canal L* en 10 niveles y los canales a* y b* en 3 colorescada uno.

4.1.5. Representacion caracterıstica

Es un desafıo importante que la representacion de caracterısticas use lasdiferencia de color tomando en cuenta tanto las caracterısticas espaciales delcolor como las orientaciones de los bordes. El articulo muestra una nueva formade representacion de caracterısticas denominado Histograma de diferencia decolor ( CDH ). Los valores de la imagen cuantizada C(x, y) se denotan como w 20, 1, . . . ,W�1. Se denotan los pixeles vecinos con locaciones (x, y) y (x0, y0) y susındices de color como C(x, y) = w1, C(x0, y0) = w2. Los valores de la orientacionde bordes de una imagen ✓(x, y) son denotados como v 2 0, 1, . . . , V � 1. Losangulos en (x, y) y (x0, y0) son denotados por ✓(x, y) = v1y✓(x0, y0) = v2. Parapixeles vecinos de quienes la distancias es D, y los numeros de cuantizacion decolor y orientacion son W y V respectivamente. Se define el CDH como:

Hcolor

(C(x, y)) =

(PPp(�L)2 + (�a)2 + (�b)2

where ✓(x, y) = ✓(x0, y0) max (|x� x0|, |y � y0|) = D

21

Page 23: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

Clase Precision Recall F1-scoreBrocado leve 0.35 0.55 0.43Brocado severo 0.17 0.21 0.19Cereza seca’ 0.68 0.77 0.72Concha 0.46 0.32 0.37Hongo 0.52 0.48 0.50Flotador 0.68 0.65 0.67Inmaduro 0.42 0.52 0.46Vinagre 0.42 0.24 0.30Negro 0.96 0.69 0.81Normal 0.43 0.72 0.53Negro parcial 0.63 0.58 0.60Pergamino 0.80 0.77 0.78Parcial Cortado 0.55 0.25 0.34Average 0.54 0.52 0.52

Cuadro 4.1: Resultados obtenidos usando el descriptor CDH.

Hcolor

(✓(x, y)) =

(PPp(�L)2 + (�a)2 + (�b)2

where C(x, y) = C(x0, y0) max (|x� x0|, |y � y0|) = D

4.2. Evaluacion

4.2.1. Experimentos

Los descriptores LBP con diferentes criterios de cuantificacion de patronesexpuestos en este capıtulo fueron evaluados en la base de datos expuesta en laseccion 2.2.1. En el experimento usamos los mismos parametros usados en Liuand Yang [2013]. El descriptor CDH es evaluado usando el clasificadorK-vecinos

mas cercanos. Se utilizan las metricas de precision, sensibilidad y la metrica Fpara analizar los resultados obtenidos.

4.2.2. Resultados y Discusion

El descriptor obtiene mejores resultados para clases donde el color es lacaracterıstica mas relevante: cereza ceca, flotador, negro, negro parcial y perga-

mino. El cuadro 4.1 evidencia que el descriptor permite determinar las muestrade clase negro con un 96% de precision, sin embargo el bajo de nivel de sensi-bilidad (69%) indica una cantidad elevada de falsos positivos para esta clase,dado que muestras de la clase negro son clasificadas erroneamente cono cereza

seca y brocado severo (Figura 4.1).Los resultados muestran un alto grado de falsos positivos y falsos negativos

entre clases donde el color dominante no es una caracterıstica suficiente paradeterminar la clase: parcial cortado, negro parcial, inmaduro, concha, y brocadosevero. Ademas el alto grado falsos negativos de clase brocado leve y brocado

severo clasificados como normal evidencia que el descriptor CDH no aprovechaaspectos locales de la imagen debido a que se construye un histograma global.

22

Page 24: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

Figura 4.1: Matriz de confusion del descriptor CDH.

23

Page 25: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

Capıtulo 5

Un enfoque para lacaracterizacion de granos decafe usando patronesbinarios locales completos

5.1. Introduccion

Algunos desventajas del descriptor de patrones binarios locales han sidodiscutidas en otra secciones de este documento. Una de ellas los descriptoresLBP no capturan aspectos locales de la imagen debido a que se construyenhistogramas globales. En [Paisitkriangkrai et al., 2014] se evalua la influenciade hacer pooling espacial en imagenes, y aplicar el extractor de caracterısticassobre cada parche, juntando los vectores de caracterısticas de cada parche enun vector final.Paisitkriangkrai et al. [2014] evalua el desempeno del extractorLBP en la metodologia de pooling espacial obteniendo resultados prometedores.

Otro aspecto importante de los descriptores LBP y CLBP convencionales,es que determinado R, solo se cuantifıcan los patrones con esta vecindad fija.Ojala et al. [2002] propone calcular el descriptor LBP para un conjunto deparametros R ( ejem. R 2 {1, 2, 4} ) obteniendo un descriptor multiresolucion.Qian et al. [2011] evalua el efecto de la utilizacion de metodos para la generacionde piramides espaciales de la imagen. EL descriptor LBP es aplicado en lasimagenes resultantes. Finalmente se juntan los vectores de caracterısticas decada capa de la piramide para formar un vector global.

5.2. Metodo propuesto

Se presenta un descriptor robusto para la representacion de granos de cafe.

Multiresolucion

Para incrementar la capacidad discriminativa del descriptor se generan image-nes en diferentes resoluciones, siguiente el enfoque descrito en [Qian et al., 2011]

24

Page 26: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

se suaviza la imagen usando filtros gausianos y escala la imagen a dimensionesmenores.

Localidad

En base a que caracterısticas locales de la imagen se encuentra en ciertasregiones del grano de cafe se plantea segmentar el grano de cafe en tres regio-nes: externa, media e interna. Para segmentar las imagenes se utiliza metodode Otsu. La mascara obtenida por el metodo de binarizacion es sometida a latransformada de distancia euclidiana. El resultado es una imagen donde la in-tensidad de cada pixeles es la distancia del pixel del contorno mas cercano. Estosvalores nos permiten segmentar la imagen del grano de cafe por contornos denivel.

Este descriptor toma la imagen de entrada y calcula el contorno del granode cafe usando el metodo de binarizacion de Otsu. La mascara obtenida por elmetodo de binarizacion es sometida a la transformada de distancia euclidiana.El resultado es una imagen donde la intensidad de cada pixeles es la distanciadel pixel del contorno mas cercano. Estos valores nos permiten segmentar laimagen del grano de cafe por contornos de nivel.

El conjunto de imagenes obtenido es sometido a transformacion de pirami-des espaciales la cual consiste en generar imagenes con resoluciones diferentes.En el experimento se generamos tres imagenes con resoluciones de 1, 1/2 y 1/4de la imagen original. El descriptor CLBP es aplicado a cada imagen del con-junto resultante. Los vectores resultantes se concatenan para formar un vectorde caracterısticas final. En la figura 5.1 se muestra un esquema del metodopropuesto.

5.3. Evaluacion

5.3.1. Base de datos

La base de datos usada en este experimento esta descrita en la seccion 2.2.1.

5.3.2. Experimento

Las imagenes fueron transformadas al espacio de de color HSV. Los descrip-tores EP-CLBP segmentan la imagen en 3 regiones, por cada region se generan3 resoluciones. En el caso del descriptor de ondıculas de Gabor se crean filtroscon 3 escalas y 5 orientaciones, el ancho de banda cubierto por el banco de filtroses �

min

= 0,0175 y �max

= 0,125. Las metricas extraıdas por cada filtro sonla media, desviacion estandar y entropıa de la parte real y la magnitud de lasresultantes. En la etapa de clasificacion se usa el clasificador de bosque aleatorio.

5.3.3. Resultados y Discusion

Los resultados muestra que los extractores de caracterıstica muestran un me-jor rendimiento con imagenes en el espacio de colores HSV, la justificacion estaen que este espacio se separa la informacion de cromatica de la imagen, informa-cion que incrementa la capacidad discriminativa de los extractores aprovechando

25

Page 27: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

Figura 5.1: Metodo propuesto

el hecho de que existen subconjuntos de clases con caracterısticas de color simi-lares: negro parcial, negro, cereza seca y vinagre; brocado leve, brocado severo,flotador, inmaduro, cortado, y normal; y pergamino, hongo. Los descriptor pro-puestos obtienen mejores resultados que el descriptor de ondıculas de Gabor.Tanto el descriptor de ondiculas con los descriptores propuestos no obtienenbuenos resultados para

26

Page 28: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

Metrica FClase EP � CLBP

u

EP � CLBPror

EP � CLBPnriu

Gabor wav.Brocado leve 0.46 0.52 0.43 0.47Brocado severo 0.45 0.44 0.41 0.18Cereza seca’ 0.68 0.71 0.63 0.45Concha 0.35 0.41 0.2 0.22Hongo 0.75 0.70 0.56 0.75Flotador 0.71 0.68 0.65 0.80Inmaduro 0.52 0.62 0.33 0.38Vinagre 0.71 0.65 0.67 0.3Negro 0.86 0.88 0.87 0.76Normal 0.43 0.43 0.48 0.50Negro parcial 0.36 0.5 0.58 0.39Pergamino 0.88 0.86 0.86 0.98Parcial Cortado 0.36 0.45 0.46 0.26Promedio 0.58 0.61 0.56 0.5

5.4. Consideraciones finales

Los resultados demuestran que fusionar la informacion de color y textu-ra en el proceso de extraccion de caracterısticas mejora los resultados consi-derablemente. El proceso de normalizacion de orientacion permite que los al-goritmos de extraccion no invariantes a la rotacion no pierdan su poder des-criptivo. El framework creado para este trabajo esta disponible en https:

//github.com/jmendozais/image-classification-framework.git.

27

Page 29: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

(a) EP-CLBP

u

(b) EP-CLBP

ror

(c) EP-CLBP

nriu

(d) Gabor wav.

Figura 5.2: Matrices de confusion para las variaciones del descriptor Completed-LBP

28

Page 30: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

Bibliografıa

[Backes et al., 2009] Andre Ricardo Backes, Dalcimar Casanova, and Odemir Marti-nez Bruno. A complex network-based approach for boundary shape analysis.Pattern Recognition, 42(1):54–67, 2009.

[Cortes and Vapnik, 1995] Corinna Cortes and Vladimir Vapnik. Support-vector net-works. Machine learning, 20(3):273–297, 1995.

[Costa et al., 2007] L da F Costa, Francisco A Rodrigues, Gonzalo Travieso, and Pau-lino Ribeiro Villas Boas. Characterization of complex networks: A survey ofmeasurements. Advances in Physics, 56(1):167–242, 2007.

[Flusser et al., 2009] Jan Flusser, Barbara Zitova, and Tomas Suk. Moments and

moment invariants in pattern recognition. Wiley, 2009.

[Gonzalez-Rufino et al., 2013] E Gonzalez-Rufino, P Carrion, E Cernadas,M Fernandez-Delgado, and R Domınguez-Petit. Exhaustive compari-son of colour texture features and classification methods to discriminate cellscategories in histological images of fish ovary. Pattern Recognition, 2013.

[Guo et al., 2010] Zhenhua Guo, Lei Zhang, and David Zhang. A completed modelingof local binary pattern operator for texture classification. Image Processing,

IEEE Transactions on, 19(6):1657–1663, 2010.

[Liu and Yang, 2013] Guang-Hai Liu and Jing-Yu Yang. Content-based image re-trieval using color di↵erence histogram. Pattern Recognition, 46(1):188–198,2013.

[Nanni et al., 2012] Loris Nanni, Alessandra Lumini, and Sheryl Brahnam. Surveyon lbp based texture descriptors for image classification. Expert Systems with

Applications, 39(3):3634–3641, 2012.

[Ojala et al., 2002] Timo Ojala, Matti Pietikainen, and Topi Maenpaa. Multiresolu-tion gray-scale and rotation invariant texture classification with local binarypatterns. Pattern Analysis and Machine Intelligence, IEEE Transactions on,24(7):971–987, 2002.

[Paisitkriangkrai et al., 2014] Sakrapee Paisitkriangkrai, Chunhua Shen, and Antonvan den Hengel. Strengthening the e↵ectiveness of pedestrian detection withspatially pooled features. arXiv preprint arXiv:1407.0786, 2014.

[Prokop and Reeves, 1992] Richard J Prokop and Anthony P Reeves. A survey ofmoment-based techniques for unoccluded object representation and recogni-tion. CVGIP: Graphical Models and Image Processing, 54(5):438–460, 1992.

29

Page 31: Descriptores visuales y su aplicaci´on a la clasificaci´on ...juliomb/resources/coffee_project.pdf · Descriptores visuales y su aplicaci´on a la clasificaci´on de granos de

[Qian et al., 2011] Xueming Qian, Xian-Sheng Hua, Ping Chen, and Liangjun Ke.Plbp: An e↵ective local binary patterns texture descriptor with pyramid re-presentation. Pattern Recognition, 44(10):2502–2515, 2011.

[Wand, 1997] MP Wand. Data-based choice of histogram bin width. The American

Statistician, 51(1):59–64, 1997.

[Wang and Zhang, 2012] Xiu-xiang Wang and Jian-fang Zhang. Histogram-kernelerror and its application for bin width selection in histograms. Acta Mathe-

maticae Applicatae Sinica, English Series, 28(3):607–624, 2012.

[Yang et al., 2008] Mingqiang Yang, Kidiyo Kpalma, Joseph Ronsin, et al. A surveyof shape feature extraction techniques. Pattern recognition, pages 43–90, 2008.

[Zhu, 2012] Chao Zhu. E↵ective and e�cient visual description based on local binary

patterns and gradient distribution for object recognition. PhD thesis, Ecolecentrale de Lyon, 2012.

30