teorÍa de decisiÓn · 2018. 11. 6. · ejemplo : detecciÓn binaria en presencia de ruido la...

51
TEORÍA DE DECISIÓN Estas transparencias contienen material adaptado del curso de PATTERN RECOGNITION AND MACHINE LEARNING de Heikki Huttunen Statistical Signal Processing Detection Theory - Steven M. Kay

Upload: others

Post on 21-Aug-2021

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

TEORÍA DE DECISIÓNEstas transparencias contienen material adaptado del curso de PATTERN RECOGNITION

AND MACHINE LEARNING de Heikki Huttunen Statistical Signal Processing Detection Theory - Steven M. Kay

Page 2: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

TEORÍA DE DECISIÓN

➤ Tiene muchos temas comunes con aprendizaje automático

➤ Los métodos se basan en teoría de estimación y tratan dar respuesta a cuestiones como:

¿Está unas señal específica presente en nuestra serie temporal ? Ej: detección de un tono en presencia de ruido

¿ Cambia el valor de continua de una señal en el tiempo?

¿Está presente una persona en este cuadro de video?

➤ Relacionado con test de hipótesis que es muy aplicado en medicina: ¿La respuesta se debe a la nueva medicación o a variaciones aleatorias?

Page 3: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

EJ: DETECCIÓN DE SINUSOIDE EN PRESENCIA DE RUIDO

➤ H1: corresponde a la hipótesis señal presente - hipótesis alternativa

➤ H0: corresponde a la hipótesis solo ruido- hipótesis nula

Page 4: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO

➤ Supongamos que x[0] es una muestra que proviene de una de dos densidades N(0,1) o N(1,1)

➤ El objetivo es elegir la hipótesis correcta en forma óptima.

➤ Las hipótesis son en este caso:

elijo la hipótesis con mayor verosimilitud para x[0] observado.

Page 5: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

➤ Elijo H1 si es más probable que es decir si:

EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO

Page 6: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO

➤ La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2.

➤ Considerando que:

➤ La regla de decisión consiste en comparar el valor del cociente de verosimilitudes (test de razón de verosimilitud, LRT) contra un umbral, en este caso de valor 1.

Page 7: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

EJEMPLO: DETECCIÓN DE LESIÓN

disjuntasson densidades las si 0y 1ser puede Solo aumenta aumenta si positivas densidades lasser Al

)(detección de adprobabilid

)(alarma falsa de adprobabilid

10 decide se donderegión : enfermo ,maligna"lesión " detectar, a evento )( :

normal ,benigna"lesión " nula, hipótesis )( ::simple hipótesis de test osConsiderem

1

1

1

0

11

00

==

==

==

=

FAD

FAD

RD

RFA

ii

PPPP

dfP

dfP

, iHRfHfH

xx

xx

xxxx

f0(x) f1(x)

R0 R1

Page 8: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

TIPOS DE ERROR

➤ En el ejemplo anterior se ve que aparecen distintos tipos de error y con costos distintos, perder una detección es mucho más caro que una falsa detección.

➤ El compromiso entre falsas detecciones (área azul) y pérdidas (área roja) se puede ajustar cambiando el umbral de detección.

Page 9: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

TIPOS DE ERROR

➤ Cada probabilidad se puede hacer arbitrariamente pequeña ajustando el umbral.

Page 10: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

EJEMPLO: PROBABILIDAD FALSA ALARMA, PÉRDIDA , DETECCIÓN

➤ Probabilidad de falsa alarma y perdida cuando

➤ Probabilidad de detección:

Page 11: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

TEOREMA DE NEYMAN-PEARSON

➤ Teniendo en cuenta que PFA y PD dependen cada una de la otra nos interesa maximizar PD sujeto a un valor máximo permitido de PFA.

➤ Teorema de Neyman-Pearson: establece que fijada PFA se maximiza PD si :

donde el umbral cumple:

L

L

Page 12: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

EJEMPLO: NEYMAN-PEARSON DETECCIÓN BINARIA

➤ Quiero encontrar el mejor detector cuando trasmito señal con media 1 o 0 en presencia de ruido gaussiano y quiero que el % de falsas alarmas no supere el 10%. (PFA=0.1)

➤ Aplicando Neyman-Pearson la regla de detección es:

➤ Para resolver el problema tenemos que determinar el umbral:

L

L

Page 13: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

EJEMPLO: NEYMAN-PEARSON DETECCIÓN BINARIA

➤ Esto puede implementarse con la función isf, que resuelve la inversa de la función distribución acumulada:

➤ Los parámetros loc y scale corresponden a la media y la desviación estándar de la densidad gaussiana.

Page 14: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

DETECTOR NP PARA UNA SEÑAL CONOCIDA

➤ Neyman-Pearson aplica para cualquier problema en el que tenemos acceso a las verosimilitudes.

➤ Un ejemplo es el caso en que se trasmite una señal conocida y se detecta la reflejada con ruido superpuesto un tiempo después(radar).

Page 15: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

DETECTOR NP PARA UNA SEÑAL CONOCIDA

➤ En este caso las verosimilitudes, bajo el supuesto de ruido gaussiano con media nula corresponden con pdf de gaussianas multivariadas:

➤ El test de cociente de verosimilitudes:

L

Page 16: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

DETECTOR NP PARA UNA SEÑAL CONOCIDA

➤ Tomando logaritmo de ambos lados y juntando la señal conocida con el umbral se simplifica la regla de detección:

L

L

L

Page 17: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

NEYMAN PEARSON DETECTOR DE CONTINUA

➤ Regla de detección: Comparo la media de las muestras recibidas contra un umbral que depende del PFA elegido.

➤ T(x) tiene distribución Gaussiana bajo ambas hipótesis con media 0 y A y varianza N veces menor.

Ver Kay

L

Page 18: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

NEYMAN PEARSON DETECTOR DE CONTINUA

Kay

Page 19: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

NEYMAN PEARSON (DISTINTAS MEDIAS - IGUAL VARIANZA)

Kay

Page 20: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

NEYMAN PEARSON (VARIANZAS DISTINTAS)

Kay

Page 21: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

DETECTOR DE UNA SINUSOIDE CONOCIDA EN PRESENCIA DE RUIDO

➤ Regla de detección: comparo la correlación de la señal recibida con la señal conocida y comparo con un umbral que depende de del PFA elegido.

Page 22: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

DETECTOR DE UNA SINUSOIDE CONOCIDA EN PRESENCIA DE RUIDO

➤ Ejemplo con desviación 0.5.

Page 23: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

DETECCIÓN DE UNA SEÑAL ALEATORIA EN PRESENCIA DE RUIDO

➤ En el caso previo se suponía que conocemos tanto la frecuencia como la fase de la sinusoide algo que agrega muchas restricciones al problema de detección.

➤ Es más razonable suponer que no conocemos exactamente la señal pero si la estructura de correlación

y formular el problema de detección como el test de hipótesis:

Page 24: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

DETECCIÓN DE UNA SEÑAL ALEATORIA EN PRESENCIA DE RUIDO

➤ La regla de decisión:

Con:

Para el caso de la sinusoide:

Page 25: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

DETECCIÓN SINUSOIDE CON FASE ALEATORIA EN RUIDO

Page 26: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

RECEIVER OPERATING CHARACTERISTIC (ROC CURVE)

➤ Una forma usual de mostrar el desempeño de un detector es a través de la curva característica de operación (ROC)

➤ Describe la relación entre PFA y PD para todos los valores del umbral.

➤ La forma de la ROC depende del problema y del detector seleccionado.

Page 27: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

EJEMPLO: ROC DETECCIÓN NIVEL DE DC

Page 28: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

ROC

.4d 1dazul 1 6. 0roja 1 1 0

21

1202

1101

==

===

===

σµµ

σµµ

azul .8 1 8. 0roja 1 1 0

12021202

11011101

====

====

σσµµ

σσµµ

σ

µµ

σµσµ

01

211

200

d

bilidad"discrimina" lapor adeterminad ROC),( ),( :Ej

−=

== NfNf

Page 29: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

ROC Y AUC

➤ Cuanto mayores son los valores de la ROC mejor es el desempeño del detector.

➤ La diagonal corresponde a suposición aleatoria

➤ Una medida de desempeño que se deriva de la ROC es el Área debajo de la curva ROC que se denomina AUC

➤ Es una medida que es independiente del umbral y que representa el desempeño del clasificador para todos los umbrales.

➤ En el ejemplo de la detección de continua el AUC disminuye cuando aumenta la varianza del ruido.

Page 30: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

ROC Y AUC

Page 31: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

AUC EMPÍRICA

➤ El uso de la ROC y AUC surge en problemas de detección de objetivos con radar o radio.

➤ Más recientemente se han convertido en medidas usuales del desempeño de clasificadores, y en particular son medidas muy usadas en el área médica para comparar la efectividad de distintos test o tratamientos. Dependiendo del área de aplicación pueden variar la terminología utilizada.

➤ Usualmente no se tiene la posibilidad de usar formas cerradas analíticas para determinar la ROC y AUC, siendo lo usual evaluar los resultados predichos en un conjunto de test (TP, FP, TN, FN, con Matriz de Confusión)

Page 32: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

TÉRMINOS ESTADÍSTICOS PARA TEST DE HIPÓTESIS

Estadísticos IngenierosTest estadístico y umbral Detector

Hipótesis nula H0 Hipótesis solo ruidoHipótesis alternativa H1 Hipótesis señal + ruido

Región crítica Región con presencia de señalError tipo I (decido H1 cuando H0 Falsa alarma Error tipo II (decido H0 cuando H1 PérdidaNivel de significancia o tamaño del

test (α).Probabilidad de Falsa alarma (PFA)

Probabilidad de Error tipo II (β) Probabilidad de pérdida(PM)

Potencia del test (1-β) Probabilidad de detección(PD)

Page 33: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

APLICACIÓN ROC A DIAGNÓSTICO MÉDICO

Sensibilidad: probabilidad de que un test resulte positivo cuando la enfermedad esta presente. Especificidad: probabilidad que un test resulte negativo cuando la enfermedad no está presente

Ej: comparación de dos test de diagnóstico de diferentes laboratorios

Page 34: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

DETERMINACIÓN EMPÍRICA PD Y PFA

➢ Analizo en forma experimental utilizando un conjunto de test.

Matriz de Confusión o Tabla de contingencia

alarmas falsas de tasa

detección de tasa

TNFPFPP

FNTPTPP

FA

D

+=

+=

Predicción + Predicción -Clase + TP FNClase - FP TN

Graficando ROCs puedo comparar la discriminabilidad para comparar efectividad de tratamientos distintos.

Page 35: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

COMPARACIÓN DE ROCS

Curvas ROC empíricas de pruebas diagnósticas distintas con área bajo la curva similares pero comportamiento distinto.

Page 36: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

EJEMPLO: ROC Y AUC PROBLEMA DE CLASIFICACIÓN

Page 37: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

EJEMPLO: ROC Y AUC PROBLEMA DE CLASIFICACIÓN

➤ Se busca un clasificador lineal que minimice el error sobre los datos de entrenamiento.

➤ Determino los coeficientes de una recta y=ax+b, donde a y b se aprenden de los datos de entrenamiento.

Page 38: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

EJEMPLO: ROC Y AUC PROBLEMA DE CLASIFICACIÓN

➤ Se puede cambiar la sensibilidad del clasificador cambiando los parámetros del clasificador, lo que es una forma de determinar en forma empírica la ROC.

Page 39: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

EJEMPLO ROC Y AUC 4 CLASIFICADORES

Page 40: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

ROC Y AUC EN PYTHON

Page 41: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

COMPARACIÓN DE ROCS Y AUCS

Comparación de algoritmos de clasificación distintos

Imagen: Hastie et al.

Page 42: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

OTRAS MEDIDAS DE DESEMPEÑO

RP)RP(1

Fv :value-F

FPTPTP

P :Precision

FNTPTP

R :Recall

FNFPTNTPTNTP

A :Accuracy

2

2

+

+=

+=

+=

+++

+=

β

β573 427

1868 48132

156 844125 49875

Page 43: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

OTRAS MEDIDAS DE DESEMPEÑO

Page 44: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

GENERALIZACIÓN - VALIDACIÓN CRUZADA

➤ Lo importante es cuán bien clasifica a los datos no vistos.

➤ Un clasificador sobre entrenado memoriza los datos de entrenamiento y no generaliza

➤ La capacidad de generalizar debe ser probada con datos no vistos.

➤ Una forma estándar es hacer k -validación cruzada: 1) separar el conjunto de datos en k subconjuntos. 2)Uso cada conjunto para evaluar mientras que entreno con los restantes. 3) El error lo estimo como la media el desempeño de todos los conjuntos de test. Un valor usual de k es 5 o 10.

Page 45: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

VALIDACIÓN CRUZADA

➤ La función puede recibir más parámetros, cambiar el número de folds, estratificación, balance.

Page 46: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

VALIDACIÓN CRUZADA ESTRATIFICADA

➤ En lugar de hacer una partición aleatoria, cada subconjunto tiene la misma proporción de muestras de cada clase que el conjunto original.

Page 47: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

DEJAR UNO AFUERA (LEAVE ONE OUT)

➤ Caso extremo k fold -cross validation. Se usa cuando tengo pocas muestras. Costoso y con gran varianza.

Page 48: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

SELECCIÓN DE K

➤ El mejor k depende de la cantidad de datos, la dificultad del problema, la métrica.

➤ Cuantos más folds mejor pero la varianza crece cuando se acerca a leave one out.

Page 49: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

OVERFITTING

➤ La generalización está relacionada con el overfitting.

➤ Los modelos de mayor orden se ajustan mucho a los datos de entrenamiento incluido el ruido de los mismos y por lo tanto pueden ser inestables y con dificultades para generalizar.

Page 50: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

REGULARIZACIÓN

➤ Una forma de mitigar este efecto es mediante estrategias de regularización que agregan términos de penalidad al error de ajuste.

➤ Se estimula al modelo para que elija coeficiente pequeños.

➤ Los coeficientes grandes son costosos.

➤ Se logran modelos de orden altos, con capacidad de expresión pero que no sigan el ruido de los patrones.

Page 51: TEORÍA DE DECISIÓN · 2018. 11. 6. · EJEMPLO : DETECCIÓN BINARIA EN PRESENCIA DE RUIDO La regla de decisión se puede reducir a comparar el valor de x[0] con el umbral = 1/2

BAYESIANOS- FRECUENTISTAS

➢ Frecuentistas: aplican Neyman-Pearson: Maximiza la probabilidad de detección sujeto a una probabilidad de falsa alarma determinada. No involucra conocimiento a priori.

➢ Bayesianos determinan las reglas de decisión que minimizan riesgos utilizando priors.

➢ Discusión epistemológica: ➢ Bayesianos: probabilidad indica grado de creencia no tiene porque haber un

experimento ➢ Frecuentistas: la probabilidad es la frecuencia de ocurrencia de un evento. Tiene que

haber datos y experimento.

➢ La elección de uno u otro enfoque depende del problema. En los sistemas de radar y sonar se utiliza típicamente Neyman-Pearson mientras que en los sistemas de comunicación se utiliza el riesgo Bayesiano.