Jesús García Herrero CLASIFICADORES BAYESIANOS

Documentos relacionados
Minería de Datos (MD) estadística

Introducción. Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna. Fernando Pérez Nava

OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls

1. Variable aleatoria. Clasificación

Aprendizaje Bayesiano. Oscar Javier Prieto Izquierdo Raúl Casillas Díaz

Reconocimiento de Patrones. Autores: José Luis Alba - Universidad de Vigo Jesús Cid - Universidad Carlos III de Madrid

Ejemplo: Consumo - Ingreso. Ingreso. Consumo. Población 60 familias

Aprendizaje Mecánico Supervisado y Clasificación

Estadísticos muéstrales

6 Minimización del riesgo empírico

PROBABILIDAD Y ESTADÍSTICA

CURSO INTERNACIONAL: CONSTRUCCIÓN DE ESCENARIOS ECONÓMICOS Y ECONOMETRÍA AVANZADA. Instructor: Horacio Catalán Alonso

Modelos lineales Regresión simple y múl3ple

3. Análisis de Factores

para cualquier a y b, entonces f(x) es la función de densidad de probabilidad de la variable aleatoria continua X.

Reconocimiento de Locutor basado en Procesamiento de Voz. ProDiVoz Reconocimiento de Locutor 1

Econometría de corte transversal. Pablo Lavado Centro de Investigación de la Universidad del Pacífico

Análisis del caso promedio. Técnicas Avanzadas de Programación - Javier Campos 70

Nos interesa asignar probabilidades a valores numéricos obtenidos a partir de fenómenos aleatorios, es decir a variables aleatorias.

17/02/2015. Ángel Serrano Sánchez de León

Métodos Matemá5cos en la Ingeniería Tema 1. Ecuaciones no lineales

CAPÍTULO 5 REGRESIÓN CON VARIABLES CUALITATIVAS

UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FISICAS Y MATEMÁTICAS

2: p.d.f. BASED MODELS

H 0 : La distribución poblacional es uniforme H 1 : La distribución poblacional no es uniforme

Aspectos fundamentales en el análisis de asociación

16/02/2015. Ángel Serrano Sánchez de León

Instrucciones: Leer detenidamente los siete enunciados y resolver seis de los siete problemas propuestos. Frecuencia absoluta (f i )

A. Una pregunta muy particular que se puede hacer a una distribución de datos es de qué magnitud es es la heterogeneidad que se observa.

FE DE ERRATAS Y AÑADIDOS AL LIBRO FUNDAMENTOS DE LAS TÉCNICAS MULTIVARIANTES (Ximénez & San Martín, 2004)

OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls. Examen Final

PyE_ EF1_TIPO1_

Análisis de supervivencia

CAPÍTULO 4 MARCO TEÓRICO

PyE_ EF2_TIPO1_

Variables Aleatorias

2. Cómputo Bayesiano

Universidad Diego Portales Facultad de Economía y Empresa

Estimación no lineal del estado y los parámetros

Variables Aleatorias

Capítulo 4: Clasificación no paramétrica (Secciones )

Problemas de Optimización. Conceptos básicos de optimización. Indice. Un problema de optimización NLP. Equivalencias. Contornos / Curvas de nivel

2 de mar de 2004 Codificación de imágenes y video

Métodos específicos de generación de diversas distribuciones discretas

Regresión y Correlación Métodos numéricos

VII. Solución numérica de ecuaciones diferenciales

Redes Neuronales Support Vector Regression

TEMA 1: INCERTIDUMBRE Y PROBABILIDAD

CAPÍTULO IV. MEDICIÓN. De acuerdo con Székely (2005), existe dentro del período información

Modelos triangular y parabólico

FUNCION DE BASE RADIAL Radial Basis Function (RBF)

1. Notación y tabulación

Un estimado de intervalo o intervalo de confianza ( IC

Problema: Existe relación entre el estado nutricional y el rendimiento académico de estudiantes de enseñanza básica?

2. Cómputo Bayesiano

OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls. Preguntas y Ejercicios para Evaluación: Tema 5

Problemas donde intervienen dos o más variables numéricas

EVALUACIÓN DEL COMPORTAMIENTO DE LOS ESTIMADORES DE LOS PARÁMETROS DE UN MODELO NO LINEAL MIXTO. UNA COMPARACIÓN DE MÉTODOS DE ESTIMACIÓN

Instituto Tecnológico Superior del Sur del Estado de Yucatán EGRESIÓN LINEAL REGRESI. 10 kg. 10 cm

3. VARIABLES ALEATORIAS.

Figura 1

T. 9 El modelo de regresión lineal

Variables Aleatorias. Variables Aleatorias. Variables Aleatorias. Objetivos del tema: Al final del tema el alumno será capaz de:

Capítulo 2: ANALISIS EXPLORATORIO de DATOS Estadística Computacional 1º Semestre 2003

Variable aleatoria: definiciones básicas

TEMA 5. INTERPOLACION

Pattern Classification

Tema 1:Descripción de una variable. Tema 1:Descripción de una variable. 1.1 El método estadístico. 1.1 El método estadístico. Describir el problema

Pronósticos. Humberto R. Álvarez A., Ph. D.

, x es un suceso de S. Es decir, si :

Departamento de Señales, Sistemas y Radicomunicaciones Comunicaciones Digitales, junio 2011

3. Algunos modelos estadísticos

Tema 5: Incumplimiento de las Hipótesis sobre el Término de Perturbación

DISTRIBUCIONES BIDIMENSIONALES

ANÁLISIS DE FRECUENCIAS

Resolución. Instrucciones: Leer detenidamente los siete enunciados y resolver seis de los siete problemas propuestos.

Índice. Tema 8: Teoría de la Respuesta al Ítem (2). 1. La estimación de los parámetros de los modelos

Econometría. Ayudantía # 01, Conceptos Generales, Modelo de Regresión. Profesor: Carlos R. Pitta 1

EJERCICIO 1 1. VERDADERO 2. VERDADERO (Esta afirmación no es cierta en el caso del modelo general). 3. En el modelo lineal general

TEMA VII. VARIABLE ALEATORIA. CLASIFICACIÓN Y CARACTERISTICAS

UNIDAD 12: Distribuciones bidimensionales. Correlación y regresión

TEMA 5. INTERPOLACION

Tema 1: Estadística Descriptiva Unidimensional

Tema 1.- Variable aleatoria discreta (V2.1)

INTRODUCCIÓN. Técnicas estadísticas

Sistemas de Reconocimiento de Patrones

CyRCE: Un modelo de Riesgo de Crédito para Mercados Emergentes.

Dicha tabla adopta la forma del diagrama de árbol del dibujo. En éste, a cada uno de los sucesos A y A c se les ha asociado los sucesos B y B c.

Detección Bayesiana de Efectos Activos en Experimentos Factoriales con Respuesta Dicotómica.

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 17 de Mayo de :00 horas

GERENCIA DE OPERACIONES Y PRODUCCIÓN DISEÑO DE NUEVOS PRODUCTOS Y SERVICIOS ESTRATEGIAS DE OPERACIONES

Tema 8: DESIGUALDAD, Xisco Oliver Economía del Bienestar (2º GECO)

OPTIMIZACIÓN DE REDES BAYESIANAS BASADO EN TÉCNICAS DE APRENDIZAJE POR INDUCCIÓN

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 6 de Junio de :00 horas. Pregunta 19 A B C En Blanco. Pregunta 18 A B C En Blanco

Transcripción:

Jesús García Herrero CLASIFICADORES BAYESIANOS En esta clase se presentan los algortmos Análss de Datos para abordar tareas de aprendzaje de modelos predctvos. Se partcularzan las técncas estadístcas vstas anterormente para resolver tareas predctvas: por un lado la regresón (lneal o no lneal para predecr valores numércos, y su aplcacón para predecr probabldades y clasfcar nstancas medante regresón logístca, y los clasfcadores bayesanos como modelo de aprendzaje de parámetros de dstrbucones de probabldad para predecr probabldades de clases. La clasfcacón medante regresón permte estmar las fronteras de decsón entre clases, presentando la equvalenca del aprendzaje de fronteras de clasfcacón al de las funcones de estmacón de pertenenca a la clase. Se puede ver la lmtacón de esta técnca a problemas lnealmente separables. Los clasfcadores bayesanos parten del prncpo de probabldad condconada para estmar probabldades a posteror de pertenca a clases de las nstanca, una vez calculadas las probabldades de los valores de los atrbutos (probabldades a pror en la fase de entrenamento. Estos clasfcadores permten tratar con datos nomnales y numércos, en este últmo caso utlzando dstrbucones normales para smplfcar el proceso. La lmtacón está en el cálculo de dependencas entre los atrbutos, que requerría un número de datos eponencal con la dmensón de éstos, problema habtualmente tratado con la smplfcacón de ndependenca condconal (método naïve Bayes. Se completa el tema revsando aspectos práctcos que surgen al aplcar técncas de clasfcacón sobre datos reales: tratamento de datos ncompletos y datos nsufcentes para estmar probabldades muy pequeñas.

Clasfcadores Bayesanos Métodos probablístcos y numércos de clasfcacón Jesús García Herrero Unversdad Carlos III de Madrd Técncas Cláscas en Problemas de Clasfcacón

Clasfcacón numérca Modelado de datos con atrbutos numércos para su aplcacón a Clasfcacón. Generalzacón Datos representados como vectores de atrbutos numércos: patrones A A... A F... F... F 3 3... 3 F............ N N... N F Problemas: dmensonaldad, sobreajuste. X, X,..., X N Técncas Cláscas en Problemas de Clasfcacón

Clasfcacón numérca Problema de Clasfcacón Clases: {C,..., C M } ( Muestras:E= {X,..., X Tamaño: ( n, X ( Para cada clase, C, hay n patrones, cada uno con F ( ( atrbutos: para cada clase C: {X,..., X } X ( j N Técncas Cláscas en Problemas de Clasfcacón,..., X ( n,..., X (M..., X (M n M ( j M n j j ( Fj ; j,..., n n }

Clasfcacón numérca g(. : R X F C {C,...,C Ĉ g(x Funcón dscrmnante de cada clase: g (X (X g g M (X Propedad deseable para el dseño de g (.: sobre el conjunto de entrenamento E, cada patrón de la clase C tene un valor mámo con el dscrmnante g(.: ( ( g ( X ma { g ( X }, j,..., n Técncas Cláscas en Problemas de Clasfcacón g (X,,...,M X Ma(. Ĉ j M },..., M j

X Fronteras de decsón g j (X : lneales 30 5 0 5 g 3 3 g 3 0 5 0 g 0 5 0 5 0 5 30 X Técncas Cláscas en Problemas de Clasfcacón

X Fronteras de decsón 30 5 0 5 0 g j (X : cuadratcas g g 3 g 3 3 5 0 g 0 5 0 5 0 5 30 X Técncas Cláscas en Problemas de Clasfcacón

Técncas Cláscas en Problemas de Clasfcacón Clasfcacón con Regresón Lneal Para cada clase se defne la funcón de pertenenca g : Se construye una funcón lneal que aprome g : Hay que aprender M funcones g C X 0; C X ; (X g t t t (I n t ( t ( n t ( y H ] H [H A ; X X X X H 0 0 y I todos los datos s en los patrones de C 0 s en resto

Clasfcacón bayesana: aplcacón de modelos estadístcos Clasfcacón con modelo de estructura probablístca conocda Clases: {C,..., C M }. Se conoce a pror: Probabldades de clase: P(C Dstrbucones de probabldad condconadas (parámetros constantes F X (,..., densdad I P(X f X(,...,I P(X,...,X P(C I I,...,X I,C I F X(,...,I... I I Técncas Cláscas en Problemas de Clasfcacón

Técncas Cláscas en Problemas de Clasfcacón Parámetros: vector de medas y matrz covaranzas Ejemplo Ej.: dstrbucón normal multvarada n t n / F n F F S ; ( S ( ep S f ( 6 6 S ; 5 30

Teorema de Bayes aplcado a clasfcacón P(C X f (X p(c f (X Probabldad a posteror: es la probabldad de que el ejemplo tenga clase C: P(C X Probabldad a pror: P(C es la probabldad total de cada clase erosmltud: f (X : es la dstrbucón de C aplcada a X Densdad total: f (X f (X P(C... f (X MP(CM Crtero de clasfcacón MAP: Clase(X mámo P(C X mámo f (X p(c funcón dscrmnante de C : proporconal a su prob a posteror: g(x f (X p(c la clase es la de aquella que mamza el dscrmnante Técncas Cláscas en Problemas de Clasfcacón

Clasfcacón bayesana y dstrb normal Dstrbucones condconales gaussanas. Para cada clase C hay una funcón dscrmnante de parámetros j, j, j=...i g ( log(p(c smplfcaon : K f ( F log ( j j / n / j P(C... F ( t S ( Parámetros de dstrbucón condconada a cada clase Regones de decsón: Funcones cuadrátcas (hpérbolas dadas por dferencas: g ( g ( g ( S son guales, y dagonales: regones lneales (caso partcular Técncas Cláscas en Problemas de Clasfcacón j j

Ejemplo con dstrbucón normal C: C: C3: 6 6 t 30 5 ; R P 0.3; C 6 6 t 35 5 ; R P 0.; C 6 6 6 t 0 0 ; R P3 0.5; C3 3 4 Técncas Cláscas en Problemas de Clasfcacón

Ejemplo 40 30 g 0 0 0-0 -0-30 C g 3 C 3 C g 3-50 -40-30 -0-0 0 0 0 30 40 50 Técncas Cláscas en Problemas de Clasfcacón

Resumen clasfcador bayesano numérco Algortmo: Estmar parámetros de cada clase C (entrenamento C :{X (,...,X ( n }, C ˆ n ( n j j Estmar probabldad de cada clase Pˆ (C n M ; n n N C n t ( ( n j Obtener regones de decsón: g j (. Técncas Cláscas en Problemas de Clasfcacón

Clasfcacón Bayesana con Atrbutos Nomnales Atrbutos nomnales con valores dscretos A ={,..., n }: atrbuto con n valores posbles Pasamos de densdades a probabldades: probabldad a pror: p(a = j C? Estmacón contando el número de casos: p(a j nº de ejemplos de clase C nº de ejemplos de clase con A C j Técncas Cláscas en Problemas de Clasfcacón

Clasfcacón Bayesana con Atrbutos Nomnales Smplfcacón: ndependenca de atrbutos ( Nave Bayes : la probabldad conjunta de varos atrbutos se pone como producto X p(x (A,A p(a,...,a I *p(a I *...*p(a I I Clasfcacón: p(c p(a X p(x *p(c p(x *p(a *...*p(a p(x F F *p(c Técncas Cláscas en Problemas de Clasfcacón

Ejemplo con atrbutos nomnales SALARIO CLIENTE EDAD HIJOS CRÉDITO Poco Sí Joven Uno NO Mucho S Joven Uno SI Mucho S Joven Uno SI Poco S Joven Uno NO Mucho S Joven Dos SI Poco S Joven Dos NO Mucho S Adulto Dos SI Mucho S Adulto Dos SI Poco No Adulto Dos NO Mucho S Adulto Dos SI Medo No Adulto Tres NO Mucho S Adulto Dos SI Medo S Adulto Dos SI Medo No Adulto Tres NO Medo No Adulto Dos SI Mucho No Mayor Tres NO Poco No Mayor Tres SI Poco No Mayor Tres SI Mucho No Mayor Tres NO Mucho No Mayor Tres SI p(si = /0 p(no = 8/0 Crédto No Sí Salaro Poco 4/8 / Mucho /8 8/ Medo /8 / Crédto No Sí Clente Sí 3/8 8/ No 5/8 4/ Crédto No Sí Edad Joven 3/8 3/ Adulto 3/8 6/ Mayor /8 3/ Crédto No Sí Hjos Uno /8 / Dos /8 7/ Tres 4/8 3/ Técncas Cláscas en Problemas de Clasfcacón

Ejemplo con atrbutos nomnales Ej.: (salaro=poco, clente=s, edad=adulto, hjos=tres p(si X p(s poco SI*p(c s SI*p(e / *8/ *6/ *3/ * / 0 / p(x adulto SI*p(h 0.0083 / p(x tres SI*p(SI / p(x p(no X p(s poco NO*p(c s NO*p(e adulto NO*p(h 4/8*3/8*3/8* 4/8*8/ 0 / p(x 0.04/ p(x tres NO*p(NO / p(x Técncas Cláscas en Problemas de Clasfcacón

Atrbutos sn valores S el ejemplo a clasfcar no tene un atrbuto, smplemente se omte. Ej.: (salaro=poco, clente=s, edad=?, hjos=3 p(si X p(s poco SI*p(c / *8/ *3/ * / 0 / p(x p(no X s SI*p(h p(s poco NO*p(c s NO*p(h 4/8*3/8* 4/8*8/ 0 / p(x tres SI*p(SI / p(x 0.067 / p(x 0.0375 / p(x tres NO*p(NO / p(x S hay faltas en la muestra de entrenamento, no cuentan en la estmacón de probabldades de ese atrbuto Técncas Cláscas en Problemas de Clasfcacón

Faltas en atrbuto EDAD SALARIO CLIENTE EDAD HIJOS CRÉDITO Poco Sí Joven Uno NO Mucho S Joven Uno SI Mucho S Joven Uno SI Poco S? Uno NO Mucho S? Dos SI Poco S? Dos NO Mucho S? Dos SI Mucho S Adulto Dos SI Poco No Adulto Dos NO Mucho S Adulto Dos SI Medo No Adulto Tres NO Mucho S Adulto Dos SI Medo S Adulto Dos SI Medo No Adulto Tres NO Medo No Adulto Dos SI Mucho No Mayor Tres NO Poco No Mayor Tres SI Poco No Mayor Tres SI Mucho No Mayor Tres NO Mucho No Mayor Tres SI p(si = /0 p(no = 8/0 Crédto No Sí Salaro Poco 4/8 / Mucho /8 8/ Medo /8 / Crédto No Sí Clente Sí 3/8 8/ No 5/8 4/ Crédto No Sí Edad Joven /6 /0 Adulto 3/6 5/0 Mayor /6 3/0 Crédto No Sí Hjos Uno /8 / Dos /8 7/ Tres 4/8 3/ Técncas Cláscas en Problemas de Clasfcacón

Atrbutos no representados. Laplace Problema: con muestra poco representatva, puede ocurrr que en alguna clase, un valor de atrbuto no aparezca: p(a = j C =0 Cualquer ejemplo X con A = j generará P(C X=0, ndependentemente de los otros atrbutos! Se suele modfcar la estmacón de las probabldades a pror con un factor que elmna los ceros. Ej.: P(Edad Crédto=NO= 3 3 Joven :, Adulto:, Mayor: 8 8 8 Ley : 3 /3 3 /3 /3 Joven :, Adulto:, Mayor: 8 8 8 A veces smplemente se ncalzan las cuentas a en vez de 0: 3 Joven :, 8 3 3 Adulto:, 8 3 Mayor: 8 3 Técncas Cláscas en Problemas de Clasfcacón

Atrbutos mtos Independenca de atrbutos ( Nave Bayes p(x p(a *p(a *...*p(a F F Atrbutos dscretos: probabldades a pror con cada clase C p(a j nº de ejemplos de clase nº de ejemplos de clase Atrbutos contnuos: densdades de clase C: normales de parámetros C con A C j, p(a j f A ( j ep ( j Técncas Cláscas en Problemas de Clasfcacón

Ejemplo con atrbutos mtos SALARIO CLIENTE EDAD HIJOS CRÉDITO 55 Sí Joven NO 000 S Joven SI 500 S Joven SI 470 S Joven NO 3000 S Joven SI 50 S Joven NO 800 S Adulto SI 700 S Adulto SI 550 No Adulto NO 600 S Adulto SI 00 No Adulto 3 NO 300 S Adulto SI 00 S Adulto SI 900 No Adulto 3 NO 800 No Adulto SI 800 No Mayor 3 NO 300 No Mayor 3 SI 00 No Mayor 3 SI 000 No Mayor 3 NO 4000 No Mayor 3 SI p(si = /0 p(no = 8/0 Crédto No Sí Salaro Meda 73 9 Desv Estándar 49 94 Crédto No Sí Clente Sí 3/8 8/ No 5/8 4/ Crédto No Sí Edad Joven 3/8 3/ Adulto 3/8 6/ Mayor /8 3/ Crédto No Sí Hjos Meda.5.08 Desv Estándar 0.89 0.67 Técncas Cláscas en Problemas de Clasfcacón

Ejemplo con atrbutos mtos Ej.: (salaro=700, clente=s, edad=adulto, hjos=3 p(si X fs(s 700 SI*p(c s SI*p(e adulto SI*fH(h (700 9 ep *8/ *6/ * ep 94 94 0.67 5.6e 6/ p(x 3 SI*p(SI / p(x (3.08 * / 0 */ P(X 0.67 p(no X fs(s 700 NO*p(c s NO*p(e adulto NO*fH(h 3 NO*p(NO / p(x (700 73 (3.5 ep *3/8*3/8* ep *8/ 0 */ P(X 49 49 0.89 0.89.8e 5/ p(x Técncas Cláscas en Problemas de Clasfcacón

Clasfcacón con costes MAP proporcona clasfcacón con mínma prob. de Error Coste de decsón D X: prob. Error total= P(C X Con frecuenca los costes son asmétrcos, y unos errores son más graves que otros. Matrz de costes Clasfcado como Clase real Costes de cada decsón. Crtero de mínmo coste medo: dada una decsón, promedo los costes de cada equvocacón y su coste: cos te(d X cp(c X c3p(c3 X cos te(d X cp(c X c3p(c3 X cos te(d X c p(c X c p(c X 3 3 0 c c 3 c c 0 3 c c 3 3 0 3 Técncas Cláscas en Problemas de Clasfcacón

Ejemplo de clasfcacón con costes Clasfcacón de setas con dos atrbutos, (X, Y y tres categorías: enenosa, Mal sabor, comestble: {, MS, C} Clase real 30 0 0 0 MS C Clasfcado como 0 MS C 000 0 C 000 0 0 MS : 5 7 50 5t ; C 50 7 C : 5 7 40 5t ; C 40 7 MS: 3 0 5 45 0t ; C3 45 5 30 0 0 0 C MS Mínmo error -0-0 -30-40 Mínmo coste -0-0 -30-40 -50-30 -0-0 0 0 0 30 40 50-50 -30-0 -0 0 0 0 30 40 50 Técncas Cláscas en Problemas de Clasfcacón