APRENDIZAJE PROBABILÍSTICO NAIVE BAYES

Tamaño: px
Comenzar la demostración a partir de la página:

Download "APRENDIZAJE PROBABILÍSTICO NAIVE BAYES"

Transcripción

1 1 APRENDIZAJE PROBABILÍSTICO NAIVE BAYES Bases de Datos Masivas 9 de Noviembre de 2016

2 2 Razonamiento Probabilístico Es una herramienta de aprendizaje estadístico. Se trata de razonar en un contexto incierto; y la mejor forma de representar la incertidumbre es a través de probabilidades. Como vimos en temas previos vamos a trabajar en aprendizaje a partir de observaciones. Dado un conjunto de entrenamiento d y con un conjunto de hipótesis H, candidatas a ser aprendidas El conjunto de datos d representa una serie de evidencias observadas Las hipótesis de H son modelos probabilísticos de cómo funciona el dominio Instancias de una variable aleatoria D Una distribución de probabilidad

3 3 Ejemplo Partimos de un dataset como evidencia Variables aleatorias que describen el dominio Las hipótesis serán teorías probabilísticas de cómo funciona el dominio. Nuestros caramelos preferidos tienen un envoltorio donde no es posible determinar el sabor h Los caramelos se 1 : 100% Cereza Cereza guardan en 5 bolsas h 2 : 75% Cereza + 25% Limón diferentes h 3 : 50% Cereza + 50% Limón h Limón 4 : 25% Cereza + 75% Limón h 5 : 100% Limón Dada una nueva bolsa v.a. H denota una nueva bolsa que puede ser de h 1 a h 5 H no es directamente observable Cuando se abre e inspecciona una bolsa se revelan los datos D 1, D 2,..,D n D i es una en una v.a. con valores posibles cereza y limón El objetivo de este sistema es predecir el sabor del siguiente caramelo [ Russell et al ]

4 4 Teorema de Bayes Sea X una muestra de datos (evidencia): se desconoce su clase Sea H la hipótesis de que X pertenece a la clase C La clasificación es para determinar H X): la probabilidad de que la hipótesis se sostenga dada una muestra de las observaciones X H) es la probabilidad a priori, es decir la probabilidad inicial. X va a comer un caramelo, independientemente del sabor, etc. X): Probabilidad de observación de una muestra X H) probabilidad a posteriori, la probabilidad de observar la muestra dado que la hipótesis se sostiene. Dado que X va a comer un caramelo cuál es la probabilidad que sea de Cereza

5 5 Teorema de Bayes Teniendo en cuenta los datos de entrenamiento X, la probabilidad a posteriori de la hipótesis H, H X), el Teorema de Bayes se denota cómo: Verosimilitud de los datos dada cada una de las hipótesis Probabilidad a priori H X) X H) H) X) Así podemos saber, cuál es la probabilidad de pertenencia de una instancia X a una clase C i si y sólo si la probabilidad C i X) es la más alta entre todas las C k X) para todas las clases de k Dificultad práctica: requiere conocimientos iniciales de muchas probabilidades, costo computacional significativo

6 6 Clasificación: Naïve Bayes Sea D un conjunto de tuplas de entrenamiento y sus etiquetas de clase asociados, y cada tupla se representada mediante un vector de atributos n-d X = (x 1, x 2,..., x n ) Supongamos que hay m clases C 1, C 2,, C m. La clasificación la haremos a partir de la hipótesis más probable. Máximo a posteriori o hipótesis MAP. Máximo( C i X) ) Esto se puede derivar de teorema de Bayes: C X) i X C ) C ) i i X) Puesto que X) es constante para todas las clases, sólo se busca maximizar: C X) i X C ) C ) i i Principio de independencia condicional

7 7 Clasificación: Naïve Bayes Calcular X C i ) si el dataset tiene muchos atributos el costo computacional es muy alto. Independencia condicional con respecto a la clase C. Ese es el supuesto naive que se adopta. Los valores de los atributos son independientes dada la clase. X Ci) n x k 1 k Ci) x Ci) x x k es el valor del atributo A k en X Ci)... x Ci) Esto reduce considerablemente el costo de cálculo: sólo cuenta la distribución de clases 1 2 n

8 8 Clasificación: Naïve Bayes Si A k es categórica, x k C i ) es el nro # de tuplas en C i que tienen valor x k para A k dividido C i, D (# de tuplas of C i in D) Si A k es un valor continuo, x k C i ) se calcula utilizando una distribución Gausiana con media μ desviación estándar σ y x k C i ) es: g ( x ) ( x,, ) e 2 2 X Ci) g( x,, k C i Ci )

9 Clasificador Naïve Bayesian: Ejemplo 9 edad ingreso estudiante calificación_crediticia compra_computadora <=30 alto no buena no <=30 alto no excelente no alto no buena si >40 medio no buena si >40 bajo si buena si >40 bajo si excelente no bajo si excelente si <=30 medio no buena no <=30 bajo si buena si >40 medio si buena si <=30 medio si excelente si medio no excelente si alto si buena si >40 medio no excelente no Clase: C 1 :compra_computadora = si C 2 :compra_computadora = no Muestra X = (edad <=30, ingresos = medio, estudiante = si, calif_credit. = buena)

10 10 Ejemplo C i ): compra_computadora = si ) = 9/14 = compra_computadora = no ) = 5/14 = Calcular X C i ) para cada una de las clases: age = <=30 compra_computadora = si ) = 2/9 = age = <= 30 compra_computadora = no ) = 3/5 = 0.6 ingresos = medio compra_computadora = si ) = 4/9 = ingresos = medio compra_computadora = no ) = 2/5 = 0.4 estudiante = si compra_computadora = si) = 6/9 = estudiante = si compra_computadora = no ) = 1/5 = 0.2 calificación_crediticia = buena compra_computadora = si ) = 6/9 = calificación_crediticia = buena compra_computadora = no ) = 2/5 = 0.4 Muestra: X = (age <= 30, ingresos = medio, estudiante = si, calificación_crediticia = buena) X C i ) : X compra_computadora = si ) = x x x = X compra_computadora = no ) = 0.6 x 0.4 x 0.2 x 0.4 = X C i )*C i ) : X compra_computadora = si ) * compra_computadora = si ) = X compra_computadora = no ) * compra_computadora = no ) = De esta manera, X pertenece a la clase ( compra_computadora = si )

11 11 Evitar el problema de 0-Pr La predicción con Naïve Bayes requiere que cada una de las probabilidades condicionales no sea cero. De lo contrario la probabilidad predicha será cero: X Ci) n xk k 1 Ci) Por ejemplo, tenemos un dataset de 1000 tuplas, ingresos=bajo (0), ingresos= medio (990), ingresos = alto (10), Se puede usar Laplacian correction (o estimador Laplaciano) Agrega 1 a cada caso Prob(ingresos = bajo) = 1/1003 Prob(ingresos = medio) = 991/1003 Prob(ingresos = alto) = 11/1003 Las estimaciones de probabilidad "corregidas" están próximas a sus contrapartes "no corregidas"

12 12 Comentarios Ventajas Fácil de implementar Buenos resultados obtenidos en la mayoría de los casos Desventajas Asumir class conditional independence, y por lo tanto la perdida de precisión. En la práctica, existen dependencias entre las variables Por ejemplo, los hospitales: pacientes: Perfil: edad, antecedentes familiares, etc. Síntomas: fiebre, tos, etc., enfermedades: cáncer de pulmón, diabetes, etc. Dependencias entre estos no pueden ser modeladas por un clasificador Naïve Bayes Cómo manejar las dependencias? Redes Bayesianas

13 20 Referencias Russell, S. J., & Norvig, P. (2004). Inteligencia Artificial: un enfoque moderno. Seguenda Edición. Cap. 20: Métodos estadísticos de aprendizaje. Jiawei Han,Micheline Kamber.Data Mining,Concepts and Techniques- 2 da edición- The Morgan Kaufmann Series in Data Management Systems

Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR

Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja

Más detalles

Métodos de Inteligencia Artificial

Métodos de Inteligencia Artificial Métodos de Inteligencia Artificial L. Enrique Sucar (INAOE) esucar@inaoep.mx ccc.inaoep.mx/esucar Tecnologías de Información UPAEP Agentes que Aprenden: Clasificador Bayesiano Clasificación Clasificador

Más detalles

MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN

MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN MÉTODOS AVANZADOS EN APRENDIZAJE ARTIFICIAL: TEORÍA Y APLICACIONES A PROBLEMAS DE PREDICCIÓN Manuel Sánchez-Montañés Luis Lago Ana González Escuela Politécnica Superior Universidad Autónoma de Madrid Teoría

Más detalles

Razonamiento probabilístico y Redes Bayesianas

Razonamiento probabilístico y Redes Bayesianas Inteligencia Computacional Razonamiento probabilístico y Redes Bayesianas Probabilidad y Teorema de Bayes Blanca A. Vargas Govea - vargasgovea@itesm.mx - Oct 9, 2012 Avisos: Exámenes Fecha de examen parcial

Más detalles

Incertidumbre y conocimiento

Incertidumbre y conocimiento Incertidumbre y conocimiento SI síntoma(p,dolor-de-muelas) ENTONCES enfermedad(p,caries) Expresa esta regla un conocimiento correcto? Quizás sería mejor un conocimiento más exhaustivo: SI sintoma(p,dolor-de-muelas)

Más detalles

Tareas de la minería de datos: clasificación. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR

Tareas de la minería de datos: clasificación. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Tareas de la minería de datos: clasificación PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja o asocia datos

Más detalles

Auxiliar 9. MNL y MLE. Daniel Olcay. 21 de octubre de 2014 IN4402. Daniel Olcay (IN4402) Auxiliar 9 21 de octubre de / 13

Auxiliar 9. MNL y MLE. Daniel Olcay. 21 de octubre de 2014 IN4402. Daniel Olcay (IN4402) Auxiliar 9 21 de octubre de / 13 Auxiliar 9 MNL y MLE Daniel Olcay IN4402 21 de octubre de 2014 Daniel Olcay (IN4402) Auxiliar 9 21 de octubre de 2014 1 / 13 Índice Modelos no lineales Probabilidad lineal Probit Logit Máxima verosimilitud

Más detalles

Redes Bayesianas (1) Carlos Hurtado L. Depto. de Ciencias de la Computación, Universidad de Chile

Redes Bayesianas (1) Carlos Hurtado L. Depto. de Ciencias de la Computación, Universidad de Chile Redes Bayesianas (1) Carlos Hurtado L. Depto. de Ciencias de la Computación, Universidad de Chile Referencia Bayesian networks without tears: making Bayesian networks more accessible to the probabilistically

Más detalles

Métodos de Inteligencia Artificial

Métodos de Inteligencia Artificial Métodos de Inteligencia Artificial L. Enrique Sucar (INAOE) esucar@inaoep.mx ccc.inaoep.mx/esucar Tecnologías de Información UPAEP Agentes que razonan bajo incertidumbre Introducción Repaso de probabilidad

Más detalles

Aprendizaje de modelos probabiĺısticos

Aprendizaje de modelos probabiĺısticos J. L. Ruiz Reina Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla Contenido El teorema de Bayes ( qué modelo probabiĺıstico explica mejor los datos observados?) Aprendizaje

Más detalles

REGLAS DE ASOCIACIÓN Bases de Datos Masivas. 29 de Octubre de 2015

REGLAS DE ASOCIACIÓN Bases de Datos Masivas. 29 de Octubre de 2015 1 REGLAS DE ASOCIACIÓN Bases de Datos Masivas 29 de Octubre de 2015 Reglas de Asociación 2 3 Reglas de Asociación Dado un conjunto de transacciones encontrar reglas que puedan predecir la ocurrencia de

Más detalles

Tema 6: Introducción a la Inferencia Bayesiana

Tema 6: Introducción a la Inferencia Bayesiana Tema 6: Introducción a la Inferencia Bayesiana Conchi Ausín Departamento de Estadística Universidad Carlos III de Madrid concepcion.ausin@uc3m.es CESGA, Noviembre 2012 Contenidos 1. Elementos básicos de

Más detalles

Aplicaciones de apoyo al diagnóstico médico. Identificación de objetos amigos y enemigos. Identificación de zonas afectadas por un desastre natural.

Aplicaciones de apoyo al diagnóstico médico. Identificación de objetos amigos y enemigos. Identificación de zonas afectadas por un desastre natural. Capítulo 5 Evaluación En muchas ocasiones requerimos hacer una evaluación muy precisa de nuestros algoritmos de aprendizaje computacional porque los vamos a utilizar en algún tipo de aplicación que así

Más detalles

Inteligencia Artificial II Razonamiento Bayesiano

Inteligencia Artificial II Razonamiento Bayesiano Inteligencia Artificial II Razonamiento Bayesiano Dr. Alejandro Guerra-Hernández Universidad Veracruzana Centro de Investigación en Inteligencia Artificial mailto:aguerra@uv.mx http://www.uv.mx/personal/aguerra

Más detalles

Clasificación Bayesiana

Clasificación Bayesiana Clasificación Bayesiana Naive Bayes septiembre 30, 2014 Ricardo Corral Corral rcorral@email.ifc.unam.mx Instituto de Fisiología Celular Universidad Nacional Autónoma de México Temas 1 Introducción Conceptos

Más detalles

ANÁLISIS DE DATOS. Jesús García Herrero

ANÁLISIS DE DATOS. Jesús García Herrero ANÁLISIS DE DATOS Jesús García Herrero ANALISIS DE DATOS EJERCICIOS Una empresa de seguros de automóviles quiere utilizar los datos sobre sus clientes para obtener reglas útiles que permita clasificar

Más detalles

Introducción. Distribución Gaussiana. Procesos Gaussianos. Eduardo Morales INAOE (INAOE) 1 / 47

Introducción. Distribución Gaussiana. Procesos Gaussianos. Eduardo Morales INAOE (INAOE) 1 / 47 Eduardo Morales INAOE (INAOE) 1 / 47 Contenido 1 2 3 (INAOE) 2 / 47 Normalmente, en los algoritmos de aprendizaje que hemos visto, dado un conjunto de ejemplos de entrenamiento se busca encontrar el mejor

Más detalles

Sistemas de Reconocimiento de Patrones

Sistemas de Reconocimiento de Patrones Sistemas de Reconocimiento de Patrones p. 1/33 Sistemas de Reconocimiento de Patrones Luis Vázquez GTI - IIE Facultad de Ingeniería Universidad de la República Sistemas de Reconocimiento de Patrones p.

Más detalles

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Reconocimiento de patrones (RP): clasificar objetos en un número de categorías o clases.

Más detalles

ECONOMETRÍA II Prof.: Begoña Álvarez TEMA 1 INTRODUCCIÓN. Estimación por máxima verosimilitud y conceptos de teoría asintótica

ECONOMETRÍA II Prof.: Begoña Álvarez TEMA 1 INTRODUCCIÓN. Estimación por máxima verosimilitud y conceptos de teoría asintótica ECONOMETRÍA II Prof.: Begoña Álvarez 2007-2008 TEMA 1 INTRODUCCIÓN Estimación por máxima verosimilitud y conceptos de teoría asintótica 1. ESTIMACIÓN POR MÁXIMA VEROSIMILITUD (MAXIMUM LIKELIHOOD) La estimación

Más detalles

Guía docente MÉTODOS ESTADÍSTICOS PARA LA EMPRESA

Guía docente MÉTODOS ESTADÍSTICOS PARA LA EMPRESA 1. Introducción Guía docente MÉTODOS ESTADÍSTICOS PARA LA EMPRESA Los análisis económicos y empresariales se efectúan sobre la base de la toma de decisiones, las cuales se toman a partir de la información

Más detalles

Por ello, son necesarios los sistemas expertos que traten situaciones de incertidumbre.

Por ello, son necesarios los sistemas expertos que traten situaciones de incertidumbre. SISTEMAS EXPERTOS BASADOS EN PROBABILIDAD En las aplicaciones, la incertidumbre es lo común y no la excepción. Por ejemplo, una pregunta típica en diagnóstico médico es: dado que el paciente presenta unos

Más detalles

Inteligencia Artificial II (Curso ) Ejercicios propuestos del tema 3

Inteligencia Artificial II (Curso ) Ejercicios propuestos del tema 3 Inteligencia rtificial II (urso 2012-2013) jercicios propuestos del tema 3 jercicio 1: Supongamos que tenemos cinco variables aleatorias,,, y, tales que: ˆ es independiente de. ˆ es independiente de y

Más detalles

Desarrollo e impacto de la Estadística Bayesiana

Desarrollo e impacto de la Estadística Bayesiana Desarrollo e impacto de la Estadística Bayesiana Eduardo Gutiérrez Peña Departamento de Probabilidad y Estadística Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas Universidad Nacional

Más detalles

Repaso de Probabilidad y Estadística

Repaso de Probabilidad y Estadística Repaso de Probabilidad y Estadística Área de Estadística e Investigación Operativa Licesio J. Rodríguez-Aragón Febrero 2011 Probabilidad 2 Definición.............................................................

Más detalles

Planificaciones Probabilidad y Estadística B. Docente responsable: GRYNBERG SEBASTIAN PABLO. 1 de 6

Planificaciones Probabilidad y Estadística B. Docente responsable: GRYNBERG SEBASTIAN PABLO. 1 de 6 Planificaciones 6109 - Probabilidad y Estadística B Docente responsable: GRYNBERG SEBASTIAN PABLO 1 de 6 OBJETIVOS 1) Que los estudiantes aprendan los elementos básicos del método probabilístico y de la

Más detalles

Clasificación. Clasificadores Bayesianos

Clasificación. Clasificadores Bayesianos Clasificación Clasificadores Bayesianos Clasificadores Bayesianos Modela relaciones probabilisticas entre el conjunto de atributos y el atributo clase Probabilidad condicional: probabilidad de que una

Más detalles

matemáticas como herramientas para solución de problemas en ingeniería. PS Probabilidad y Estadística Clave de la materia: Cuatrimestre: 4

matemáticas como herramientas para solución de problemas en ingeniería. PS Probabilidad y Estadística Clave de la materia: Cuatrimestre: 4 PS0401 - Probabilidad y Estadística DES: Ingeniería Programa(s) Educativo(s): Ingeniería de Software Tipo de materia: Obligatoria Clave de la materia: PS0401 Cuatrimestre: 4 UNIVERSIDAD AUTÓNOMA DE Área

Más detalles

Clasificación. Aurea Grané. Análisis Discriminante

Clasificación. Aurea Grané. Análisis Discriminante Diplomatura en Estadística 1 Diplomatura en Estadística 2 Análisis discriminante Análisis Discriminante y Clasificación Aurea Grané Departamento de Estadística Universidad Carlos III de Madrid Supongamos

Más detalles

Redes Bayesianas (3) Carlos Hurtado L. Depto. de Ciencias de la Computación, Universidad de Chile

Redes Bayesianas (3) Carlos Hurtado L. Depto. de Ciencias de la Computación, Universidad de Chile Redes Bayesianas (3) Carlos Hurtado L. Depto. de Ciencias de la Computación, Universidad de Chile Referencia Tutorial NIPS (Neural Information Processing Systems Conference) 2001: Learning Bayesian Networks

Más detalles

Ms. C. Marco Vinicio Rodríguez

Ms. C. Marco Vinicio Rodríguez Ms. C. Marco Vinicio Rodríguez mvrodriguezl@yahoo.com http://mvrurural.wordpress.com/ Uno de los objetivos de la estadística es saber acerca del comportamiento de parámetros poblacionales tales como:

Más detalles

Razonamiento bajo incertidumbre

Razonamiento bajo incertidumbre Inteligencia en Redes de Comunicaciones Razonamiento bajo incertidumbre Julio Villena Román jvillena@it.uc3m.es Razonamiento humano En el razonamiento humano hay que trabajar con la incertidumbre: la información

Más detalles

PRÁCTICA I. Ejercicios Teóricos

PRÁCTICA I. Ejercicios Teóricos PRÁCTICA I TEORÍA DE LA DECISIÓN BAYESIANA Ejercicios Teóricos Ejercicio. En el caso de dos categorías, en la regla de decisión de Bayes el error condicional está dado por la ecuación (7). Incluso si las

Más detalles

CURSO: ANALISIS ESTADISTICO DE RIESGOS

CURSO: ANALISIS ESTADISTICO DE RIESGOS MANAGEMENT CONSULTORES CURSO: ANALISIS ESTADISTICO DE RIESGOS Cnel. R.L. Falcón 1435 C1406GNC 35 Buenos Aires, Argentina Tel.: 054-11-15-5468-3369 Fax: 054-11-4433-4202 Mail: acaminos@mgmconsultores.com.ar

Más detalles

Análisis de Datos en Física de Partículas

Análisis de Datos en Física de Partículas Análisis de Datos en Física de Partículas Sección de Posgrado Facultad de Ciencias Universidad Nacional de Ingeniería C. Javier Solano S. jsolano@uni.edu.pe http://compinformatidf.wordpress.com/ Página

Más detalles

Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR

Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis Facultad de Ciencias Sociales, UdelaR Índice 1. Introducción: hipótesis estadística, tipos de hipótesis, prueba de hipótesis 2.

Más detalles

PFC: Localización de robots mediante filtro de Kalman

PFC: Localización de robots mediante filtro de Kalman 6.- FILTRO DE KALMAN 6.1.- MOTIVACIÓN Los sistemas de navegación se han convertido en un estándar, ya que se venden más y más, sobre todo con los coches nuevos. La mayoría de estos sistemas de navegación

Más detalles

2.3. Análisis bayesiano para datos normales

2.3. Análisis bayesiano para datos normales 2.3. Análisis bayesiano para datos normales 87 2.3. Análisis bayesiano para datos normales Otra de las situaciones más frecuentes en la práctica estadística es aquella en la que nos encontramos con datos

Más detalles

Análisis de sensibilidad:

Análisis de sensibilidad: Análisis de sensibilidad: Métodos en la evaluación económica de tecnologías sanitarias Parte 1 David Epstein dme2@york.ac.uk 1 Índice El Análisis de Sensibilidad (AS) - Parte 1 Objetivos de un AS Revisión

Más detalles

MODELOS DE SIMULACIÓN ESTADÍSTICOS CLASE 4: DISTRIBUCIÓN t, CHI-CUADRADA y EXPONENCIAL PROFESOR: OSCAR SAAVEDRA ANDRÉS DURANGO.

MODELOS DE SIMULACIÓN ESTADÍSTICOS CLASE 4: DISTRIBUCIÓN t, CHI-CUADRADA y EXPONENCIAL PROFESOR: OSCAR SAAVEDRA ANDRÉS DURANGO. DISTRIBUCIÓN t Con frecuencia intentamos estimar la media de una población cuando se desconoce la varianza, en estos casos utilizamos la distribución de t de Student. Si el tamaño de la muestra es suficientemente

Más detalles

INDICE. Prólogo a la Segunda Edición

INDICE. Prólogo a la Segunda Edición INDICE Prólogo a la Segunda Edición XV Prefacio XVI Capitulo 1. Análisis de datos de Negocios 1 1.1. Definición de estadística de negocios 1 1.2. Estadística descriptiva r inferencia estadística 1 1.3.

Más detalles

Determinar la incertidumbre al momento de desarrollar aplicativos en inteligencia artificial, haciendo uso de estructuras probabilísticas..

Determinar la incertidumbre al momento de desarrollar aplicativos en inteligencia artificial, haciendo uso de estructuras probabilísticas.. Sistemas expertos e inteligencia artificial, Guia 5 1 Facultad : Ingeniería Escuela : Computación Asignatura: Sistemas expertos e Inteligencia Artificial Tema: RAZONAMIENTO CON INCERTIDUMBRE. Objetivo

Más detalles

Análisis de Datos. Combinación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores

Análisis de Datos. Combinación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores Análisis de Datos Combinación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción Diversos algoritmos de clasificación están limitados a resolver problemas binarios, es decir, con dos

Más detalles

Carrera: Ingeniería Civil CIM 0531

Carrera: Ingeniería Civil CIM 0531 1.- DATOS DE LA ASIGNATURA Nombre de la asignatura: Carrera: Clave de la asignatura: Horas teoría-horas práctica-créditos: Probabilidad y Estadística Ingeniería Civil CIM 0531 3 2 8 2.- HISTORIA DEL PROGRAMA

Más detalles

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos Agro 6998 Conferencia Introducción a los modelos estadísticos mixtos Los modelos estadísticos permiten modelar la respuesta de un estudio experimental u observacional en función de factores (tratamientos,

Más detalles

LA MINERÍA DE DATOS APLICADA A LA BÚSQUEDA DE PATRONES DE SUPERVIVIENCIA EN LA NEOPLASIA MALIGNA DE TRÁQUEA, BRONQUIOS Y PULMÓN

LA MINERÍA DE DATOS APLICADA A LA BÚSQUEDA DE PATRONES DE SUPERVIVIENCIA EN LA NEOPLASIA MALIGNA DE TRÁQUEA, BRONQUIOS Y PULMÓN LA MINERÍA DE DATOS APLICADA A LA BÚSQUEDA DE PATRONES DE SUPERVIVIENCIA EN LA NEOPLASIA MALIGNA DE TRÁQUEA, BRONQUIOS Y PULMÓN Miguel Ángel Negrín; Christian González; Jaime Pinilla; Francisco-José Vázquez-Polo

Más detalles

Sistemas Expertos basados en probabilidad (2011/2012)

Sistemas Expertos basados en probabilidad (2011/2012) Luis Valencia Cabrera (coordinador) lvalencia@us.es (http://www.cs.us.es/~lvalencia) Manuel García-Quismondo mgarciaquismondo@us.es (http://www.cs.us.es/~mgarcia) Ciencias de la Computacion e IA (http://www.cs.us.es/)

Más detalles

Diplomado en Inteligencia de Negocios Módulo. Minería de Datos

Diplomado en Inteligencia de Negocios Módulo. Minería de Datos Diplomado en Inteligencia de Negocios Módulo Minería de Datos Análisis Supervisado III Modelos Probabilísticos Diplomado en Inteligencia de Negocios Módulo 3 Agenda Repaso de probabilidad Modelos Bayesianos

Más detalles

Econometría II Grado en finanzas y contabilidad

Econometría II Grado en finanzas y contabilidad Econometría II Grado en finanzas y contabilidad Variables aleatorias y procesos estocásticos. La FAC y el correlograma Profesora: Dolores García Martos E-mail:mdgmarto@est-econ.uc3m.es Este documento es

Más detalles

viene dada por la sumatoria de las N observaciones, dividida por el tamaño de la

viene dada por la sumatoria de las N observaciones, dividida por el tamaño de la REPASO La siguiente unidad de este curso se trata de estimación puntual. Para comprender estos contenidos es bueno recordar que la varianza de una población y de una muestra se mide de manera distinta.

Más detalles

Sesión 2: Teoría de Probabilidad

Sesión 2: Teoría de Probabilidad Modelos Gráficos Probabilistas L. Enrique Sucar INAOE Sesión 2: Teoría de Probabilidad Considero que la probabilidad representa el estado de la mente con respecto a una afirmación, evento u otra cosa para

Más detalles

Sesión 2: Teoría de Probabilidad

Sesión 2: Teoría de Probabilidad Modelos Gráficos Probabilistas L. Enrique Sucar INAOE Sesión 2: Teoría de Probabilidad las reglas mátemáticas de la probabilidad no son simplemente reglas para calcular frecuencias de variables aleatorias;

Más detalles

PROBABILIDAD Y ESTADÍSTICA

PROBABILIDAD Y ESTADÍSTICA PROBABILIDAD Y ESTADÍSTICA Pablo Torres Facultad de Ciencias Exactas, Ingeniera y Agrimensura - Universidad Nacional de Rosario Unidad 2: Probabilidad INTRODUCCIÓN Al lanzar un dado muchas veces veremos

Más detalles

Estimación de Parámetros. Jhon Jairo Padilla A., PhD.

Estimación de Parámetros. Jhon Jairo Padilla A., PhD. Estimación de Parámetros Jhon Jairo Padilla A., PhD. Inferencia Estadística La inferencia estadística puede dividirse en dos áreas principales: Estimación de Parámetros Prueba de Hipótesis Estimación de

Más detalles

Estimación de Parámetros. Jhon Jairo Padilla A., PhD.

Estimación de Parámetros. Jhon Jairo Padilla A., PhD. Estimación de Parámetros Jhon Jairo Padilla A., PhD. Inferencia Estadística La inferencia estadística puede dividirse en dos áreas principales: Estimación de Parámetros Prueba de Hipótesis Estimación de

Más detalles

10.1 Enfoque Bayesiano del problema de la estimación

10.1 Enfoque Bayesiano del problema de la estimación Chapter 10 Estimadores de Bayes 10.1 Enfoque Bayesiano del problema de la estimación puntual Consideremos nuevamente un problema estadístico de estimación paramétrico. Se observa un vector X = X 1,...,

Más detalles

Aprendizaje y extensiones mixtas

Aprendizaje y extensiones mixtas Capítulo 7 Aprendizaje y extensiones mixtas 7.1. Aprendizaje En esta sección veremos la relevancia de definir un modelo de aprendizaje en ambientes inciertos. El paradigma de modelo de aprendizaje en teoría

Más detalles

Asignaturas antecedentes y subsecuentes

Asignaturas antecedentes y subsecuentes PROGRAMA DE ESTUDIOS PROBABILIDAD Área a la que pertenece: Área Sustantiva Profesional Horas teóricas: 3 Horas prácticas: 2 Créditos: 8 Clave: F0056 Asignaturas antecedentes y subsecuentes PRESENTACIÓN

Más detalles

Información general. Obligatoria básica o de fundamentación X. Obligatoria profesional. Horas de trabajo independiente del estudiante

Información general. Obligatoria básica o de fundamentación X. Obligatoria profesional. Horas de trabajo independiente del estudiante Guía de asignatura Formato institucional Rev. Abril 2013 Información general Asignatura E S T A D I S T I C A Código 73210011 Tipo de asignatura Obligatoria X Electiva Tipo de saber Número de créditos

Más detalles

Elementos de probabilidad e inferencia estadística en el seguro

Elementos de probabilidad e inferencia estadística en el seguro Elementos de probabilidad e inferencia estadística en el seguro Instructor: Act. Erick Mier Moreno. Director general y profesor de AMAT- Applied Mathematics and Actuary Training. Profesor de asignatura

Más detalles

SOLUCIÓN EXAMEN IV Nombres: Apellidos: C.I.: Firma: Fecha: 19/11/2004

SOLUCIÓN EXAMEN IV Nombres: Apellidos: C.I.: Firma: Fecha: 19/11/2004 Nombres: Apellidos: C.I.: Firma: Fecha: 19/11/004 MÉTODOS ESTADÍSTICOS I EXAMEN IV PARTE I: Encierre con un círculo la respuesta correcta (0,5 puntos c/u): 1. (V F) Los contrastes de hipótesis de dos muestras

Más detalles

Inteligencia Artificial

Inteligencia Artificial Abril 30 de 2008 El estudiante de la Pontificia Universidad Javeriana, como agente de su propia formación, es corresponsable de la Identidad Institucional, uno de cuyos cimientos es tener como hábito un

Más detalles

6. Inferencia con muestras grandes. Informática. Universidad Carlos III de Madrid

6. Inferencia con muestras grandes. Informática. Universidad Carlos III de Madrid 6. Inferencia con muestras grandes 1 Tema 6: Inferencia con muestras grandes 1. Intervalos de confianza para μ con muestras grandes 2. Determinación del tamaño muestral 3. Introducción al contraste de

Más detalles

4.12 Ciertos teoremas fundamentales del cálculo de probabilidades

4.12 Ciertos teoremas fundamentales del cálculo de probabilidades 1 de 9 15/10/2006 05:57 a.m. Nodo Raíz: 4. Cálculo de probabilidades y variables Siguiente: 4.14 Tests diagnósticos Previo: 4.10 Probabilidad condicionada e independencia de 4.12 Ciertos teoremas fundamentales

Más detalles

Tema 2. Introducción a la Estadística Bayesiana

Tema 2. Introducción a la Estadística Bayesiana 2-1 Tema 2 Introducción a la Estadística Bayesiana El teorema de Bayes Ejemplo Interpretación Ejemplo: influencia de la distribución a priori Ejemplo: densidad de flujo Probabilidad bayesiana Ejemplo:

Más detalles

Carrera: Ingeniería Civil Participantes Comité de Evaluación Curricular de Institutos Tecnológicos

Carrera: Ingeniería Civil Participantes Comité de Evaluación Curricular de Institutos Tecnológicos 1.- DATOS DE LA ASIGNATURA Nombre de la asignatura: Carrera: Probabilidad y Estadística Ingeniería Civil Clave de la asignatura: Horas teoría-horas práctica-créditos 3-2-8 2.- HISTORIA DEL PROGRAMA Lugar

Más detalles

CÁLCULO DE PROBABILIDADES

CÁLCULO DE PROBABILIDADES CÁLCULO DE PROBABILIDADES Tipo de asignatura: Troncal Anual. Créditos ECTS: 15 I.- INTRODUCCIÓN AL CÁLCULO DE PROBABILIDADES. (16 horas presenciales) Tema 1.- La naturaleza del cálculo de probabilidades.

Más detalles

Bases estadísticas del reconocimiento de patrones

Bases estadísticas del reconocimiento de patrones Bases estadísticas del reconocimiento de patrones César Martínez cmartinez _AT_ fich.unl.edu.ar Inteligencia Computacional FICH-UNL Percepción humana Tarea muuuuy simple: Cuántas llaves hay? Inteligencia

Más detalles

Análisis de imágenes digitales

Análisis de imágenes digitales Análisis de imágenes digitales SEGMENTACIÓN DE LA IMAGEN Segmentación basada en color INTRODUCCIÓN La segmentación de imágenes a color se puede realizar mediante técnicas de clasificación supervisada.

Más detalles

PROGRAMA ANALÍTICO DE ASIGNATURA

PROGRAMA ANALÍTICO DE ASIGNATURA UNIVERSIDAD AUTÓNOMA DEL ESTADO DE HIDALGO COORDINACIÓN DE DOCENCIA DIRECCIÓN DE PLANEACIÓN Y DESARROLLO EDUCATIVO PROGRAMA ANALÍTICO DE ASIGNATURA 1.- DATOS GENERALES 1.1 INSTITUTO: Instituto de Ciencias

Más detalles

Tema 4. Probabilidad Condicionada

Tema 4. Probabilidad Condicionada Tema 4. Probabilidad Condicionada Presentación y Objetivos. En este tema se dan reglas para actualizar una probabilidad determinada en situaciones en las que se dispone de información adicional. Para ello

Más detalles

Inteligencia Artificial e Ingeniería del Conocimiento

Inteligencia Artificial e Ingeniería del Conocimiento Inteligencia Artificial e Ingeniería del Conocimiento Departamento de Ciencias de la Computación e Inteligencia Artificial Curso 2008/2009 Curso: 4 Cuatrimestre: 1 Tipo: Troncal Nº créditos: 4,5T + 4,5

Más detalles

EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD)

EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD) EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD) Fortino Vela Peón fvela@correo.xoc.uam.mx FVela-0 Objetivo Introducir las ideas básicas del principio de máxima verosimilitud. Problema Considere el experimento

Más detalles

PROGRAMA DETALLADO VIGENCIA TURNO UNIVERSIDAD NACIONAL EXPERIMENTAL POLITÉCNICA DE LA FUERZA ARMADA 2009 DIURNO INGENIERÌA EN SISTEMAS ASIGNATURA

PROGRAMA DETALLADO VIGENCIA TURNO UNIVERSIDAD NACIONAL EXPERIMENTAL POLITÉCNICA DE LA FUERZA ARMADA 2009 DIURNO INGENIERÌA EN SISTEMAS ASIGNATURA PROGRAMA DETALLADO VIGENCIA TURNO UNIVERSIDAD NACIONAL EXPERIMENTAL POLITÉCNICA DE LA FUERZA ARMADA 2009 DIURNO INGENIERÌA EN SISTEMAS SEMESTRE ASIGNATURA 8vo TEORÍA DE DECISIONES CÓDIGO HORAS MAT-31314

Más detalles

PRUEBA DE BONDAD DE AJUSTE O PRUEBA CHI - CUADRADO

PRUEBA DE BONDAD DE AJUSTE O PRUEBA CHI - CUADRADO O PRUEBA CHI - CUADRADO Hasta ahora se han mencionado formas de probar lo que se puede llamar hipótesis paramétricas con relación a una variable aleatoria, o sea que se ha supuesto que se conoce la ley

Más detalles

Aprendizaje para Clasificación con Factorización Matricial Basado en Listwise para Filtrado Colaborativo

Aprendizaje para Clasificación con Factorización Matricial Basado en Listwise para Filtrado Colaborativo 2012 Aprendizaje para Clasificación con Factorización Matricial Basado en Listwise para Filtrado Colaborativo Iván López Espejo 22/04/2012 2 Aprendizaje para Clasificación con Factorización Matricial Basado

Más detalles

UNIVERSIDAD DE MANAGUA Al más alto nivel

UNIVERSIDAD DE MANAGUA Al más alto nivel UNIVERSIDAD DE MANAGUA Al más alto nivel Estadística Inferencial Encuentro #9 Tema: Estimación puntual y por Intervalo de confianza Prof.: MSc. Julio Rito Vargas A. Grupos: CCEE y ADMVA /2016 Objetivos:

Más detalles

Object Recognition as Machine Translation: Learning a Lexicon for a Fixed Image Vocabulary

Object Recognition as Machine Translation: Learning a Lexicon for a Fixed Image Vocabulary Object Recognition as Machine Translation: Learning a Lexicon for a Fixed Image Vocabulary P. Duygulu, K. Barnard, J.F.G. de Freitas, and D.A. Forsyth Dr. Enrique Sucar 1 Victor Hugo Arroyo Dominguez 1

Más detalles

TEMA 2: Estimadores y distribuciones en el muestreo. Alfredo García Hiernaux. Grupos 69 y 73 Estadística I. Curso 2006/07

TEMA 2: Estimadores y distribuciones en el muestreo. Alfredo García Hiernaux. Grupos 69 y 73 Estadística I. Curso 2006/07 TEMA 2: Estimadores y distribuciones en el muestreo 1) Introducción 2) Tipos de muestreos 3) Estadísticos INDICE 4) Estimadores y propiedades 5) Distribución muestral 6) Teorema Central del Límite 7) Distribuciones

Más detalles

Aprendizaje Automatizado

Aprendizaje Automatizado Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto

Más detalles

Clasificador Jerárquico de Imágenes utilizando Naive Bayes

Clasificador Jerárquico de Imágenes utilizando Naive Bayes Clasificador Jerárquico de Imágenes utilizando Naive Bayes Hernandez Torres Julio Noe, Marin Castro Maribel Angelica Instituto Nacional de Astrofísica Óptica y Electrónica {julio.hernandez.t, mmarinc}

Más detalles

Incertidumbre. Dr. Jesús Antonio González Bernal

Incertidumbre. Dr. Jesús Antonio González Bernal Incertidumbre Universidad Politécnica de Puebla Dr. Jesús Antonio González Bernal Introducción In which we see what an agent should do when not all is crystal clear. R&N, pg 462 2 Introducción Sea la acción

Más detalles

TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN

TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN FUNDAMENTOS CURSO DE DOCTORADO Dr. Ramón García-Martínez * * * CONTEXTO La inteligencia de negocio propone un abordaje interdisciplinario que tomando:

Más detalles

ESTIMACION INFERENCIA ESTADISTICA

ESTIMACION INFERENCIA ESTADISTICA P M INFERENCIA ESTADISTICA Desde nuestro punto de vista, el objetivo es expresar, en términos probabilísticos, la incertidumbre de una información relativa a la población obtenida mediante la información

Más detalles

Curso de Inteligencia Artificial

Curso de Inteligencia Artificial Curso de Inteligencia Artificial Modelos Ocultos de Markov Gibran Fuentes Pineda IIMAS, UNAM Redes Bayesianas Representación gráfica de relaciones probabilísticas Relaciones causales entre variables aleatorias

Más detalles

ESTADISTICA INFERENCIAL DR. JORGE ACUÑA A.

ESTADISTICA INFERENCIAL DR. JORGE ACUÑA A. ESTADISTICA INFERENCIAL DR. JORGE ACUÑA A. 1 PROBABILIDAD Probabilidad de un evento es la posibilidad relativa de que este ocurra al realizar el experimento Es la frecuencia de que algo ocurra dividido

Más detalles

Estadística Inferencial. Sesión No. 9 Regresión y correlación lineal

Estadística Inferencial. Sesión No. 9 Regresión y correlación lineal Estadística Inferencial Sesión No. 9 Regresión y correlación lineal Contextualización En la administración, las decisiones suelen basarse en la relación entre dos o más variables. En esta sesión se estudia

Más detalles

Sistemas Expertos basados en probabilidad (2010/2011)

Sistemas Expertos basados en probabilidad (2010/2011) Luis Valencia Cabrera lvalencia@us.es (http://www.cs.us.es/~lvalencia) Ciencias de la Computacion e IA (http://www.cs.us.es/) Universidad de Sevilla Sistemas Expertos basados en probabilidad (2010/2011)

Más detalles

Tema 5.5: Contrastes de hipótesis

Tema 5.5: Contrastes de hipótesis Tema 5.5: Contrastes de hipótesis 1. Qué es un contraste de hipótesis? 2. Elementos de un contraste: hipótesis nula y alternativa, tipos de error, nivel de significación, región crítica 3. Contrastes para

Más detalles

PROGRAMA DE ESTADÍSTICA DESCRIPTIVA

PROGRAMA DE ESTADÍSTICA DESCRIPTIVA PROGRAMA DE ESTADÍSTICA DESCRIPTIVA CONCEPTOS BÁSICOS DE ESTADÍSTICA Definición de Estadística Origen del concepto. Evolución histórica de la Estadística Estadística Descriptiva y Estadística Inferencial

Más detalles

ESTADÍSTICA INFERENCIAL

ESTADÍSTICA INFERENCIAL ESTADÍSTICA INFERENCIAL ESTADÍSTICA INFERENCIAL 1 Sesión No. 10 Nombre: Pruebas de hipótesis referentes al valor de la media de la población Contextualización En estadística existen dos métodos para la

Más detalles

2. Conceptos Básicos de Probabilidad. ESTADÍSTICA Esp. Paola G. Herrera S.

2. Conceptos Básicos de Probabilidad. ESTADÍSTICA Esp. Paola G. Herrera S. 2. Conceptos Básicos de Probabilidad ESTADÍSTICA Esp. Paola G. Herrera S. Introducción La probabilidad es la rama de las matemáticas que estudia los fenómenos con incertidumbre. Es un mecanismo por medio

Más detalles

ANALISIS FACTORIAL. Jorge Galbiati R.

ANALISIS FACTORIAL. Jorge Galbiati R. ANALISIS FACTORIAL Jorge Galbiati R El análisis factorial es un modelo matamático que pretende explicar la correlación entre un conjunto grande de variables observadas y un pequeño conjunto de factores

Más detalles

Teoría de la decisión

Teoría de la decisión 1.- Un problema estadístico típico es reflejar la relación entre dos variables, a partir de una serie de Observaciones: Por ejemplo: * peso adulto altura / peso adulto k*altura * relación de la circunferencia

Más detalles

Conferencia C1 MODELOS DE REDES PROBABILÍSTICAS EN SISTEMAS EXPERTOS

Conferencia C1 MODELOS DE REDES PROBABILÍSTICAS EN SISTEMAS EXPERTOS V CONFERENCIA NACIONAL DE CIENCIAS DE LA COMPUTACIÓN CCBOL'98 Del 6 al 2 de Noviembre 998 en Potosí Conferencia C MODELOS DE REDES PROBABILÍSTICAS EN SISTEMAS EXPERTOS Prof. José Manuel Gutiérrez Dpto.

Más detalles

Aprendizaje Supervisado Clasificación Bayesiana (Método de Naïve Bayes)

Aprendizaje Supervisado Clasificación Bayesiana (Método de Naïve Bayes) Aprendizaje Supervisado Clasificación Bayesiana (Método de Naïve Bayes) 10 10 Modelo general de los métodos de Clasificación Id Reembolso Estado Civil Ingresos Anuales 1 Sí Soltero 125K No Fraude Algoritmo

Más detalles

Muestreo y Distribuciones en el Muestreo

Muestreo y Distribuciones en el Muestreo Muestreo y Distribuciones en el Muestreo Departamento de Estadística-FACES-ULA 03 de Abril de 2013 Introducción al Muestreo En algunas ocaciones es posible y práctico examinar a cada individuo en el Universo

Más detalles

Programa Regular. Probabilidad y Estadística.

Programa Regular. Probabilidad y Estadística. Programa Regular Probabilidad y Estadística. Modalidad de la asignatura: teórico-práctica. Carga horaria: 5hs. Objetivos: Con relación a los conocimientos a impartir en el desarrollo de la materia, es

Más detalles

1. La Distribución Normal

1. La Distribución Normal 1. La Distribución Normal Los espacios muestrales continuos y las variables aleatorias continuas se presentan siempre que se manejan cantidades que se miden en una escala continua; por ejemplo, cuando

Más detalles

ESTIMACIÓN Y PRUEBA DE HIPÓTESIS INTERVALOS DE CONFIANZA

ESTIMACIÓN Y PRUEBA DE HIPÓTESIS INTERVALOS DE CONFIANZA www.jmontenegro.wordpress.com UNI ESTIMACIÓN Y PRUEBA DE HIPÓTESIS INTERVALOS DE CONFIANZA PROF. JOHNNY MONTENEGRO MOLINA Objetivos Desarrollar el concepto de estimación de parámetros Explicar qué es una

Más detalles