Razonamiento probabilístico y redes bayesianas. Semántica de las RB Inferencia exacta Blanca A. Vargas Govea Octubre 16, 2012

Documentos relacionados
Razonamiento probabilístico y redes bayesianas

Alumno: Julián Argil Profesora: Dr. Ana Lilia Laureano Cruces

Teoría de probabilidades

Redes Bayesianas. Manuel Valenzuela-Rendón. Centro de Sistemas Inteligentes Tecnológico de Monterrey, Campus Monterrey.

Bases Formales de la Computación: Redes de Bayes (segunda parte)

REDES BAYESIANAS. O Redes de creencias

Modelos Gráficos Probabilistas L. Enrique Sucar INAOE. Sesión 10: Redes Bayesianas Inferencia. 1era parte. [Neapolitan 90]

Sesión 8: Redes Bayesianas - Representación

Razonamiento probabilístico y Redes Bayesianas

Métodos de Inteligencia Artificial

Inferencia en Modelos Gráficos para detección de Tópicos (LDA)

Inteligencia Artificial Razonamiento probabilístico

Inteligencia Artificial II Razonamiento Bayesiano

SIMULACION. Urna 1. s(x) h(x) Urna 2. s(x) Dado. Urna /6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6 Dado 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6

Notación de probabilidad

Tema 7: Razonamiento con incertidumbre

Incertidumbre y conocimiento

e Inteligencia Artificial

Incertidumbre. Dr. Jesús Antonio González Bernal

FACULTAD DE CIENCIAS EXACTAS, INGENIERIA Y AGRIMENSURA INTRODUCCION A LA INTELIGENCIA ARTIFICIAL L.C.C. PRACTICA RA 2007

Manejo de Incertidumbre

Algoritmo de eliminación de variables - Factores

Inteligencia Artificial II

Inferencia Exacta: Ejemplo

Probabilidad Eventos mutuamente excluyentes y no excluyentes

Redes Bayesianas (1) Carlos Hurtado L. Depto. de Ciencias de la Computación, Universidad de Chile

Decidiendo en 3D. Soluciones de Negocio

Reyes bayesianas. J. L. Ruiz Reina, F.J. Martín Mateos et al. Dpto. Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla

RAZONAMIENTO APROXIMADO EN LA INTELIGENCIA ARTIFICIAL

RAZONAMIENTO APROXIMADO

Métodos de Inteligencia Artificial

Inteligencia Artificial II (Curso ) Ejercicios propuestos del tema 3

Clasificación. Clasificadores Bayesianos

Modelos causales en inteligencia artificial Un caso práctico

4 VARIABLES ALEATORIAS DISCRETAS

RAZONAMIENTO APROXIMADO

Tema 8: Teorema de Herbrand. Tableros en lógica de primer orden

Tema 8: Teorema de Herbrand. Tableros en lógica de primer orden

CI5438. Inteligencia Artificial II Clase 9: Incertidumbre Cap 13 Ru. Cap 13 Russel & Norvig

Representación y razonamiento con conocimiento incierto

Relación 4 - Conocimiento probabilístico

Redes Bayesianas:Introducción

GeNie: entorno de desarrollo para la construcción de modelos gráficos de decisión Decision Systems Laboratory, University of Pittsburgh.

Tema 7: Razonamiento con incertidumbre

Inteligencia Artificial II

Apellidos:... Nombre:...

Conferencia C1 MODELOS DE REDES PROBABILÍSTICAS EN SISTEMAS EXPERTOS

Una pregunta pendiente

ÁRBOLES DE SINTAXIS. Los nodos no terminales (nodos interiores) están rotulados por los símbolos no terminales.

Perfiles y modelos ocultos de Markov

Modelos Alternativos de RI. UCR ECCI CI-2414 Recuperación de Información Prof. Kryscia Daviana Ramírez Benavides

Redes bayesianas temporales para reconocimiento de escenarios

Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos

Probabilidad y Procesos Aleatorios

Curso de Inteligencia Artificial

Sesión 2: Teoría de Probabilidad

Razonamiento probabilístico y Redes Bayesianas

Matemáticas Discretas Probabilidad

Proyectos de Sistemas de Software Prof. Gerardo I. Simari Asistente Fabio R. Gallo

Sesión 7: Campos de Markov

Sesión 2: Teoría de Probabilidad

Tenemos una red bayesiana formada por siete variables binarias y los siguientes enlaces: A , A , B , B , C , D , E y F . Dada la evidencia { A 1 y E

AXIOMAS DE PROBABILIDAD: REGLA DE LA ADICIÓN

Introducción. Distribución Gaussiana. Procesos Gaussianos. Eduardo Morales INAOE (INAOE) 1 / 47

Redes de Markov y CRF

Banda Ancha. Compresión, Almacenamiento y Transmisión Eficiente de Señales de Voz, Video y Datos. MSc. Luis Rojas

Representación y razonamiento con conocimiento incierto

Sesión 8: Campos de Markov

Calculando la matriz de covarianzas con la estructura de una red Bayesiana Gaussiana

METODOS ESTADÍSTICOS

Formas clausulares Teoría de Herbrand Algoritmo de Herbrand Semidecidibilidad. Teoría de Herbrand. Lógica Computacional

PROBABILIDAD E INFERENCIA ESTADÍSTICA TEMA 1: INTRODUCCIÓN A LA PROBABILIDAD

Gestión de los Riesgos del Proyecto basado en los estándares del PMI. Ing. Osvaldo Martínez Gómez, MSc, MAP

El Valor esperado de la información n perfecta

RESUMEN CONTENIDOS TERCERA EVALUACIÓN PROBABILIDAD DISTRIBUCIÓN BINOMIAL DISTRIBUCIÓN NORMAL

En general, se considera válido un razonamiento cuando sus premisas ofrecen soporte suficiente a su conclusión.

ÁRBOLES CRISTIAN ALFREDO MUÑOZ ÁLVAREZ JUAN DAVID LONDOÑO CASTRO JUAN PABLO CHACÓN PEÑA EDUARDO GONZALES

INSTITUCIÓN EDUCATIVA EL NACIONAL MALLA CURRICULAR GRADO 11

Sesión 14: Redes de Decisión

Trabajo Final de Especialidad en Tecnologías de Explotación de Información

Matemáticas Discretas L. Enrique Sucar INAOE. Teoría de Grafos. Problema de los puentes de Königsberg [Euler]

Splines (funciones polinomiales por trozos)

EL4005 Principios de Comunicaciones Clase No.24: Demodulación Binaria

Sistemas Expertos basados en probabilidad (2010/2011)

UNIVERSIDAD TECNICA LUIS VARGAS TORRES Esmeraldas - Ecuador MATRICES Y VECTORES

Por ello, son necesarios los sistemas expertos que traten situaciones de incertidumbre.

Grado en Ciencias Ambientales. Matemáticas. Curso 11/12

EJERCICIOS PAU MATEMÁTICAS II ARAGÓN Autor: Fernando J. Nora Costa-Ribeiro Más ejercicios y soluciones en fisicaymat.wordpress.com

Métodos de Pareo FN1. Fernanda Ruiz Nuñez Noviembre, 2006 Buenos Aires

Pronósticos e Intervención en Sistemas Dinámicos de Flujo. Liliana Figueroa Quiroz

MATEMÁTICAS II PROBABILIDAD DISTRIBUCIÓN BINOMIAL DISTRIBUCIÓN NORMAL

PROBABILIDAD Y ESTADÍSTICA

Procesos estocásticos Cadenas de Márkov

RAZONAMIENTO APROXIMADO EN LA INTELIGENCIA ARTIFICIAL

Inteligencia Artificial

Conceptos básicos de Geometría

Bloque I: Estadística y Probabilidad

Transcripción:

Razonamiento probabilístico y redes bayesianas Semántica de las RB Inferencia exacta Blanca A. Vargas Govea vargasgovea@itesm.mx Octubre 16, 2012

Objetivos Conocer la semántica de las redes bayesianas. Conocer la inferencia exacta en redes bayesianas. 2

Ejemplo 3

Semántica de las RB Hay dos formas en las que se pueden entender 1.Pueden verse como una representación de la distribución de probabilidad conjunta. 2.También como una codificación de una colección de enunciados de independencia condicional. Aunque son equivalentes, la primera nos sirve para entender cómo construir las redes mientras que la segunda nos ayuda a diseñar métodos de inferencia. 4

Representando la distribución conjunta completa Una RB proporciona una descripción completa del dominio. Cada entrada puede calcularse a partir de la información en la red. Una entrada es la probabilidad de una conjunción de asignación de valores a cada variable P(X 1 = x 1 X n =x n ) que se abrevia como: P(x 1,, x n ) 5

Representando la distribución conjunta completa Cada entrada en la distribución conjunta se representa por el producto de los elementos apropiados de las tablas (CPT). n P(x 1,, x n ) = Π P(x i padres(x i )) i=1 6

Representando la distribución conjunta completa Podemos calcular la probabilidad de que la alarma haya sonado pero no hay ni robo ni temblor y que tanto Mary como John llamen: P(j m a ~b ~e) = P(j a)p(m a)p(a ~b ~e)p(~b)p(~e)= 0.90 x 0.70 x 0.001 x 0.999 x 0.998= 0.00062 7

Construcción de RBs La ecuación n P(x 1,, x n ) = Π P(x i padres(x i )) i=1 implica ciertas relaciones de independencia condicional que pueden ser usadas para construir la RB. 8

Construcción de RBs Se reescribe la probabilidad conjunta en términos de una probabilidad condicional P(a b) = P(a b) P(b) P(x 1,...,x n ) = P(x n x n-1,...,x 1 )P(x n-1 x n-2,...,x 1 )...P(x 2 x 1 )P(x 1 )= n Π P(x i x i-1,...,x 1 ) i=1 Regla de la cadena 9

Regla de la cadena: ejemplo P(x 1,x 2,x 3,x 4 ) = P(x 1 ) P(x 2 x 1 ) P(x 3 x 2,x 1 ) P(x 4 x 3,x 2,x 1 ) n Π P(x i x i-1,...,x 1 ) i=1 Una RB es una representación correcta del dominio sólo si cada nodo es condicionalmente independiente de sus predecesores dados sus padres. 10

Construcción de RBs 1.Nodos: determinar el no. de variables requeridas para modelar el dominio. La red será más compacta si las variables se ordenan de modo que las causas precedan a los efectos. 2.Links: estructura acíclica. Cualquier variable no-descendiente del nodo X es independiente condicionalmente de X dados sus padres. 3.Agregar tabla de probabilidad para cada nodo. 11

Construcción de RBs Causa Efecto. Se modelan menos ligas. Al revés se tienen que especificar dependencias condicionales. P(MaryLlama JohnLlama, Alarma,Temblor, Robo) = P(MaryLlama Alarma) 12

Compresión y orden de nodos Una RB es a menudo más compacta que la distribución conjunta completa. Sistema localmente estructurado. Cada componente interactúa con un número limitado de componentes. Estructura local: crecimiento lineal. 13

Compresión y orden de nodos Rbs: cada variable aleatoria es directamente influenciada por k nodos. n variables booleanas. 2 k números: información necesaria para especificar la tabla; n2 k : red completa. Distribución conjunta: 2 n Para n=30 y k=5, RB requiere (30)2 5 = 960 números y la distribución conjunta 2 30 =1,073,741,824. 14

Si Mary y John saben que tembló no llamarán. Agregar la liga? 15

Orden de nodos Determina la compresión de la red. Agregar las causas primero, luego las variables que influencian hasta llegar a las hojas. Las hojas ya no tienen influencia causar en otras variables. 16

Más ligas que la red original. Las relaciones no son claras. 17

Relaciones de independencia condicional En vez de obtener las relaciones de independencia condicional a partir de la distribución conjunta se parte de la topología. 18

Semántica de la topología 1. Cada variable es condicionalmente independiente de sus no-descendientes dados sus padres. JohnLlama es independiente de Robo, Temblor y MaryLlama dado el estado de la Alarma. 19

Semántica de la topología 2. Un nodo es condicionalmente independiente del resto de nodos de la red dados sus padres, hijos y padres de sus hijos. Robo es independiente de JohnLlama y MaryLlama dado Alarma y Temblor. 20

Inferencia exacta:inferencia por enumeración La tarea básica de un sistema de información probabilista es calcular la distribución de probabilidad posterior para un conjunto de variables dado un evento. La distribución conjunta puede escribirse en términos de productos de probabilidades condicionales. 21

Inferencia exacta:inferencia por enumeración Un query puede contestarse utilizando una red Bayesiana calculando la suma de productos de las probabilidades condicionales de la red. Calcular la probabilida de que un robo haya ocurrido: P(Robo JohnLlama=true,MaryLlama=true) 22

Inferencia exacta:inferencia por enumeración P(Robo JohnLlama=true,MaryLlama=true) de la ec. suma sobre las posibles combinaciones en las variables no observadas la semántica de RB permite expresar en términos de independencia condicional 23

24

25

Inferencia exacta:inferencia por enumeración p(b j,m)= p(b)p(e)p(a b,e)p(j a)p(m a)+ p(b)p(e)p(~a b,e)p(j ~a)p(m ~a)+ p(b)p(~e)p(a b,~e)p(j a)p(m a)+ p(b)p(~e)p(~a b,~e)p(j ~a)p(m ~a) De las tablas: (0.001)(0.002)(0.95)(0.90)(0.70)+ 1.197x10-6 (0.001)(0.002)(0.05)(0.05)(0.01)+ 5x10-11 (0.001)(0.998)(0.94)(0.90)(0.70)+ 5.9x10-4 0.001(0.998)(0.06)(0.05)(0.01) 2.994x10-8 0.0005922 26

Inferencia exacta:inferencia por enumeración p(b j,m)=0.0005922 p(~b j,m)=0.0014919 Normalizando: p(b j,m) + p(~b j,m) = 1 α(0.0005922) + α(0.0014919) = 1 α(0.0005922+0.0014919) = 1 despejando α = 4.79814 x 10 2 p(b j,m)=0.284 p(~b j,m)= 0.7158 La probabilidad de que se trate de un robo dado que los dos vecinos llamaron es de 28% 27

Ejercicio Construye una red Bayesiana que represente el siguiente escenario: Considera 4 nodos binarios: nublado, aspersor, lloviendo y pasto-mojado. La mayor probabilidad de que el pasto esté mojado es cuando el aspersor está puesto y está lloviendo. La probabilidad es menor cuando solamente una de las evidencias se observa. La probabilidad de que esté nublado es 0.5. 28

Tarea Instala Hugin (versión demo) http://www.hugin.com/ Construye la red del ejercicio. Compila y corrige en caso necesario. 29