Factorización de árboles de probabilidad y sus aplicaciones I. Martínez, S. Moral, C. Rodríguez, A. Salmerón Dept. Estadística y Mat. Aplicada Universidad de Almería Dept. Ciencias de la Computación e I.A. Universidad de Granada Factorizaci ón de árboles de probabilidad y sus aplicaciones p.1/13
Índice 1. Motivación 2. Niveles de factorización 3. Factorización de árboles de probabilidad 4. Aplicaciones 5. Conclusiones Factorizaci ón de árboles de probabilidad y sus aplicaciones p.2/13
Para qué factorizar? En cálculo de probabilidades, FACTORIZAR MÁS EFICIENCIA Factorizaci ón de árboles de probabilidad y sus aplicaciones p.3/13
Para qué factorizar? En cálculo de probabilidades, FACTORIZAR MÁS EFICIENCIA Modelos multivariantes, gran número de variables, f.m.p. sin expresión analítica: MUY FRECUENTES EN LA PRÁCTICA Factorizaci ón de árboles de probabilidad y sus aplicaciones p.3/13
Para qué factorizar? En cálculo de probabilidades, FACTORIZAR MÁS EFICIENCIA Modelos multivariantes, gran número de variables, f.m.p. sin expresión analítica: MUY FRECUENTES EN LA PRÁCTICA Antes de factorizar: INTRATABLES Factorizaci ón de árboles de probabilidad y sus aplicaciones p.3/13
Para qué factorizar? En cálculo de probabilidades, FACTORIZAR MÁS EFICIENCIA Modelos multivariantes, gran número de variables, f.m.p. sin expresión analítica: MUY FRECUENTES EN LA PRÁCTICA Antes de factorizar: INTRATABLES Después de factorizar: TRATABLES Factorizaci ón de árboles de probabilidad y sus aplicaciones p.3/13
Niveles de factorización PRIMER NIVEL: Red bayesiana Join tree. Factorizaci ón de árboles de probabilidad y sus aplicaciones p.4/13
Niveles de factorización PRIMER NIVEL: Red bayesiana Join tree. Concepto subyacente: Independencia condicional Factorizaci ón de árboles de probabilidad y sus aplicaciones p.4/13
Niveles de factorización PRIMER NIVEL: Red bayesiana Join tree. Concepto subyacente: Independencia condicional SEGUNDO NIVEL: Potenciales asociados a los nodos del join tree. Factorizaci ón de árboles de probabilidad y sus aplicaciones p.4/13
Niveles de factorización PRIMER NIVEL: Red bayesiana Join tree. Concepto subyacente: Independencia condicional SEGUNDO NIVEL: Potenciales asociados a los nodos del join tree. Un potencial es una función Ψ : R n R + 0 con soporte finito Factorizaci ón de árboles de probabilidad y sus aplicaciones p.4/13
Árboles de probabilidad Un potencial se puede representar como un árbol: w x y ψ(w, x, y) 0 0 0 0.1 0 0 1 0.2 0 1 0 0.2 0 1 1 0.4 1 0 0 0.3 1 0 1 0.6 1 1 0 0.6 1 1 1 1.2 Factorizaci ón de árboles de probabilidad y sus aplicaciones p.5/13
Árboles de probabilidad Un potencial se puede representar como un árbol: w x y ψ(w, x, y) 0 0 0 0.1 0 0 1 0.2 0 1 0 0.2 0 1 1 0.4 1 0 0 0.3 1 0 1 0.6 1 1 0 0.6 1 1 1 1.2 0 W 1 0 1 0 1 Y Y Y Y 0 1 0 1 0 1 0 1 0.1 0.2 0.2 0.4 0.3 0.6 0.2 1.2 Factorizaci ón de árboles de probabilidad y sus aplicaciones p.5/13
Factorización de árboles de prob. Se puede factorizar un árbol? Factorizaci ón de árboles de probabilidad y sus aplicaciones p.6/13
Factorización de árboles de prob. Se puede factorizar un árbol? bajo ciertas condiciones, SÍ Factorizaci ón de árboles de probabilidad y sus aplicaciones p.6/13
Factorización de árboles de prob. Se puede factorizar un árbol? bajo ciertas condiciones, SÍ Definición: Sea ψ un potencial sobre = { 1,..., n } representado por un árbol T. Sea C y ( C = x C ) una configuración de variables que llevan desde T hasta una variable i. Decimos que T es factorizable en i para el contexto ( C = x C ), si para todo x,y Ω i, ε > 0 t.q. T R( C=x C, i =x) = ε T R( C=x C, i =y). Factorizaci ón de árboles de probabilidad y sus aplicaciones p.6/13
Factorización de árboles de prob. Definición: Sea T un árbol de probabilidad. Definimos T ( C = x C, i,x,y,ε) como el árbol que se obtiene reemplazando, en T, T R( C=x C, i =x) por la constante 1 y T R( C=x C, i =y) por ε. Factorizaci ón de árboles de probabilidad y sus aplicaciones p.7/13
Factorización de árboles de prob. Definición: Sea T un árbol de probabilidad. Definimos T ( C = x C, i,x,y,ε) como el árbol que se obtiene reemplazando, en T, T R( C=x C, i =x) por la constante 1 y T R( C=x C, i =y) por ε. Definición: Sea T un árbol de probabilidad. Definimos T ( C = x C, i,x) como el árbol que se obtiene reemplazando, en T, T R( C=x C ) por T R( C=x C, i =x) y T R( D=x D ) por 1 para cualquier contexto ( D = x D ) incompatible con ( C = x C ). Factorizaci ón de árboles de probabilidad y sus aplicaciones p.7/13
Factorización de árboles de prob. Proposición: Sea T un árbol de probabilidad factorizable en i con factor de proporcionalidad ε para el contexto ( C = x C ). Entonces, T = T ( C = x C, i,x,y,ε) T ( C = x C, i = x) Factorizaci ón de árboles de probabilidad y sus aplicaciones p.8/13
Ejemplo 0 W 1 0 1 0 1 Y Y Y Y 0 1 0 1 0 1 0 1 0.1 0.2 0.2 0.4 0.3 0.6 0.2 1.2 Factorizaci ón de árboles de probabilidad y sus aplicaciones p.9/13
Ejemplo 0 W 1 0 1 0 1 Y Y Y Y 0 1 0 1 0 1 0 1 0.1 0.2 0.2 0.4 0.3 0.6 0.2 1.2 T es factorizable en para el contexto (W = 0) Factorizaci ón de árboles de probabilidad y sus aplicaciones p.9/13
Ejemplo 0 W 1 0 1 0 1 Y Y Y Y 0 1 0 1 0 1 0 1 0.1 0.2 0.2 0.4 0.3 0.6 0.2 1.2 T es factorizable en para el contexto (W = 0) W W Y 1 1 2 Y Y 0.1 0.2 0.3 0.6 0.6 1.2 Factorizaci ón de árboles de probabilidad y sus aplicaciones p.9/13
Aplicaciones: propagación perezosa La factorización es útil cuando: Se va a borrar una variable que está en más de un árbol. Factorizaci ón de árboles de probabilidad y sus aplicaciones p.10/13
Aplicaciones: propagación perezosa La factorización es útil cuando: Se va a borrar una variable que está en más de un árbol. Alguno de los árboles es factorizable en para algún contexto. Factorizaci ón de árboles de probabilidad y sus aplicaciones p.10/13
Aplicaciones: propagación perezosa La factorización es útil cuando: Se va a borrar una variable que está en más de un árbol. Alguno de los árboles es factorizable en para algún contexto. Es tanto más efectiva cuanto más cerca de la raíz esté. Factorizaci ón de árboles de probabilidad y sus aplicaciones p.10/13
Justificación Proposición: Ninguna variable aparece más de una vez en una misma rama de un árbol de probabilidad. Factorizaci ón de árboles de probabilidad y sus aplicaciones p.11/13
Justificación Proposición: Ninguna variable aparece más de una vez en una misma rama de un árbol de probabilidad. Corolario: T ( C = x C, i ) no contiene a i. Factorizaci ón de árboles de probabilidad y sus aplicaciones p.11/13
Justificación Proposición: Ninguna variable aparece más de una vez en una misma rama de un árbol de probabilidad. Corolario: T ( C = x C, i ) no contiene a i. PROBLEMA: Puede ser difícil que se dé la proporcionalidad en un árbol Factorizaci ón de árboles de probabilidad y sus aplicaciones p.11/13
Solución: factorización aproximada Definición: Sea ψ un potencial sobre = { 1,..., n } representado por un árbol T. Sea C y ( C = x C ) una configuración de variables que llevan desde T hasta una variable i. Decimos que T es δ-factorizable en i para el contexto ( C = x C ), con δ > 0, si para todo x,y Ω i, ε > 0 t.q. T R( C=x C, i =x) ε T R( C=x C, i =y) δ. Factorizaci ón de árboles de probabilidad y sus aplicaciones p.12/13
Ejemplo 0 W 1 0 1 0 1 Y Y Y Y 0 1 0 1 0 1 0 1 0.1 0.2 0.21 0.39 0.3 0.6 0.2 1.2 Factorizaci ón de árboles de probabilidad y sus aplicaciones p.13/13
Ejemplo 0 W 1 0 1 0 1 Y Y Y Y 0 1 0 1 0 1 0 1 0.1 0.2 0.21 0.39 0.3 0.6 0.2 1.2 T es 0.1-factorizable en para el contexto (W = 0) Factorizaci ón de árboles de probabilidad y sus aplicaciones p.13/13
Ejemplo 0 W 1 0 1 0 1 Y Y Y Y 0 1 0 1 0 1 0 1 0.1 0.2 0.21 0.39 0.3 0.6 0.2 1.2 T es 0.1-factorizable en para el contexto (W = 0) W W Y 1 1 2 Y Y 0.1 0.2 0.3 0.6 0.6 1.2 Factorizaci ón de árboles de probabilidad y sus aplicaciones p.13/13