Modelos causales en inteligencia artificial Un caso práctico

Documentos relacionados
Bases Formales de la Computación: Redes de Bayes (segunda parte)

GeNie: entorno de desarrollo para la construcción de modelos gráficos de decisión Decision Systems Laboratory, University of Pittsburgh.

Medición de la gestión de la innovación en las universidades mediante sistemas expertos

BLOQUE III: SENTIDO ESTADÍSTICO COMO OBJETO DE ENSEÑANZA/APRENDIZAJE. MODULO 6: Probabilidad MODULO 7: Estadística

Predicción de potencia en el parque eólico de Villonaco, Loja, Ecuador. Alberto Reyes y Tania Guerrero INER Ecuador

Arboles de decisión. Area de Computación e Inteligencia Artificial

MATRIZ DE ARBOLES DE DECISION

Razonamiento probabilístico y redes bayesianas. Semántica de las RB Inferencia exacta Blanca A. Vargas Govea Octubre 16, 2012

Arboles de decisión. Area de Computación e Inteligencia Artificial

Modelos Gráficos Probabilistas L. Enrique Sucar INAOE. Sesión 10: Redes Bayesianas Inferencia. 1era parte. [Neapolitan 90]

7. PARAMETRIZACIÓN SOBRE LA RED DE PRUEBA

Desde hace algún tiempo los problemas más recurrentes con los que se enfrenta la industria

Diseño o de un estudio epidemiológico

Razonamiento probabilístico y redes bayesianas

Tema 6 Razonamiento aproximado

MATEMÁTICAS II. 15 de septiembre al 6 de octubre ESTÁNDARES DE APRENDIZAJE EVALUABLES

Análisis á de decisiones

Métodos de Inteligencia Artificial

4. DISEÑOS MULTIFACTORIALES O FACTORIALES

Créditos: 6 Horas Presenciales del estudiante: 45 Horas No Presenciales del estudiante: 105 Total Horas: 150 UTILIZACIÓN DE LA PLATAFORMA VIRTUAL:

Inteligencia Artificial I

Redes bayesianas temporales para reconocimiento de escenarios

ANÁLISIS DE DECISIONES EN MEDICINA

Sesión 8: Redes Bayesianas - Representación

Métodos Cuantitativos

ANÁLISIS DE DECISIONES EN MEDICINA

Universidad Nacional de Educación a Distancia. Ingeniería Técnica en Informática de Sistemas. Introducción a la Inteligencia Artificial (2º curso)

MATEMÁTICAS II MATRIZ DE ESPECIFICACIONES DE LA ASIGNATURA DE MATEMÁTICAS II ESTÁNDARES DE APRENDIZAJE AL BLOQUE

MATEMÁTICAS CRITERIOS DE EVALUACIÓN Y CALIFICACIÓN BACHILLERATO CURSO

Conceptos básicos estadísticos

A continuación se presenta la información de la altura promedio para el año de 1998 en Holanda de hombres y mujeres jóvenes.

Métodos de Inteligencia Artificial

Planificación didáctica de MATEMÁTICAS 3º E.S.O.

ELABORACIÓN DE LA MATRIZ DE ESPECIFICACIONES DE CADA UNA DE LAS MATERIAS OBJETO DE LA EBAU Matemáticas II. 2º Bachillerato

1. PROGRAMACION 2º CURSO BACHILLERATO CCSS

Bloque de asignaturas troncales generales según modalidad. CIENCIAS Matemáticas II. 2º Bachillerato. Matriz de especificaciones

Modelo Dinámico del Diseño del Software y Representación en UML. UNIDAD 9 Análisis y Diseño de Sistemas de Información

Visión de Alto Nivel. Dr. Luis Enrique Sucar INAOE. ccc.inaoep.mx/~esucar Sesión 5 Representación y Reconocimiento

DIRECCION GENERAL DE ASUNTOS ACADEMICOS PROGRAMA DE UNIDAD DE APRENDIZAJ E POR COMPETENCIAS

Aprendizaje Automatizado

Hernández Gaspar, Serafín Ángulo Pineda Fecha de elaboración: 28 de mayo 2010 Fecha de última actualización:

5. DISEÑO FACTORIALES 2 k

CAPÍTULO IV 4 METODOLOGÍA DE LA INVESTIGACIÓN

Visión n del Usuario Final

Aprendizaje Automatizado

INFERENCIA DE PARÁMETROS EN UNA RED DE REGULACIÓN GENÉTICA

Métodos de Inteligencia Artificial

ANÁLISIS DE DATOS. L.A. y M.C.E. Emma Linda Diez Knoth

MATEMÁTICAS APLICADAS A LAS CCSS II (2º BACHILLERATO)

ESTADÍSTICA APLICADA AL TURISMO

Simulación perceptual

Sesión 14: Redes de Decisión

Técnicas de Minería de Datos

TIPOS Y DISEÑOS DE INVESTIGACIÓN

SEMINARIO DE INVESTIGACIÓN DE MERCADOS

Universidad Nacional de Educación a Distancia Ingeniería Técnica en Informática de Sistemas Introducción a la Inteligencia Artificial (2º curso)

CRITERIOS DE EVALUACIÓN 2º DE BACHILLERATO MATEMÁTICAS II. Bloque 1: Procesos, métodos y actitudes en matemáticas

- Si se repite un experimento, en condiciones indistinguibles, los resultados presentan variabilidad.

GUÍAS. Módulo de Pensamiento científico Ciencias físicas SABER PRO

Redes y Sistemas Complejos

ÁREA DE CIENCIAS NATURALES

AÑO 2017 PROGRAMACIÓN DE FISICA DE 4º AÑO

Licenciatura en Química PROGRAMA DE ESTUDIO. Obligatoria Nancy Romero Ceronio, Armando Escobar Programa elaborado por:

Selección Diseño de Cribado

Programa de Asignatura

Probabilidad y muestreo

MATEMÁTICAS APLICADAS A LAS CCSS II. 1. Resolver sistemas de ecuaciones lineales mediante el método de Gauss.

Lic. M.A. Josué Daniel Tuy Jiatz Sesión No. 2

ESTADÍSTICA APLICADA PREUNIVERSITARIA. Grado en FACULTAD DE ESTUDIOS ESTADÍSTICOS. CAMPUS DE MONCLOA Avda. Puerta de Hierro s/n UNIVERSIDAD

Tema 20: La importancia de realizar pruebas

Muestreo, Recogida de información y Análisis de datos

Sistemas Expertos Unidad 2. Prof. Francklin Rivas Echeverría Universidad de Los Andes Laboratorio de Sistemas Inteligentes

INTERPRETACIÓN DE GRÁFICOS

Carrera: SCB Participantes. Representantes de la academia de sistemas y computación de los Institutos Tecnológicos.

Reporte de la prueba de habilidad

GUÍA DE STATGRAPHICS 5.1

ÁREA: MATEMÁTICAS ETAPA: PRIMARIA CICLO: PRIMERO

RESUMEN PROGRAMACIÓN ESTADÍSTICA I. 3. Diseñar tablas estadísticas para coleccionar y ordenar datos.

Métodos de Inteligencia Artificial

REGISTRO DE EVIDENCIAS

Árboles de Decisión Árboles de Sintaxis

Anexo. Guía de uso de la herramienta Java de identificación.

Resolución general de problemas

Teoría de probabilidades

Pronósticos e Intervención en Sistemas Dinámicos de Flujo. Liliana Figueroa Quiroz

Competencia N 1. Indicador 1.2

ASIGNATURA DE MÁSTER: BIOESTADÍSTICA

Índice general. Introducción... 23

Tópicos Avanzados: Inteligencia Computacional I

Estadística para administración y economía

Modelos Para la Toma de Decisiones

GUÍA DOCENTE DE LA ASIGNATURA ESTADÍSTICA APLICADA

Planificación didáctica de MATEMÁTICAS 1º E.S.O.

EL TEOREMA DE BAYES Y EL DIAGNÓSTICO CLÍNICO

UNIVERSIDAD CENTRAL DE VENEZUELA FACULTAD DE INGENIERÍA ESCUELA DE INGENIERÍA CIVIL DEPARTAMENTO DE INGENIERÍA HIDROMETEOROLÓGICA LABORATORIO:

Portal MÓDULO DE ENTRENAMIENTO

CRITERIOS DE SELECCIÓN DE MODELOS

Fundamentación. Metodología del Curso. Objetivos Generales

Transcripción:

SECCIÓN Fisicomatemáticas e Ingeniería Modelos causales en inteligencia artificial Un caso práctico Alicia E. Silva Ávila Alma J. Domínguez Lugo Abraham Castorena Peña Roxana Elizondo Díaz Facultad de Ingeniería Mecánica y Eléctrica alicia.silva@uadec.edu.mx Resumen Los sistemas expertos surgieron en los años setenta como programas capaces de imitar el razonamiento de expertos humanos e, incluso, con la intención de sustituirlos cuando fuera necesario. Sin embrago, en las décadas siguientes, durante los años ochenta y noventa, el principal objetivo de la inteligencia artificial pasó de imitar la inteligencia natural a convertirse en colaborador de los humanos, expertos o no, de forma sinérgica. De hecho, Clancey resalta que la revista Knowledge Acquisition decía en su nota para los autores: la cuestión clave no es la inteligencia artificial, sino cómo mejorar la inteligencia natural con la ayuda de los sistemas basados en conocimiento. Una de las principales aptitudes de los expertos humanos es su capacidad para comunicar su conocimiento y explicar el razonamiento llevado a cabo para obtener un resultado. Palabras Clave: inteligencia artificial, sistemas expertos, redes bayesianas, modelos causales Redes bayesianas Las redes bayesianas modelan un fenómeno mediante un conjunto de variables y las relaciones de dependencia entre ellas. Dado este modelo, se puede hacer inferencia bayesiana; es decir, estimar la probabilidad posterior de las variables no conocidas con base en las variables conocidas. Estos modelos pueden tener diversas aplicaciones, para clasificación, predicción, diagnóstico, etcétera. 1

Además, pueden proporcionar información interesante sobre la manera como se relacionan las variables del dominio, las cuales pueden ser interpretadas en ocasiones como relaciones de causa-efecto. Las redes bayesianas son una representación gráfica de dependencias para razonamiento probabilístico, en la cual los nodos representan variables aleatorias y los arcos representan relaciones de dependencia directa entre las variables. En una RB todas las relaciones de independencia condicional representadas en el grafo corresponden a relaciones de independencia en la distribución de probabilidad. Causalidad Desde un punto de vista matemático, una red bayesiana es simplemente un modelo para representar dependencias e independencias probabilísticas; en este caso, un enlace, considerado por sí mismo no tiene ningún significado. Sin embargo, cuando se construye una red bayesiana como un modelo de un sistema del mundo real, un enlace A B es causal si A es una causa de B, es decir, si existe un mecanismo mediante el cual el valor que tome A influye sobre el valor de B. Una red bayesiana se dice que es causal cuando todos sus enlaces son causales. Las razones para usar modelos causales en inteligencia artificial, especialmente en sistemas expertos probabilistas, son múltiples, entre las que destacamos las siguientes. Los seres humanos tendemos a interpretar los hechos en términos de relaciones causa-efecto. Por tanto, los modelos causales son más fáciles de construir y de modificar, puesto que tienden a ser más simples que los no causales. En consecuencia, también son más fáciles de entender por los usuarios. Muchos dominios de aplicación reales están organizados en forma de jerarquías causales, como el caso de la medicina, cuyo conocimiento está estructurado en forma causa-efecto: desde la invasión de determinados organismos (virus, bacterias, etc.) en el cuerpo humano, pasando por las anomalías físicas que produce, hasta sus complicaciones, síndromes, estados clínicos y los síntomas que genera. Los modelos causales aportan mucha más información que los modelos meramente probabilísticos. Una distribución conjunta nos aporta información sobre las probabilidades de ciertos eventos y sobre como variarán estas después de diferentes observaciones, un modelo causal además nos indica como variarán dichas probabilidades como resultado de intervenciones externas. Existen modelos canónicos probabilísticos (puerta OR, puerta MAX, puerta AND, etc.) basados en la interpretación de los padres de un nodo como causas o condiciones para dicho nodo y sobre la 2

asunción de independencia de interacciones causales. Estos modelos reducen el número de parámetros de la red, simplificando la adquisición del conocimiento e incluso produciendo cálculos más eficientes. Las redes bayesianas causales proporcionan determinados modelos de razonamiento cualitativo que pueden ser identificados con el objetivo de explicar los resultados de la inferencia. Metodología Métodos y técnicas Se manejó el proceso de modo manual mediante la colaboración entre los ingenieros del conocimiento y los expertos en el dominio que se desea representar. En este caso, los modelos que se suelen desarrollar corresponden a redes causales, pues los expertos humanos suelen tener el conocimiento estructurado en forma causal. Red bayesiana La figura 1 muestra cómo quedó la red bayesiana después de realizar varias depuraciones, se observa que consta de tres niveles. Recordando, las redes bayesianas se deben estructurar como causa-efecto por lo que: el primer nivel de la red (de abajo hacia arriba) corresponde al objetivo principal de este caso la cual es la innovación tecnológica (el efecto). Enseguida se observan las categorías y, por último, el tercer nivel representa los puntos más relevantes de cada uno de los ítems del método usado. Dentro de esta figura se muestran las relaciones que existen entre los nodos, de las cuales se hace mención más adelante, del significado de sus colores. Figura 1. Red bayesiana en modo edición. Elaboración propia. 3

Cuando las redes se editan con la interfaz gráfica elegida, durante el proceso de construcción del grafo cualitativo todos los enlaces están coloreados en negro, representando el hecho de que aún no se han asignado las probabilidades. Así, cuando se han asignado las probabilidades asociadas a un nodo, el color de los enlaces cambia al color de la influencia transmitida por cada uno de sus padres. Por otra parte, un enlace puede tener el color negro incluso después de asignar las probabilidades, cuando los valores que toma el padre no modifican la probabilidad del hijo ésta puede eliminarse ya que no es necesario ese enlace. La figura 2 muestra los enlaces que resultaron de esta red canónica. La interpretación de cada color de enlace es la siguiente: - Rojo: indica que hay una influencia positiva, es decir, que al aumentar el valor del padre, aumenta el valor del nodo hijo. - Azul: indica influencia negativa. - Negro. Indica que el enlace no transmite información - Violeta: indica que hay influencia ambigua, es decir, que en algunos valores del padre hay influencia positiva y para otras negativas. Figura 2. Representación de influencias en modo edición entre los nodos, donde el color rojo indica que hay una influencia positiva entre los nodos. Elaboración propia. 4

En la figura 3 se pueden observar los resultados a priori del modelo en cuestión del cual se captan las siguientes probabilidades para cada nodo: - trayectoria= 0.72 - visión= 0.56 - estrategia= 0.68 - recursos humanos= 0.72 - financiación=0.76 Con esto se observa que, si en todos los nodos elegimos sí, es decir, en todos los nodos elegimos como positivo cada uno de ellos, el resultado que arrojará en modo inferencia para el nodo innovación será de 1.00. - captación= 0.76 Figura 3. Modelo inferencia mostrando las probabilidades de los nodos a priori. Elaboración propia. Resultados En la construcción del grafo cualitativo, de acuerdo a la bibliografía estudiada, los constructos elegidos para el modelo normalmente corresponden a posibles causas como: que las estrategias existan o no, que se tenga su- 5

ficiente capital monetario, así como suficiente y eficiente recurso humano, etc. Durante el proceso de construcción del grafo cualitativo uno de los pasos importantes fue la definición de los estados de cada variable; todas las variables tienen un nombre significativo y además todas son binarias, con valores del tipo ausente-presente, no-sí, positivo-negativo, ya que, lo que interesa conocer de cada una de ellas es si tienen valor distinto al habitual. Al haber realizado el modelo se procedió a la aplicación de éste alimentándolo con diversos datos de entrada y obteniendo los resultados mostrados en la tabla 3. Para evaluar el resultado de la aplicación del modelo se utilizaron los arreglos ortogonales de Taguchi. El arreglo ortogonal es una herramienta ingenieril que simplifica, y en algunos casos elimina, gran parte de los esfuerzos de diseño estadístico. Es una forma de examinar simultáneamente muchos factores a bajo costo. El doctor Taguchi recomienda el uso de arreglos ortogonales para hacer matrices que contengan los controles y los factores de ruido en el diseño de experimentos. La ventaja de los arreglos ortogonales es que pueden aplicarse al diseño experimental involucrando un gran número de factores. Un arreglo ortogonal permite asegurar que el efecto de "B" en "A1" es el mismo efecto de "B" en "A2". Así se podrá estar seguro de que se están haciendo comparaciones entre efectos de niveles de un factor. Arreglo ortogonal que representa La(b)C donde: L = indica que es un arreglo ortogonal a = número de corridas experimentales b = número de niveles para cada factor c = número de columnas o factores de un arreglo ortogonal ARREGLO ORTOGONAL L8(2)6 1 2 3 4 5 6 Na A B C D E F RESULTADOS 1 1 1 1 1 1 1 Presente=1 2 1 1 1 2 2 2 Presente=0.96 3 1 2 2 1 1 2 Presente=0.98 4 1 2 2 2 2 1 Presente=0.93 5 2 1 2 1 2 1 Presente=0.98 6 2 1 2 2 1 2 Presente= 0.88 7 2 2 1 1 2 2 Presente=0.92 8 2 2 1 2 1 1 Presente=0.98 Tabla 3. Arreglo ortogonal. 1=Presente y 2=Ausente. Elaboración propia. 6

Enseguida se muestran los casos realizados en el software ELVIRA. En cada uno se observan los movimientos realizados en cada nodo y el resultado que se obtiene al realizar dicho movimiento. Figura 4. Resultados obtenidos en modo inferencia. Elaboración propia. Conclusiones Se tiene la posibilidad de generar respuestas a través del modelo representado en la red bayesiana y estas explicaciones se pueden presentar de forma verbal y de modo gráfico: o La explicación verbal del modelo consiste en mostrar la información asociada a un nodo o enlace seleccionado por el usuario. o La explicación gráfica consiste en representar el tipo de influencia que transmite cada nodo a sus hijos dibujando los enlaces con distintos colores. Se da la posibilidad de gestionar distintos casos de evidencia, lo cual propicia la visualización de los resultados del análisis de sensibilidad de cada nodo respecto de la evidencia y el razonamiento hipotético ofreciendo 7

un modo sencillo de estudiar los resultados obtenidos. La clasificación de los hallazgos que forman la evidencia, dependiendo del tipo y la cantidad de influencia que ejercen sobre una variable determinada, permite obtener información sobre el porqué de los resultados obtenidos sobre dicha variable. Las explicaciones únicamente se ofrecen cuando el usuario lo solicita. Se controlan mediante el software las posibles inconsistencias que se pueden producir al intentar realizar acciones no permitidas. Bibliografía C., L. (2002). explicacion en redes bayesianas causales. Aplicaciones medicas. Madrid: Tesis doctoral. George L. Michael, R. D. (2005). The lean six sigma pocket toolbook. internacional: pocket toolbook. Jova Aguiar Santiago, O. S. (2008). La transferencia de tecnologia, la innovacion tecnologica y su incidencia en el desarrollo local. Uffe B. Kyaerulff, M. A. (2008). Bayesian Networks and Influence Diagrams. ISBN 978-0-387-74100-0. 8