APRENDIZAJE BASADO EN GRAFOS. Jesús González y Eduardo Morales

Documentos relacionados

APRENDIZAJE BASADO EN GRAFOS. Jesús González

Resolución de Problemas

Tutorial: Uso básico de RapidMiner Parte II: Predicción de variables categóricas

MODELOS DE RECUPERACION

Análisis y cuantificación del Riesgo

SEGURIDAD Y PROTECCION DE FICHEROS

CAPITULO 3 REDES HIBRIDAS-COMPLEJAS. 3.1 Descripción de la Red Híbrida Compleja (HCNN)

Capítulo 4. Pruebas y resultados.

Autómatas Finitos. Leopoldo Altamirano, Eduardo Morales. Verano, 2011 INAOE. Introducción a. Autómatas. Definición formal de un. Finito Determinístico

Modelos y Bases de Datos

Diseño Estructurado de Algoritmos

INTRODUCCIÓN A LOS SISTEMAS GESTORES DE BASE DE DATOS

3.1 Metodología de la investigación

TEMA 8: LÍMITES DE FUNCIONES. CONTINUIDAD

PROGRAMACIÓN ORIENTADA A OBJETOS Master de Computación. II MODELOS y HERRAMIENTAS UML. II.1 UML: Introducción

CAPÍTULO 10 Aplicaciones de la Derivada a Funciones Económicas

Continuidad y ramas infinitas. El aumento A producido por cierta lupa viene dado por la siguiente ecuación: A = 2. lm í

Generalización como búsqueda. El problema de aprendizaje por generalización puede verse como un problema de búsqueda:

Ya se definió brevemente lo que es la minería de datos, pero ahora conviene

Complejidad - Problemas NP-Completos. Algoritmos y Estructuras de Datos III

1 Límites de funciones

Actividades para mejoras. Actividades donde se evalúa constantemente todo el proceso del proyecto para evitar errores y eficientar los procesos.

MANUAL DE USUARIOS DEL MODULO DE EVALUACIÓN DE DESEMPEÑO SISTEMA DE ADMINISTRACIÓN DE SERVIDORES PÚBLICOS (SASP)

Operaciones en el Modelo Relacional. Relacional. Relacional. Índice. Lenguajes de Consulta

Tema 07. LÍMITES Y CONTINUIDAD DE FUNCIONES

Procesos Críticos en el Desarrollo de Software

Modelos y Bases de Datos

Criptografía y Seguridad Computacional Clase 5: 30/03/2016. Tenemos el siguiente esquema donde se manda un mensaje con tag t de verificación:

Dirección de Operaciones

Introducción. Ciclo de vida de los Sistemas de Información. Diseño Conceptual

EDITOR DE ECUACIONES en Open Office.org Writer INTRODUCCIÓN

Teoría del Juego - Juegos Combinatoriales Imparciales

5. Experimentos y Resultados

Unidad 5 Utilización de Excel para la solución de problemas de programación lineal

Una investigación australiana reveló que posiblemente la disminución

CAPÍTULO 4: ALGORITMOS DE APRENDIZAJE

SEGURIDAD EN SISTEMAS DE INFORMACION. TEMA 2 - parte 2. Criptografia asimétrica

Problemas de satisfacción de restricciones.

Este botón situado en la barra de título de la ventana de la aplicación, nos da acceso a un menú mediante el cual podemos, entre otras opciones:

Tema 5. Diseño detallado.

REDES AD HOC INFORME DE REDES DE COMPUTADORES I. Felipe Muñoz Jonathan Porta Matías Contreras

Inteligencia Artificial II. Razonamiento con ontologías

Lección 1-Introducción a los Polinomios y Suma y Resta de Polinomios. Dra. Noemí L. Ruiz Limardo 2009

LA MEDIDA Y SUS ERRORES

ESTIMACIÓN. puntual y por intervalo

Manual Usuario Wordpress. Índice

Ingeniería del Software I Clase de Testing Funcional 2do. Cuatrimestre de 2007

4 Teoría de diseño de Experimentos

EL DISEÑO FACTORIAL COMPLETO 2 2

Base de datos relacional

Aprendizaje Automático y Data Mining. Bloque IV DATA MINING

LÍMITES DE FUNCIONES. CONTINUIDAD Y RAMAS INFINITAS

GRAFOS. Prof. Ing. M.Sc. Fulbia Torres

Lea esto primero! un estudio de investigación sobre pruebas de VIH que se realizan en la comodidad de su hogar TEST. REPLY. KNOW.

El Futuro de la Computación en la Industria de Generación Eléctrica

Fundamentos y Aplicaciones Prácticas del Descubrimiento de Conocimiento en Bases de Datos. - Sesión 9 -

TEMA 3 PROFESOR: M.C. ALEJANDRO GUTIÉRREZ DÍAZ 2 3. PROCESAMIENTO DE CONSULTAS DISTRIBUIDAS

2002 Emerson Process Management. Todos los derechos reservados. Vea este y otros cursos en línea en

GUÍA DOCENTE. Curso Ingeniería Informática en Sistemas de Información Doble Grado:

Bienvenido al sistema de Curriculum Digital CVDigital

Proceso de normalización

Capitulo V Administración de memoria

LÍMITES DE FUNCIONES. CONTINUIDAD Y RAMAS INFINITAS

GUÍA DE EJERCICIOS UNIDAD II

La vida en un mundo centrado en la red

Page 1. Contenido. Generalidades (1) Pontificia Universidad Católica del Perú Facultad de Ciencias e Ingeniería INTELIGENCIA ARTIFICIAL

Matemáticas para la Computación

Correspondencias entre taxonomías XBRL y ontologías en OWL Unai Aguilera, Joseba Abaitua Universidad de Deusto, EmergiaTech

TEMA V TEORÍA DE CUADRIPOLOS LINEALES Introducción Parámetros de Impedancia a circuito abierto.

MATEMÁTICAS CON LA HOJA DE CÁLCULO

COMPETENCIAS BÁSICAS: DIEZ CLAVES

TERCER LINEAMIENTO PROCEDIMIENTO DE IDENTIFICACIÓN DE ASPECTOS Y VALORACIÓN DE IMPACTOS AMBIENTALES

Tema 1: Fundamentos de lógica, teoría de conjuntos y estructuras algebraicas: Apéndice

Mapa conceptual. Mapa conceptual

UNIDAD EJECUTORA DE CONSERVACION VIAL MANUAL DEL USUARIO DEL SISTEMA INTEGRAL DE CONTROL DE PROYECTOS

LÍMITES DE FUNCIONES. CONTINUIDAD

Sistemas operativos avanzados. 1.3 Algoritmos de planificación del procesador

4. Modelo Relacional: Manipulación de los datos.

NIFBdM C-7 OTRAS INVERSIONES PERMANENTES

UN SIMULADOR DE UNA MAQUINA COMPUTADORA COMO HERRAMIENTA PARA LA ENSEÑANZA DE LA ARQUITECTURA DE COMPUTADORAS

Seminario Aplicaciones de las Redes Neuronales (WebSOM)

Tema 5. Aproximación funcional local: Polinomio de Taylor. 5.1 Polinomio de Taylor

Unidad 623 Correr en días de calor

1-Comportamiento de una función alrededor de un punto:

Apuntes de Matemática Discreta 1. Conjuntos y Subconjuntos

BASE DE DATOS RELACIONALES

Sistemas de ayuda a la decisión Tema 5. Análisis de Sensibilidad Análisis Cualitivo y Análisis Paramétrico

CAPÍTULO 1 PROYECTO JURÍDICO PRÁCTICAS MONOPÓLICAS EN LOS CONTRATOS DE FRANQUICIAS EN MÉXICO

Organización como función administrativa Resumen para Administración y Gestión Profesor: Gonzalo V.

UNIVERSIDAD NACIONAL DE ASUNCION FACULTAD POLITÉCNICA CARRERA: LCIK MATERIA: Bases de Datos I Prof: Lic. Lilian Riveros Unidad 2: Modelo Relacional

Construcción de Escenarios

Tema 7. Límites y continuidad de funciones

LAS NUEVAS TECNOLOGÍAS DE LA INFORMACIÓN Y DE LA COMUNICACIÓN (TIC) EN LA EDUCACIÓN.

Lección 24: Lenguaje algebraico y sustituciones

Internet, Participación y Movilización

UNIVERSIDAD DON BOSCO FACULTAD DE ESTUDIOS TECNOLÓGICOS

Operación de Microsoft Excel. Guía del Usuario Página 79. Centro de Capacitación en Informática

PLAN DE TRABAJO. Descripción del problema a aceptación hasta el

De acuerdo con la diferente naturaleza de las operaciones, esta política diferenciará fundamentalmente entre dos tipos de operaciones:

Propiedad Colectiva del Código y Estándares de Codificación.

Transcripción:

APRENDIZAJE BASADO EN GRAFOS Jesús González y Eduardo Morales

Aprendizaje Basado en Grafos 2 Funciona para dominios estructurados Como ILP Algunos dominios estructurados Bioinformática Visión por computadora Recuperación de texto Análisis de archivos web-logs

Aprendizaje Basado en Grafos 3 Encuentran subestructuras a partir de un conjunto de grafos Caracterizar conjuntos de grafos Discriminar diferentes grupos de grafos Clasificar y agrupar grafos Construir índices de grafos

Aprendizaje Basado en Grafos 4 2 principales formas de buscar subestructuras frecuentes Con generación de candidatos Sin generación de candidatos

Aprendizaje Basado en Grafos 5 Generación de Candidatos n Genera subestructuras candidatas n Verifica la frecuencia de esas subestructuras n Como lo hace el alg. de Agrawal para encontrar reglas de asociación n Realizan operación join entre 2 o más subestructuras frecuentes para generar una nueva subestructura candidata n Búsqueda BFS para generar todos los candidatos de tamaño k n Dos pasos muy tardados n Unir dos grafos frecuentes de tamaño-k para generar grafos candidatos de tamaño-k+1 n Verificar la frecuencia de los candidatos en otro paso n Cuello de botella para algoritmos tipo a priori o generación de candidatos n Ejemplos: Algoritmos AGM, FSG, path-join

Aprendizaje Basado en Grafos 6

Aprendizaje Basado en Grafos 7 Sin generación de candidatos Evitar cuello de botella de alg. que generan candidatos Utilizan método en que van creciendo el patrón Extienden un patrón a partir de un solo grafo Al extender el patrón ya se está seguro de que es frecuente, ya no se generan candidatos Pueden utilizar BFS ó DFS Ejemplos: gspan, MoFa, FFSM, SPIN, Gaston Muy importante: paso de crecimiento de patrones podando lo más posible el espacio de búsqueda

Aprendizaje Basado en Grafos 8

Introducción a Subdue 9 Representación de conocimiento Basado en grafos Fase de preparación de datos n Transformación de los datos a un formato de grafo Espacio de búsqueda Todos los subgrafos que se pueden derivar a partir del grafo de entrada n Espacio de búsqueda es exponencial n También el tiempo de ejecución n Se puede restringir para hacerlo polinomial (pero ya no completo)

Introducción a Subdue 10 Criterio de evaluación Para determinar cuáles subgrafos del espacio de búsqueda son relevantes y formar parte de los resultados Subdue utiliza el Principio de Longitud de Descripción Mínima ó MDL n MDL dice que la mejor descripción del conjunto de datos es aquella que minimiza la longitud de la descripción de todo el conjunto de datos n Subdue lo utiliza para determinar que tan bien un grafo comprime al grafo de entrada

Introducción a Subdue 11 Proceso KDD SPECIFIC DOMAIN DATA COLLECTION DATA SELECTION DATA PREPARATION DATA SET CLEAN, PREPARED DATA DATA TRANSFORMATION KNOWLEDGE APPLICATION KNOWLEDGE PATTERN EVALUATION DATA MINING SUBDUE FOUND PATTERNS FORMATTED AND STRUCTURED DATA

Introducción a Subdue 12 Versión no supervizada Descubre patrones (subestructuras) en conjuntos de datos estructurales Representa los datos como un grafo etiquetado Entrata: Vértices y arcos Salida: Patrones descubiertos y sus instancias

Introducción a Subdue 13 Ejemplo

Búsqueda de Subdue 14 Inicia con un solo vértice por cada etiqueta diferente y lo expande Añade un arco y un vértice Añade un arco (entre 2 vértices de la subestructura) Restringido computacionalmente Beam Search Espacio de búsqueda Todos los sub-grafos del grafo de entrada Guiado por heurísticas de compresión

MDL en Subdue 15 Codificación mínima (Minimum Encoding) Basada en MDL (Rissanen 1989) La mejor descripción del conjunto de datos es la que minimiza I(S) + I(G S) S es la subestructura utilizada para describir el grafo de entrada G I(S) es la longitud (número de bits) requeridos para codificar S I(G S) es la longitud de la codificación del grafo G después de comprimirlo utilizando la subestructura S

MDL en Subdue 16 La conectividad del grafo se representa con una matriz de adyacencia A de tamaño n x n Valores A[i,j] corresponden a la conectividad del grafo n Arcos no dirigidos se guardan en una sola entrada de la matriz n A[i,j] = 1 si los vértices i y j están conectados n A[i,j] = 0 si no lo están Hay una tabla que contiene las l u etiquetas únicas del grafo G

MDL en Subdue 17 El número de bits requerido para codificar las etiquetas de los vértices del grafo es: n vbits = lgv + vlgl u n lgv es el # de bits para codificar el # de vértices v en el grafo n vlgl u es el # de bits requerido para codificar las etiquetas de todos los v vértices del grafo de entrada

MDL en Subdue 18 El número de bits requerido para codificar los renglones de la matriz de adyacencia A es: n rbits = lg( b + 1) + v i= 1 v lg( b + 1) + lg ki n donde cada renglón i tiene k i 1 s y (n k i ) 0 s, y k i << (n k i ) n b es el número máximo de 1 s en un renglón n Para codificar el valor de k i necesitamos lg(b + 1) bits n El número de posibilidades para acomodar k i 1 s en un renglón de longitud v esta dado por v ki = v! k!( v k)!

MDL en Subdue 19 El número de bits requeridos para codificar los arcos de la matriz A representada por las entradas A[i,j] = 1 esta dado por ebits ebits ebits = = = lgm + lgm + e(1 + lgl v e(1 + lgl i= 1 j= 1 u v A[ i, j](lgm + e( i, u ) + ) + ( K + 1)lgm v v i= 1 j= 1 j)[1 + lgl A[ i, j]lgm u ])

MDL en Subdue 20 n e(i,j) es el # de arcos entre los vértices i y j en el grafo y la matriz A (arcos no dirigidos se cuentan sólo una vez n m es el máximo e(i,j) n e es el número de arcos en el grafo n K es el número de 1 s en la matriz de adyacencia A n Para cada par de vértices i, j necesitamos lgm bits para codificar el número de arcos entre ellos n Necesitamos [1+lg l u ] bits por cada arco para codificar la etiqueta del arco y si el arco es dirigido o no dirigido n También requerimos codificar el número de bits lgm para especificar el número de arcos por entrada

MDL en Subdue 21 El número total de bits necesarios para codificar el grafo G esta dado por: vbits + rbits + ebits Cada que subdue encuentra una subestructura la evalúa utilizando el principio MDL Compara el valor con el de otras subestructuras Elige la que mejor comprime el grafo en términos de MDL Subdue reemplaza las instancias de las subestructuras por un vértice que representa esa subestructura Inicia una nueva iteración n Nuevas subestructuras podrían contener otras encontradas previamente

SubdueCL (Concept Learning) 22 Versión de aprendizaje de conceptos de Subdue Dos versiones n Consistente (cuestiones teóricas) n No-consistente Positive/Negative Training Examples input SubdueCL output Concept Criterio de evaluación: Set-Covering Value = 1 # PosEgsNotCovered + # NegEgsCovered # PosEgs+ # NegEgs

SubdueCL (Análisis Teórico) 23 Grafos conceptuales Análisis PAC learning Comparación con método de Galois Lattice

SubdueCL (Grafos Conceptuales) 24 Grafos Conceptuales Representación de conocimiento basada en lógica derivada de las redes semánticas y los grafos existenciales de Pierce Tienen vértices para conceptos y relaciones Animal : Cat On Object : Mat Traducción directa a lógica n onrelation(cat, mat).

PAC Learning 25 PAC Learning Determina si una clase de conceptos C se puede aprender en tiempo polinomial a partir de ejemplos 1 m (ln H ε Asumimos n El alg. de aprendizaje corre en tiempo polinomial n Algoritmo consistente 1 + ln( )) δ n Ejemplos de entrenamiento y prueba tomados de acuerdo a la misma distribución de probabilidad D

PAC Learning con SubdueCL 26 Espacio de búsqueda de SubdueCL Peor caso cota superior: 2 n2 1 2 m ( n ε 1 ln2 + ln( )) δ Operaciones de subgrafo-isomorfo restringidas a tiempo polinomial n No 100% preciso SubdueCL usa beam search à definir el beam infinito Teóricamente no podemos PAC learn con SubdueCL

Galois Lattice 27 Marco formal para aprendizaje de conceptos basado en grafos Concepto: grafos de descripción y ejemplos cubiertos por esos grafos de descripción Construye una lattice (o celosía, o malla) utilizando generalización Mantiene la lattice ordenada especialización/ generalización Permite grafos desconectados Mantiene sólo grafos núcleo Restringido a utilizar grafos localmente-inyectivos

SubdueCL como una Galois Lattice 28 Marco formal para aprendizaje de conceptos basado en grafos Concepto: grafos de descripción y ejemplos cubiertos por esos grafos de descripción Construye una lattice utilizando least-generalgeneralization Mantiene la lattice ordenada especialización/ generalización No permite grafos desconectados No mantiene sólo grafos núcleo No restringido a utilizar subclases de grafos

SubdueCL como una Galois Lattice 29 Modificar SubdueCL para satisfacer lo que asume Galois Lattice? Usar sólo grafos núcleo? Permitir grafos desconectados? Sub-isomorfismo de grafos: polinomial para subclases de grafos? No, SubdueCL es exitoso en dominios complejos

Análisis Empírico 30 Experimentos con un dominio artificial Comparación con sistemas ILP FOIL y Progol Dominios planos n Golf, Vote, Diabetes y TTT Dominios relacionales n Ajedrez y cáncer Experimentos con el dominio del Web

Dominio Artificial 31 Generar grafos conteniendo un concepto y una parte aleatoria Utilizando grafos normales y conceptuales Estudiar el desempeño de SubdueCL n Tamaño de los grafos n Densidad de los grafos n 10-Fold Cross Validation n Curva de aprendizaje

Resultados Experimentales 32 Prueba #5, grafos con 20 vértices y 40 arcos (pequeños) v1 e1 v3 v1 e1 v3 v3 e3 v3 e3 e2 v1 v2 e3 v4 e1 v3 v3 e1 e1 Positive sub Negative sub Normal graph result Conceptual graph result

Resultados Experimentales 33 Prueba #6, grafos con 20 vértices y 40 arcos (pequeños) v1 e1 v3 v1 e1 v3 v3 e1 v3 e3 e2 e3 v4 e1 v3 v4 e1 v3 v4 e1 v3 v3 e3 Positive sub Negative sub Normal graph result Conceptual graph result

Resultados Experimentales 34 Resultados similares utilizando grafos normales y conceptuales Resultados de grafos conceptuales son sub-grafos de los grafos normales en la mayoría de las pruebas Podemos utilizar grafos conceptuales para la comparación con sistemas ILP

Efecto Densidad de Grafos en SubdueCL 35 Densidad: #arcos / #vértices Variar la densidad ayuda a saber como se comporta SubdueCL al introducir ruido Ruido: La subestructura positiva se reproduce en los ejemplos negativos

Efecto Densidad de Grafos en 36 SubdueCL Substructures Found in Relation with the Graph Density Number of Substructures 10 8 6 4 2 0 0 1 2 3 4 5 6 7 8 9 10 11 Graph Density Es más probable que SubdueCL produzca más subestructuras al incrementarse la densidad de los grafos

10-Fold Cross Validation 37 Usar los grafos de las pruebas #5 y #6 100 ejemplos de entrenamiento, 50 pos y 50 neg Grafos pequeños 20 vértices y 40 arcos, grafos normales 60 vértices y 80 arcos, grafos conceptuales Grafos grandes 50 vértices y 100 arcos, grafos normales 150 vértices y 200 arcos, grafos conceptuales

10-Fold Cross Validation 38 Graph Test #Errors Accuracy ε m δ=0.1 m δ=0.05 Normal 5 small 10/0 90%.10 2,796 2,803 5 large 5/3 92%.08 21,691 21,700 6 small 2/8 90%.10 2,796 2,803 6 large 6/0 94%.06 28,922 28,934 Conceptual 5 small 9/4 87%.13 19,208 19,214 5 large 9/3 88%.12 129,994 130,000 6 small 20/36 44%.56 4,460 4,462 6 large 33/17 50%.50 31,199 31,200

Curva de Aprendizaje 39 Evaluar la curva de aprendizaje de SubdueCL Entrenar SubdueCL con 10, 20,, 90 ejemplos y probar con un conjunto diferente de 10 ejemplos Cuántos ejemplos necesita SubdueCL para aprender?

Curva de Aprendizaje 40 Learning Curve for Test # 5, 20 vertices and 40 edges Learning Curve for Test # 5, 50 vertices and 100 edges E r r o r s 1 0.5 0 10 20 30 40 50 60 70 80 90 E r r o r s 6 4 2 0 10 20 30 40 50 60 70 80 90 Tra ining Exa mple s Tra ining Exa mple s Learning Curve for Test #6, 20 vertices and 40 edges Learning Curve for Test # 6, 50 vertices and 100 edges E r r o r s 4 3 2 1 0 10 20 30 40 50 60 70 80 90 Errores: # de ejemplos de prueba mal clasificados 4 3 2 1 0 10 20 30 40 50 60 70 80 90 Tra ining Exa mple s Tra ining Exa mple s E r r o r s

Comparación con Sistemas ILP 41 Representación outlookrelation ne sunny event ne ne ne ne humidrelation temprelation rainrelation ne ne ne 85 85 false outlookrelation(1,event,sunny). humidityrelation(1,event,85). temprelation(1,event,85). rainrelation(1,event,false). Conceptual Graph Representation SubdueCL Logic Representation Progol

Comparación con Sistemas ILP en 42 Dominios No-Relacionales Precisión en dominios no relacionales Golf Vote Diabetes Credit T-T-T FOIL 66.67 93.02 70.66 68.60 100.0 Progol 66.67 94.19 63.68 63.20 100.0 SubdueCL 66.67 94.65 65.79 63.50 100.0 SubdueCL es competitivo con sistemas ILP Mejor en dominios que no tienen valores continuos

Comparación con Sistemas ILP en Dominios Relacionales 43 Dominio del Ajedrez lt 0 1 2 0 WK 1 2 WR BK WKC adj pos eq WKR adj lt lt WRR lt pos BKR adj WRC pos BKC adj (a) (b) Un ejemplo del dominio del ajedrez. (a) Configuración del tablero y (b) Representación gráfica del ejemplo Precisión: Progol: 99.74%, FOIL: 99.34%, SubdueCL: 99.74%

Comparación con Sistemas ILP en 44 Dominios Relacionales Dominio del Cáncer six_ring in_group in_group element c p cytogen_ca contains atom type charge 22-13 6 di227 compound 7 positive ames contains atom element type c 22 charge -13 ashby_alert ashby_alert halide10

Comparación con Sistemas ILP en 45 Dominios Relacionales Dominio del Cáncer Precisión n Progol: 64% (reportado 72%) n SubdueCL: 61.54% SubdueCL no consideró información sobre mutagénesis que Progol utilizó 2 Subestructuras encontradas en el dominio del Cáncer compound drosophila_slrl p compound chromaberr p has_group amine

Experimentos con el Dominio del Web 46 Dominio Web Tres opciones para el contenido de los grafos n Estructura de hiperligas n Estructura de hiperligas + títulos de páginas n Estructura de hiperligas + contenido de páginas

Experimentos con el Dominio del Web 47 Experimento 1: Estructura de hiperligas + contenido de las páginas Ejemplos positivos: Páginas web de profesores Ejemplos negativos: Páginas web de estudiantes page word box Subestructura encontrada en el dominio Web (Profesores-Estudiantes)

Experimentos con el Dominio del Web 48 Experimento 2: Estructura de hiperligas Ejemplos positivos: Tiendas de computadoras Ejemplos negativos: Páginas web de profesores page 8 link page 1 link link link link link page 17 page 18 page 19 page 22 link page 21 link Node 8 represents a category of products linked to 3 subcategories of products represented by nodes 1, 17, and 18. Nodes 19 and 22 represent either more specific subcategories derived from the subcategory represented by node 1 or specific products. Node 21 represents a specialization of the subcategory represented by node 22.

Conclusiones 49 Análisis Teórico El espacio de búsqueda de SubdueCL es: Es posible PAC Learn grafos simples utilizando nuestro método SubdueCL crea una Galois Lattice definida por la correspondencia entre las descripciones de grafos (subestructuras) y los grafos descritos por ellas (instancias) 2 n2

Conclusiones 50 Análisis empírico Dominio artificial n SubdueCL aprende exitosamente un dominio aún con la introducción de ruido Comparación con sistemas ILP n SubdueCL competitivo con ILP s n Mejora u obtiene la misma precisión que FOIL y Progol n Excepto con atributos numéricos

Trabajo Actual y Futuro 51 Teoría Encontrar una expresión más formal y precisa para el tamaño del espacio de búsqueda Utilizar grafos núcleo como un mecanismo de podado Utilizar subclases de grafos para las que el subgrafoisomorfo corra en tiempo polinomial flexible

Trabajo Actual y Futuro 52 Mejoras a SubdueCL Expresar rangos de valores (Tesis de Oscar Romero) Expresar que una etiqueta de un vértice es la misma que la etiqueta de otro vértice (=, >, < para etiquetas numéricas) Encontrar una representación capaz de describir reglas recursivas gramáticas de grafos n Istvan Jonyer Mejorar la precisión con grafos conceptuales Probar algoritmos de subgrafo-isomorfo sin generación de candidatos n SI-COBRA, tesis de Ivan Olmos