Tema 4: Aprendizaje de conceptos

Documentos relacionados
Proyecto 6. Árboles de decisión: Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial.

Aprendizaje basado en ejemplos.

Aprendizaje Automatizado

Inteligencia Artificial. Aprendizaje neuronal. Ing. Sup. en Informática, 4º. Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani

Tema 2: Equivalencias y formas normales

Tema 2: Representación de problemas como espacios de estados

Tema 12: Arboles de decisión

Aprendizaje: Boosting y Adaboost

TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN

Teoría de Conjuntos y Conjuntos Numéricos

Métodos de Inteligencia Artificial

Generalización como búsqueda. El problema de aprendizaje por generalización puede verse como un problema de búsqueda:

Tema 4: Búsqueda informada mediante técnicas heurísticas

INDICE Prologo Capitulo 1. Algoritmos y programas Capitulo 2. La resolución de los problemas con computadoras y las herramientas de programación

Asignaturas antecedentes y subsecuentes

Aprendizaje Computacional. Eduardo Morales y Jesús González

Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO

Micro y Macroeconomía

Carrera: Ingeniería en Sistemas Computacionales PRESENTACIÓN

Es claro que es una relación de equivalencia. Para ver que tener la misma cardinalidad y la cardinalidad están bien definidas queremos ver que

Tema 15: Combinación de clasificadores

Formulación del problema de la ruta más corta en programación lineal

Algoritmos para determinar Caminos Mínimos en Grafos

Tema 2. Fundamentos de la Teoría de Lenguajes Formales

TEMA 6. SVM Support Vector Machines (Máquinas de Vectores Soporte)

ASIGNATURA: INTRODUCCIÓN A LA INTELIGENCIA ARTIFICIAL.

Sucesiones Introducción

Problemas de Satisfacción de Restricciones

Introducción. Autoencoders. RBMs. Redes de Convolución. Deep Learning. Eduardo Morales INAOE (INAOE) 1 / 60

ALGORITMO ID3. Objetivo

TEORÍA DE GRAFOS Ingeniería de Sistemas

Nombre de la asignatura: Algoritmos y Lenguajes de programación.

Coordinación de Matemática I (MAT021) 1 er Semestre de 2013 Semana 1: Lunes 11 Viernes 16 de Marzo. Contenidos

Razonamiento Deductivo e Inductivo

Análisis del Consumidor

CRITERIOS DE SELECCIÓN DE MODELOS

Terminaremos el capítulo con una breve referencia a la teoría de cardinales.

Tema 11: Inducción de Reglas p. 1/1

Universidad de Guanajuato Tronco Común de Ingenierías

Aprendizaje automático

Universidad Salesiana de Bolivia

UNIDAD DIDACTICA. Esta unidad es el punto de partida para la correcta asimilación de las posteriores unidades didácticas del módulo.

Diagnóstico de fallas en circuitos digitales

Tema 3: Sistema inicial de representación y razonamiento

Complejidad computacional (Análisis de Algoritmos)

Jesús Getán y Eva Boj. Marzo de 2014

Resolución de problemas de búsqueda

Inteligencia en Redes de Comunicaciones - 06 Aprendizaje

Pasos en el Método Simplex

EJEMPLO DE PREGU,TAS

Algebra lineal y conjuntos convexos

Análisis Inteligente de Datos: Introducción

Formas Normales. Normalización. Introducción

Matemáticas aliadas a la salud MATE3035

Tema AA 1: Introducción a al Aprendizaje Automático

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES ACATLÁN LICENCIATURA EN MATEMÁTICAS APLICADAS Y COMPUTACIÓN

Estado 3.2 (coste = 9)

Tema 7: Estadística y probabilidad

4ta. Práctica. Búsqueda en árbol con contrincante: MiniMax con poda Alfa-Beta. Inteligencia Artificial Prácticas 2004/2005

Curso: Teoría, Algoritmos y Aplicaciones de Gestión Logística. Modelos de Inventarios, Parte 1: Modelos de tamaño económico de lote

MÉTODOS Y TÉCNICAS DE INVESTIGACIÓN I Mc. Graw-Hill abril 2006 CONTENIDO

Algebra Lineal. Gustavo Rodríguez Gómez. Verano 2011 INAOE. Gustavo Rodríguez Gómez (INAOE) Algebra Lineal Verano / 21

SESIÓN 11 DERIVACIÓN DE FUNCIONES TRIGONOMETRICAS INVERSAS

Aplicaciones de problemas de Máximos y Mínimos.

EL PROCESO DE LA ESCRITURA

Métodos Bayesianos. Carlos J. Alonso González Grupo de Sistemas Inteligentes Departamento de Informática Universidad de Valladolid

SILABO MATEMÁTICA III

Teoría de Conjuntos y Conjuntos Numéricos

Computación Paralela Móvil

Tema 5: Conceptualización relacional

Ordenación parcial Conjunto parcialmente ordenado Diagrama de Hasse

Derivadas Parciales (parte 2)

UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS FACULTAD DE INGENIERÍA PROYECTO CURRICULAR DE INGENIERÍA INDUSTRIAL

PROGRAMA INSTRUCCIONAL MATEMÁTICA IV

ALGORITMO MINIMAX. o Nodo: Representa una situación del juego. o Sucesores de un nodo: Situaciones del juego a las que se

TEMA N 1 LÓGICA Y CONJUNTOS

1 Números reales. Funciones y continuidad.

Universidad Tec Milenio: Profesional HG04002 Análisis de Decisiones I

Práctica N o 8 Desigualdades Válidas - Algoritmos de Planos de Corte - Algoritmos Branch & Cut

Tema 5: Problemas de satisfacción de restricciones

PROCESAMIENTO DE IMÁGENES DIGITALES

Identificación de inecuaciones lineales en los números reales

RAZONAMIENTO LÓGICO LECCIÓN 1: ANÁLISIS DEL LENGUAJE ORDINARIO. La lógica se puede clasificar como:

Máster Universitario en Tecnologías de la Información y las Comunicaciones Universidad de Alcalá Curso Académico 2013/14

TEMA 6: DIVISIÓN DE POLINOMIOS RAÍCES MATEMÁTICAS 3º ESO

Inducción en definiciones y demostraciones AUTÓMATAS Y LENGUAJES FORMALES PRELIMINARES MATEMÁTICOS. Números naturales. Inducción matemática

Introd. al Pens. Científico Nociones básicas de la lógica ClasesATodaHora.com.ar

Matemáticas Universitarias

Unidad 5: Geometría Analítica

UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA SUR. Ingeniería Aplicada TEÓRICA SERIACIÓN 100% DE OPTATIVAS DISCIPLINARIAS

Unidad 5: MODELO DE COMPORTAMIENTO - ESQUEMA DE DATOS CARACTERÍSTICAS DEL ESQUEMA DE DATOS DIAGRAMA ENTIDAD RELACIÓN (D.E.R.)

Aux 6. Introducción a la Minería de Datos

Espacios Topológicos 1. Punto de Acumulación. Al conjunto de puntos de acumulación de A se le denomina el conjunto derivado de A (A a Notación).

TEMA 3. Demanda individual y de mercado. Introducción a la Microeconomía,

ECSDI - Ingeniería del Conocimiento y Sistemas Distribuidos Inteligentes

Clasificador (Classifier) Aprendizaje Automatizado. Atributos. Clases. Conceptos. conceptos.

SISTEMAS INTELIGENTES

FÍSICA Y QUÍMICA 3º ESO. OBJETIVOS, CONTENIDOS Y CRITERIOS DE EVALUACIÓN 1ª Evaluación: Unidad 1. La medida y el método científico.

ALGEBRA 1- GRUPO CIENCIAS- TURNO TARDE- Enteros

4.2 Números primos grandes. MATE 3041 Profa. Milena R. Salcedo Villanueva

Transcripción:

Inteligencia Artificial II Curso 2004 2005 Tema 4: Aprendizaje de conceptos José A. Alonso Jiménez Francisco Jesús Martín Mateos José Luis Ruiz Reina Dpto. de Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla IA-II 2004 2005 CcIa Aprendizaje de conceptos 4.

Contenido Introducción al aprendizaje automático Aprendizaje de conceptos Notación y terminología Aprendizaje como búsqueda Orden de generalidad Algoritmo Find-S Espacio de versiones Eliminación de candidatos Clasificación de nuevas instancias Sesgo inductivo IA-II 2004 2005 CcIa Aprendizaje de conceptos 4.2

Aprendizaje Definiciones de aprendizaje: Cualquier cambio en un sistema que le permita realizar la misma tarea de manera más eficiente la próxima vez (H. Simon) Modificar la representación del mundo que se está percibiendo (R. Michalski) Realizar cambios útiles en nuestras mentes (M. Minsky) Aprendizaje automático: construir programas que mejoran automáticamente con la experiencia Ejemplos de tareas: Construcción de bases de conocimiento a partir de la experiencia Clasificación y diagnóstico Minería de datos, descubrir estructuras desconocidas en grandes grupos de datos Resolución de problemas, planificación y acción IA-II 2004 2005 CcIa Aprendizaje de conceptos 4.3

Agente con aprendizaje (Russel y Norvig, 998) Critico Aprendizaje Generador Problemas Retroalimentacion Objetivos Cambios Conocimiento Sensores Agente Actores ENTORNO Sistema de aprendizaje: realiza cambios al sistema en función del rendimiento Agente: actúa Crítico: evalúa el rendimiento Generador de Problemas: sugiere nuevas experiencias que entrenan IA-II 2004 2005 CcIa Aprendizaje de conceptos 4.4

Tipos de aprendizaje y paradigmas Tipos de aprendizaje Supervisado No supervisado Con refuerzo Paradigmas Aprendizaje por memorización Clasificación (Clustering) Aprendizaje inductivo Aprendizaje por analogía Descubrimiento Algoritmos genéticos, redes neuronales IA-II 2004 2005 CcIa Aprendizaje de conceptos 4.5

Aprendizaje de conceptos (ejemplo) Ejemplos de días en los que hacer (o no hacer) deportes acuáticos: Representación como una lista de pares atributo valor Cielo Temperatura Humedad Viento Agua Previsión Hacer Deporte Soleado Templada Normal Fuerte Templada Igual Sí Soleado Templada Alta Fuerte Templada Igual Sí Lluvia Fría Alta Fuerte Templada Cambio No Soleado Templada Alta Fuerte Fría Cambio Sí Objetivo: aprender el concepto Días en los que se hace deporte IA-II 2004 2005 CcIa Aprendizaje de conceptos 4.6

Notación y terminología (I) Conjunto X de instancias Ejemplos de instancias: < Sol, T emplada, Normal, F uerte, T emplada, Igual > < Nublado, F ria, Alta, F uerte, T emplada, Cambio > < Lluvia, Alta, Baja, Sin viento, Caliente, Igual > Un concepto es un subconjunto de X, usualmente dado por su función característica c : X {, 0} Instancias positivas y negativas Ejemplo de concepto: si x es un día en el que se hace deporte, c(x) =. En caso contrario c(x) = 0 Concepto (o función) objetivo: el que se desea aprender En principio, no se conoce Sólo se conoce el valor de c para algunas instancias (ejemplos) IA-II 2004 2005 CcIa Aprendizaje de conceptos 4.7

Notación y terminología (II) Conjunto de entrenamiento D: ejemplos de instancias x para las que se conoce el valor de la función objetivo c(x) (representado por < x, c(x) >) En la tabla anterior, 3 ejemplos positivos y negativo Espacio de hipótesis H: Conjunto de funciones h : X {, 0} que en el proceso de aprendizaje se pueden considerar como posibles definiciones del concepto objetivo Usualmente, en H no están todos los posibles conceptos. Sesgo inductivo Objetivo del aprendizaje: Encontrar h H tal que para cualquier ejemplo < x, c(x) > D, se tenga h(x) = c(x) (hipótesis consistente con los ejemplos) Ejemplo de hipótesis aprendida: < Soleado, T emplada,?, F uerte,?,? > Hipótesis del Aprendizaje Inductivo IA-II 2004 2005 CcIa Aprendizaje de conceptos 4.8

Ejemplo de espacio de hipótesis Un posible espacio de hipótesis: Conjunción de restricciones sobre los valores de los atributos Ejemplo de hipótesis: Los días para hacer deporte son los de cielo soleado, viento fuerte y con previsión de que el tiempo siga igual Representación compacta: usar? para representar un valor cualquiera ó para representar que ningún valor es posible Ejemplos: < Soleado, T emplada,?, F uerte,?,? >, <?, F ria, Alta,?,?,? >, <,,,,, > Atención: los algoritmos y definiciones de este tema NO son específicos de este tipo de espacio de hipótesis IA-II 2004 2005 CcIa Aprendizaje de conceptos 4.9

Aprendizaje como búsqueda Aprendizaje de conceptos: búsqueda en el espacio de hipótesis de una o varias hipótesis consistentes con los ejemplos del conjunto de entrenamiento. Aprendizaje por enumeración? Problema: espacio de hipótesis exponencialmente grande Solución: estructurar el espacio de hipótesis Permite explorar el espacio de hipótesis de manera exhaustiva sin necesidad de enumerarlo IA-II 2004 2005 CcIa Aprendizaje de conceptos 4.0

El orden de generalidad Una instancia x X satisface la hipótesis h si h(x) = Dadas h, h 2 H, h es más general que h 2 (y h 2 es más específica que h ) si cualquier instancia que satisface h 2 satisface h. Notación: h g h 2. Generalidad estricta: h > g h 2 Ejemplo: IA-II 2004 2005 CcIa Aprendizaje de conceptos 4.

El algoritmo Find-S Pseudocódigo:. Inicialmente, h es la hipótesis más específica de H. 2. Por cada ejemplo positivo x del conjunto de entrenamiento: - Si h(x)=, no hacer nada. - En otro caso, reemplazar h por la menor generalización h de h, tal que h (x)= 3. Devolver h IA-II 2004 2005 CcIa Aprendizaje de conceptos 4.2

Find-S (ejemplo) Paso 0: Paso : Paso 2: Paso 3: Paso 4: h0 = <,,,, > Ejemplo positivo: x = <Sol,Templ,Normal,Fuerte,Templ,Igual> h = <Sol,Templ,Normal,Fuerte,Templ,Igual> Ejemplo positivo: x2 = <Sol,Templ,Alta,Fuerte,Templ,Igual> h2 = <Sol,Templ,?, Fuerte,Templ,Igual> Ejemplo negativo: x3 = <Lluvia,Fria,Alta,Fuerte,Templada,Cambio>, h3 = h2 Ejemplo positivo: x4 = <Sol,Templ,Alta,Fuerte,Fria,Cambio> h4 = <Sol,Templ,?, Fuerte,?,?> IA-II 2004 2005 CcIa Aprendizaje de conceptos 4.3

Comentarios sobre Find-S Propiedades de Find-S sobre espacios de hipótesis como conjunción de atributos: Find-S encuentra una hipótesis de máxima especificidad que es consistente con todos los ejemplos positivos Los ejemplos negativos se ignoran Consistente con los ejemplos negativos? Sí, si el concepto objetivo está en H (expresividad del espacio de hipótesis) y los ejemplos de entrenamiento son correctos (ausencia de ruido) Ejemplo problemático Positivos: < Sol, T empl, F uerte >, < Lluvia, F ria, F uerte > Negativos: < Luvia, T empl, F uerte > Por qué devolver sólo una hipótesis de las consistentes? IA-II 2004 2005 CcIa Aprendizaje de conceptos 4.4

Espacio de versiones Espacio de versiones: V S H,D {h H h es consistente con D} Ejemplo: Cielo Temperatura Humedad Viento Agua Previsión Hacer Deporte Soleado Templada Normal Fuerte Templada Igual Sí Soleado Templada Alta Fuerte Templada Igual Sí Lluvia Fría Alta Fuerte Templada Cambio No Soleado Templada Alta Fuerte Fría Cambio Sí Espacio de versiones: < Soleado, T emplada,?, F uerte,?,? > < Soleado,?,?, F uerte,?,? > < Soleado, T emplada,?,?,?,? > <?, T emplada,?, F uerte,?,? > < Soleado,?,?,?,?,? > <?, T emplada,?,?,?,? > IA-II 2004 2005 CcIa Aprendizaje de conceptos 4.5

Una representación compacta del espacio de versiones Definiciones h H es una hipótesis de máxima generalidad (resp. de máxima especificidad) de H si no existe h H tal que h > g h (resp. h > g h ) Cota general G de un espacio de hipótesis respecto de D: elementos de máxima generalidad del espacio de versiones Cota específica S de un espacio de hipótesis respecto de D: elementos de máxima especificidad del espacio de versiones Teorema de representación del espacio de versiones El espacio de versiones es el conjunto de hipótesis que están entre la cota general y la cota específica V S H,D = {h H ( s S)( g G)(g g h g s)} IA-II 2004 2005 CcIa Aprendizaje de conceptos 4.6

Ejemplo de espacio de versiones S: { <Sol., Templada,?, Fuerte,?,?>} <Sol.,?,?, Fuerte,?,?> <Sol., Templada,?,?,?,?> <?, Templada,?, Fuerte,?,?> G: { <Sol.,?,?,?,?,?>, <?, Templada,?,?,?,?>} IA-II 2004 2005 CcIa Aprendizaje de conceptos 4.7

Algoritmo de eliminación de candidatos. Sea G el conjunto de elementos de máxima generalidad de H. 2. Sea S el conjunto de elementos de máxima especificidad de H. 3. Para cada ejemplo d del conjunto de entrenamiento D: 3. Si d es un ejemplo positivo, entonces: 3.. Eliminar de G cualquier hipótesis inconsistente con d. 3..2 Para cada hipótesis s de S inconsistente con d: * Eliminar s de S. * Incluir en S todas las generalizaciones minimales h de s, tales que h es consistente con d y existe una hipótesis en G más general que h. * Eliminar de S aquellas hipótesis tales que exista en S otra hipótesis más específica. 3.2 Si d es un ejemplo negativo, entonces: 3.2. Eliminar de S cualquier hipótesis inconsistente con d. 3.2.2 Para cada hipótesis g de G inconsistente con d: * Eliminar g de G. * Incluir en G todas las especializaciones minimales h de g, tales que h es consistente con d y existe una hipótesis en S más específica que h. * Eliminar de G aquellas hipótesis tales que exista en G otra hipótesis más general. IA-II 2004 2005 CcIa Aprendizaje de conceptos 4.8

Eliminación de candidatos (ejemplo) Paso 0: S0 = {<,,,, >}, G0 = {<?,?,?,?,?,? >} Paso : - Ejemplo positivo: < Sol, T empl, Normal, F uerte, T empl, Igual > - Nada que eliminar de G0 - Generalización minimal de S0: < Sol, T empl, N ormal, F uerte, T empl, Igual > Esta generalización es más específica que la hipótesis de G0 - Luego: S = {< Sol, T empl, Normal, F uerte, T empl, Igual >} G = {<?,?,?,?,?,? >} Paso 2: - Ejemplo positivo: < Sol, T empl, Alta, F uerte, T empl, Igual > - Nada que eliminar de G - Generalización minimal de S: < Sol, T empl,?, F uerte, T empl, Igual > Esta generalización es más específica que la hipótesis de G - Luego: S2 = {< Sol, T empl,?, F uerte, T empl, Igual >} G2 = {<?,?,?,?,?,? >} IA-II 2004 2005 CcIa Aprendizaje de conceptos 4.9

Eliminación de candidatos (ejemplo) Paso 3: - Ejemplo negativo: < Lluvia, F ria, Alta, F uerte, T emplada, Cambio > - Nada que eliminar de S2. - Especializaciones minimales de G2 que son más generales que la hipótesis de S2: < Sol,?,?,?,?,? >, <?, T empl,?,?,?,? > y <?,?,?,?,?, Igual >. - Luego: S3 = {< Sol, T empl,?, F uerte, T empl, Igual >} G3 = {< Sol,?,?,?,?,? >, <?, T empl,?,?,?,? >, <?,?,?,?,?, Igual >} Paso 4: - Ejemplo positivo: < Sol, T empl, Alta, F uerte, F ria, Cambio > - Eliminamos de G3 la hipótesis <?,?,?,?,?, Igual > - Generalización minimal de S3: < Sol, T empl,?, F uerte,?,? > Esta generalización es más específica que hipótesis de G3. - Luego: S4 = {< Sol, T empl,?, F uerte,?,? >} G4 = {< Sol,?,?,?,?,? >, <?, T empl,?,?,?,? >} IA-II 2004 2005 CcIa Aprendizaje de conceptos 4.20

Algoritmo de eliminación de candidatos (propiedades) Sean S y G obtenidos por eliminación de candidatos Si S y G son no vacíos, resultan ser respectivamente la cota específica y cota general del espacio de versiones (respecto del conjunto de entrenamiento) Si S = G = {h}, entonces h es la única hipótesis de H consistente con todos los ejemplos Si S = G =, no existe h H consistente con los ejemplos Convergencia hacia el concepto objetivo, siempre que: Conjunto de entrenamiento suficientemente grande Ejemplos sin errores (ausencia de ruido) El concepto objetivo está en H IA-II 2004 2005 CcIa Aprendizaje de conceptos 4.2

Elección de ejemplos Supongamos posible elegir el siguiente ejemplo Estrategia óptima: requerir un ejemplo satisfecho por la mitad del espacio de versiones Ejemplo: < Soleado, T emplado, Normal, Ligero, T emplado, Igual > Convergencia hacia el concepto objetivo (siempre que sea posible) Con log 2 V S nuevos ejemplos IA-II 2004 2005 CcIa Aprendizaje de conceptos 4.22

Clasificación de nuevas instancias Usamos S y G obtenidos por eliminación de candidatos para clasificar nuevas instancias: Si es consistente con todo S, positivo Si no es consistente con ninguno de G, negativo En otro caso, voto mayoritario o simplemente no se clasifica Ejemplos: < Sol, T empl, Normal, F uerte, F ria, Cambio > -> Sí < Lluvia, F ria, Normal, Suave, T empl, Igual > -> No < Sol, F ria, Normal, F uerte, T empl, Igual > -> Sí (por mayoría) < Sol, T empl, Normal, Suave, T empl, Igual > ->? IA-II 2004 2005 CcIa Aprendizaje de conceptos 4.23

Sesgo inductivo Siempre que H 2 X, se tiene un sesgo en el tipo de conceptos que se pueden aprender Sesgo inductivo: cualquier medio que el sistema de aprendizaje pueda usar para tener preferencia entre dos hipótesis consistentes con los ejemplos Tipos de sesgo inductivo: Sesgo en el lenguaje: el lenguaje disponible para expresar las hipótesis define un espacio de hipótesis que excluye conceptos (por ejemplo, conjunción de restricciones) Sesgo preferencial: el algoritmo de búsqueda en el espacio de hipótesis incorpora implícitamente alguna preferencia de algunas hipótesis sobre otras IA-II 2004 2005 CcIa Aprendizaje de conceptos 4.24

Sesgo inductivo y aprendizaje Inutilidad del aprendizaje insesgado Espacio de versiones en un espacio de hipótesis insesgado Eliminación de candidatos obtendría S = {(p... p n )}, G = { (n... n m )} Una instancia nueva sería clasificada como positiva por la mitad del espacio de versiones y negativa por la otra mitad Un sistema de aprendizaje que no asume conocimiento a priori sobre el concepto objetivo no puede clasificar nuevas instancias Concimiento a priori en eliminación de candidatos: el concepto objetivo está en el espacio de hipótesis IA-II 2004 2005 CcIa Aprendizaje de conceptos 4.25

Bibliografía Mitchell, T.M. Machine Learning (McGraw-Hill, 997) Cap. : Introduction Cap. 2: Concept Learning and the General-to-Specific Ordering Russell, S. y Norvig, P. Inteligencia artificial (Un enfoque moderno) (Prentice Hall Hispanoamericana, 996) Cap. 8: Aprendiendo de observaciones IA-II 2004 2005 CcIa Aprendizaje de conceptos 4.26