Aprendizaje automático



Documentos relacionados
Aprendizaje Automatizado

TEMA 1. Introducción

Modelos y Bases de Datos

Organización como función administrativa Resumen para Administración y Gestión Profesor: Gonzalo V.

RAZONAMIENTOS LÓGICOS EN LOS PROBLEMAS DE MATEMÁTICAS

LÓGICA JURÍDICA. Idea preliminar Cap. I. Nicolás Mejía Gómez -Universidad Libre Facultad de derecho

Introducción. Ciclo de vida de los Sistemas de Información. Diseño Conceptual

A. Subcampos basados en el contenido.

Diseño Estructurado de Algoritmos

Ingeniería en Informática

Planificación para el aula

3º Grado Educación Infantil Bilingüe Números. Método Singapur y F. Bravo E R

Comente: Los bancos siempre deberían dar crédito a los proyectos rentables. Falso, hay que evaluar la capacidad de pago.

por Miguel Crespo Celda

LA INNOVACIÓN EMPRESARIAL

RECOMENDACIONES DE INVESTIGACIÓN FUTURA.

4. EVALUACIÓN DEL PROGRAMA DE CAPACITACIÓN

Guía breve para la. Versión abreviada del Manual para la. evaluación de desempeño y potencial

MATEMÁTICAS APLICADAS A LAS C.C. SOCIALES

Introducción a la estadística y SPSS

UNIVERSIDAD DE ATACAMA FACULTAD DE INGENIERÍA / DEPARTAMENTO DE MATEMÁTICA

Evaluación del desempeño: los miembros de la familia, a examen

ANALISIS MULTIVARIANTE

REGLAMENTO DE LOS SERVICIOS DE PREVENCIÓN. RD 39/1997, de 17 de enero

Por qué es importante la planificación?

Plan de estudios Maestría en Sistemas de Información y Tecnologías de Gestión de Datos

EL GRUPO DENTRO DE LA SOCIOLOGÍA

En la mayoría de las ocasiones, el fracaso académico no es consecuencia

Contabilidad de Costos

35 Facultad de Ciencias Universidad de Los Andes Mérida-Venezuela. Potencial Eléctrico

SELECCIÓN N Y DISEÑO DEL PRODUCTO Y SERVICIO

Es necesario mencionar esta proporción, debido a la importancia de. evaluar la inversión que se hará para implantar un programa de capacitación, ya

Modelos y Bases de Datos

INGENIERIA DEL CONOCIMIENTO UBICACION HISTORICA. Dr. Ramón GARCIA MARTINEZ

Demasiados deberes en casa?

enunciadas no constituyen una secuencia rígida. Ej. Grilla del sistema solar. Planificación de clases Metas del modelo 1. Modelos inductivos

Colegio Alexander von Humboldt - Lima. Tema: La enseñanza de la matemática está en un proceso de cambio

LA MUJER EN LA REDUCCIÓN DE DESASTRES.

Manual de usuario para Android de la aplicación PORTAFIRMAS MÓVIL

MODELOS DE RECUPERACION

CAPITULO 1 INTRODUCCIÓN. Puesta en Evidencia de un circulo virtuoso creado por los SRI entre los Mercados Financieros y las Empresas

El rincón de los problemas

Capítulo 1. Introducción

Principios de Finanzas

MAPAS DE RIESGOS. DEFINICIÓN Y METODOLOGÍA

Investigadores de la Universitat Ja u m e I d e C a s t e l l ó h a n desarrollado un sistema de reidentificación

VENTAJAS Y DESVENTAJAS DE LAS TECNOLOGIAS

CAPÍTULO 9 LA PLANEACIÓN DOCENTE. REQUISITOS, EXIGENCIAS Y VÍNCULO CON EL TRABAJO DE LAS ASIGNATURAS

Contabilidad Orientada a los Negocios

TERCERA EDAD Y AUTOGENIA

El poder de la motivación Luis Arturo Quesada Oviedo Luis Arturo Quesada Oviedo Asesor y Consultor Empresarial Freelance

Sistemas de Calidad Empresarial

Instituto de Investigación y Desarrollo Educacional - Centro de Análisis Regional del Maule. Diplomado en Gestión y Desarrollo Local

PSICOBIOLOGÍA: CONCEPTOS Y DEFINICIONES PREVIAS

EL PROFESOR COMO TUTOR RESUMEN

Título: Árboles de Decisión automáticos para el Pronóstico del Rendimiento Docente (aplicable al Control de Procesos).

Unidad de aprendizaje Interpretando significados de diversos textos. Materia Lenguaje. Grado 4. Título del objeto de aprendizaje

Health Coaches. Recursos para. Como crear un programa de coaching

COMPETENCIAS BÁSICAS: DIEZ CLAVES

_ Antología de Física I. Unidad II Vectores. Elaboró: Ing. Víctor H. Alcalá-Octaviano

LA EXTERNALIZACIÓN EN EL PROCESO DE INTERNACIONALIZACIÓN

8. CONCERTACIÓN MULTISECTORIAL PARA LA LUCHA CONTRA LAS DROGAS EN EL

FASES DEL PROCESO DE RESOLUCIÓN DE PROBLEMAS

CAPITULO VI ESTRATEGIAS DE OUTSOURCING

6. LOS PROCEDIMIENTOS Y CRITERIOS DE EVALUACIÓN, PROMOCIÓN DEL ALUMNADO Y TITULACIÓN DEL ALUMNADO.

Apuntes de Matemática Discreta 1. Conjuntos y Subconjuntos

Actividades para mejoras. Actividades donde se evalúa constantemente todo el proceso del proyecto para evitar errores y eficientar los procesos.

Guía breve para la. administración de la capacitación en las. entidades públicas. Versión abreviada del Manual para la. entidades públicas

Unidad I: Introducción a la gestión de proyectos

Análisis y gestión de riesgo

Los Cursos y niveles de Reiki

TÉCNICAS DE ESTUDIO EN EL TERCER CICLO DE EDUCACIÓN PRIMARIA

La Zona de Desarrollo Próximo (ZDP)

Guía para la Capacitación en el Servicio y Educación de Preservicio Relativa al DIU

CAPÍTULO 4: ALGORITMOS DE APRENDIZAJE

BASE DE DATOS RELACIONALES

PROCESOS DE INDUCCIÓN Y ENTRENAMIENTO

Tema : ELECTRÓNICA DIGITAL

Bloque I: Conceptos básicos y fundamentos de la Dirección de Proyectos.

SISTEMAS DE INFORMACIÓN CONTABLE Y ADMINISTRATIVO.

2. PROCESO DE LA CAPACITACIÓN

1.0 PLANTEAMIENTO DEL PROBLEMA 1.1 DESCRIPCIÔN DEL PROBLEMA

ORIENTACIONES SIMCE TIC

Representación del conocimiento. Diferencia entre información y conocimiento (1) Diferencia entre información y conocimiento (2) Notas

DIFICULTADES DE LOS NIÑOS Y ADOLESCENTES CON TDAH ESTRATEGIAS TIPO PARA AFRONTAR ESTAS DIFICULTADES

RESUMEN. Colegio Antonio Machado Baeza (Jaén)

CAPITULO 3 REDES HIBRIDAS-COMPLEJAS. 3.1 Descripción de la Red Híbrida Compleja (HCNN)

CAPÍTULO I. Sistemas de Control Distribuido (SCD).

UF0130: Mantenimiento y Mejora de las Actividades Diarias de Personas Dependientes en Instituciones

Los requisitos de accesibilidad en un proyecto software. Implicaciones de usuarios discapacitados en el proceso software

10. La organización de las niñas y de los niños Criterios para la organización de las niñas y de los niños

Jean Piaget propuso a través de su teoría una serie de consideraciones, vistas desde una perspectiva psicogenética que permiten a los docentes

DIAGRAMA DE CLASES EN UML

Sesión 3 - Movimiento Diferencial

Aprendizaje automático mediante árboles de decisión

Recursos para el Estudio en Carreras de Ingeniería 2006 UNIDAD TEMÁTICA Nº 4 LA TOMA DE APUNTES

Dirección de Evaluación de la Calidad Educativa

El Futuro de la Computación en la Industria de Generación Eléctrica

Generalización como búsqueda. El problema de aprendizaje por generalización puede verse como un problema de búsqueda:

Transcripción:

Aprendizaje automático Machine Learning 1 Aprendizaje automático Definición de aprendizaje Primer problema: desconocemos los mecanismos que rigen el aprendizaje humano Por esto las definiciones hacen hincapié en aspectos funcionales (es decir, hechos observados como consecuencia del aprendizaje) y no en aspectos estructurales. Simon señaló su frustración al intentar enseñar o transferir conocimiento a alguien, debido a que desconocemos cómo aprende una persona. 2

Aprendizaje automático Diferentes definiciones históricas Aprender es construir o modificar representaciones de aquello con lo que se está experimentando (McCarthy, 1968) El aprendizaje denota cambios en el sistema que...permiten que se realice la misma tarea...más eficiente y eficazmente la próxima vez (Simon, 1983) El problema de definir aprendizaje se reduce a definir conocimiento. Aprendizaje sería el aumento de conocimiento (Dietterich,1986) 3 Aprendizaje automático Aspectos claves del aprendizaje: Adquisición de conocimiento Inferir nuevo conocimiento a partir del ya adquirido Capacidad de mejorar en una habilidad haciendo uso del conocimiento poseído Capacidad de relacionarse con el ambiente: Interacción con el entorno cambiante y habilidad para prever los cambios de este entorno, modificar el estado interno de acuerdo al nuevo ambiente y eventualmente anticiparse a esos cambios (supervivencia). 4

Aprendizaje automático Dos formas básicas de aprendizaje: Adquisición del conocimiento (knowledge adquisition): Una persona aprende por ejemplo Física en el sentido de que adquiere y comprende los conceptos y comprende su relación con objetos físicos del mundo real. Incorpora representaciones y crea modelos mentales (J-Laird). En resumen, es el aprendizaje de nueva información simbólica y adquisición de la capacidad de aplicar dichos conocimientos. Adquisición y perfeccionamiento de habilidades (skill refinement). Aumento de las habilidades a través de la práctica y de la repetición. Muchos procesos es una mezcla de ambas actividades. 5 Aprendizaje automático Definición (Mitchell): Se dice que un programa aprende de la experiencia con respecto a cierta clase de tareas T y una medida del rendimiento P si la medida del rendimiento de tareas en T medidas por P aumenta con la experiencia E. Por ejemplo un programa de ajedrez puede aumentar su capacidad para ganar partidas jugando contra sí mismo. En este caso: Tarea T: jugar al ajedrez Medida del rendimiento P: porcentaje de partidas ganadas frente a oponentes. Experiencia de entrenamiento E: jugar partidas de entrenamiento contra sí mismo. 6

Aprendizaje automático Otros ejemplos: Problema de aprendizaje de reconocimiento de manuscritos: Tarea T: reconocer y clasificar palabras manuscritas Medida del rendimiento P: porcentaje de palabras correctamente clasificadas. Experiencia de entrenamiento E: una base de datos de palabras manuscritas correctamente clasificadas.. Problema de aprendizaje de un robot conductor Tarea T: conducir por una autopista con sensores de visión. Medida del rendimiento P: distancia recorrida sin cometer errores Experiencia de entrenamiento E: secuencias de imágenes de humanos conduciendo. 7 Aspectos básicos Representación: un sistema no puede aprender aquello que no puede representar, es decir, conocimiento? representación Elección del marco de representación: Diversos algoritmos (Mitchell, Quinlan) se basan en la elección adecuada del lenguaje de instancias (ejemplos presentados) e hipótesis (conceptos posibles). Esto traslada el problema a la forma de representar el conocimiento. 8

Principal aplicación del aprendizaje automático Problemas de clasificación, también conocido como aprendizaje de conceptos o aprendizaje por generalización El clasificador puede ser inductivo o deductivo El proceso de aprendizaje consiste en buscar la estructura que mejor y de forma más simple refleje la clasificación observada de los ejemplos. Se considera mejor aquella que además de clasificar los ejemplos tal y como estos se han presentado, sea capaz de acertar un mayor número de veces en la clasificación de nuevos objetos no observados. 9 Principal aplicación del aprendizaje automático Normalmente se establecerán reglas de clasificación (u otras representaciones reducibles a reglas como los árboles de decisión), donde para ciertos valores de atributos o características tendremos una clase o categoría. Por ejemplo, SI color=rojo y tamaño=pequeño y número de rayas=3 ENTONCES la clase=pez payaso El objetivo es predecir el valor de la clase para un ejemplar de pez que no haya visto antes. Estas reglas deben ser lo más generales posibles para poder luego predecir el valor de nuevos ejemplos. 10

Aprendizaje automático Teoría Inferencial del Aprendizaje (ITL): propuesta por Mickalski (1990) pretende ser un marco conceptual general para caracterizar los métodos de aprendizaje existentes. Postula que un proceso de aprendizaje puede ser caracterizado en términos de operadores, que actuando sobre el conocimiento disponible (Background knowledge) y el conocimiento de entrada (Input knowledge) lo transforma en conocimiento especificado por el objetivo de la tarea a aprender 11 Procesos de Aprendizaje Background K Background K + Input K Nuevo conocimiento Objetivo (goal) Input K Operadores 12

Procesos de Aprendizaje Definimos pues Aprendizaje como el proceso siguiente: Dados: Conocimiento de Entrada (IK) Objetivos (G) Conocimiento a priori (BK) Operadores (O) Determinar Conocimiento de salida (OK) que satisfaga G aplicando operadores O al conocimiento de entrada I y al conocimiento a priori BK. 13 Procesos de inferencia Ecuación fundamental de la inferencia: Ecuación básica para diferenciar los distintos tipos de razonamiento: Premisa + Background knowledge consecuente Razonamiento deductivo: se deriva el consecuente C a partir de p y BK ( tracing forward the relationship ) Razonamiento inductivo: se postula como hipótesis la premisa P a partir del consecuente C y de BK ( tracing backward the relationship ). Otros razonamientos posibles combinación de ambos: Razonamiento analógico: A es a B como C es a D. 14

Procesos de inferencia Además, un razonamiento puede ser: Razonamiento independiente del dominio: es verdadero o falso siempre. Razonamiento dependiente del dominio: sólo se puede afirmar que es plausible. Si además se da una relación causal (redes bayesianas), es útil considerar las diferentes probabilidades (condicionadas y a priori) y podemos así diferenciar entre: Razonamiento contingente deductivo: deriva un consecuente probeble C a partir de las causas representadas por P. Razonamiento abductivo: deriva posibles causas P a partir del conocimiento de los efectos C. 15 Principales técnicas existentes Según sea el método inferencial usado podemos clasificar los métodos de aprendizaje en: Aprendizaje inductivo o Aprendizaje basado en ejemplos (Michalski): generalización Aprendizaje deductivo o aprendizaje basado en la explicación, EBL (Mitchell): demostración de teoremas Aprendizaje por analogía (Carbonell, Russell) Aprendizaje abductivo (de los efectos a las causas) Aprendizaje multiestrategia o combinación de diferentes tipos de estrategias y/o diferentes tipos de aprendizaje. 16

Aprendizaje inductivo Realizan generalizaciones basada en las semejanzas que puedan tener los ejemplos Pueden partir de una clasificación de las observaciones procesadas de acuerdo con un supervisor externo (llamado por Valiant oráculo) en ejemplos positivos o negativos de la clase (aprendizaje supervisado) O tener que realizar primero una agrupación o clustering de los ejemplos según algún criterio de semajanza previamente prefijzado (aprendizaje no supervisado) Ejemplo: árboles de decisión 17 Aprendizaje deductivo Surge a lo largo de los años 80 También llamado EBL (Explanation Based Learning) El objetivo es obtener particularizaciones de conceptos que resultan demasiado generales para ser aplicados eficientemente (es decir, un resumen) 18

Aprendizaje por analogía Basado en el aprendizaje de los niños Se realiza una generalización inductiva sobre las relaciones que se cumplen en un determinado dominio para aplicarlo en otro domino relacionado. También se llama EBR (Razonamiento Basado en Casos): se trata de almacenar y recuperar casos para trasladar las conclusiones obtenidas en la solución de nuevos casos que se van presentando, partiendo de un proceso de resolución análogo. El conjunto de casos es el conocimiento del sistema 19 Aprendizaje abductivo Dada una conclusión se proponen hipótesis que la describan Un ejemplo sería el proceso de diagnóstico de la enfermedad (hipótesis) a partir de los síntomas observados (efectos) 20

Aprendizaje multiestrategia Se trata de desarrollar sistemas de aprendizaje que integren dos o más estrategias de inferencia diferentes (inducción, deducción,..) y/o dos o más estrategias de computación diferentes (ID3, EBG,...) Este enfoque tiene una relación directa con los últimos modelos cognitivos establecidos mediante estudios psicológicos. 21 Otras clasificaciones Otros criterios de clasificación: En función del tipo de razonamiento o inferencia utilizado (inductivo, deductivo o análogo) En función del tipo de representación del conocimiento que se use (expresiones lógicas, reglas, marcos,...) La forma en que se le suministra el conocimiento al sistema (incremental o en bloque) El área de aplicación práctica del sistema En función de la información de entrada: Supervisado: se dan ejemplos clasificados de antemano No supervisado: se dan ejemplos u observaciones no clasificadas Basándose en el papel que juege el BK, el aprendizaje podrá usar mucho BK (y poco IK), mucha información de entrada (y poco BK) o una combinación de ambos. 22

Otras clasificaciones Otro criterio puede ser basar la clasificación en el objetivo o propósito principal del proceso de aprendizaje: Aprendizaje sintético: el objetivo es adquirir nuevo conocimiento e ir más allá del conocimiento poseido (inducción y analogía) Aprendizaje analítico: en el que poseemos un conocimiento general y lo particularizamos para hacerlo más efectivo (deducción) 23 Repaso histórico Etapa Inicial (1955-1965) Se corresponde con la etapa neurocibernética de la IA (redes neuronales): conexionismo. Se pretende crear una memoria asociativa, capaz de autoorganizarse y aprender de forma autónoma. Etapa intermedia (1962-1976) Se parte de la premisa de que para que los sistemas tuvieran una capacidad apreciable de adquirir conocimiento había que dotarles de cierto conocimiento inicial sobre el dominio. Surgen las primeras técnicas simbólicas sobre la adquisición de conceptos. Los problemas resueltos podrían clasificarse de laboratorio 24

Repaso histórico Etapa de Asentamiento (1976-1988) Aparecen las primeras aplicaciones reales Se celebra la primera conferencia en la Universidad de Carneggie Mellon en 1980. Se estudia sobre todo el aprendizaje inductivo en problemas de clasificación. Surgen también el aprendizje deductivo y el analógico. Actualmente (1988-...) Se desarrolla el campo del aprendizaje multiestrategia. Se desarrollan a su vez arquitecturas integradas (PRODIGY, SOAR,...) Se aplica con éxito a los sistemas de personalización del usuario (e-learning, Web,...), minería de datos (Data mining),... 25 Clasificación de patrones 26

Clasificación de patrones Por ejemplo supongamos que queremos clasificar un conjunto de peces (patrones) en diferentes categorías o clases. Esta clasificación la haremos en función de unas características o atributos de esos patrones (por ejemplo el color, tipos de escamas, tamaño,...) Cada uno de estos atributos tendrán un conjunto de valores asociados Al proceso de extracción de estos atributos se le llama extracción de características. En este proceso no sólo se trata de obtener valores sino también de elegir cuáles son los atributos necesarios para la clasificación. 27 Clasificación de patrones Este proceso de extracción debe ir precedido de un preprocesado de la imagen y de una segmentración (porque los peces pueden estar juntos y ser casi indistinguibles, o en un conjunto de palabras en un sistema de reconocimiento del habla debo ver cuando acaba cada una) Al sistema clasificador lo entrenaremos con un conjunto de ejemplos de enrenamiento. El objetivo es generalizar, es decir, realizar clasificaciones sobre ejemplos o patrones no vistos y clasificarlos. 28

Clasificación de patrones Otros métodos clásicos: Regresión: se busca una descripción funcionales de los datos para predecir valores de para una entrada nueva. Interpolación: nosotros podemos deducir una fución para un rango en concreto de la variable de entrada. El problema es inferir la función para rangos intermedios de entrada Estimación de la densidad: es el problema de estimar la densidad (o probabilidad) de que un miembro de una categoría determinada tenga ciertos valores de atributos. 29 Ciclo de diseño Recolección de datos. Elección de las características o atributos. Depende del conocimiento previo que tenga el sistema Elección del modelo de sistema clasificador. Proceso de entrenamiento. Proceso de test o evaluación del sistema con datos conocidos Evaluación de ejemplos desconocidos. 30

Tipos de aprendizaje Aprendizaje supervisado, donde se va dirigiendo al sistema en el proceso de entrenamiento. Aprendizaje no supervisado, donde no se corrige al sistema en su proceso de entrenamiento. Aprendizaje por refuerzo, en el que no se le dice la salida, sólo si ha clasificado bien o no. 31