Inteligencia artificial

APRENDIZAJE DE MÁQUINAS (MACHINE LEARNING)

Aprendizaje Construcción o modificación de representaciones de lo que se experimenta R. Michalski Lograr cambios útiles en nuestras mentes. M. Minsky Las percepciones deben servir no solo para actuar sino para mejorar la capacidad del agente para actuar en el futuro. S. Russell Adquirir conocimiento para modificar el comportamiento según el entorno.

Cúmulo de conocimientos que enlazados en un todo unitario contienen los modos, medios y mecanismos del apoderamiento de la ciencia. Actividad que se origina a través de la reacción a una situación presentada, con tal que las características del cambio registrado en la actividad no puedan explicarse con fundamento en las tendencias innatas de respuesta, la maduración o estados transitorios del organismo (ej., fatiga, drogas, etc.)

Aprendizaje de máquinas Cambios en un sistema que le permiten realizar una tarea de forma más eficiente la próxima vez... H. Simon Sistema capaz adquirir e integrar autónomamente conocimiento. Capacidad de un sistema para aprender a partir de la experiencia, la observación analítica y otros medios. Sistema que puede autocorregirse y aumentar su eficiencia y efectividad. Sistema que puede detectar los errores, corregirlos y ser más eficiente.

Agentes capaces de mejorar su comportamiento mediante el estudio de sus propias experiencias. Sistema que mejora su comportamiento mediante el estudio de sus propias experiencias. Agente que produce resultados de la interacción con el mundo; y de la observación del agente de sus propios procesos de toma de decisiones.

Propósito Entender y mejorar la eficiencia del aprendizaje humano (CAI) Descubrir estructuras ocultas para los humanos. Completar especificaciones incompletas de un dominio. Describir métodos y estrategias de aprendizaje eficiente para ser implementados en las máquinas. Analizar procesos cognitivos que efectúa el ser humano.

Interrelaciones Ciencias del conocimiento Ciencias de la computación APRENDIZAJE DE MÁQUINAS Biología Sicología Neurología Estadística

Aplicaciones Manejo de datos: expedientes médicos, estudios de crédito. Reconocimiento de voz, conducción autónoma. Buscadores, minería de datos, redes neuronales artificiales, autómatas,... Enseñanza (tutores, agentes,...)

Aplicaciones Alvinn, 70 mph.

Agente Desempeño estándar Retroalimentación Metas de Aprendizaje Crítico Elemento de Aprendizaje Generador de Problemas modificaciones conocimiento AGENTE Sensores Elemento del Desempeño Efectores A M B I E N T E

Paradigmas Aprendizaje supervisado: usa ejemplos, el Profesor especifica los respuestas correspondiente a las entradas, el comportamiento deseado es conocido. Aprendizaje por refuerzo: emplea recompensa y castigo, el aprendiz no se le indica que acciones debe elegir, pero recibe premio/penalización del entorno y ajusta/aprende la acción a elegir. Aprendizaje no supervisado: emplea la observación, no se dispone de profesor, el aprendiz busca patrones en las entradas, no existe una respuesta explícita que sea la correcta.

Paradigmas Basado en problemas: el aprendiz se enfrenta a problemas y guarda las estrategias de solución, conjunto de casos. Basado en analogías: el aprendiz busca en su base de conocimiento problemas similares y extracta las estrategias empleadas en aquel caso.

Aprendizaje problema Aprendizaje = emplear experiencia (E) en alguna tarea (T) con respecto a alguna medida (m) de desarrollo. Ejemplo: Aprender a hacer ensayos T = ensayo E = elementos para hacerlos m = parámetros definidos, nota evaluatoria, errores. Qué experiencia? Qué se aprende? Cómo se representara el aprendizaje? Cuál es el algoritmo?

Aprendizaje inductivo Generaliza a partir de ejemplos; curva de aprendizaje. El conocimiento solo puede ser probado falso. PREDICHO Falsos positivos Verdaderos positivos Falsos negativos ACTUAL Usa sesgos para generalizar los ejemplos: espacio de hipótesis. Ej: aprendizaje de conceptos. Ejemplos positivos y negativos. Ruido.

Aprendizaje inductivo El cometido es producir una función que se aproxime a otra a partir de una hipótesis, es decir unas posibles soluciones. Cualquier preferencia por una hipótesis es conocida como predisposición. Un agente puede realizar un aprendizaje gradual, en la que el agente se concentra en actualizar sus antiguas hipótesis.

Aprendizaje con arboles de decisión Constituye un adecuado medio para el área del aprendizaje inductivo, y una sencilla representación del conocimiento propositivo útil en la toma de decisiones y en la clasificación de objetos. Es limitado en su representación. Toma como entradas objetos o situaciones caracterizados mediante un conjunto de propiedades.

Arboles de decisión Si existen ejemplos positivos y negativos, entonces separarlos escogiendo el mejor atributo. Si los ejemplos son positivos (o todos negativos), no hay problema; podemos responder si o no. Si no hay ejemplos, significa que no se observo un ejemplo tal, por lo que se regresa al valor predefinido calculado a partir de la clasificación de la mayoría en el padre del nodo.

Arboles de decisión Sino quedan atributos, pero si tanto ejemplos positivos como negativos, entonces hay problemas. significa que la descripción de estos ejemplos es exactamente la misma, pero su clasificación es diferente. Lo anterior sucede cuando algunos de los datos son incorrectos (se dice que hay ruido de datos). También sucede cuando los atributos no proporcionan suficiente información para describir cabalmente la situación, o cuando el dominio es auténticamente no determinista.

Arbol para decidir la espera de una mesa en un restaurante

Aprendizaje de conceptos Parte Rectáng. Soporta ARCO Parte Rectáng. Soporta Polígono Rectáng. Triáng. Parte Polígono Rectáng. Triáng.

Aprendizaje de conceptos Parte Rectáng. No toca Soporta ARCO Parte Rectáng. Soporta Parte Polígono

Aprendizaje de conceptos Parte Rectáng. No toca Soporta ARCO Parte Rectáng. Soporta Parte? Polígono

Árboles de decisión Algoritmos: C4.5, ID3, CART Núcleo? Células cancerosas Cancerosa Cuerpo? Células sanas Sesgo preferencial: navaja de Ockham, la explicación más simple consistente con las observaciones es la mejor. Colas? Saludable Cancerosa Saludable

Espacio de hipótesis Mejor hipótesis del momento Hipótesis Negativo Generalización Positivo Especialización consistente falso falso Eliminación de candidatos

Espacio de hipótesis Eliminación de candidatos G: {Obj(X,Y,Z)} S:{} +: G: {Obj(X,Y,Z)} S:{Obj(peq,rojo,bola)} -: G: {Obj(X,rojo,Z),Obj(X,Y,bola)} S:{Obj(peq,rojo,bola)} +: G: {Obj(X,rojo,Z),Obj(X,Y,bola)} S:{Obj(X,rojo,bola)} G: {Obj(peq,rojo,bola)} S:{Obj(peq,rojo,bola)} -:

Aplicaciones: Robótica Exploración autónoma Manipulación Movimiento preferible Movimiento inútil

Evaluación de la eficiencia de un algoritmo de aprendizaje Reunir una gran cantidad de ejemplos. Dividirla en dos conjuntos diferentes: el conjunto de capacitación y el conjunto de prueba. Emplear el algoritmo de aprendizaje, con el conjunto de capacitación como ejemplo de base para producir una hipótesis. Medir el porcentaje de ejemplos del conjunto de prueba correctamente clasificados como hipótesis. Repetir los pasos del 1 al 4 en conjuntos de capacitación.

Taxonomía basada en enfoques del conocimiento Enfoque conductista (llamados subsimbólicos) Aprendiz sufre modificaciones en su estructura para ajustarse al comportamiento a simular. Enfasis en el rendimiento y no en el conocimiento adquirido. Ejemplos: aprendizaje inductivos Generales (pueden ser supervisados o no) Sistemas conexionistas: Redes neuronales. Sistemas evolucionistas: Algoritmos genéticos. Más específicos (tienden a no ser supervisados) Clasificadores: Clusterings.

Aprendizaje conductista Modelo Estímulo-Respuesta = Caja Negra Sistema Aprendiente Refuerzo Crítico o Maestro

Aprendizaje cognoscitivo Modelo espacio de estados = Representación conocimiento Sistema Aprendiente Base de Conocimiento Módulo de Ejecución Refuerzo Crítico o Maestro

Memorización Archivo de los pasos que se han seguido Archivo de respuestas obtenidas Archivo de... Existe variantes en las que se almacenan ejemplos y se recupera posteriormente el más parecido. Aprendizaje basado en Instancias Aprendizaje por Analogía.

MCP MLP

Aprendizaje por instrucción Es el mecanismo más simple Requiere la intervención de Otro agente Una persona Se selecciona información más relevante y se transforma a representación adecuada Es como aprendemos en clase ( %)

Aprendizaje por instrucción Motor Inferencia Reglas Pide reglas Generador de Reglas Sistema con Aprendizaje

Inducción He visto un cisne gris He visto otro cisne gris He visto otro cisne gris... Todos los cisnes son grises

Aprendizaje a partir de ejemplos Gestor de datos Motor inferencias Pide datos Datos Aprendiz Reglas Pide reglas Sistema con Aprendizaje

Creatividad Habilidad que posee una persona para generar conclusiones rápidas y eficaces. Habilidad para solucionar problemas de una manera diferente a las demás personas. Capacidad para generar ideas que pueden alterar un sistema.

Imaginar Capacidad para crear mundos no existentes. Capacidad de generar ideas que a la vista de los demás parecen irreales. Capacidad de idear soluciones no lógicas a problemas. Habilidad de producir objetos a partir de ideas no definidas adecuadamente.

Razonar Capacidad de encadenar conocimiento que se tiene con nuevo conocimiento. Capacidad de generar conclusiones combinando conocimiento existente y experiencia nueva. Reproducción amplia de conocimiento a partir del aprendizaje llevado a cabo.

Pensar Capacidad de imaginar y razonar determinando que el resultado es bueno o malo. Ampliación del razonamiento para determinar la aplicabilidad de algo. Acto de la mente que permite generar ideas (pensamientos) Acto del cerebro que permite determinar que se desea aprender.

Creatividad Imaginar Razonar Aprendizaje Pensar

Reflexiones finales Si un sistema experto diseñado e implementado brillantemente no puede aprender a no repetir sus errores, no es más inteligente que un gusano... O. Selfridge Encuentre un error en un programa, y repárelo, y el programa funcionará hoy. Muéstrele al programa como encontrar y reparar errores, y el programa trabajará para siempre. O. Selfridge

El aprender una cosa ayuda a aprender otra? Qué es lo que ocurre cuando recordamos y cuando olvidamos? Cuál es el proceso (s)? Qué control se ejerce sobre estos procesos?

Referencias Russell y Norvig Artificial Intelligence Luger y Stubblefield http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo- 3/www/ml-1997.html ML por Tom Mitchell http://www.aic.nrl.navy.mil~aha/ - ML por David Aha http://www-2.cs.cmu.edu/~rll/welcome.html - Robot Learning Laboratory Machine Learning. Tom Mitchell, McGraw Hill, 1997.