Inteligencia Artificial I Introducción a la IA 2. Agentes Inteligentes Dr. Edgard Iván Benítez Guerrero 1
2. Agentes Inteligentes Agentes y su entorno Agentes racionales y REAS Propiedades de los entornos de trabajo Tipos de agentes 2
Agentes Un agente es cualquier cosa que puede percibir su entorno a través de sensores y actuar sobre él mediante actuadores Agente humano: ojos, oídos, y otros órganos como sensores; manos, piernas y otras partes del cuerpo como actuadores Agente robótico: cámaras e infrarrojos como sensores; motores como actuadores 3
Agentes y entornos La función del agente mapea la historia de las percepciones a acciones: [f: P* A] El programa del agente implementa la función Descripción matemática abstracta (función) vs implementación(programa) 4
El mundo de la aspiradora Percepción: ubicación y contenido, e.g.,[a, Dirty] Acciones: Left, Right, Suck, NoOp 5
Un agente aspirador 6
Agentes racionales Un agente debe decidir hacer lo correcto, basándose en lo que puede percibir y las acciones que puede realizar. La acción correcta es aquella que causará que el agente tenga más éxito. Medida de rendimiento: criterio objetivo para medir el éxitodelaconductadeunagente Ejemplo: las medidas de rendimiento del agente limpiador pueden ser, entre otras: La cantidad de polvo eliminado Lacantidaddetiempoqueletomóhacerlo La cantidad de electricidad consumida 7
Agente racional En cada posible secuencia de percepciones, un agente racional deberá emprender aquella acción que supuestamente maximice su medida de rendimiento, basándose en las evidencias aportadas por la secuencia de percepciones y en el conocimiento que el agente tenga almacenado El agente limpiador es racional? 8
Agentes racionales La racionalidad es diferente de la omnisciencia (conocer todo con conocimiento infinito) Los agentes pueden ejecutar acciones con el objetivo de modificar percepciones futuras para obtener información útil (recopilación de información, exploración) El agente debe aprender lo máximo posible de lo que está percibiendo Un agente es autónomo si su comportamiento queda determinado por su propia experiencia, compensando conocimiento incompleto o parcial 9
REAS El Rendimiento, el Entorno, los Actuadores y los Sensores (REAS) deben especificarse para guiar el diseño de agentes Ejemplo: la tarea de diseñar un taxista automático Rendimiento: Seguro, rápido, legal, viaje cómodo, maximizar ganancias Entorno: caminos, tráfico, peatones, clientes Actuadores: volantes, acelerador, clutch, señales, claxon Sensores: Camaras, sonar, tacometro, GPS, sensores en el motor 10
Propiedades de los entornos Totalmente observable(vs. parcialmente observable) Totalmente observable: los sensores del agente le proporcionan acceso al estado completo del entorno; i.e. los sensores detectan todos los aspectos relevantes a la toma de decisiones Parcialmente observable: no es totalmente observable debido al ruido y a sensores poco exactos o que no reciben la información del sistema Determinístico(vs. estocástico). Determinista: si el siguiente estado del entorno está totalmente determinado por su estado actual y la acción ejecutada por el agente Estocástico: no determinista Entorno estratégico: medio determinista excepto para las acciones de otros agentes 11
Propiedades de los entornos Episódico(vs. secuencial) Entorno episódico: cuando la experiencia del agente se divide en episodios atómicos independientes, donde cada episodio consiste en la percepción del agente y la realización de una única acción posterior Entorno secuencial: no existe dicha división y una decisión presente puede afectar a decisiones futuras Estático(vs. dinámico) Estático: el entorno no cambia mientras el agente está deliberando Dinámico: el entorno sí cambia Semi-dinámico: el entorno no cambia con el paso del tiempo, pero el rendimiento del agente cambia 12
Propiedades de los entornos Discreto(vs. continuo) Discreto: el entorno tiene un número finito de estados distintos Continuo: no es posible enumerar los estados Agente individual(vs. multiagente) Individual: un solo agente resolviendo un problema Multiagente: varios compitiendo o cooperando 13
Propiedades de los entornos Problema complejo: parcialmente observable, estocástico, secuencial, dinámico, continuo, multiagente Las propiedades del entorno determinan en gran medida el diseño de agentes 14
Estructura de los agentes Un agente es completamente especificado por la función que mapea secuencias de percepciones a acciones(e.g. que determina su conducta) El trabajo de la IA es diseñar el programa del agente que implemente la función del mismo El programa se ejecutará en alguna computadora con sensores y actuadores, lo que se conoce como arquitectura Agente = arquitectura + programa 15
Tipos de agentes Cuatro tipos básicos en orden incremental de generalidad: Agentes reactivos simples Agentes reactivos basados en modelos Agentes basados en objetivos Agentes basados en utilidad Estos agentes se pueden convertir en agentes que aprendan 16
Agentes reactivos simples 17
Agentes reactivos simples 18
Agentes reactivos basados en modelos 19
Agentes reactivos basados en modelos 20
Agentes basados en objetivos 21
Agentes basados en utilidad 22
Agentes que aprenden 23