Ingeniería en Informática



Documentos relacionados
Análisis de los datos

UNIDAD 1 LAS LEYES FINANCIERAS DE CAPITALIZACIÓN DESCUENTO

UNIDAD 6. POLINOMIOS CON COEFICIENTES ENTEROS

CESMA BUSINESS SCHOOL MATEMÁTICAS FINANCIERAS. TEMA 3 CAPITALIZACIÓN COMPUESTA

Estas visiones de la información, denominadas vistas, se pueden identificar de varias formas.

MANUAL DE AYUDA MODULO TALLAS Y COLORES

Ecuaciones de primer grado con dos incógnitas

Adaptación al NPGC. Introducción. NPGC.doc. Qué cambios hay en el NPGC? Telf.: Fax.:

Aproximación local. Plano tangente. Derivadas parciales.

TEMA 13. FONDOS DE INVERSIÓN

INTRODUCCIÓN-CONCEPTOS BÁSICOS

Guías _SGO. Gestione administradores, usuarios y grupos de su empresa. Sistema de Gestión Online

UNIDAD 1. LOS NÚMEROS ENTEROS.

MANUAL SERVICIOS TELEFONIA FIJA

Nota 2. Luis Sierra. Marzo del 2010

GESTINLIB GESTIÓN PARA LIBRERÍAS, PAPELERÍAS Y KIOSCOS DESCRIPCIÓN DEL MÓDULO DE KIOSCOS

La nueva criba de Eratóstenes Efraín Soto Apolinar 1 F.I.M.E. U.A.N.L. San Nicolás, N.L. México. efrain@yalma.fime.uanl.mx

Gestión de Retales WhitePaper Noviembre de 2009

Ciclo de vida y Metodologías para el desarrollo de SW Definición de la metodología

EJERCICIOS SOBRE : ECUACIONES DE PRIMER GRADO

Ejemplo de tipo fijo CALCULADOR CONTABLE

MANUAL DE PRACTICUM12 PARA CENTROS EDUCATIVOS ÁMBITO MÁSTER

Bases de datos en Excel

Manual Oficina Web de Clubes (FBM)

CATÁLOGO CATÁLOGO CATÁLOGO CATÁLOGO CATÁLOGO

TEMA 39: OPERACIONES LOCALES EN EL MODELO RASTER

Trazabilidad ERP Microsa Gestión de Lotes

Patrones para persistencia (I) Ingeniería del Software II

Tecnologías en la Educación Matemática. Expresiones. Datos. Expresiones Aritméticas. Expresiones Aritméticas 19/08/2014

Manual para la utilización de PrestaShop

Sistema de Facturación de Ventas WhitePaper Enero de 2007

DOMINIO Y RANGO página 89. Cuando se grafica una función existen las siguientes posibilidades:

EJERCICIOS RESUELTOS 1º DE BACHILLERATO (Hnos. Machado): EJERCICIOS DE REFUERZO 1º EVALUACIÓN (Cinemática) Por Álvaro Téllez Róbalo

MANUAL ECOMMERCE 2.0

Un vistazo a la calle revela que hay una gran cantidad de vehículos con arañazos o

Programa diseñado y creado por Art-Tronic Promotora Audiovisual, S.L.

Universidad de Zaragoza Manual de Usuario

15 CORREO WEB CORREO WEB

Carrito de Compras. Esta opción dentro de Jazz la podremos utilizar como cualquier otro carrito de compras de una página de Internet.

Servicio de Informática Vicerrectorado de Tecnologías de la Información y la Comunicación

Todo lo que hay que saber sobre la concertación de visitas. La verdad y nada más que la verdad.

Tema 2. Espacios Vectoriales Introducción

Análisis de Datos. Práctica de métodos predicción de en WEKA

Centro de Capacitación en Informática

El e-commerce de Grupo JAB es una herramienta que permite a los clientes del Grupo, realizar un amplio conjunto de servicios de consulta, petición y

ETSIINGENIO 2009 DIBUJO DE GRAFOS MEDIANTE ALGORITMOS GENÉTICOS

Ideas básicas sobre movimiento

Manual de guía para Clientes Sistema MoTrack

Manual de usuario Servicios Telemáticos Municipales

La Tecnología líder en Simulación

Ingeniería del Software I Clase de Testing Funcional 2do. Cuatrimestre de 2007

BASES Y DIMENSIÓN. Propiedades de las bases. Ejemplos de bases.

Las normas son necesarias y ayudan a hacer más responsables a los hijos frente a los hábitos que deseamos adquieran.

Práctica 1 - Pista de Carreras Programación II

GUIA APLICACIÓN DE SOLICITUDES POR INTERNET. Gestión de Cursos, Certificados de Aptitud Profesional y Tarjetas de Cualificación de Conductores ÍNDICE

TPVFÁCIL. Caja Real. Definiciones.

MANUAL BÁSICO PARA CLIENTES

Soluciones de los ejercicios de Selectividad sobre Probabilidad de Matemáticas Aplicadas a las Ciencias Sociales II

Configuración de un APs D-Link DWL-2100AP.-

FICHERO MUESTRA Pág. 1

Ejemplos de conversión de reales a enteros

Sesión 7: Visón general

Guía para el tratamiento en Allegro de recibos para centros no pertenecientes a la Generalitat Valenciana.

Datos del autor. Nombres y apellido: Germán Andrés Paz. Lugar de nacimiento: Rosario (Código Postal 2000), Santa Fe, Argentina

Manual de Uso Transpotista de Hormigón TECNOLOGÍA DE SEGUIMIENTO DE CAMIONES HORMIGONERA MANUAL DE USO TRANSPORTISTA DE HORMIGÓN

GUÍA BÁSICA DE INSTALACIÓN

AGREGAR UN EQUIPO A UNA RED Y COMPARTIR ARCHIVOS CON WINDOWS 7

Ejemplo de tipo variable

PREGUNTAS FRECUENTES MOVISTAR FUSIÓN

CASO PRÁCTICO. ANÁLISIS DE DATOS EN TABLAS DINÁMICAS

En términos generales, un foro es un espacio de debate donde pueden expresarse ideas o comentarios sobre uno o varios temas.

Registro (record): es la unidad básica de acceso y manipulación de la base de datos.

INSTRUCTIVO ESCUELA COMERCIAL

Plantillas Office. Manual de usuario Versión 1.1

Bienvenido a la prelicencia!

Contenidos. INFORME ENCUESTA TELEFÓNICA. Curso

Manual de Usuario Ciclos Formativos Matriculación para Modalidad de Completa

DELTA MASTER FORMACIÓN UNIVERSITARIA C/ Gral. Ampudia, 16 Teléf.: MADRID

Porcentajes. Cajón de Ciencias. Qué es un porcentaje?

Servicio de Informática

SINAUTO. (Captura Requirimientos) GRUPO 03

Tipo de interés nominal (TIN)

FacilPlan 1.2 Manual de usuario

Operación Microsoft Access 97

Enfoque del Marco Lógico (EML)

DOMINIO Y RANGO DE UNA FUNCIÓN I N D I C E. martilloatomico@gmail.com. Página. Titulo:

Este es un ejemplo muy sencillo, un esquema de empleados que trabajan en proyectos, en una relación muchos a muchos.

ESTADISTICA PARA RELACIONES LABORALES

Kaldeera Advanced Forms 2009 Guía del usuario

2 EL DOCUMENTO DE ESPECIFICACIONES

E 1 E 2 E 2 E 3 E 4 E 5 2E 4

Generación de funciones lógicas mediante decodificadores binarios con salidas activas a nivel alto

INFORME DE ANÁLISIS DE ENCUESTAS DE SATISFACCIÓN DE USUARIOS PERÍODO

Autores en Web of Science y ResearcherID

MANUAL COPIAS DE SEGURIDAD

ISO 9001:2000 DOCUMENTO INFORMATIVO DOCUMENTO ELABORADO POR CHRISTIAN NARBARTE PARA EL IVECE

1. Lección 10 - Operaciones Financieras - Introducción a los préstamos

Mantenimiento Limpieza

Ingeniería Técnica en Informática de Gestión

Transcripción:

Departamento de Informática Universidad Carlos III de Madrid Ingeniería en Informática Aprendizaje Automático Junio 2007 Normas generales del examen El tiempo para realizar el examen es de 3 horas No se responderá a ninguna pregunta sobre el examen Si se sale del aula, no se podrá volver a entrar durante el examen No se puede presentar el examen escrito a lápiz Problema 1. (5 puntos) Se desea construir un sistema de guiado de coches por gps que tenga en cuenta las condiciones del tráfico a la hora de elegir el mejor camino entre dos cruces cualesquiera. Para ello, se ha digitalizado el mapa de una ciudad y se tiene información respecto a todos los tramos de calle de la ciudad. Cada tramo de calle comienza en un cruce y termina en otro y puede tener uno o dos sentidos. Desde cada cruce se pueden seguir n tramos de calle. Por cada tramo de calle y sentido se conoce su longitud y el número de carriles. Las condiciones del tráfico respecto a cada tramo y sentido que pueden influir en la decisión del mejor camino a seguir son la velocidad, la hora y los minutos, el día de la semana, el día del mes y si es fiesta o no. El sistema a construir está basado en un algoritmo de búsqueda heurística (como el A ) que, para cada estado e (equivalente al cruce donde podría estar el coche), calcula el conjunto de los n sucesores como los cruces a los que puede llegar desde e. Lo que se desea es construir un algoritmo de aprendizaje que permita generar automáticamente la función g (coste de recorrer un tramo de calle en un sentido) en función de las observaciones que han realizado varios coches durante un año circulando por esa ciudad. Esta función tomará un estado y una acción (recorrer un tramo en un sentido) y debe devolver una estimación del tiempo que le llevará aplicar la acción. Se pide A. (2 puntos) Si se deseara utilizar una técnica proposicional, diseña una representación de los datos que te parezca adecuada para realizar esta tarea de aprendizaje. Pon un ejemplo. Describe qué tipo de salida generaría el sistema de aprendizaje. B. (1 punto) Qué algoritmo utilizarías de los vistos en clase para la tarea de aprendizaje propuesta y por qué? C. (1 punto) Si se deseara utilizar una técnica basada en predicados, diseña una representación de los datos que te parezca adecuada para realizar esta tarea de aprendizaje. Pon un ejemplo. Describe qué tipo de salida generaría el sistema de aprendizaje y cómo se ajustaría a las necesidades de la función g. D. (1 punto) Si se deseara utilizar una técnica por refuerzo, diseña una representación de los datos que te parezca adecuada para realizar esta tarea de aprendizaje. Pon un ejemplo. Describe qué tipo de salida generaría el sistema de aprendizaje y cómo se acoplaría la salida con el sistema que se desea construir.

Problema 2. (5 puntos) Una empresa de logística desea utilizar un planificador para determinar la mejor forma de transportar contenedores de una ciudad a otra. Para ello, diseña un sistema que utiliza una representación del dominio con los operadores: cargar-en-camión (carga un contenedor en un camión), cargar-en-barco, cargar-en-tren, descargar-desde-camión (descarga un contenedor de un camión), descargar-desde-barco, descargar-desde-tren, mover-camión (traslada un camión de una ciudad a otra), mover-barco y mover-tren. Para representar el dominio, utiliza los predicados en(contenedor,vehículo) (vehículo puede ser de cualquiera de los tres tipos), en-sitio(contenedor,ciudad), en-vehículo(vehículo,ciudad), y libre(vehículo). Como metas siempre va a intentar conseguir que un contenedor esté en una ciudad. Dado que el planificador tarda mucho tiempo en resolver los problemas, se desea construir una técnica de aprendizaje automático que, una vez que se resuelvan problemas, los siguientes problemas se resuelvan más rápidamente. Se pide A. (1 punto) Describir al menos dos aproximaciones diferentes (al menos una basada en muchos ejemplos, inductiva) para aprender conocimiento que permitan conseguir el objetivo de mejorar la eficiencia del planificador. B. (2 puntos) Dada la aproximación inductiva, describir el lenguaje de representación de los ejemplos de entrada y la salida que se obtendría. C. (2 puntos) Dada esa representación, cuál sería el factor de ramificación en el momento inicial respecto a las posibles alternativas que se tendrían en el nodo raíz de la búsqueda de la mejor hipótesis?

Soluciones del examen de Aprendizaje Automático. Junio 2007 Solución al problema 1 Si se desea utilizar una técnica proposicional, la representación debe ser orientada a atributo-valor. Por tanto, la entrada a cualquier técnica de este tipo será un conjunto de instancias, cada una descrita por un conjunto de valores de atributos y una clase. En el problema, cada instancia definirá una toma de datos de las condiciones de tráfico de un tramo de calle en un sentido. Los atributos serán los específicados en el enunciado y relacionados con la tarea de regresión que se desea resolver: 1. tramo (nominal), sentido (ida o vuelta): estos dos atributos determinan el tramo de calle concreto sobre el que se han tomado los datos. Al separarlos en dos atributos, el sistema de aprendizaje podría obtener clasificadores que generalizaran el tramo. 2. número de carriles es constante para todas las instancias de cada tramo, por lo que tampoco aporta mucho, pero podría servir para generalizar para varios tramos que tuvieran el mismo rango de valores (las calles con más carriles tienden a tener una velocidad media mayor). 3. hora, minutos (ambos numéricos): se mantendrán los dos atributos, dado que es posible que solo sea necesaria, de forma general, la hora para poder generalizar. 4. día de la semana (lunes, martes,... ), día del mes (1 a 31), fiesta (booleano) La clase será el tiempo que se ha tardado en recorrer el tramo en ese sentido en ese contexto (los demás atributos). Se ha eliminado como información de cada instancia: 1. cruce origen y destino: podrían haberse integrado, dado que si los cruces están saturados, esto influye en la saturación de los tramos. Pero, dado que no hay relación entre una instancia y otra (tramos de calle), porque estamos en una representación proposicional y, si no, habría que representar instancias de grupos de tramos relacionados entre sí mediante cruces, no va a poder utilizarse la información referida a qué cruces conecta el tramo. 2. longitud y velocidad: estas variables tienen una relación conocida y directa con la clase. Si se hubieran incluido, podría haber técnicas de aprendizaje que generaran como salida t = l/v, lo que no aporta nada a lo que se desea construir. Un ejemplo sería la siguiente tabla. Tramo Sentido Carriles Hora Minutos Día-semana Día-mes Fiesta Tiempo 1 ida 2 9 30 martes 23 no 13.5 1 ida 2 10 30 miércoles 24 no 6.5 2 vuelta 1 9 45 jueves 25 no 16.5 2 ida 2 11 00 jueves 25 no 4.7 3 ida 1 19 30 sábado 27 sí 5.5 Una posible salida sería un conjunto de reglas que determinen el tiempo que llevaría recorrer un determinado tramo y sentido. Por ejemplo, IF THEN hora<=10,fiesta=no clase=15.54 IF THEN hora>10 clase=5.3 La técnica de aprendizaje a utilizar debe tratar con clases numéricas. Por tanto, opciones serían los árboles de regresión (CART) o de modelos lineales (M5 o M5-rules) o las redes de neuronas. Otra alternativa sería discretizar la clase, pero dado que queremos una salida numérica para utilizarla en la función g, habría que realizar una transformación posterior de la salida

La representación en predicados podría tomar como punto de partida la representación proposicional y añadir aquellos aspectos que se han dejado fuera debido a las restricciones de la lógica atributo-valor. Por ejemplo, se podrían utilizar los siguientes predicados: 1. tramo(id,cruce-origen,cruce-destino,longitud,número-carriles) 2. tiempo(id,hora,minutos,dia-semana,día-mes,fiesta,tiempo) También se podría haber separado los datos del tiempo en predicados binarios (normalmente, más eficientes) con un identificador de la toma concreta de tiempo. Un ejemplo sería: tramo(1,c1,c2,50,2), tiempo(1,9,30,martes,23,no,13.5), tiempo(1,10,30,miércoles,24,no,6.5), tramo(2,c2,c3,25,1), tiempo(2,9,45,jueves,25,no,16.5), tramo(3,c3,c2,25,1), tiempo(3,11,00,jueves,25,no,4.7),tramo(4,c3,c4,20,2),tiempo(4,19,30,sábado,27,sí,5.5) Las técnicas que manejan este tipo de representación son las de aprendizaje relacional, como las de ilp: foil, progol,.... Dado que estas dos técnicas manejan una clase simbólica y aquí se desea predecir en una clase numérica, se pueden utilizar las técnicas de regresión relacional, en las que se aprenden (la salida), por ejemplo, árboles de regresión relacionales, s-cart, tilde-rt. Otra alternativa, al igual que antes, consiste en discretizar la clase, el tiempo, para, una vez se obtiene la clasificación, volver a transformar una clase nominal en un número que se pueda pasar al A. La utilización de las técnicas de aprendizaje por refuerzo en este caso servirían para sustituir al A. Permitirían aprender buenos caminos, en función de la historia de refuerzos obtenidos (que, en este caso, serían los tiempos empleados para recorrer los tramos). Los estados serían cada uno de los cruces, las acciones serían cada uno de los tramos que se pueden recorrer desde cada cruce y los refuerzos, el tiempo empleado en recorrerlos. El principal inconveniente que tendrían es que las técnicas por refuerzo se suelen utilizar para conocer el camino óptimo entre cada cruce de la ciudad y uno dado. En cuanto quisiéramos ir a cualquier cruce de la ciudad, tendríamos que aprender de nuevo. Por tanto, esta aproximación no sería tan adecuada como las anteriores. Otro inconveniente viene del tamaño del conjunto de estados, que, en este caso, sería igual al número de cruces de la ciudad. Por último, habría que tener en cuenta que, dado que se desea minimizar el tiempo, y el aprendizaje por refuerzo intenta maximizar el refuerzo acumulado en el tiempo, se debería transformar el problema de minimizar en un problema de maximizar. Esto se podría hacer fijando el tiempo máximo que se podría tardar en ir de un sitio a otro de la ciudad (o considerar el máximo real posible en la representación elegida para los números) y considerar el refuerzo como la resta entre el tiempo máximo y al tiempo de un tramo. Solución al problema 2 1. Aproximaciones válidas de aprendizaje automático para resolver este problema serían los macrooperadores (deductiva), razonamiento basado en casos (deductiva-inductiva), o aprendizaje de reglas de control (inductiva si se hace con técnicas de ilp o deductiva se realiza mediante ebl). 2. Si se utilizan técnicas de ilp, al igual que en la práctica, se podría tener el siguiente lenguaje de representación: Conocimiento de contexto: en(id-prob,contenedor,vehículo), en-sitio(id-prob,contenedor,ciudad), en-vehículo(id-prob,vehículo,ciudad), libre(id-prob,vehículo), tipo(id-prob,instancia,tipo), meta-en-sitio(id-prob,contenedor,ciudad) Concepto meta (para cada operador del dominio): seleccionar-operador(id-prob) La salida serían reglas de control del estilo de: seleccionar-mover-camión(problema) :- meta-en-sitio(problema,contenedor,ciudad), en(problema,contenedor,vehículo), en-vehículo(problema,vehículo,ciudad1), Ciudad =\= Ciudad1, tipo(problema,vehículo,camión).

3. Al utilizar una técnica de ilp, en el momento inicial solo se tiene la cabeza de la cláusula: seleccionar-mover-camión(problema) En ese momento, las alternativas en la búsqueda de la mejor hipótesis (regla de control) serían todos los posibles literales que se pueden añadir como primera condición del cuerpo de la cláusula. Por tanto, serían todas las posibles instanciaciones de los predicados del contexto. Así, se podría tener: en(id-prob,contenedor,vehículo): 2 3 posibilidades (cada variable puede ser una de las que aparece ya en la regla o una nueva) en-sitio(id-prob,contenedor,ciudad): 2 3 en-vehículo(id-prob,vehículo,ciudad): 2 3 libre(id-prob,vehículo): 2 2 tipo(id-prob,instancia,tipo): 2 3 meta-en-sitio(id-prob,contenedor,ciudad): 2 3 Por tanto, el factor de ramificación sería: 5 2 3 + 2 2 = 44