No se permiten libros ni apuntes ni calculadora

Documentos relacionados
(e) Con la poda alfa-beta se eliminan nodos que nunca serán alcanzados

(d) Puede haber estrategias que funcionan mejor que Minimax si el contrincante es

Hoja de Problemas Tema 6 Búsqueda con estados estructurados: Restricciones

CI-6675 Algoritmos y Estructuras Optimizadas para Videojuegos

(b) Cuál es la desventaja principal de una heurística con aprendizaje? es más informada que otra función heurística optimista h 2 *?

Restricciones. Inteligencia Artificial. Ingeniería Superior en Informática, 4º Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani

JUEGOS. Área de aplicación de los algoritmos heurísticos Juegos bi-personales: oponente hostil

4ta. Práctica. Búsqueda en árbol con contrincante: MiniMax con poda Alfa-Beta. Inteligencia Artificial Prácticas 2004/2005

Aritmética de Enteros

Inteligencia Artificial. Aprendizaje neuronal. Ing. Sup. en Informática, 4º. Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani

A B MIN C D E F MAX x E.T.S.I. INFORMÁTICA 4º CURSO. INTELIGENCIA ARTIFICIAL E INGENIERÍA DEL CONOCIMIENTO

Búsqueda con adversario

Algoritmos para CSP 1

Instrucciones. No hable durante el experimento o usted será inmediatamente excluido del mismo! Buena suerte!

Investigación Operativa

Métodos de Búsqueda para juegos humano-maquina. PROF: Lic. Ana María Huayna D.

C a l ses P P y y NP C a l se P C a l se N P N P [No N n o -De D te t rmin i i n s i ti t c i Polynomial-tim i e]

Estado 3.2 (coste = 9)

Inteligencia Artificial. Visiones: Árboles de Búsqueda Técnicas Look-Back Técnicas Look-Ahead. Elizabeth Montero Ureta.

Formulación del problema de la ruta más corta en programación lineal

Problemas de satisfacción de restricciones.

Satisfacción de Restricciones

Universidad Tec Milenio: Profesional HG04002 Análisis de Decisiones I

Seminario de problemas. Curso Hoja 5

El Juego como Problema de Búsqueda

Algoritmos. Medios de expresión de un algoritmo. Diagrama de flujo

PSU Matemática NM-4 Guía 23: Isometrías. Nombre: Curso: Fecha: -

Resolución de problemas

Árboles. Un grafo no dirigido es un árbol si y sólo si existe una ruta unica simple entre cualquiera dos de sus vértices.

PROGRAMACION CUADRATICA

ALGORITMO MINIMAX. o Nodo: Representa una situación del juego. o Sucesores de un nodo: Situaciones del juego a las que se

UNIDAD 8: SUCESIONES Y SERIES

Tema: Los Grafos y su importancia para la optimización de redes.

PROCESADORES DE LENGUAJE EXAMEN FINAL 8-JUNIO-07

SCUACAC026MT22-A16V1. SOLUCIONARIO Ejercitación Generalidades de números

Micro y Macroeconomía

Inteligencia Artificial Problemas de satisfacción de restricciones

ÍNDICE INTRODUCCIÓN...13

Capitulo 4. DECISIONES BAJO RIESGO TEORIA DE JUEGOS

Grafos. Amalia Duch Brown Octubre de 2007

UNIVERSIDAD MAYOR DE SAN SIMÓN FACULTAD DE CIENCIAS Y TECNOLOGÍA INGENIERÍA DE SISTEMAS BÚSQUEDA PRIMERO EL MEJOR

Programación NO Lineal (PNL) Optimización sin restricciones

Análisis matemático de la función de Nelson y Siegel

Máquinas Secuenciales, Autómatas y Lenguajes. Tema 3.1: Autómatas Finitos Deterministas

Circuitos con fuentes independientes de corriente y resistencias, circuitos R, I

SEGUNDA OLIMPIADA ESTATAL DE MATEMÁTICAS

Ruta más Corta con una sóla Fuente de Inicio (Single-Source Shortest Paths) DR. JESÚS A. GONZÁLEZ BERNAL CIENCIAS COMPUTACIONALES INAOE

Lic. Manuel de Jesús Campos Boc

Trabajo Práctico N 5: ESPACIOS VECTORIALES. Ejercicio 1:

Práctica N o 8 Desigualdades Válidas - Algoritmos de Planos de Corte - Algoritmos Branch & Cut

Ecuaciones, ecuación de la recta y sistemas

Para definir en formalmente el juego se deberá establecer:

Programación con Restricciones Constraint Programming

APUNTADORES. Un apuntador es un objeto que apunta a otro objeto. Es decir, una variable cuyo valor es la dirección de memoria de otra variable.

Tema 3: Juegos bipersonales

CONTENIDOS. 1. Procesos Estocásticos y de Markov. 2. Cadenas de Markov en Tiempo Discreto (CMTD) 3. Comportamiento de Transición de las CMTD

Introducción a la unidad 4:

CIRCUITOS LÓGICOS. Lógica FCE 1. ALGEBRA DE BOOLE

EJERCICIO 26 DE EXCEL

Sistemas de ecuaciones.

CRITERIOS DE SELECCIÓN DE MODELOS

= 310 (1 + 5) : 2 2 = = = 12 ( 3) ( 5) = = 2 = ( 4) + ( 20) + 3 = = 21

Razonamiento. con. Restricciones. Esquema Global. Tutorial CAEPIA Introducción - Definiciones - Ejemplos

RELACIÓN DE PROBLEMAS DE CLASE DE PROGRAMACIÓN LINEAL ENTERA

Técnicas de Clasificación Supervisada DRA. LETICIA FLORES PULIDO

Teoría de grafos y optimización en redes

n-1 n (número del período)

Aproximaciones Sucesivas.

FUNCIONES EN EXCEL III

3. Técnicas de diseño de algoritmos

Jesús Getán y Eva Boj. Marzo de 2014

Curso /10/12. Inteligencia Artificial (30223) Lección 5. Juegos. Índice. Juegos. Los juegos son una forma de entorno multiagente

UNIDAD: ÁLGEBRA Y FUNCIONES INECUACIONES Y SISTEMAS DE INECUACIONES

Análisis de. Análisis de. Decisiones:

OPERACIONES CON POLINOMIOS

Jueves, 30 de abril. Ejemplo de recursión. Ejemplo de PD. Ejemplo de programación dinámica. Programación dinámica

Algunos ejemplos de conjuntos pueden ser los siguientes:

Universidad de Cantabria. Facultad de Ciencias Ingeniería en Informática. Ingeniería del Software II

Flujos de redes (Network Flows NF)

Tema 5: Problemas de satisfacción de restricciones

Trabajo Práctico N 5: ESPACIOS VECTORIALES

Espacios Vectoriales

Aprendizaje Automatizado

Algoritmos y Estructuras de Datos Curso 06/07. Ejercicios

UNIDAD: ÁLGEBRA Y FUNCIONES ECUACIÓN DE LA RECTA

Práctica 2: Análisis de sensibilidad e Interpretación Gráfica

Contenido: Solución algebraica a los problemas de programación lineal con el método simplex.

Elementos Diagramas de Clases Clase:

Autómatas Deterministas. Ivan Olmos Pineda

Factorización ecuación identidad condicional término coeficiente monomio binomio trinomio polinomio grado ax3

Problema 3 Sea ABC un triángulo acutángulo con circuncentro O. La recta AO corta al lado BC en D. Se sabe que OD = BD = 1 y CD = 1+

Centro Asociado Palma de Mallorca. Tutor: Antonio Rivero Cuesta

Cap. 3: relaciones en un triángulo

5.- Construcción de la Matriz Admitancia de Barra del Sistema

Juegos deterministas. Ajedrez, damas, Go, Othello. barquitos

El método simplex 1. 1 Forma estándar y cambios en el modelo. 2 Definiciones. 3 Puntos extremos y soluciones factibles básicas. 4 El método simplex.

El conjunto de las operaciones de simetría que se pueden aplicar a una molécula tienen las propiedades de un grupo matemático.

Lo rojo sería la diagonal principal.

UNIVERSIDAD TECNOLÓGICA DE JALISCO

Transcripción:

Ejercicio : [ puntos: respuesta acertada = +, respuesta incorrecta = ] Complete las frases que se muestran a continuación con las alternativas especificadas. En la siguiente tabla, indique "V" o "F" para respuestas verdaderas y falsas respectivamente: (a) (b) (c) (d). V F V F. F F V F.3 F V F V.4 V F V F. F F V V Pág. /

.. Cuáles de las siguientes afirmaciones acerca de la búsqueda en línea es(son) cierta(s)? (a) Se intercala una fase de búsqueda (elección de acciones) con una fase de acción/percepción. (b) La búsqueda en línea siempre es óptima y completa. (c) Es conveniente aplicar la búsqueda con horizonte cuando el espacio de búsqueda es demasiado grande para realizar una única búsqueda A*. (d) Una búsqueda en línea es más eficiente cuanto mayor sea su índice competitivo (coste del camino real entre coste del camino óptimo)... Cuál(es) de las siguientes afirmaciones acerca de los juegos bipersonales de suma nula es (son) verdadera(s)? (a) Cualquier algoritmo de búsqueda heurística puede aplicarse de forma efectiva a juegos bipersonales de suma nula. (b) En algunos casos es posible que el algoritmo Minimax con poda α-β expanda más nodos que el algoritmo Minimax sin poda α-β. (c) El algoritmo Minimax con poda α-β produce siempre el mismo resultado que el algoritmo Minimax sin poda α-β. (d) En el algoritmo ExpectMinimax los nodos azar representan una mala jugada del jugador min..3. Sea X = {A,B,C,D} un conjunto de variables, D = {D A, D B, D C, D D } un conjunto de dominios tal que D A = D B = D C = D D = {,}, y R = {R A,B, R A,C, R B,C } un conjunto de restricciones, todas ellas de desigualdad (p.e. R A,B (A B)). Cuáles de los siguientes afirmaciones respecto al Problema de Satisfacción de Restricciones (X,D,R) son ciertas y cuáles falsas? (a) El grafo que representa el Problema de Satisfacción de Restricciones es conexo (b) El Problema de Satisfacción de Restricciones es arco-consistente (c) El Problema de Satisfacción de Restricciones tiene exactamente una solución (d) El Problema de Satisfacción de Restricciones no tiene solución Pág. /

.4. Cuáles de las siguientes afirmaciones son verdaderas y cuáles son falsas? (a) En lógica de descripciones ALC r.c r. r.c r.c (b) En RDF Schema no se puede expresar que una clase es subclase de otra (c) En SPARQL es posible expresar patrones opcionales (d) La unión de conjuntos borrosos se realiza mediante una t-norma.. Cuáles de las siguientes afirmaciones acerca de los algoritmos de aprendizaje son verdaderas y cuáles son falsas? (a) En el Q-learning, la inicialización de los valores de la función Q a valores muy bajos (por debajo de los valores reales) favorece la exploración de nuevas soluciones. (b) En un método de aprendizaje subsimbólico los datos son representados por sus características. (c) Es posible que un clasificador binario que tiene una tasa de verdaderos positivos (true positive rate) igual a cometa errores. (d) Considerando un problema de clasificación binario de un número de casos finitos y cuyos clases son linealmente separables. Una red neuronal de una única capa llega a aprender un clasificador correcto para este problema si se elige una tasa de aprendizaje (α) adecuada y se presentan todos los casos un número infinito de veces. Pág. 3 /

Ejercicio : [ puntos] Considera el siguiente subárbol de un problema de búsqueda. Los números asignados a cada arco representan los costes de las operaciones/acciones correspondientes. Los números en los nodos representan una estimación del coste del camino más corto de este nodo a un nodo meta. Los nodos meta están marcados con doble circulo. 9 4 3 7 6 8 7 3 9 6 8 Construye el árbol que expandiría el algoritmo A* aplicado a este problema, indica el orden en el que se expandirían los nodos, los valores de la función f* y el nodo meta que el algoritmo encontraría. Solución: f*=+7=8 f*=+= 9 f*=9+= 7 6 f*=+6=7 4 4 f*=9+= f*=4+=9 3 3 f*=7+=9 3 6 f*=+=6 8 f*=+8=8 f*=7+=7 6 7 f*=6+=6 Pág. 4 /

Ejercicio 3: [ puntos] Aplicamos la modelización habitual del problema de las n-reinas como CSP para representar el problema de las reinas (e.d. las filas son las variables del CSP (x a x ) y los columnas son los dominios de cada una de las variables (de a )). Emplee el algoritmo de satisfacción de restricciones con vuelta atrás cronológica y comprobación hacia adelante (cronological backtracking with forward checking) para encontrar una solución al problema de las reinas, usando las siguientes heurísticas: Elección de variables: preferir variables con índices más pequeños (p.e. se prefiere x sobre x 3 ) Elección de valores: preferir valores pequeños (p.e. se prefiere x 3 = sobre x 3 =4) Para cada nodo del árbol de búsqueda indique las variables asignadas y los dominios de las variables no-asignadas. Aplique la comprobación hacia adelante (forward checking) a cada nodo que se inserta en el árbol de búsqueda (no sólo a los nodos que se expanden). Solución: {} D = {3,4,} D 3 = {,4,} D 4 = {,3,} {x = } D {x = } {x = 4} {x = } D = {,3,4} = {4,}, D 3 = {,3,} D = {,} {x = 3} D = {,} D = {,,3} D 4 = {,3,4}, D = {,3,4,} D 3 = {,4} D 3 = {,3,} D 3 = {,,4} D 4 = {,,4,} D 4 = {,3,} D 4 = {,3,4} D 3 = {} {x =, D 3 = {} {x =, D D = {,,4,} D = {,,3,} D = {,3,4} 3 = {} {x D 4 = {} =, D x = 3} 4 = {3,} x = 4} D 4 = {} x D = {,4} = } D = {,3} D = {3,4} D 4 = {} D = {,4} {x =, x = 3, x 3 = } D = {4} {x =, x = 3, x 3 =, x 4 = } {x =, x = 3, x 3 =, x 4 =, x 3 = 4} Pág. /

Ejercicio 4: [ puntos] Dados los siguientes nombres de conceptos: Tienda, Libro, Librería, Capítulo, Editorial y Agradable, y los nombres de roles tiene y vende, representar el siguiente conocimiento en lógica de descripciones ALC ( puntos) y en lógica de primer orden ( puntos). ) Los libros tienen capítulos y editorial ) Las librerías son tiendas que sólo venden libros (si no venden ninguno no lo son) 3) Los libros y las tiendas son cosas distintas 4) El Quijote es un libro vendido en la tienda La casa del libro ) Las tiendas que venden libros son agradables Solución: ) Los libros tienen capítulos y editorial Libro tiene.capítulo tiene.editorial x(libro(x) y(tiene(x,y) Capítulo(y)) z(tiene(x,z) Editorial(z))) ) Las librerías son tiendas que sólo venden libros (si no venden ninguno no lo son) Librería Tienda vende.libro vende. x(librería(x) Tienda(x) y(vende(x,y) Libro(y)) z vende(x,z)) 3) Los libros y las tiendas son cosas distintas Libro Tienda x(libro(x) Tienda(x)) 4) El Quijote es un libro vendido en la tienda La casa del libro Libro(ElQuijote) Tienda(LaCasaLibro) vende(lacasalibro, ElQuijote) Libro(ElQuijote) Tienda(LaCasaLibro) vende(lacasalibro, ElQuijote) ) Las tiendas que venden libros son agradables Tienda vende.libro Agradable x(tienda(x) y(vende(x,y) Libro(y)) Agradable(x)) Pág. 6 /

Ejercicio : [ puntos] La variable número de goles por temporada de los equipos de fútbol de primera división toma los valores borrosos mostrados mediante las funciones de pertenencia representadas en la siguiente figura: bajos B Goles medios M altos A goles 3 4 7 9 Un experto considera una regla Si los goles del Real Madrid son altos entonces los goles del F.C. Barcelona son muy altos. Sabiendo que en la temporada 7/8 el Real Madrid anotó 84 goles y el F.C. Barcelona 76 goles, obtener el grado de verdad de dicha regla usando las funciones de Lukasiewicz: T-norma = W(x,y) = Max(, x+y ) T-conorma = W*(x,y) = Min(, x+y) Implicación = J(x,y) = Min(, x + y) Solución: µ A (84) =.7 µ A (76) =.3 µ A MuyA (84,76) = J(µ A (84), µ A (76) ) = J(.7,.3 ) = Mín(,.7 +.9) =.39 Pág. 7 /

Ejercicio 6: [ puntos] En un videojuego, un jugador tiene que recorrer una especie de laberinto desde un punto de salida (s) a un punto de destino (x) tal y como se presenta la siguiente figura. s a g b d c h e x f i El jugador puede desplazarse de un punto a otro (figuras geométricas) por los caminos existentes (flechas). El jugador sólo puede irse hacía adelante (hacía la izquierda) y no puede volver por el camino por el que ha venido. Cuando el jugador entra en un nuevo punto ocurren los siguientes eventos: el jugador gana monedas el jugador gana 9 monedas el jugador gana moneda el jugador pierde una vida En la salida (x) el jugador no gana monedas ni pierde ninguna vida y se termina el juego. Para identificar los estados del problema (puntos) se emplean las letras minúsculas de la figura. Las acciones se identifican por los números y, de tal forma que en cada estado el camino más hacia arriba corresponde al y el otro (si lo haya) al número. Es decir, tomar el camino de d a c sería realizar la acción en el estado d, mientras el camino de d a e corresponde a realizar la acción en el estado d. Se supone que el jugador no conoce este escenario a priori y su objetivo es aprender el camino más lucrativo en sucesivos instancias del juego. El camino más lucrativo es aquél en el que el jugador obtiene el mayor número de monedas y pierde menos vidas. Para establecer una relación entre vidas y monedas, el jugador estima que cada vida equivale a monedas. Apliqué el algoritmo de Q-learning a este problema con los siguientes parámetros: Los valores de la función Q se inicializan todos a Emplea el siguiente factor de descuento: γ= El jugador elige sus acciones con una política greedy (ávara) Si en un momento dado no tiene ningún criterio mejor, prefiere siempre las acciones (caminos) más arriba. Pág. 8 /

a) Ejecuta el algoritmo Q-learning para una instancia del problema, indicando las acciones que el jugador realiza (los puntos por los que pasa) y la evolución de los valores de la función Q. b) Dado los valores de la función Q aprendidos, ejecuta el algoritmo de nuevo para una segunda y una tercera instancia del juego. Nuevamente indica las acciones que el jugador realiza y la evolución de los valores de la función Q. c) Indica si el jugador aprendería el camino óptimo si se ejecutase el algoritmo de forma iterativa en nuevas instancias del juego. Argumenta, por qué encuentra (no encuentra) el camino óptimo. Solución: a) Con los parámetros indicados en el enunciado, el jugador realizaría los movimientos correspondientes a la línea discontinua y actualizaría los valores de Q de las acciones correspondientes a los valores que se representan en la figura (todas las demás acciones mantienen el valor de inicialización ). s Q(s,)=9 a Q(a,)=- g b Q(b,)=9 d h c Q(c,)= e x f i b) En las siguientes instancias del juego, el jugador realizará las siguientes acciones y actualizará los valores de Q de la siguiente forma. Instancia : s Q(s,)=9 a b Q(a,)=- Q(a,)=- g Q(b,)=9 c d Q(d,)=9 h Q(c,)= e x f i Pág. 9 /

Instancia 3: s Q(s,)=- a b Q(a,)=- Q(a,)=- g Q(b,)=9 c d Q(d,)=9 h Q(c,)= e x f i c) Hay dos caminos óptimos: s-a-b-c-e-x y s-a-d-c-e-x (con ganancia de 9). Sin embargo, si se ejecutase el algoritmo con los parámetros especificados de forma iterativa, no encontraría ninguno de estos dos caminos. Después de varias ejecuciones, el jugador se quedaría con el camino s-f-g-e-x con una ganancia de. El jugador no encontraría el camino óptimo porque emplea una política greedy para seleccionar sus acciones. Con esta política, una vez que haya encontrado un camino aceptable, se quedaría con él. Para encontrar el camino óptimo el jugador debería emplear una política que explore más los posibles caminos como, por ejemplo, una política épsilon-greedy. Pág. /