No se permiten libros ni apuntes ni calculadora

Ejercicio : [ puntos: respuesta acertada = +, respuesta incorrecta = ] Complete las frases que se muestran a continuación con las alternativas especificadas. En la siguiente tabla, indique "V" o "F" para respuestas verdaderas y falsas respectivamente: (a) (b) (c) (d). V F V F. F F V F.3 F V F V.4 V F V F. F F V V Pág. /

.. Cuáles de las siguientes afirmaciones acerca de la búsqueda en línea es(son) cierta(s)? (a) Se intercala una fase de búsqueda (elección de acciones) con una fase de acción/percepción. (b) La búsqueda en línea siempre es óptima y completa. (c) Es conveniente aplicar la búsqueda con horizonte cuando el espacio de búsqueda es demasiado grande para realizar una única búsqueda A*. (d) Una búsqueda en línea es más eficiente cuanto mayor sea su índice competitivo (coste del camino real entre coste del camino óptimo)... Cuál(es) de las siguientes afirmaciones acerca de los juegos bipersonales de suma nula es (son) verdadera(s)? (a) Cualquier algoritmo de búsqueda heurística puede aplicarse de forma efectiva a juegos bipersonales de suma nula. (b) En algunos casos es posible que el algoritmo Minimax con poda α-β expanda más nodos que el algoritmo Minimax sin poda α-β. (c) El algoritmo Minimax con poda α-β produce siempre el mismo resultado que el algoritmo Minimax sin poda α-β. (d) En el algoritmo ExpectMinimax los nodos azar representan una mala jugada del jugador min..3. Sea X = {A,B,C,D} un conjunto de variables, D = {D A, D B, D C, D D } un conjunto de dominios tal que D A = D B = D C = D D = {,}, y R = {R A,B, R A,C, R B,C } un conjunto de restricciones, todas ellas de desigualdad (p.e. R A,B (A B)). Cuáles de los siguientes afirmaciones respecto al Problema de Satisfacción de Restricciones (X,D,R) son ciertas y cuáles falsas? (a) El grafo que representa el Problema de Satisfacción de Restricciones es conexo (b) El Problema de Satisfacción de Restricciones es arco-consistente (c) El Problema de Satisfacción de Restricciones tiene exactamente una solución (d) El Problema de Satisfacción de Restricciones no tiene solución Pág. /

.4. Cuáles de las siguientes afirmaciones son verdaderas y cuáles son falsas? (a) En lógica de descripciones ALC r.c r. r.c r.c (b) En RDF Schema no se puede expresar que una clase es subclase de otra (c) En SPARQL es posible expresar patrones opcionales (d) La unión de conjuntos borrosos se realiza mediante una t-norma.. Cuáles de las siguientes afirmaciones acerca de los algoritmos de aprendizaje son verdaderas y cuáles son falsas? (a) En el Q-learning, la inicialización de los valores de la función Q a valores muy bajos (por debajo de los valores reales) favorece la exploración de nuevas soluciones. (b) En un método de aprendizaje subsimbólico los datos son representados por sus características. (c) Es posible que un clasificador binario que tiene una tasa de verdaderos positivos (true positive rate) igual a cometa errores. (d) Considerando un problema de clasificación binario de un número de casos finitos y cuyos clases son linealmente separables. Una red neuronal de una única capa llega a aprender un clasificador correcto para este problema si se elige una tasa de aprendizaje (α) adecuada y se presentan todos los casos un número infinito de veces. Pág. 3 /

Ejercicio : [ puntos] Considera el siguiente subárbol de un problema de búsqueda. Los números asignados a cada arco representan los costes de las operaciones/acciones correspondientes. Los números en los nodos representan una estimación del coste del camino más corto de este nodo a un nodo meta. Los nodos meta están marcados con doble circulo. 9 4 3 7 6 8 7 3 9 6 8 Construye el árbol que expandiría el algoritmo A* aplicado a este problema, indica el orden en el que se expandirían los nodos, los valores de la función f* y el nodo meta que el algoritmo encontraría. Solución: f*=+7=8 f*=+= 9 f*=9+= 7 6 f*=+6=7 4 4 f*=9+= f*=4+=9 3 3 f*=7+=9 3 6 f*=+=6 8 f*=+8=8 f*=7+=7 6 7 f*=6+=6 Pág. 4 /

Ejercicio 3: [ puntos] Aplicamos la modelización habitual del problema de las n-reinas como CSP para representar el problema de las reinas (e.d. las filas son las variables del CSP (x a x ) y los columnas son los dominios de cada una de las variables (de a )). Emplee el algoritmo de satisfacción de restricciones con vuelta atrás cronológica y comprobación hacia adelante (cronological backtracking with forward checking) para encontrar una solución al problema de las reinas, usando las siguientes heurísticas: Elección de variables: preferir variables con índices más pequeños (p.e. se prefiere x sobre x 3 ) Elección de valores: preferir valores pequeños (p.e. se prefiere x 3 = sobre x 3 =4) Para cada nodo del árbol de búsqueda indique las variables asignadas y los dominios de las variables no-asignadas. Aplique la comprobación hacia adelante (forward checking) a cada nodo que se inserta en el árbol de búsqueda (no sólo a los nodos que se expanden). Solución: {} D = {3,4,} D 3 = {,4,} D 4 = {,3,} {x = } D {x = } {x = 4} {x = } D = {,3,4} = {4,}, D 3 = {,3,} D = {,} {x = 3} D = {,} D = {,,3} D 4 = {,3,4}, D = {,3,4,} D 3 = {,4} D 3 = {,3,} D 3 = {,,4} D 4 = {,,4,} D 4 = {,3,} D 4 = {,3,4} D 3 = {} {x =, D 3 = {} {x =, D D = {,,4,} D = {,,3,} D = {,3,4} 3 = {} {x D 4 = {} =, D x = 3} 4 = {3,} x = 4} D 4 = {} x D = {,4} = } D = {,3} D = {3,4} D 4 = {} D = {,4} {x =, x = 3, x 3 = } D = {4} {x =, x = 3, x 3 =, x 4 = } {x =, x = 3, x 3 =, x 4 =, x 3 = 4} Pág. /

Ejercicio 4: [ puntos] Dados los siguientes nombres de conceptos: Tienda, Libro, Librería, Capítulo, Editorial y Agradable, y los nombres de roles tiene y vende, representar el siguiente conocimiento en lógica de descripciones ALC ( puntos) y en lógica de primer orden ( puntos). ) Los libros tienen capítulos y editorial ) Las librerías son tiendas que sólo venden libros (si no venden ninguno no lo son) 3) Los libros y las tiendas son cosas distintas 4) El Quijote es un libro vendido en la tienda La casa del libro ) Las tiendas que venden libros son agradables Solución: ) Los libros tienen capítulos y editorial Libro tiene.capítulo tiene.editorial x(libro(x) y(tiene(x,y) Capítulo(y)) z(tiene(x,z) Editorial(z))) ) Las librerías son tiendas que sólo venden libros (si no venden ninguno no lo son) Librería Tienda vende.libro vende. x(librería(x) Tienda(x) y(vende(x,y) Libro(y)) z vende(x,z)) 3) Los libros y las tiendas son cosas distintas Libro Tienda x(libro(x) Tienda(x)) 4) El Quijote es un libro vendido en la tienda La casa del libro Libro(ElQuijote) Tienda(LaCasaLibro) vende(lacasalibro, ElQuijote) Libro(ElQuijote) Tienda(LaCasaLibro) vende(lacasalibro, ElQuijote) ) Las tiendas que venden libros son agradables Tienda vende.libro Agradable x(tienda(x) y(vende(x,y) Libro(y)) Agradable(x)) Pág. 6 /

Ejercicio : [ puntos] La variable número de goles por temporada de los equipos de fútbol de primera división toma los valores borrosos mostrados mediante las funciones de pertenencia representadas en la siguiente figura: bajos B Goles medios M altos A goles 3 4 7 9 Un experto considera una regla Si los goles del Real Madrid son altos entonces los goles del F.C. Barcelona son muy altos. Sabiendo que en la temporada 7/8 el Real Madrid anotó 84 goles y el F.C. Barcelona 76 goles, obtener el grado de verdad de dicha regla usando las funciones de Lukasiewicz: T-norma = W(x,y) = Max(, x+y ) T-conorma = W*(x,y) = Min(, x+y) Implicación = J(x,y) = Min(, x + y) Solución: µ A (84) =.7 µ A (76) =.3 µ A MuyA (84,76) = J(µ A (84), µ A (76) ) = J(.7,.3 ) = Mín(,.7 +.9) =.39 Pág. 7 /

Ejercicio 6: [ puntos] En un videojuego, un jugador tiene que recorrer una especie de laberinto desde un punto de salida (s) a un punto de destino (x) tal y como se presenta la siguiente figura. s a g b d c h e x f i El jugador puede desplazarse de un punto a otro (figuras geométricas) por los caminos existentes (flechas). El jugador sólo puede irse hacía adelante (hacía la izquierda) y no puede volver por el camino por el que ha venido. Cuando el jugador entra en un nuevo punto ocurren los siguientes eventos: el jugador gana monedas el jugador gana 9 monedas el jugador gana moneda el jugador pierde una vida En la salida (x) el jugador no gana monedas ni pierde ninguna vida y se termina el juego. Para identificar los estados del problema (puntos) se emplean las letras minúsculas de la figura. Las acciones se identifican por los números y, de tal forma que en cada estado el camino más hacia arriba corresponde al y el otro (si lo haya) al número. Es decir, tomar el camino de d a c sería realizar la acción en el estado d, mientras el camino de d a e corresponde a realizar la acción en el estado d. Se supone que el jugador no conoce este escenario a priori y su objetivo es aprender el camino más lucrativo en sucesivos instancias del juego. El camino más lucrativo es aquél en el que el jugador obtiene el mayor número de monedas y pierde menos vidas. Para establecer una relación entre vidas y monedas, el jugador estima que cada vida equivale a monedas. Apliqué el algoritmo de Q-learning a este problema con los siguientes parámetros: Los valores de la función Q se inicializan todos a Emplea el siguiente factor de descuento: γ= El jugador elige sus acciones con una política greedy (ávara) Si en un momento dado no tiene ningún criterio mejor, prefiere siempre las acciones (caminos) más arriba. Pág. 8 /

a) Ejecuta el algoritmo Q-learning para una instancia del problema, indicando las acciones que el jugador realiza (los puntos por los que pasa) y la evolución de los valores de la función Q. b) Dado los valores de la función Q aprendidos, ejecuta el algoritmo de nuevo para una segunda y una tercera instancia del juego. Nuevamente indica las acciones que el jugador realiza y la evolución de los valores de la función Q. c) Indica si el jugador aprendería el camino óptimo si se ejecutase el algoritmo de forma iterativa en nuevas instancias del juego. Argumenta, por qué encuentra (no encuentra) el camino óptimo. Solución: a) Con los parámetros indicados en el enunciado, el jugador realizaría los movimientos correspondientes a la línea discontinua y actualizaría los valores de Q de las acciones correspondientes a los valores que se representan en la figura (todas las demás acciones mantienen el valor de inicialización ). s Q(s,)=9 a Q(a,)=- g b Q(b,)=9 d h c Q(c,)= e x f i b) En las siguientes instancias del juego, el jugador realizará las siguientes acciones y actualizará los valores de Q de la siguiente forma. Instancia : s Q(s,)=9 a b Q(a,)=- Q(a,)=- g Q(b,)=9 c d Q(d,)=9 h Q(c,)= e x f i Pág. 9 /

Instancia 3: s Q(s,)=- a b Q(a,)=- Q(a,)=- g Q(b,)=9 c d Q(d,)=9 h Q(c,)= e x f i c) Hay dos caminos óptimos: s-a-b-c-e-x y s-a-d-c-e-x (con ganancia de 9). Sin embargo, si se ejecutase el algoritmo con los parámetros especificados de forma iterativa, no encontraría ninguno de estos dos caminos. Después de varias ejecuciones, el jugador se quedaría con el camino s-f-g-e-x con una ganancia de. El jugador no encontraría el camino óptimo porque emplea una política greedy para seleccionar sus acciones. Con esta política, una vez que haya encontrado un camino aceptable, se quedaría con él. Para encontrar el camino óptimo el jugador debería emplear una política que explore más los posibles caminos como, por ejemplo, una política épsilon-greedy. Pág. /