Búsqueda Heurística IV



Documentos relacionados
Juegos deterministas. Ajedrez, damas, Go, Othello. barquitos

Juegos deterministas. Ajedrez, damas, Go, Othello. barquitos

Curso /10/12. Inteligencia Artificial (30223) Lección 5. Juegos. Índice. Juegos. Los juegos son una forma de entorno multiagente

Inteligencia Artificial Búsqueda entre adversarios

INSTRUCCIONES AJEDREZ

Juegos. Esquema. Introducción: juegos como búsqueda Decisiones perfectas Decisiones imperfectas Poda α β

OTHELLO MANUAL DEL USUARIO

Estrategias en Juegos

REGLAMENTO DEL AJEDREZ. Tablero cuadrado 8x8 de 64 casillas con colores alternados (típicamente blanco y negro).

Tarea 2: Diseño CrossOver

4ta. Práctica. Búsqueda en árbol con contrincante: MiniMax con poda Alfa-Beta. Inteligencia Artificial Prácticas 2004/2005

1.0 Juegos en Forma Extensiva

Resolución de Problemas

EL TABLERO. El tablero está dividido en sesenta y cuatro (64) casillas o escaques alternando los colores blancos con los negros.

Un juego de Odet L Homer y Roberto Fraga

Métodos Heurísticos en Inteligencia Artificial

Modelo de Factores Específicos Introducción. El comercio internacional con frecuencia produce ganadores y perdedores. Razones:

LA DUALIDAD PAR-IMPAR. 1. En una reunión de 25 personas. Puede ser que cada una se salude dándose la mano con todas las demás excepto con una?

REGLAS DE JUEGO DURANTE LOS TORNEOS DE AJEDREZ MAYA EN LA MODALIDAD DE AJEDREZ MAYA PEK

ESTUDIO DE TÉCNICAS HEURISTICAS PARA JUGAR AL GO

Tema 3: Juegos bipersonales

Liderazgo se genera en el lenguaje

Búsqueda Heurística I

Reglas del juego. 2 o más jugadores

Práctica 1 - Pista de Carreras Programación II

Ra Un juego de Reiner Knizia Traducción de Manuel Suffo

Búsqueda heurística Prof. Constantino Malagón

ROBOTS SEGUIDORES DE LÍNEA. CATEGORIA: UNIVERSIDADES

Análisis de los datos

CAPITULO 4 JUSTIFICACION DEL ESTUDIO. En este capítulo se presenta la justificación del estudio, supuestos y limitaciones de

Teoría de juegos en forma extensiva (repaso)

HISTORIA. 1. COMPLETA. Los orígenes del ajedrez son., 2. Nombra, al menos 3 pueblos de la antigüedad.

REGLAS DE SALÓN DE LA DCI PARA DUEL MASTERS Efectivas desde el 6 de agosto de 2004

3º Sesión NAIPES Y SUMA-100. I. Algo Sencillo para comenzar:

Administración de proyectos. Organizar, planificar y programar los proyectos de software

Curso Taller de Matemáticas Olímpicas. Principio Fundamental del Conteo

Juegos Dinámicos. Tema 2: Juegos Dinámicos con Información Imperfecta. Universidad Carlos III

UNIVERSIDAD DE ALMERÍA

Metodología. del ajuste estacional. Tablero de Indicadores Económicos

Tipos de centro. Unidad 2. El centro. Tipos de centro

Resumen de técnicas para resolver problemas de programación entera Martes, 9 de abril. Enumeración. Un árbol de enumeración

RELOJ PRIMIGENIO. Un juego de apuestas, faroleo y press your luck de 3 a 5 jugadores.

Sergio Peñalba Lopez NIA:

ENSEÑA A TU HIJO HABILIDADES SOCIALES Y A SOLUCIONAR SUS PROBLEMAS

Aprendizaje por refuerzo

Incidencias: Todas las incidencias que ocurrirán durante el apadrinamiento de un niño se deben registrar para poder buscar soluciones.

Control Estadístico de Procesos

Poker Texas Hold em. Aprender a jugar

2 GRADOS. CATEGORÍAS DE PREGUNTAS Y PRUEBAS: Las tarjetas de preguntas y pruebas tienen dos niveles de dificultad: bajo y alto.

REFORMA DE LAS PENSIONES

Procesos. Planificación del Procesador.

Restricciones. Inteligencia Artificial. Ingeniería Superior en Informática, 4º Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani

Palabras clave: Taragüí. Redes sociales. Facebook. Twitter. Página web. Atención al cliente.

Manejo de la Información

Componentes del juego

LECCIÓN 4. SEGUIMIENTO DEL PROGRESO DEL PROYECTO.

Manual de Usuario. Modulo de Registro de Determinación y Control de Participación del Estado

INVESTIGACIÓN DE OPERACIONES

Tema 7 COSTO ESTÁNDAR

Ticket to Ride Europe

ANÁLISIS DE UN JUEGO DE CARTAS: LAS SIETE Y MEDIA

Región de Murcia Consejería de Educación, Ciencia e Investigación. Manual Usuario FCT

7. Conclusiones. 7.1 Resultados

Inteligencia Artificial

Idea general: Comienzo de la partida:

La Educación Preescolar hace una Diferencia!

REPRESENTACIÓN DE UNA DISTRIBUCIÓN DE PROBABILIDAD DISCRETA

POKER TEXAS Hold'em REGLAMENTO

Madrid, 31 de marzo de 2015 INFORME SOBRE SOLVENCIA DE BAER, CROSBY & PIKE, AGENCIA DE VALORES, S.A. RELATIVO AL EJERCICIO 2014

Booking Control. Características generales.

UNIVERSIDAD DE ATACAMA

CAPITULO I NOCIONES INICIALES

Tema 8: El Problema de Programación Lineal Entera. Modelización y Resolución

CRM. Qué es CRM. Información para la Gestión

b) Riesgos de crédito. Es decir, que alguna de las 2 partes no cumpla con el compromiso contraído en la operación de swap.

SMS PUSH SMS ENCUESTAS INTERNET FAX

Por qué interesa suscribir un plan de pensiones?

Capítulo 12: Indexación y asociación

ENCUESTA SOBRE EL ACCESO DE LAS PYMES A LA FINANCIACIÓN AJENA

Teoría del Juego - Juegos Combinatoriales Imparciales

Figura 4.1 Clasificación de los lenguajes de bases de datos

Tema 3: Problemas de Satisfacción de Restricciones

Qué es una fuerza? Cómo se relaciona con el movimiento?

CALCULO DE INTERESES POR MORA

RECONOCIMIENTO Y TRANSFERENCIA DE CREDITOS XXVI JORNADAS DE GERENCIA UNIVERSITARIA

22 de diciembre de 2008

TEMA 14: ANÁLISIS DE LOS ESTADOS FINANCIEROS DE LA EMPRESA

PARTE 3 ECUACIONES DE EQUIVALENCIA FINANCIERA T E M A S


Un juego curioso con conexiones interesantes

Manual Oficina Web de Clubes (FBM)

INTRODUCCIÓN-CONCEPTOS BÁSICOS

Manual de Ayuda Administración de Usuarios SISPECAN. Subdirección de Formación Servicio Canario de Empleo

13Soluciones a los ejercicios y problemas PÁGINA 280

Inteligencia Artificial Búsqueda entre adversarios

Transcripción:

Búsqueda Heurística IV Pedro Meseguer IIIA-CSIC Bellaterra, Spain pedro@iiia.csic.es 2 jugadores Búsqueda para juegos Perfecta información: cada jugador conoce toda la información del contrario no hay elementos aleatorios Ejemplos: ajedrez, damas, othello Juegos con información incompleta: poker, bridge Búsqueda Heurística 2

Programas para juegos Programas campeones del mundo: damas, othello Programa con muy buen rendimiento: ajedrez importante: desde 1956, ajedrez era un objetivo para IA Deep Blue gano a Kasparov en 1997 quantity had become quality Importancia económica directa Estrategia: búsqueda en un espacio de billones de nodos profundización selectiva Búsqueda Heurística 3 Othello Fichas con dos caras: blanca y negra 2 jugadores: blanco y negro Mover: nueva ficha en posición en línea recta con otra ficha del mismo color que entremedio tenga fichas de color opuesto Las fichas entremedio cambian de color (y por tanto de jugador) Turnos alternativos Ganar: más fichas de un color cuando se llena el tablero o cuando no hay movimiento posible Búsqueda Heurística 4

Árbol de juegos jugador B jugador A 1 ply 1 move Alternan jugadores por niveles Sucesores de un nodo: todas los movimientos legales que ese jugador puede hacer Búsqueda Heurística 5 1 gana -1 gana 0 tablas MiniMax 1-1 0 1 1 1 0 0 1 Cuál es el mejor movimiento? Supongo que el oponente elige el movimiento que más le conviene. max min -1 1 0 1 1-1 0 1 1 1 0 0 1 Búsqueda Heurística 6

MiniMax Idea: propagar hacia atrás el valor de los hijos Nodos terminales: valor 1, -1 (gana A o gana B) Dos tipos de nodos: max: gana con 1 min: gana con -1 Propagación hacia atrás: max: el máximo de los valores de los hijos min: el mínimo de los valores de los hijos Búsqueda Heurística 7 Algoritmo MiniMax Algoritmo MiniMax: evaluar nodo n de un árbol de juegos 1. Expandir el árbol bajo n 2. Evaluar los nodos terminales. 3. Seleccionar un nodo sin valor que todos sus hijos han sido valuados. Si no existe, retornar el valor de n. Stop. 4. Si el nodo es max, asignar el máximo de sus hijos. Si el nodo es min asignar el mínimo de sus hijos. Ir a 3. Búsqueda Heurística 8

Pregunta El algoritmo anterior tiene un problema: cuál? Supone búsqueda en anchura: 4. Si el nodo es max, asignar el máximo de sus hijos. Si el nodo es min asignar el mínimo de sus hijos. espacio exponencial Búsqueda Heurística 9 MiniMax en DFS 1. L = {n} 2. x extrae-primero(l). Si x =n con valor asignado, retorna ese valor. Stop. 3. Si x tiene valor w, nodo p es padre de x con valor v Si p es max, asignar max(v, w) a p. Si p es min, asignar min(v, w) a p. Eliminar x de L, ir a 2. 4. Si x no tiene valor y es un nodo terminal, asignar +1 o -1 como valor, depende si gana para max o min 5. Si x no tiene valor y no es un nodo terminal, asignar - o + como valor, depende si es max o min Búsqueda Heurística 10

MiniMax en DFS Minimax ha de guardar: sucesores de rama actual (como DFS) nodos en la rama actual: para actualizar su valor Búsqueda Heurística 11 Alfa-Beta max min -1 1 0 1-1 0 1 1 1 0 0 1 Con una buena ordenación de sucesores, min 1-1 0 1 1 1 1-1 0 0 0 1 Poda muy importante: b 36 b 6 Búsqueda Heurística 12

Función de evaluación Árbol de juegos: demasiado grande no se puede buscar hasta el final d 0,3-0,5 0.2 nivel máximo de búsqueda ganadoras / perdedoras 1-1 1-1 1-1 Función de evaluación: evalua lo prometedora que es una posición incluye número de piezas distribución movilidad Búsqueda Heurística 13 Función de evaluación para ajedrez e(n) [-1, +1] sustituye la deteccion de nodos terminales es imperfecta Ajedrez: sumar los valores de las piezas peón, caballo, alfil, torre, reina 1 3 3 5 10 B: suma de las blancas N: suma de las negras e(n) = B - N / B + N Búsqueda Heurística 14

Efecto horizonte a c b -1-0,4-0,6 d = 3-1 horizonte -1-1 -1-0,4-0,5-0,3-0,2-1 -0,6-0,5-0,7 búsqueda Jugadas: a: perdedora b: retrasa el efecto de a c: no perdedora -1-1 -1-1....... Búsqueda Heurística 15 Efecto horizonte en ajedrez Efecto horizonte: una jugada que inicialmente parece buena puede resultar mala el peligro no se ve, está tras el horizonte la función de evaluación es incapaz de detectarlo Solución fuerza bruta: buscar más profundo coste computacional en ajedrez, hay muchos movimientos que pueden retrasar una jugada de peligro Aproximación selectiva: identificar los nodos en los que se debe profundizar más extensiones singulares Búsqueda Heurística 16

Extensiones singulares único nodo que justifica la decisión final d = 2 0,3 0,3 0,2 0,3 0,9 diferencia 0,2 0,2 significativa Buscar más debajo de ese nodo 0,3 0,3 0,2 extensión singular 0,9 0,2 0,2 búsqueda a 1 nivel más Búsqueda Heurística 17 Deep Blue Proyecto de IBM Alfa-beta paralelo: Hardware especializado (2 millones posiciones / sg) Extensiones singulares, quiescencia Función de evaluación sofisticada Biblioteca: aperturas y finales Resultados: Venció a Kasparov en 1997 Ratio 2700, Kasparov 2800 quantity had become quality Búsqueda Heurística 18

Algunas especulaciones Por qué los programas son buenos en ciertos juegos y en otros no? Hipótesis: Programa = búsqueda Rendimiento frente a humanos: aumenta con profundidad d Número de estados a visitar b d en tiempo fijado Depende de b factor de ramificación: Si b pequeño, se puede profundizar buen rendimiento Si b grande, no se puede profundizar rendimiento pobre Búsqueda Heurística 19 Algunas especulaciones Factor de ramificación: damas: 4 othello: < 10 el campeón mundial es un programa ajedrez: 36 go: 361 Otras ideas: aprendizaje (backgammon) dificultad cuando se intercambian muchas piezas Búsqueda Heurística 20

Resumen Juegos: objetivo de IA desde hace mucho tiempo 2 jugadores, perfecta información Árbol de juegos MiniMax: propaga valores de nodos terminales a internos Alfa-beta: genera poda Árbol demasiado grande: no se llega a nodos terminales Función de evaluación: sobre nodos a profundidad d Extensiones singulares Especulación: factor de ramificación Búsqueda Heurística 21