Tema 3: Juegos bipersonales

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Tema 3: Juegos bipersonales"

Transcripción

1 Tema 3: Juegos bipersonales Resumen: 3. Juegos bipersonales 3.1. Juegos bipersonales básicos (con información perfecta) 3.2. Juegos bipersonales con elementos de azar 3.3 Juegos bipersonales con información incompleta

2 Resolución de problemas con múltiples agentes

3 Entorno multiagente Situación: múltiples agentes (jugadores) actúan en el mismo entorno las acciones de los demás agentes influyen en la medida de rendimiento de cada agente ningún agente puede controlar las acciones de los demás agentes hasta cierto punto, un agente puede predecir las acciones de los demás Tipos de problemas multiagente : escenarios cooperativos: metas compartidas escenarios parcialmente cooperativos: algunas metas compartidas, otras opuestas escenarios antagónicos: metas opuestas

4 Escenarios antagónicos: Juegos de suma cero Juegos de suma cero: juegos donde las ganancias y perdidas suman cero lo que un jugador gana es lo que el otro pierde ejemplo clásico de escenarios antagónicos p.e.: Ajedrez, Póker, Juegos con recompensas: la ganancia /perdida tiene cantidad el jugador quiere maximizar la cantidad Juegos sin recompensas: solo se gana o se pierde Tipos de juegos: elementos de azar: con elementos de azar (backgammon) / sin elementos de azar (damas) información: información perfecta (damas) / información incompleta (póker)

5 Tema 3: Juegos bipersonales Resumen: 3. Juegos bipersonales 3.1. Juegos bipersonales básicos (con información perfecta) 3.2. Juegos bipersonales con elementos de azar 3.3 Juegos bipersonales con información incompleta

6 Modelar juegos bipersonales Modelo similar a la búsqueda con un único agente (juegos unipersonales): Estados: cada situación del juego define un estado Acciones: jugadas permitidas en una determinada situación los jugadores ejecutan sus acciones de forma alternando Estado inicial: estado actual del juego Estado final: estado en el que termina el juego Hay dos jugadores: max y min No se busca un plan de acciones ya que el jugador contrario influye en el progreso Objetivo de un agente: encontrar la mejor jugada para él (la jugada que tiene las mayores posibilidades de llevarle a ganar el juego)

7 Ejemplo: Tres en Raya Tres en Raya: dos jugadores (min y max) los jugadores van poniendo fichas en las casillas de un tablero 3x3 max usa las fichas X / min usa las fichas O una casilla puede contener como mucho una ficha Reglas: Inicialmente el tablero está vacío max empieza y los jugadores se van alternando en poner sus fichas max gana si obtiene una raya de tres fichas X min gana si obtiene una raya de tres fichas O si todas las casillas están ocupadas sin que haya una raya de 3 fichas del mismo tipo, hay empate gana max gana min empate

8 Modelar juegos bipersonales Conocimientos mínimos a priori de los agentes max y min : Nótese: s 0 posición inicial (estado inicial) expandir: s {s i1,..., s in } cjto. finito de posiciones sucesores terminal?: s true false prueba terminal U: s k, k R función parcial de utilidad del juego la función expandir codifica las jugadas (acciones) permitidas en una posición s supone implícitamente que los jugadores se alternan en realizar las jugadas la función de utilidad está definida sólo en los estados terminales s juegos de suma cero sin recompensas: max gana si y sólo si min pierde gana max: U(s) = + / gana min : U(s) = / empate: U(s) = 0

9 Ejemplo: Árbol de juego para Tres en Raya max min... max... min terminal 0 + utilidad

10 Árboles de juego Definición: Sea N un conjunto de nodos, E N N, L = {max,min}, y G = (N,E,L) un árbol etiquetado. G es un árbol de juego si G no es vacío la raíz está etiquetada max todos los sucesores de max son etiquetados min todos los sucesores de min son etiquetados max Observaciones: cada nivel del árbol de juego representa un ply (media jugada) en los nodos etiquetados max, es el turno del agente max en los nodos etiquetados min, es el turno del agente min las hojas de un árbol de juego (completamente desarrollado) representan las posiciones terminales del juego

11 Estrategias Problema del agente max: cómo determinar su mejor jugada? max podría aplicar métodos de búsqueda estándar, usando las posiciones en las que él gana como estados meta pero min no querría realizar las acciones que el plan de max prevé para él! Estrategia: define las jugadas de max para cada posible jugada de min un subárbol del árbol de juego Estrategia óptima (ó racional) : la estrategia que implica el mejor resultado garantizado para max escenarios totalmente antagónicos con agentes racionales: max puede asumir que min hará lo mejor para sí mismo, lo cual el lo peor para max la estrategia óptima para max es la estrategia minimax: maximizar la utilidad mínima en cada jugada

12 Ejemplo: estrategia minimax estrategia óptima: mejor jugada de max: a 1 max 0 a 1 a 2 a 3 min a 1,1 a 1,2 a 1,3 a 2,1 a 2,2 a 2,3 a 3,1 a 3,2 a 3,3 terminal utilidad

13 Método minimax Método Minimax: 1. Generar el árbol de juego completo 2. Aplicar la función de utilidad en cada nodo terminal 3. Propagar las utilidades hacia arriba en los nodos max, usar la utilidad máxima de los sucesores en los nodos min, usar la utilidad mínima de los sucesores 4. Eventualmente los valores de utilidad llegan al nodo raíz (max) 5. La jugada óptima de max es la que lleva al sucesor de utilidad máxima

14 Algoritmo Minimax básico Algoritmo: funciones mutuamente recursivas estado es el estado actual α : máximo de la utilidad de los sucesores de un nodo max β : mínimo de la utilidad de los sucesores de un nodo min {MaxValor en el Minimax básico} Función MaxValor(estado) Si terminal?(estado) entonces devolver(u(estado)) sucesores expandir(max, estado) α Para cada s sucesores hacer α max(α, MinValor(s)) devolver(α) Fin {MaxValor} {MinValor en el Minimax básico} Función MinValor(estado) Si terminal?(estado) entonces devolver(u(estado)) sucesores expandir (min, estado) β + Para cada s sucesores hacer β min(β,maxvalor(s)) devolver(β) Fin {MinValor}

15 Decisiones imperfectas Problema: crecimiento exponencial del árbol de juego incluso en juegos muy simples, es imposible desarrollar el árbol de juego completo hasta todos sus nodos terminales Solución: Heurísticas sustituir la prueba terminal por una prueba suspensión que detiene la búsqueda aún sin llegar a una posición terminal: límite de profundidad fijo posiciones en reposo aplicar una función de evaluación e, que estime la utilidad esperada del juego correspondiente a una posición s determinada suele ser función lineal ponderada : e(s) = w 1 f 1 (s) + w 2 f 2 (s) w n f n (s) Ajedrez: e(s) = suma de los valores materiales en s Tres en Raya: e(s) = nº de líneas abiertas para líneas max en s nº de líneas abiertas para líneas min en s

16 Ejemplo: minimax con suspensión estrategia óptima: mejor jugada de max: a 1 max 3 a 1 a 2 a 3 min a 1,1 a 1,2 a 1,3 a 2,1 a 2,2 a 2,3 a 3,1 a 3,2 a 3,3 evaluación e

17 Algoritmo Minimax con suspensión Algoritmo: funciones mutuamente recursivas estado es el estado actual α : máximo de la evaluación de los sucesores de un nodo max β : mínimo de la evaluación de los sucesores de un nodo min {MaxValor: Minimax con suspensión} Función MaxValor(estado) Si suspensión?(estado) entonces devolver(e(estado)) sucesores expandir(max, estado) α Para cada s sucesores hacer α max(α, MinValor(s)) devolver(α) Fin {MaxValor} {MinValor: Minimax con suspensión} Función MinValor(estado) Si suspensión?(estado) entonces devolver(e(estado)) sucesores expandir (min, estado) β + Para cada s sucesores hacer β min(β,maxvalor(s)) devolver(β) Fin {MinValor}

18 Ejemplo: Tres en Raya Suspensión en ply 3 max min max

19 Juegos con recompensas variables Juegos sin recompensas variables: gana max: U(s) = + / gana min : U(s) = / empate: U(s) = 0 Juegos de recompensas variables: por ejemplo ganar puntos/dinero/ La utilidad de un nodo hoja depende de la recompensa la propia recompensa puede define la utilidad La función de evaluación tiene que evaluar la recompensa esperada Ejemplo: cantidad de dinero que se gana, A veces la estrategia minimax es dudosa: 99 a 1 a ? a 1,1 a 1,2 a 1,3 a 2,1 a 2,2 a 2,

20 Ejercicio 3.1 Considérese el siguiente árbol de juego desarrollado hasta ply 3. Los nodos están etiquetados con los valores de la función de evaluación e. a) Evalúe el árbol del juego en base al algoritmo minimax. b) Cuál es la mejor jugada para el agente max?

21 Poda α-β Nótese: a veces es posible calcular la utilidad de un nodo sin tener que evaluar todos sus sucesores max 3 a 1 a 2 a 3 min a 1,1 a 1,2 a 1,3 a 2,1 a 2,2 a 2,3 a 3,1 a 3,2 a 3,

22 Poda α-β Utilidad más alta encontrada en un nodo max hasta el momento: α max min... β α Condición de poda: β α La utilidad U min del nodo min será como mucho β La utilidad U max del nodo max será al menos α No es necesario explorar los sucesores restantes de min, ya que se cumple en todo caso: U min β α U max

23 Poda α-β Utilidad más baja encontrada en un nodo min hasta el momento: β min max... α β Condición de poda: α β La utilidad U max del nodo max será al menos α La utilidad U min del nodo min será como mucho β No es necesario explorar los sucesores restantes de max, ya que se cumple en todo caso: U min β α U max

24 Minimax con poda α-β Algoritmo: funciones mutuamente recursivas estado es el estado actual α es el mejor valor de evaluación para max en el camino hasta estado β es el mejor valor de evaluación para min en el camino hasta estado {MaxValor: Minimax con poda α β} Función MaxValor(estado,α,β) Si suspensión?(estado) entonces devolver(e(estado)) sucesores expandir(max, estado) Para cada s sucesores hacer α max(α, MinValor(s,α,β )) Si α β entonces devolver(α) devolver(α) Fin {MaxValor} {MinValor: Minimax con poda α β} Función MinValor(estado,α,β) Si suspensión?(estado) entonces devolver(e(estado)) sucesores expandir (min, estado) Para cada s sucesores hacer β min(β,maxvalor(s,α,β )) Si β α entonces devolver(β) devolver(β) Fin {MinValor}

25 Ejercicio 3.2 Considerese el árbol de juego del ejercicio anterior. Evalúe el árbol utilizando el algoritmo minimax con poda α-β. Cuando aplica una poda, indique la condición de poda correspondiente

26 Resumen minimax Análisis: la eficiencia de minimax con poda α-β depende del orden en el que se exploran los nodos en promedio, la poda α-β permite expandir 50% menos nodos que minimax Problemas: efecto horizonte: la búsqueda se suspende justo cuando el jugador está por hacer una gran jugada suposición de racionalidad perfecta: suponga que max está a punto de perder si min juega de forma óptima sin embargo, hay una jugada que hace ganar a max, si min hace un solo error Extensiones: heurísticas fuertes basados en meta-razonamiento algoritmos de búsqueda guiados por la utilidad esperada de expandir un nodo

27 Tema 3: Juegos bipersonales Resumen: 3. Juegos bipersonales 3.1. Juegos bipersonales básicos (con información perfecta) 3.2. Juegos bipersonales con elementos de azar 3.3 Juegos bipersonales con información incompleta

28 Juegos bipersonales con elemento de azar Muchos jugos tienen elementos de azar: p.e.: cualquier juego con dados Cómo tratar estos elementos? Algoritmo: EXPEXTMINIMAX Idea: Utilizar el algoritmo minimax Añadir un nuevo jugador: azar que se incluye en el árbol siempre que haya un evento independiente de los jugadores y cuyo resultado es aleatorio Los sucesores de un nodo azar son las posibles situaciones que podrían ser el resultado de este elemento de azar p.e.: todos los posibles resultados de tirar un dado Cada uno de los sucesores de un nodo azar tiene asociado la probabilidad de que este resultado ocurra p.e.: en el caso del dado: P(1)=1/6,, P(6)=1/6

29 Ejemplo: Backgammon simplificado Estado inicial: Objetivo: mover las fichas al lado opuesto (max=, al campo 5 y min= al campo 0) Reglas: max empieza y los jugadores se van alternando sus jugadas Cada jugada consiste primero en tirar una moneda; la cara tiene el valor 1 y la cruz el valor 2. Después se mueve una de las fichas 1 o 2 campos en la dirección deseada (dependiendo del resultado de la tirada de la moneda) No es posible mover una ficha a un campo que tiene una ficha del oponente Si un jugador no puede mover sus fichas pierde su turno (si puede, tiene que mover una ficha) Gana el jugador que primero ha movido ambas fichas al campo deseado El elemento de azar ocurre antes de elegir la jugada

30 Ejemplo: Backgammon simplificado Representación eficiente de estados: (x1,x2,y1,y2) x1 y x2 posiciones de las fichas blancas e y1,y2 posiciones de las fichas negras Árbol del juego: (0,0,5,5) azar 1;1/2 2;1/2 max (1,0,5,5) (0,1,5,5) (2,0,5,5) (0,2,5,5) azar 1;1/2 2;1/2 min (1,0,4,5) (1,0,5,4) azar 1;1/2 2;1/2 max (2,0,4,5) (1,1,4,5) azar

31 Expectminimax Objetivo: elegir la mejor jugada para max Cómo propagar los valores de utilidad/evaluación de los nodos hoja a los nodos superiores? Solución: ExpectMinimax(n) = e(n) ; si n es nodo terminal o de suspensión max (ExpectMinimax(s)) ; si n es nodo max s expandir(max,n) min (ExpectMinimax(s)) ; si n es nodo min si n es nodo min s expandir(min,n) (P(s) ExpectMinimax(s)) ; si n es nodo azar s expandir(min,n) Implementación: ejercicio

32 Ejemplo: Backgammon simplificado Situación actual: (toca a max) cara (3,4,1,2); max tiene que mover una ficha (blanca) una posición Suponemos el algoritmo expectminimax con un nivel de suspensión de 5 Como función de evaluación se usa la siguiente: e((a,b,c,d))=a+b+c+d valores altos de a y b son buenos para max porque indican que sus fichas están cerca de la meta (5) valores altos de c y d son buenos para max porque indican que las fichas de min estan lejos de su meta (0) para el estado actual: e((3,4,1,2))=10

33 max (3,5,1,2) (4,4,1,2) azar min 1;1/2 2;1/2 1;1/2 2;1/2 azar (3,5,1,0) (3,5,0,2) (4,4,0,2) (4,4,1,0) (4,4,1,1) (3,5,1,1) (4,5,0,2) (5,5,0,2) (4,5,1,0) (5,5,1,0) (4,5,1,1) (4,4,1,1) (4,5,0,2) (4,4,0,2) (5,4,1,0) (4,4,1,0) (5,4,1,1) (5,4,0,2) (4,5,1,0) (4,5,1,1) (5,5,1,1) e(nodo) max 1;1/2 2;1/2 1;1/2 2;1/2 1;1/2 2;1/2 1;1/2 2;1/2 1;1/2 2;1/2 2;1/2 1;1/ ,5 10,5 9,5 11,5 11,5 10,5 10,5 9,5 11,5 10,

34 Funciones de evaluación/utilidad Criterios de los funciones de evaluación/utilidad: no pueden devolver + o (los nodos azar tendrían siempre valores + o ) la escala de los valores si importa (no como en el algoritmo minimax): max 2,1 4,9 azar min 0,9 2 2,1 0,1 3 0,9 1 1,3 0,1 4 0,9 2 4,8 0,1 30 0,9 1 4,9 0,

35 Funciones de evaluación/utilidad Caso ideal: La función de evaluación debe ser una transformación lineal positiva de la probabilidad de ganar (o de la recompensa esperada) e(nodo) P(ganar nodo) Muchas veces es difícil establecer una función e que cumple este criterio (véase el ejemplo) Juegos con recompensas: la propia recompensa suele proporcionar una buena función de evaluación Ejemplo: backgammon simplificado donde, además, el perdedor paga al ganador 1 euro por cada unidad de distancia de sus fichas respecto a la meta

36 Estrategia ExpectMinimax/ Estartegias alternativas Estrategia del algoritmo ExpectMinimax: max siempre hace lo mejor para él (máximo) max azar min siempre hace lo mejor para si mismo (mínimo) 1,8 1,4 0,1 nodos de azar se pondera la utilidad por la probabilidad 0,7 0,3 0,4 0,6 0,9 0, Estrategia optimista elige el máximo en los nodos de azar Estrategia pesimista elige el mínimo en los nodos de azar ,7 0,3 0,4 0,6 0,9 0,1 0,7 0,3 0,4 0,6 0,9 0,

37 El dinero como función de utilidad El dinero puede proporcionar una función de utilidad Pero considera el siguiente ejemplo: Un ganador de un concurso puede aceptar el premio de euros o jugarse el premio a cara y cruz. Si acierta gana el euros y si no acierta pierde todo E 0,5 0, E 0 E E Mejor U(s) (0..10): U(0E)=0; U( E)=8; U( E)= E U=8 0,5 0,5 U=4,5 0 E U= E U=9

38 Complejidad ExpectMinimax Proporcional al número de nodos en el árbol d- nivel de suspensión, b- factor de ramificación Si no tuviéramos nodos de azar, sería la misma complejidad que en el minimax: O(b d ) Si en cada jugada existe un elemento de azar con n posibilidades, la complejidad se convierte en O(b d *n d ) Ejemplo Backgammon: n=21 (2 dados) y b 20 Nr. jugadas anticipadas incluyendo un nivel azar (d) Nr. nodos (ap.) 1 20*21=

39 max Ejercicio 3.3 Considere el siguiente árbol de juego. Evalúe el árbol utilizando el algoritmo expectminimax. Las probabilidades de los diferentes nodos son 0,5 para cada acción en los nodos de azar del nivel 3 y los que se indican en el árbol para los nodos de nivel 1. azar min 0,2 0,1 0,7 0,1 0,9 0,3 0,7 azar

40 Varios jugadores y alternancia no simétrica Para más (o menos) jugadores y alternancias no estrictamente simétricas Ejemplo: Parchis: Si un jugador tiene un seis le toco otra vez La oca : de oca en oca y tiro porque me toca Minimax y Expectminimax son igualmente aplicables: simplemente se añaden los nodos correspondientes en la posición correspondiente en el árbol min max azar 0,2 0,1 0,7

41 Ejercicio 3.4 El algoritmo ExpectMinimax también es aplicable en determinados casos en los que sólo actúa un agente y en los que existen elementos de azar. Considere el siguiente juego. Un agente A quiere apostar dinero en una casa de apuestas. Las reglas de las apuestas son siempre las mismas: hay una probabilidad de ganar del 0,4 y de perder del 0,6. El agente puede elegir entre las siguientes acciones: irse a casa con el dinero que le queda, o apostar cualquier cantidad (entera) de su dinero. Utilice el algoritmo ExpectMinimax para decidir que le conviene hacer al agente si tiene un euro. Para ello realiza el árbol hasta incluyendo dos rondas de apuestas. Qué función de evaluación se puede usar?

42 Tema 3: Juegos bipersonales Resumen: 3. Juegos bipersonales 3.1. Juegos bipersonales básicos (con información perfecta) 3.2. Juegos bipersonales con elementos de azar 3.3 Juegos bipersonales con información incompleta

43 Juegos bipersonales con información incompleta En muchos juegos los jugadores no conocen el estado del juego completamente El agente solo tienen información parcial sobre el estado actual El agente sólo sabe que el juego se encuentra en alguno de los estados que concuerdan con la información de la que disponen El estado actual real es uno de una serie de estados posibles Ejemplo: juegos con cartas (que se reparten al principio), bridge, versiones simples de póker, (Primera) Idea: Considerar cada posible valor de los parámetros desconocidos y su probabilidad de ocurrencia / crear un árbol para cada posible estado Aplicar el algoritmo ExpectMinimax Elegir la acción que es mejor en todos los posibles casos

44 ExpectMinimax con información incompleta Situación actual del agente: En un momento dado (estado indeterminado s 0 ) existen n combinaciones distintas de valores para los parámetros desconocidos (estados posibles s 1,,s n ) La probabilidad de que el estado actual sea s i es p(s i ) con p(s 1 )+ +p(s n )=1 El agente puede elegir entre m posibles acciones: a 1,,a m Combinar todos los posibles árboles (para todos los posibles estados s 1,,s n ) s 1 s 0 p(s 1 ) p(s n ) a 1 a m a 1 a m U(a 1 s 1 ) U(a U(a 1 s n ) m s 1 ) Obtener las utilidades para cada acción y cada posible estado s i n Calcular la utilidad de cada acción: U ( a ) = p( s ) U ( a s ) Realizar la acción a i que maximize U(a i ) i k = 1 k s n i k U(a m s n )

45 Ejemplo 1: Apuestas 1 Dos jugadores (min y max) y una baraja de cartas con 2 ases (A), 2 reyes (K) y 2 reinas (Q). Reglas: Cada jugador pone un euro en el bote. Después obtiene una carta. A continuación max puede pasar (min gana el bote), o puede apostar 2 o 4 euros. Min puede pasar (max gana el bote) o igualar (poner igualmente dos euros). Si min igual la apuesta de max, ambos enseñan sus cartas. Gana el bote aquel jugador cuyas cartas tiene mayor valor (A>K>Q) Si ambas cartas tienen el mismo valor entonces se reparte el bote (nadie gana ni pierde). Problema para max: max ha tenido una carta K y no conoce la carta de min Qué acción conviene a max?

46 Aplicar ExpectMinimax: Apuestas 1 <K,?> <K,Q> 2/5 1/5 <K,K> 2/5 <K,A> -1 p 4 2 p p 4 2 p i p i p i p i p i p i Calcular la utilidad de cada acción: U( p) = 2 / / / 5 1= 1 U( 2) = U( 4) = 2 / 2 / / / / / 5 3 = 0, = 14, Acción óptima: apostar 2 euros

47 Aplicar ExpectMinimax: Apuestas 1 Porqué la utilidad de apostar 2 euros es -0,8? max tiene mayores posibilidades de perder dinero que de ganar dinero Analizamos: si max tiene un K y apuesta 2 euros: Si min tiene K (probabilidad 1/5) max no pierde nada Si min tiene A (probabilidad 2/5) max pierde 3 euros solo en el peor de los casos, es decir, si min iguala la apuesta es lo que debería hacer min si tiene A Si min tiene Q (probabilidad 2/5) max gana 1 euro solo en el peor de los casos, es decir, si min pasa eso es lo más razonable para min si tiene Q el algoritmo siempre considera el peor caso para max se supone que min siempre actúa lo mejor posible La solución es razonable: En muchos casos este algoritmo funciona aceptablemente bien

48 Ejemplo 2: Adivina la carta Consideramos el siguiente juego hipotético: min coge una carta de una baraja (A o K con la misma probabilidad) y max tiene que adivinarla max puede pasar o intentarlo. si pasa min le paga 1 euro Luego min decide si pasa (tiene que pagar 10 euros a max) o permite a max que lo intente. Finalmente, max intenta adivinar la carta. Si acierta gana 5 euros de min y si no acierta pierde 5 euros a min.

49 Ejemplo 2: Adivinar la carta <K> 1/2 <?> 1/2 <A> p i p i p i p K A +5-5 Qual es la mejor jugada para max: pasar o intentarlo? +5 i +5 K A U ( p) = 1/ / 2 1 = 1 U ( i) = 1/ / 2 5 = 5 Según el algoritmo, max debe intentar de adivinar la carta aunque tenga un 50% de posibilidad de perder 5 euros. Mientras si pasa gana 1 euro seguro.

50 Porqué no funciona bien el algoritmo? El algoritmo es: demasiado optimista para max Se supone que max siempre hace lo mejor para él Si la carta que tiene min es K max dirá K Si la carta que tiene min es A max dirá A PERO: en realidad max no sabe la carta que tiene min Para hacer lo mejor para si mismo, max necesita toda la información sólo tiene información parcial Solución: ExpectMinimax con estados de creencias

51 Primero formalizar mejor el proceso de decisión en juegos bipersonales Antes de nada: Formalizar el modelo de transición de estados del problema (el espacio de estados). Esta formalización es la misma para minimax y expectminimax y minimax con estados de creencia! Tenemos (conocimientos a priori del agente): estados, conjunto S={s 0,s 1, } acciones, conjunto de acciones AC={a 1, a 2, } Conocimientos a priori y suposiciones: En cada estado hay un conjunto de acciones aplicables Sea A: S AC {0,1} una función que estima si se puede aplicar a en s 1, si a es aplicable al estado s A(s,a) = 0, en otro caso

52 Primero formalizar mejor el proceso de decisión en juegos bipersonales Más conocimientos a priori: Cada realización de una acción en un estado lleva con una determinada probabilidad a otro estado y genera una observación el agente percibe las observaciones después de que se haya realizado la acción s 3 a,1/4,o 1 s 1 a,3/4,o 2 s 2 aplicar a en s 3 lleva con probabilidad ¼ a s 1 (generando o 1 ) y con probabilidad ¾ a s 2 (generando o 2 ) Conjunto posible de observaciones en el dominio: OB={o 1, o 2, } Se supone una observación por defecto o d OB que se percibe si no se observa nada (p.e.: mi oponente coge una carta y no me la enseña)

53 Primero formalizar mejor el proceso de decisión en juegos bipersonales Más conocimientos a priori: Formalizar las transiciones: s 3 a,1/4,o 1 a,3/4,o 2 s 1 s 2 T:S AC S [0,1] es un modelo de transición T(s,a,s ) denota la probabilidad de que la acción a aplicado a s lleva al estado s (p. E.:T(s 3,a,s 1 )=1/4) T cumple que: T(s,a,s' s' S ) = 1, si A(a,s) = 1 0, en otro caso

54 Primero formalizar mejor el proceso de decisión en juegos bipersonales Más conocimientos a priori: Formalizar las observaciones: s 3 a,1/4,o 1 a,3/4,o 2 s 1 s 2 O: S AC S OB {0,1} es un modelo de observaciones 1, si la transición del estado s al estado s' O( s, a, s', o) = con la acción a genera la observación o 0, en otro caso O determina si una observación se genera como resultado de aplicar a a s y teniendo como estado resultado s (p. E.:O(s 3,a,s 1,o 1 )=1) Se supone: Cada tupla S AC S tiene una y sólo una observación asociada Esta observación puede ser la observación por defecto o d

55 Primero formalizar mejor el proceso de decisión en juegos bipersonales Más conocimientos a priori: Los modelos de observaciones y transiciones definen 3 tipos de acciones posibles: Acciones deterministas Acciones con elementos de azar no observables Acciones con elementos de azar observables s 3 a,1,o 1 s 1 s 3 a,1/4,o 1 s 1 s 3 a,1/4,o 1 s 1 a,3/4,o 1 s 2 a,3/4,o 2 s 2 - el resultado de a en s es determinista - solo hay una posible observación - resultado observable - p.e.: jugar un as - el resultado de a en s es probabilística - la observación recibida es siempre la misma - resultado no observable - p.e.: coger una carta min - el resultado de a en s es probabilística - la observación recibida es distinta en cada caso - resultado observable - p.e.: coger una carta max

56 Primero formalizar mejor el proceso de decisión en juegos bipersonales Ejemplo: Supón un juego hipotético con cartas: 4 ases (A) y 4 reyes (K) Cada jugador tiene unas cartas de la baraja (y no ve las cartas del otro jugador) Los jugadores se alternan Hay dos turnos de coger cartas En cada turno cada jugador puede coger una carta o pasar Al final gana el que tiene mayor proporción de ases respecto a reyes y, si ámbos tiene la misma proporción, el que tiene más ases Como se definirían los elementos del modelo de transición?: Estados, Acciones, Observaciones A(s i,a)=? T(s i,a,s j )=? O(s i,a,s j,o k )=?

57 Primero formalizar mejor el proceso de decisión en juegos bipersonales Ejemplo: Estados: <x,y>; x - las cartas de max; y las cartas de min S={<x,y> con x,y {{},{A},{K},{A,A},{A,K}, } } Acciones: AC={ coger carta max, coger carta min, pasar max, pasar min } Observaciones: OB={ K, A, nada ) A(s i,a): definido por las reglas del juego Están definidos por las reglas del juego, A(<x,y>, pasar max,<x,y>)=1, si le toca a max A(<x,y>, pasar min,<x,y>)=1, si le toca a min A(<x,y>, coger carta min,<x,y>)=1, si le toca a min A(<x,y>, coger carta max,<x,y>)=1, si le toca a max Se supone que se controla el progreso (a quien toca en cada momento y que acciones puede realizar) del juego por algún mecanismo a parte.

58 Primero formalizar mejor el proceso de decisión en juegos bipersonales Ejemplo: T(s,a,s ): definido por las reglas del juego Sea s=<x,y> y x e y el número de cartas de max y min; y x A, y A, x K e y K el número de ases y de reyes de max y min T(<x,y>, pasar max,<x,y>)=1 T(<x,y>, pasar min,<x,y>)=1 T(<x,y>, coger carta max,<x {A},y>) =(4- x A y A )/(8- x - y ) T(<x,y>, coger carta max,<x {K},y>) =(4- x K y K )/(8- x - y ) T(<x,y>, coger carta min,<x,y {A}>) =(4- x A y A )/(8- x - y ) T(<x,y>, coger carta min,<x,y {K}>) =(4- x K y K )/(8- x - y ) Para todas las demás pares de (s,a,s ): T(s,a,s )=0

59 Primero formalizar mejor el proceso de decisión en juegos bipersonales Ejemplo: O(s i,a,s j,o k ): definido por las reglas del juego O(<x,y>, pasar max,<x,y>,nada)=1 O(<x,y>, pasar min,<x,y>,nada)=1 O(<x,y>, coger carta max,<x {A},y>,A) =1 O(<x,y>, coger carta max,<x {K},y>,K) =1 O(<x,y>, coger carta min,<x,y {A}>,nada) =1 O(<x,y>, coger carta min,<x,y {K}>,nada) =1 Para todas las demás pares de (s,a,s,o): O(s,a,s,o)=0

60 Primero formalizar mejor el proceso de decisión en juegos bipersonales El modelo de transición define el grafo del problema (espacio de estados): La misma acción puede llevar a diferentes estados (con alguna probabilidad) <{A},{K,A}> coger carta max, p=2/5, A <{A,A},{K,A}> coger carta min, p=2/5,nada <{A,A},{K,K}> coger carta min, p=3/5,nada pasar max, p=1, nada coger carta max, p=3/5, K <{A,A},{K}> pasar min, p=1, nada coger carta max, p=2/5, A <{A,A,K},{K}> <{A,A,A},{K}>

61 ExpectMinimax con estados de creencias Los jugadores no conocen exactamente el estado actual del juego sólo tienen información parcial del estado del juego sólo saben que el juego se encuentra en alguno de los estados que concuerdan con la información de la que disponen Estados de creencia: anotado por b distribución de probabilidad sobre todos los posibles estados del juego Sea S={s 1,,s n } el conjunto de estados del problema/juego. b=((s 1,p 1 ),,(s n,p n )) p i = probabilidad/creencia de que el estado actual es s i p 1 + +p n =1 Representación comprimida de un estado de creencia: omitir todos los estados con probabilidad 0 Definimos b(s)= la probabilidad del estado s en el estado de creencia b Si b=((s 1,p 1 ),,(s n,p n )), entonces b(s 1 )=p 1 Idea: Adaptar EpectMinimax a los estados de creencia

62 Ejemplos: Apuestas 1: Estado de creencias Estados: <x,y>, x,y {K,Q,A} x- carta de max, y- carta de min Situación actual: ambos jugadores tienen una carta, max tiene K y no sabe la carta de min Estado de creencia (comprimido) de max: ((<K,Q>, 2/5),(<K,K>, 1/5), (<K,A>, 2/5)) Adivinar la carta: Estados: <x>, x {K,A} x- carta que tiene min Situación actual: min tiene una carta y max no sabe cual es Estado de creencia (comprimido) de max: ((<K>, 1/2),(<A>, 1/2)) OJO: Por simplicidad omitimos otra información que está contenida en el estado/estado de creencia acerca de la situación actual del juego p.e.: en qué momento del juego se está, quién tiene el turno,

63 ExpectMinimax con estados de creencias Problemas a resolver: 1. Cómo cambia el estado de creencia al realizar una acción? crear el árbol del juego 2. Cómo se evalúa la utilidad de un estado de creencia? evaluar los nodos hoja 3. Cómo propagar la utilidad a los nodos superiores del árbol? propagar las utilidades para tomar una decisión

Búsqueda en línea y Búsqueda multiagente

Búsqueda en línea y Búsqueda multiagente Búsqueda en línea y Búsqueda multiagente Ingeniería Informática, 4º Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani 1 Tema 2: Agentes basados en Búsqueda Resumen: 2. Agentes basados

Más detalles

Curso 2012-2013 15/10/12. Inteligencia Artificial (30223) Lección 5. Juegos. Índice. Juegos. Los juegos son una forma de entorno multiagente

Curso 2012-2013 15/10/12. Inteligencia Artificial (30223) Lección 5. Juegos. Índice. Juegos. Los juegos son una forma de entorno multiagente Inteligencia Artificial (30223) Lección 5. Juegos Curso 2012-2013 José Ángel Bañares 15/10/2013. Dpto. Informática e Ingeniería de Sistemas. Índice Juegos Decisiones optimas Poda α-β Juegos con información

Más detalles

Búsqueda Heurística IV

Búsqueda Heurística IV Búsqueda Heurística IV Pedro Meseguer IIIA-CSIC Bellaterra, Spain pedro@iiia.csic.es 2 jugadores Búsqueda para juegos Perfecta información: cada jugador conoce toda la información del contrario no hay

Más detalles

Juegos deterministas. Ajedrez, damas, Go, Othello. barquitos

Juegos deterministas. Ajedrez, damas, Go, Othello. barquitos Búsqueda con adversario: Juegos Fernando Berzal, berzal@acm.org Tipos de juegos Juegos deterministas Juegos de azar Con información perfecta Con información imperfecta Ajedrez, damas, Go, Othello barquitos

Más detalles

Juegos deterministas. Ajedrez, damas, Go, Othello. barquitos

Juegos deterministas. Ajedrez, damas, Go, Othello. barquitos Árboles de juegos Análisis y Diseño de Algoritmos Tipos de juegos Juegos deterministas Juegos de azar Con información perfecta Con información imperfecta Ajedrez, damas, Go, Othello barquitos Backgammon,

Más detalles

Inteligencia Artificial Búsqueda entre adversarios

Inteligencia Artificial Búsqueda entre adversarios Inteligencia Artificial Búsqueda entre adversarios Primavera 27 profesor: Luigi Ceccaroni Juegos En los entornos multiagente (cooperativos o competitivos), cualquier agente tiene que considerar las acciones

Más detalles

Manejo de la Información

Manejo de la Información Los juegos de azar Manejo de la Información Que las y los estudiantes deduzcan y argumenten que la probabilidad de que un evento suceda está relacionada con la frecuencia en que ocurre el resultado esperado

Más detalles

1. Juegos de suma cero con dos jugadores

1. Juegos de suma cero con dos jugadores Teoría de juegos Jesús López Fidalgo Esta teoría está íntimamente relacionada con la teoría de la decisión. Lo que diferencia una de otra es el rival contra el que se entra en juego. En la teoría de la

Más detalles

Universidad Diego Portales Facultad de Economía y Empresa

Universidad Diego Portales Facultad de Economía y Empresa Suponga que, conversando con su cuate, surge la idea de hacer una apuesta simple. Cada uno escoge decir cara ó sello. Se lanza una moneda al aire, y si sale cara, quien dijo sello le paga a quien dijo

Más detalles

Juegos. Esquema. Introducción: juegos como búsqueda Decisiones perfectas Decisiones imperfectas Poda α β

Juegos. Esquema. Introducción: juegos como búsqueda Decisiones perfectas Decisiones imperfectas Poda α β Juegos Transparencias IA (F29) M.Marcos, 2002 (Figuras c S.Russell & P.Norvig, 1998) 1 Esquema Introducción: juegos como búsqueda Decisiones perfectas Decisiones imperfectas Poda α β Transparencias IA

Más detalles

Práctica 1 El juego de los chinos

Práctica 1 El juego de los chinos Práctica 1 El juego de los chinos Fecha de entrega: 6 de diciembre Según una teoría, el conocido como juego de los chinos nació en el año 1787 en un pequeño pueblo de León. Felipe Valdeón Triguero, un

Más detalles

10. Probabilidad y. Estadística

10. Probabilidad y. Estadística 10. Probabilidad y Estadística Ámbito científico 1. Saltos de canguro 2. Pares y nones 3. La travesía del río 4. Las tres fichas 5. Las tres ruletas 6. El dado ganador 7. El reparto 8. Lotería 9. Lotería

Más detalles

Tema 7: Juegos con información incompleta

Tema 7: Juegos con información incompleta Tema 7: Juegos con información incompleta Microeconomía Avanzada II Iñigo Iturbe-Ormaeche U. de Alicante 2008-09 Modelo de Spence Introducción y ejemplos Equilibrio Bayesiano de Nash Aplicaciones Señales

Más detalles

INVESTIGACIÓN DE OPERACIONES

INVESTIGACIÓN DE OPERACIONES INVESTIGACIÓN DE OPERACIONES Teoría de Juegos MSc. Julio Rito Vargas A. Fecha: 06/11/2014 06/11/2014 Contenidos Conceptuales 1.- Definición de un juego. 2.- Elementos de un juego. 3.- Tipos de juegos:

Más detalles

Teoría del Juego - Juegos Combinatoriales Imparciales

Teoría del Juego - Juegos Combinatoriales Imparciales Teoría del Juego - Juegos Combinatoriales Imparciales Carlos Gámez Taller de Resolución de Problemas Escuela de Matemática Universidad de El Salvador Estudio de Casos Esquema Introducción Juegos de Agarrar

Más detalles

BLACK JACK. BACCARAT (Light)

BLACK JACK. BACCARAT (Light) BLACK JACK La finalidad de este juego es tener una mano de mayor valor en puntos en total que el dealer, sin sobrepasar 21 puntos. Cada carta tiene su valor, las figuras valen 10 y el As toma el valor

Más detalles

Estrategias en Juegos

Estrategias en Juegos Estrategias en Juegos Reglas comunes a todos los juegos, salvo que se indique lo contrario: Torres Los juegos son para dos jugadores. Cada jugador mueve por turnos, según las reglas del juego. No puede

Más detalles

Enseñar Matemáticas en el siglo XXI INDICADORES DE LAS COMPETENCIAS (PISA 2003)

Enseñar Matemáticas en el siglo XXI INDICADORES DE LAS COMPETENCIAS (PISA 2003) INDICADORES DE LAS COMPETENCIAS (PISA 2003) Pensar y razonar Plantear cuestiones propias de las matemáticas ( cuántos hay? Cómo encontrarlo? Si es así, entonces etc.) Conocer los tipos de respuestas que

Más detalles

ANÁLISIS DE UN JUEGO DE CARTAS: LAS SIETE Y MEDIA

ANÁLISIS DE UN JUEGO DE CARTAS: LAS SIETE Y MEDIA ANÁLISIS DE UN JUEGO DE CARTAS: LAS SIETE Y MEDIA MaMaEuSch (Management Mathematics for European School) http://www.mathematik.uni-kl.de/~mamaeusch/ Modelos matemáticos orientados a la educación Clases

Más detalles

(d) Puede haber estrategias que funcionan mejor que Minimax si el contrincante es

(d) Puede haber estrategias que funcionan mejor que Minimax si el contrincante es Universidad Rey Juan Carlos Curso 2014 2015 Hoja de Problemas Tema 5 1. Cuáles de las siguientes afirmaciones acerca del algoritmo Minimax son ciertas (a) El algoritmo Minimax realiza una exploración primero

Más detalles

(e) Con la poda alfa-beta se eliminan nodos que nunca serán alcanzados

(e) Con la poda alfa-beta se eliminan nodos que nunca serán alcanzados Universidad Rey Juan Carlos Curso 2014 2015 Hoja de Problemas Tema 5 1. Cuáles de las siguientes afirmaciones acerca del algoritmo Minimax son ciertas (a) El algoritmo Minimax realiza una exploración primero

Más detalles

(e) Con la poda alfa-beta se eliminan nodos que nunca serán alcanzados

(e) Con la poda alfa-beta se eliminan nodos que nunca serán alcanzados Universidad Rey Juan Carlos Curso 2014 2015 Hoja de Problemas Tema 5 1. Cuáles de las siguientes afirmaciones acerca del algoritmo Minimax son ciertas (a) El algoritmo Minimax realiza una exploración primero

Más detalles

JUEGOS DE INTERIOR PARA GUARDIAS, TUTORÍAS Y RATOS DE OCIO

JUEGOS DE INTERIOR PARA GUARDIAS, TUTORÍAS Y RATOS DE OCIO JUEGOS DE INTERIOR PARA GUARDIAS, TUTORÍAS Y RATOS DE OCIO AUTORÍA LUIS SERRANO CORTÉS TEMÁTICA ENSEÑANZA DIVERTIDA ETAPA PRIMARIA Y ESO. Resumen En el trabajo con nuestros alumnos nos encontramos con

Más detalles

Puede dar pérdida un Casino?

Puede dar pérdida un Casino? Puede dar pérdida un Casino? por Ernesto Mordecki En esta nota calculamos la probabilidad de que pierda la banca en la ruleta, en un período dado de tiempo. uestro enfoque consiste en determinar cuantas

Más detalles

I, PokerBot. Never let your sense of morals get in the way of doing what s right. Isaac Asimov. Juan Lao Tebar

I, PokerBot. Never let your sense of morals get in the way of doing what s right. Isaac Asimov. Juan Lao Tebar I, PokerBot Never let your sense of morals get in the way of doing what s right. Isaac Asimov Juan Lao Tebar 7 de enero de 2014 Resumen Este documento explica la motivación, el funcionamiento y la implementación

Más detalles

Práctica 1 - Pista de Carreras 12407 - Programación II

Práctica 1 - Pista de Carreras 12407 - Programación II 1. Introducción Práctica 1 - Pista de Carreras 12407 - Programación II En esta práctica el objetivo es implementar una matriz de adyacencia para el juego Pista de Carreras. Con tal fin, primero hay que

Más detalles

Tema 7: Estadística y probabilidad

Tema 7: Estadística y probabilidad Tema 7: Estadística y probabilidad En este tema revisaremos: 1. Representación de datos e interpretación de gráficas. 2. Estadística descriptiva. 3. Probabilidad elemental. Representaciones de datos Cuatro

Más detalles

Copyright 2015 Wealth & Trust. Todos los derechos reservados. www.wealthntrust.com

Copyright 2015 Wealth & Trust. Todos los derechos reservados. www.wealthntrust.com Copyright 2015 Todos los derechos reservados www.wealthntrust.com Tabla de contenido No tener un plan de Trading 1 Falta de disciplina para respetar el plan. 2 No negociar a favor de la tendencia o la

Más detalles

El juego de cartas de 2 a 6 jugadores, para tratantes de ganado avispados.

El juego de cartas de 2 a 6 jugadores, para tratantes de ganado avispados. Kuhhandel Master El juego de cartas de 2 a 6 jugadores, para tratantes de ganado avispados. Contenido 40 cartas de animal con el dorso rojo. 10 cartas de pedigree con el dorso rojo (Una por cada animal)

Más detalles

La estrategia básica para jugar blackjack.

La estrategia básica para jugar blackjack. La estrategia básica para jugar blackjack. Por Carlos Zilzer. Concepto básico: En cada turno, el jugador tiene que seleccionar una de 3 posibles jugadas: Plantarse, Pedir una carta o Doblar la apuesta.

Más detalles

EVALUACIÓN 11 B) 150 1 C) 2 D) 15 E) 30

EVALUACIÓN 11 B) 150 1 C) 2 D) 15 E) 30 EVALUACIÓN 1. Si la probabilidad que llueva en San Pedro en verano es 1/30 y la probabilidad que caigan 100 cc es 1/40, cuál es la probabilidad que no llueva en San Pedro y que no caigan 100 cc? A) 1/1200

Más detalles

Universidad Carlos III de Madrid Teoría de Juegos Lista de Ejercicios de Juegos Repetidos y Bayesianos

Universidad Carlos III de Madrid Teoría de Juegos Lista de Ejercicios de Juegos Repetidos y Bayesianos Sesión 1: 1, 2, 3, 4 Sesión 2: 5, 6, 8, 9 Universidad Carlos III de Madrid Teoría de Juegos Lista de Ejercicios de Juegos Repetidos y Bayesianos 1. Considere el siguiente juego en forma normal: Jugadora

Más detalles

Mamut Matemáticas Sumar 1. Índice. Introducción...

Mamut Matemáticas Sumar 1. Índice. Introducción... Mamut Matemáticas Sumar 1 Índice Introducción... 4 Juegos... 5 Recursos en Internet... 6 Dos grupos y un total... 8 Aprender los símbolos + y =... 11 Práctica de sumar 1... 14 Qué número es mayor?... 16

Más detalles

Métodos Estadísticos 2.3. Distribuciones discretas de probabilidad

Métodos Estadísticos 2.3. Distribuciones discretas de probabilidad 2.3. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD Parámetros de un problema Saber: Explicar el concepto de variable discreta. Explicar los conceptos y métodos de la distribución binomial, hipergeométrica,

Más detalles

Capítulo 12: Indexación y asociación

Capítulo 12: Indexación y asociación Capítulo 12: Indexación y asociación Conceptos básicos Índices ordenados Archivos de índice de árbol B+ Archivos de índice de árbol B Asociación estática Asociación dinámica Comparación entre indexación

Más detalles

Un juego de cartas: Las siete y media

Un juego de cartas: Las siete y media Un juego de cartas: Las siete y media Paula Lagares Federico Perea Justo Puerto * MaMaEuSch ** Management Mathematics for European Schools 94342 - CP - 1-2001 - DE - COMENIUS - C21 * Universidad de Sevilla

Más detalles

Tarea 2: Diseño CrossOver

Tarea 2: Diseño CrossOver Tarea 2: Diseño CrossOver Tomas Neira 7 de Junio de 2006 CrossOver El tema principal de este juego es el conflicto por territorio. Esto no es en el mismo sentido que en el GO, sino que las posiciones relativas

Más detalles

MOOC UJI: La Probabilidad en las PAU

MOOC UJI: La Probabilidad en las PAU 3. Definición intuitiva de probabilidad: ley de Laplace La palabra probabilidad, que usamos habitualmente, mide el grado de creencia que tenemos de que ocurra un hecho que puede pasar o no pasar. Imposible,

Más detalles

Ra Un juego de Reiner Knizia Traducción de Manuel Suffo

Ra Un juego de Reiner Knizia Traducción de Manuel Suffo Ra Un juego de Reiner Knizia Traducción de Manuel Suffo Un juego de desafío de Hombres Dioses y sus Monumentos El juego simula 1500 años de historia egipcia. Tienes que expandir tu poder y fama. Hay muchas

Más detalles

Introducción a la Teoría de Probabilidad

Introducción a la Teoría de Probabilidad Capítulo 1 Introducción a la Teoría de Probabilidad Para la mayoría de la gente, probabilidad es un término vago utilizado en el lenguaje cotidiano para indicar la posibilidad de ocurrencia de un evento

Más detalles

EJ:LANZAMIENTO DE UNA MONEDA AL AIRE : S { } { } ESPACIO MUESTRAL:CONJUNTO DE TODOS LOS SUCESOS ELEMENTALES DE UN EXPERIMENTO ALEATORIO.

EJ:LANZAMIENTO DE UNA MONEDA AL AIRE : S { } { } ESPACIO MUESTRAL:CONJUNTO DE TODOS LOS SUCESOS ELEMENTALES DE UN EXPERIMENTO ALEATORIO. GUIA DE EJERCICIOS. TEMA: ESPACIO MUESTRAL-PROBABILIDADES-LEY DE LOS GRANDES NUMEROS. MONTOYA.- CONCEPTOS PREVIOS. EQUIPROBABILIDAD: CUANDO DOS O MAS EVENTOS TIENEN LA MISMA PROBABILIDAD DE OCURRIR. SUCESO

Más detalles

Lima, 28 de febrero de 2007

Lima, 28 de febrero de 2007 N 110-2007-MINCETUR/VMT/DGJCMT Lima, 28 de febrero de 2007 Visto, el Expediente N 000068-2007-MINCETUR, de fecha 17.01.2007, en el que la empresa Corporación Turística Peruana S.A.C., solicita autorización

Más detalles

BINGO. mybingo - mybaccarat - myblackjack (21) - myruleta

BINGO. mybingo - mybaccarat - myblackjack (21) - myruleta BINGO Nuestro sitio le ofrece una sala de Chat donde usted puede jugar con otros jugadores de todo el país Puedes jugar hasta 30 cartones de Bingo a la vez, Y con nuestro marcador automático te asegurará

Más detalles

REPRESENTACIÓN DE UNA DISTRIBUCIÓN DE PROBABILIDAD DISCRETA

REPRESENTACIÓN DE UNA DISTRIBUCIÓN DE PROBABILIDAD DISCRETA REPRESENTACIÓN DE UNA DISTRIBUCIÓN DE PROBABILIDAD DISCRETA Similar a las distribuciones de frecuencia, una distribución de probabilidad discreta puede ser representada (descrita) tanto gráficamente como

Más detalles

www.onda4.com Una estrategia de f optima al 10% (la estrategia de Diego) proporciona cobertura al 90% del capital.

www.onda4.com Una estrategia de f optima al 10% (la estrategia de Diego) proporciona cobertura al 90% del capital. El ABC (y D) de la gestión de capital o cómo sacar el máximo partido a un sistema de especulación. (cont). Segunda parte: Ernesto y Felipe Este artículo es continuación de: www.onda4.com/files/abcd.pdf

Más detalles

Hasta el momento hemos analizado como los agentes económicos toman sus decisiones de consumo o producción en condiciones de certeza total.

Hasta el momento hemos analizado como los agentes económicos toman sus decisiones de consumo o producción en condiciones de certeza total. III. Elección en condiciones de incertidumbre Hasta el momento hemos analizado como los agentes económicos toman sus decisiones de consumo o producción en condiciones de certeza total. Es decir, cuando

Más detalles

Juego Azar O Matemática?

Juego Azar O Matemática? Juego Azar O Matemática? Carlos Aragón Pérez Grado en Ingeniería en telecomunicaciones c.aragon@edu.uah.es Vamos a explicar las técnicas matemáticas que podremos utilizar para poder ganar en los juegos

Más detalles

Juegos Dinámicos: Info Completa. Tema 05. Profesor: Carlos R. Pitta. Análisis de Sectores Económicos

Juegos Dinámicos: Info Completa. Tema 05. Profesor: Carlos R. Pitta. Análisis de Sectores Económicos Universidad Austral de Chile Escuela de Ingeniería Comercial Análisis de Sectores Económicos Tema 05 Juegos Dinámicos: Info Completa Profesor: Carlos R. Pitta Análisis de Sectores Económicos, Prof. Carlos

Más detalles

SUCESOS. PROBABILIDAD. BACHILLERATO. TEORÍA Y EJERCICIOS SUCESOS

SUCESOS. PROBABILIDAD. BACHILLERATO. TEORÍA Y EJERCICIOS SUCESOS 1 SUCESOS Experimento aleatorio. Es aquel que al repetirlo en análogas condiciones, da resultados diferentes, es decir, no se puede predecir el resultado que se va a obtener. Ejemplos: - Lanzar una moneda

Más detalles

Problemas indecidibles

Problemas indecidibles Capítulo 7 Problemas indecidibles 71 Codificación de máquinas de Turing Toda MT se puede codificar como una secuencia finita de ceros y unos En esta sección presentaremos una codificación válida para todas

Más detalles

Reglas del juego. 2 o más jugadores

Reglas del juego. 2 o más jugadores Reglas del juego 2 o más jugadores & OTROS JUEGOS DE DADOS La generala Real es una versión nueva de la Generala tradicional, enriquecida en algunas variantes que la convierten en un excelentejuego familiar.

Más detalles

Aprendizaje por refuerzo

Aprendizaje por refuerzo Inteligencia Artificial Aprendizaje por refuerzo Ing. Sup. en Informática, 4º Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani Aprendizaje Resumen: 3. Aprendizaje automático 3.1 Introducción

Más detalles

ESTUDIO DE TÉCNICAS HEURISTICAS PARA JUGAR AL GO

ESTUDIO DE TÉCNICAS HEURISTICAS PARA JUGAR AL GO ESCUELA TÉCNICA SUPERIOR DE INGENIEROS INDUSTRIALES Y DE TELECOMUNICACIÓN Titulación: INGENIERO TÉCNICO EN INFORMÁTICA DE GESTIÓN Título del proyecto: ESTUDIO DE TÉCNICAS HEURISTICAS PARA JUGAR AL GO TÍTULO

Más detalles

Resumen de técnicas para resolver problemas de programación entera. 15.053 Martes, 9 de abril. Enumeración. Un árbol de enumeración

Resumen de técnicas para resolver problemas de programación entera. 15.053 Martes, 9 de abril. Enumeración. Un árbol de enumeración 5053 Martes, 9 de abril Ramificación y acotamiento () Entregas: material de clase Resumen de técnicas para resolver problemas de programación entera Técnicas de enumeración Enumeración completa hace una

Más detalles

Inversión. Inversión. Arbitraje. Descuento. Tema 5

Inversión. Inversión. Arbitraje. Descuento. Tema 5 Inversión Tema 5 Inversión Los bienes de inversión obligan a gastar hoy para obtener ganancias en el futuro Vamos a estudiar cómo se valoran los pagos futuros Por ejemplo, la promesa de recibir euro dentro

Más detalles

Lección 22: Probabilidad (definición clásica)

Lección 22: Probabilidad (definición clásica) LECCIÓN 22 Lección 22: Probabilidad (definición clásica) Empezaremos esta lección haciendo un breve resumen de la lección 2 del libro de primer grado. Los fenómenos determinísticos son aquellos en los

Más detalles

Práctico 4. Probabilidad

Práctico 4. Probabilidad Práctico 4. Probabilidad Problema Calcular la probabilidad que si se lanzan dos dados la suma de los resultados obtenidos sea inferior a 9. Problema 2 Las posibilidades de apostar a pleno en la ruleta

Más detalles

Tema 3: Problemas de Satisfacción de Restricciones

Tema 3: Problemas de Satisfacción de Restricciones Tema 3: Problemas de Satisfacción de Restricciones Universidad de Granada Tema 3: Satisfacción de Restricciones Contenido Problemas de satisfacción de restricciones Métodos de búsqueda Búsqueda local para

Más detalles

LOS JUEGOS EN MATEMÁTICAS. Jose Ramón Gregorio Guirles (*) 1. JUEGOS PARA AUTOMATIZAR OPERACIONES SENCILLAS DE SUMAS Y RESTAS

LOS JUEGOS EN MATEMÁTICAS. Jose Ramón Gregorio Guirles (*) 1. JUEGOS PARA AUTOMATIZAR OPERACIONES SENCILLAS DE SUMAS Y RESTAS LOS JUEGOS EN MATEMÁTICAS SIGMA 26 Jose Ramón Gregorio Guirles (*) 1. JUEGOS PARA AUTOMATIZAR OPERACIONES SENCILLAS DE SUMAS Y RESTAS Como ya comentaba en un artículo anterior sobre juegos de numeración,

Más detalles

RELOJ PRIMIGENIO. Un juego de apuestas, faroleo y press your luck de 3 a 5 jugadores.

RELOJ PRIMIGENIO. Un juego de apuestas, faroleo y press your luck de 3 a 5 jugadores. RELOJ PRIMIGENIO Un juego de apuestas, faroleo y press your luck de 3 a 5 jugadores. - Materiales 1 Baraja Primigenia Estas reglas o una imagen para tener las cartas de referencia con las que se forma

Más detalles

JUEGOS CON ESTRATEGIAS MIXTAS

JUEGOS CON ESTRATEGIAS MIXTAS JUEGOS CON ESTRATEGIAS MIXTAS ELISA SCHAEFFER Programa de Posgrado en Ingeniería de Sistemas (PISIS) elisa@yalma.fime.uanl.mx INVESTIGACIÓN DE OPERACIONES JUEGOS DE SUMA CERO Los pagos de cada combinación

Más detalles

Probabilidad. La probabilidad de un suceso es un nombre que pertenece al intervalo [0, 1]

Probabilidad. La probabilidad de un suceso es un nombre que pertenece al intervalo [0, 1] Probabilidad Un fenómeno es aleatorio si conocemos todos sus posibles resultados pero no podemos predecir cual de ellos ocurrirá. Cada uno de estos posibles resultados es un suceso elemental del fenómeno

Más detalles

Un problema sobre repetidas apuestas al azar

Un problema sobre repetidas apuestas al azar Un problema sobre repetidas apuestas al azar Eleonora Catsigeras 1 10 de marzo de 2003. Resumen En estas notas se da el enunciado y una demostración de un conocido resultado sobre la probabilidad de éxito

Más detalles

Juegos de estrategia

Juegos de estrategia Juegos de estrategia José H. Nieto (jhnieto@yahoo.com). Introducción Los juegos a los cuales nos referimos en este trabajo pueden conceptualizarse como sistemas que pueden estar en cierto número de estados,

Más detalles

TEORIA DE JUEGOS (Síntesis de conceptos introductorias de J.Pérez, J.L. Jimeno y E. Cerdá, Teoría de Juegos, Madrid, Pearson, 2004, )

TEORIA DE JUEGOS (Síntesis de conceptos introductorias de J.Pérez, J.L. Jimeno y E. Cerdá, Teoría de Juegos, Madrid, Pearson, 2004, ) TEORIA DE JUEGOS (Síntesis de conceptos introductorias de J.Pérez, J.L. Jimeno y E. Cerdá, Teoría de Juegos, Madrid, Pearson, 2004, ) Hablando en términos generales e intuitivos, podríamos decir que la

Más detalles

1 Agencia de viajes: enunciado

1 Agencia de viajes: enunciado 1 AGENCIA DE VIAJES: ENUNCIADO 1 1 Agencia de viajes: enunciado Una agencia de viajes mantiene una base de datos con exactamente N clientes y M destinos turísticos. En una situación real, estos valores

Más detalles

Teoría de las decisiones y de los juegos 2007-2008 Grupo 51 Ejercicios - Tema 3 Juegos dinámicos con información completa (0, 2) 2 D (3, 0) 1 B I

Teoría de las decisiones y de los juegos 2007-2008 Grupo 51 Ejercicios - Tema 3 Juegos dinámicos con información completa (0, 2) 2 D (3, 0) 1 B I Teoría de las decisiones y de los juegos 007-008 rupo 5 Ejercicios - Tema 3 Juegos dinámicos con información completa. Considere el siguiente juego en su forma extensiva. I (0, ) D (3, 0) I (, ) D (, 3)

Más detalles

Teoría de la Decisión Estadística Ejercicios

Teoría de la Decisión Estadística Ejercicios Teoría de la Decisión Estadística Ejercicios 1. Una librería debe decidir cuántas revistas pedir. Las compra a 20 euros y las vende a 25. Las revistas que no vende al final del día no tienen valor. La

Más detalles

Algoritmos Genéticos Y

Algoritmos Genéticos Y Algoritmos Genéticos Y Optimización n Heurística Dr. Adrian Will Grupo de Aplicaciones de Inteligencia Artificial Universidad Nacional de Tucumán awill@herrera.unt.edu.ar Algoritmos Genéticos - Operadores

Más detalles

Tema 1: Teoría de la decisión bajo incertidumbre

Tema 1: Teoría de la decisión bajo incertidumbre Tema 1: Teoría de la decisión bajo incertidumbre Microeconomía Avanzada II Iñigo Iturbe-Ormaeche U. de Alicante 2008-09 Anomalías Introducción Formalización Utilidad esperada Actitud frente al riesgo Aplicaciones

Más detalles

Optimización de consultas Resumen del capítulo 14

Optimización de consultas Resumen del capítulo 14 Optimización de consultas Resumen del capítulo 14 Libro: Fundamentos de Bases de Datos Silberschatz et al. 5ed. Dr. Víctor J. Sosa Agenda 1. Visión general 2. Estimación de las estadísticas de los resultados

Más detalles

Ejercicios de combinatoria resueltos. Matemática Discreta. 4º Ingeniería Informática

Ejercicios de combinatoria resueltos. Matemática Discreta. 4º Ingeniería Informática 1. Un número telefónico consta de siete cifras enteras. Supongamos que la primera cifra debe ser un número entre 2 y 9, ambos inclusive. La segunda y la tercera cifra deben ser números entre 1 y 9, ambos

Más detalles

Análisis del juego televisivo QUIÉN QUIERE SER MILLONARIO? R

Análisis del juego televisivo QUIÉN QUIERE SER MILLONARIO? R Análisis del juego televisivo QUIÉN QUIERE SER MILLONARIO? R Federico Perea Justo Puerto * MaMaEuSch ** Management Mathematics for European Schools 94342 - CP - 1-2001 - DE - COMENIUS - C21 * Universidad

Más detalles

LA DUALIDAD PAR-IMPAR. 1. En una reunión de 25 personas. Puede ser que cada una se salude dándose la mano con todas las demás excepto con una?

LA DUALIDAD PAR-IMPAR. 1. En una reunión de 25 personas. Puede ser que cada una se salude dándose la mano con todas las demás excepto con una? NOTAS Un sencillo principio matemático que da mucho más juego del que parece a primera vista es la simple distinción entre los números pares e impares. Conviene tener presente las siguientes propiedades,

Más detalles

CARBAYERA.COM. Apuesta con un solo pronóstico sobre un acontecimiento deportivo. Se trata de combinar varios eventos, con un mínimo de dos apuestas.

CARBAYERA.COM. Apuesta con un solo pronóstico sobre un acontecimiento deportivo. Se trata de combinar varios eventos, con un mínimo de dos apuestas. Apuesta simple: Apuesta con un solo pronóstico sobre un acontecimiento deportivo. Son las típicas apuestas del 1x2 de toda la vida. Apuestas Combinadas: Se trata de combinar varios eventos, con un mínimo

Más detalles

En una misma ronda, un jugador puede haber resultado ganador o perdedor dependiendo de a qué tipo de juego está jugando.

En una misma ronda, un jugador puede haber resultado ganador o perdedor dependiendo de a qué tipo de juego está jugando. Modalidades de juego En una misma ronda, un jugador puede haber resultado ganador o perdedor dependiendo de a qué tipo de juego está jugando. Por eso es conveniente conocer las distintas modalidades para

Más detalles

Máster en Ciencia y Tecnología Informática

Máster en Ciencia y Tecnología Informática Departamento de Informática Universidad Carlos III de Madrid Máster en Ciencia y Tecnología Informática Programación Automática Examen Normas generales del examen El tiempo para realizar el examen es de

Más detalles

LAS APUESTAS EN EL FRONTÓN

LAS APUESTAS EN EL FRONTÓN Las Apuestas en el Frontón LAS APUESTAS EN EL FRONTÓN Alberto Bagazgoitia (*) En los frontones el juego de la pelota vasca se ha mantenido y se mantiene con fuerza a través de los años. Estos últimos años

Más detalles

Breve Introducción al Póker

Breve Introducción al Póker 1 Breve Introducción al Póker Existen muchas variantes de poker, pero todas ellas comparten unas reglas básicas. Todos los juegos de poker incluyen o implican apuestas y en todos los juegos de poker se

Más detalles

que tan buen predictor

que tan buen predictor Introducción Las Teorías de Finanzas y las de Economía tratan de describir lo mejor posible situaciones que ocurren en la vida real, como cualquier teoría su fortaleza radica en que tan buen predictor

Más detalles

Guía. probabilidades. Comprender. Una. para las L A VENTA JA DE L A C A SA

Guía. probabilidades. Comprender. Una. para las L A VENTA JA DE L A C A SA L A VENTA JA DE L A C A SA Una Guía para las Comprender probabilidades AMERICAN GAMING ASSOCIATION 1299 Pennsylvania Avenue, NW Suite 1175 Washington, DC 20004 202-552-2675 www.americangaming.org 2012

Más detalles

ECONOMIA DE LA INFORMACION Y DE LA INCERTIDUMBRE EJERCICIOS (TEORIA DE JUEGOS)

ECONOMIA DE LA INFORMACION Y DE LA INCERTIDUMBRE EJERCICIOS (TEORIA DE JUEGOS) ECONOMIA DE LA INFORMACION Y DE LA INCERTIDUMBRE EJERCICIOS (TEORIA DE JUEGOS) Ejercicio 1. Aplicando el concepto de estrategias estrictamente dominadas al siguiente juego, qué estrategias podemos estar

Más detalles

LAS PROBABILIDADES Y EL SENTIDO COMÚN

LAS PROBABILIDADES Y EL SENTIDO COMÚN LAS PROBABILIDADES Y EL SENTIDO COMÚN Existen leyes del azar? Nuestro sentido común pareciera decirnos que el azar y las leyes son conceptos contradictorios. Si algo sucede al azar, es porque no hay leyes

Más detalles

(1) Medir el azar. ESTALMAT-Andalucía Actividades 06/07. a) Cuenta los casos en que la suma de salga múltiplo de tres y calcula la probabilidad.

(1) Medir el azar. ESTALMAT-Andalucía Actividades 06/07. a) Cuenta los casos en que la suma de salga múltiplo de tres y calcula la probabilidad. (1) Medir el azar Se lanzan dos dados y sumamos los puntos de las caras superiores a) Cuenta los casos en que la suma de salga múltiplo de tres y calcula la probabilidad. Una bolsa contiene 4 bolas rojas,

Más detalles

Folleto de instrucciones para el profesor

Folleto de instrucciones para el profesor Folleto de instrucciones para el profesor En la web elrinconeducativo.bde.es puede encontrar material de apoyo. 1 1. INTRODUCCIÓN El Banco de España ha creado el juego La Caja Fuerte como instrumento de

Más detalles

DISTRIBUCIONES DE PROBABILIDAD DE VARIABLE DISCRETA. LA BINOMIAL

DISTRIBUCIONES DE PROBABILIDAD DE VARIABLE DISCRETA. LA BINOMIAL DISTRIBUCIONES DE PROBABILIDAD DE VARIABLE DISCRETA. LA BINOMIAL Página 4 REFLEXIONA Y RESUELVE Recorrido de un perdigón Dibuja los recorridos correspondientes a: C + C C, + C + C, + C C C, + + + +, C+CC

Más detalles

Teoría: Hazlo-Tú-Mismo. - Guía de revisión de estadísticas del PT

Teoría: Hazlo-Tú-Mismo. - Guía de revisión de estadísticas del PT Teoría: Hazlo-Tú-Mismo - Guía de revisión de estadísticas del PT El propósito de este artículo es proporcionar un análisis de las estadísticas del Poker Tracker a los nuevos jugadores cuando se preguntan

Más detalles

En este capitulo se presentan los métodos y algoritmos utilizados para el desarrollo del

En este capitulo se presentan los métodos y algoritmos utilizados para el desarrollo del 33 En este capitulo se presentan los métodos y algoritmos utilizados para el desarrollo del sistema de procesamiento de imágenes para controlar un robot manipulador y se describen en la forma como serán

Más detalles

La Teoría del Consumidor: Incertidumbre

La Teoría del Consumidor: Incertidumbre La Teoría del Consumidor: Incertidumbre Incertidumbre y Riesgo La presencia de incertidumbre supone que las consecuencias que se derivan de cada alternativa disponible no se conocen de antemano, sino que

Más detalles

Recuerda lo fundamental

Recuerda lo fundamental álculo de probabilidades Recuerda lo fundamental Nombre y apellidos:... urso:... Fecha:... ÁLULO DE PROBABILIDADES EXPERIENIAS ALEATORIAS Experiencias aleatorias son aquellas cuyo resultado depende...

Más detalles

Ruleta: Reglas del Juego de la Ruleta

Ruleta: Reglas del Juego de la Ruleta Ruleta: Reglas del Juego de la Ruleta Como único objetivo este juego tiene el saber en que casillero exactamente con el color y número caerá la bola. Dichos jugadores se enfrentarán a un "croupier" denominado

Más detalles

Las Reglas del Texas Hold em Poker. www.pokerproductos.com

Las Reglas del Texas Hold em Poker. www.pokerproductos.com Las Reglas del Texas Hold em Poker Qué es el Texas Hold em Poker? El Texas Hold em Poker es la variante del póker más practicada en el mundo. Una variante en la que se disputan los grandes torneos internacionales

Más detalles

Tema 3 Probabilidades

Tema 3 Probabilidades Probabilidades 1 Introducción Tal vez estemos acostumbrados con algunas ideas de probabilidad, ya que esta forma parte de la cultura cotidiana. Con frecuencia escuchamos a personas que hacen afirmaciones

Más detalles

5.4 Una flecha será ensamblada en un cojinete como se muestra a continuación.

5.4 Una flecha será ensamblada en un cojinete como se muestra a continuación. PROBLEMAS 5.1. El famoso juego 7-11, requiere que el jugador lance dos dados una v. más veces hasta tomar la decisión de que se gana o se pierde el juego. El juego se gana si en el primer lanzamiento los

Más detalles

NO SE RECONOCERÁN NI SE PAGARÁN ERRORES EN NINGÚN TIPO DE LOGROS, ODDS Y/O MOMIOS; Y EL TICKET SERÁ ELIMINADO SIN AVISO AL VENDEDOR O USUARIO

NO SE RECONOCERÁN NI SE PAGARÁN ERRORES EN NINGÚN TIPO DE LOGROS, ODDS Y/O MOMIOS; Y EL TICKET SERÁ ELIMINADO SIN AVISO AL VENDEDOR O USUARIO TODAS LAS APUESTAS DEBERÁN SER REALIZADAS ANTES DE QUE INICIE EL EVENTO, CUALQUIER APUESTA REALIZADA DESPUÉS DEL INICIO DEL EVENTO SERÁ CANCELADA SIN AVISO AL JUGADOR O VENDEDOR. NO SE RECONOCERÁN NI SE

Más detalles

RULETA. El jugador selecciona las fichas - - - - y pone sus fichas en su selección en la mesa.

RULETA. El jugador selecciona las fichas - - - - y pone sus fichas en su selección en la mesa. RULETA OBJETIVO En el juego de Ruleta en vivo el objetivo del jugador en predecir en cuál de las 38 casillas en la rueda giratoria caerá la bolita después de que esta ha sido lanzada a la rueda giratoria.

Más detalles

TÉCNICAS DE PLANIFICACIÓN Y CONTROL DE PROYECTOS 1

TÉCNICAS DE PLANIFICACIÓN Y CONTROL DE PROYECTOS 1 Técnicas de planificación y control de proyectos Andrés Ramos Universidad Pontificia Comillas http://www.iit.comillas.edu/aramos/ Andres.Ramos@comillas.edu TÉCNICAS DE PLANIFICACIÓN Y CONTROL DE PROYECTOS

Más detalles

Tesis de Licenciatura. Juegos de Richman

Tesis de Licenciatura. Juegos de Richman UNIVERSIDAD DE BUENOS AIRES Facultad de Ciencias Exactas y Naturales Departamento de Matemática Tesis de Licenciatura Juegos de Richman Pablo Blanc Director: Juan Pablo Pinasco Marzo de 014 ii Índice general

Más detalles

Búsqueda heurística Prof. Constantino Malagón

Búsqueda heurística Prof. Constantino Malagón Búsqueda heurística Prof. Constantino Malagón Area de Computación e Inteligencia Artificial 1 Búsqueda heurística Los métodos de búsqueda heurística disponen de alguna información sobre la proximidad de

Más detalles

Tema 11 Probabilidad Matemáticas B 4º ESO 1

Tema 11 Probabilidad Matemáticas B 4º ESO 1 Tema 11 Probabilidad Matemáticas B 4º ESO 1 TEMA 11 PROBABILIDAD SUCESOS EJERCICIO 1 : En una bolsa hay 8 bolas numeradas del 1 al 8. Extraemos una bola al azar y anotamos su número. a Escribe el espacio

Más detalles