MASTER EN INGENIERÍA DE LA DECISIÓN



Documentos relacionados
Subespacios vectoriales en R n

INVESTIGACIÓN DE OPERACIONES

Matrices equivalentes. El método de Gauss

Teoría de las decisiones y de los juegos Grupo 51 Ejercicios - Tema 3 Juegos dinámicos con información completa (0, 2) 2 D (3, 0) 1 B I

Tema 3. Espacios vectoriales

Universidad Carlos III de Madrid Teoría de Juegos Lista de Ejercicios de Juegos Repetidos y Bayesianos

TEORÍA DE JUEGOS. 1 Definiciónes y Conceptos Básicos. 1.1 Definición: 1.2 Elementos de un juego. 1.3 Representación de un juego.

Por ello, también será importante la estructura del juego constituyente para efectuar una predicción del resultado.

Divisibilidad y números primos

Tema 2. Espacios Vectoriales Introducción

Ecuaciones de primer grado con dos incógnitas

BASES Y DIMENSIÓN. Propiedades de las bases. Ejemplos de bases.

La Lección de hoy es sobre determinar el Dominio y el Rango. El cuál es la expectativa para el aprendizaje del estudiante LF.3.A1.

CASO PRÁCTICO DISTRIBUCIÓN DE COSTES

Tema 1. Parte II. La teoría de juegos y la estrategia competitiva

Universidad Diego Portales Facultad de Economía y Empresa. 1. Reputación. Apuntes de Teoría de Juegos Profesor: Carlos R. Pitta

1. Juegos de suma cero con dos jugadores

LA SELECCION DE PERSONAL

Análisis de los datos

Administración de Empresas. 11 Métodos dinámicos de evaluación de inversiones 11.1

BREVE MANUAL DE SOLVER

Lección 22: Probabilidad (definición clásica)

Estructuras algebraicas

LABORATORIO Nº 2 GUÍA PARA REALIZAR FORMULAS EN EXCEL

1.1. Introducción y conceptos básicos

Funciones, x, y, gráficos

Agentes autónomos. Agentes. Racionalidad. Sistemas multiagentes. Dilema del prisionero. El trato

Fundamentos de Investigación de Operaciones Investigación de Operaciones 1

Guía de Ejercicios. Teoría de Juegos

LÍMITES Y CONTINUIDAD DE FUNCIONES

Juegos Dinámicos. Tema 2: Juegos Dinámicos con Información Imperfecta. Universidad Carlos III

TABLA DE DECISION. Consideremos la siguiente tabla, expresada en forma genérica, como ejemplo y establezcamos la manera en que debe leerse.

Definición Dados dos números naturales m y n, una matriz de orden o dimensión m n es una tabla numérica rectangular con m filas y n columnas.

Ingeniería del Software I Clase de Testing Funcional 2do. Cuatrimestre de 2007

UNIDAD 1. LOS NÚMEROS ENTEROS.

Criterios de Selección de Inversiones: El Valor Actual Neto y sus derivados *.

ÍNDICE DISEÑO DE CONTADORES SÍNCRONOS JESÚS PIZARRO PELÁEZ

TEORÍA A DE JUEGOS. Un marco para estudiar y aplicar en la gerencia política

x

Tema 07. LÍMITES Y CONTINUIDAD DE FUNCIONES

SOLUCIÓN CASO GESTIÓN DE PERSONAL I

Análisis de medidas conjuntas (conjoint analysis)

ANÁLISIS DE DATOS NO NUMERICOS

Barreras naturales o legales impiden la entrada de nuevas empresas El número de empresas que compite es pequeño

4 Pruebas y análisis del software

MICROECONOMÍA II PRÁCTICA TEMA III: MONOPOLIO

1. Lección 5 - Comparación y Sustitución de capitales

Unidad 6 Cálculo de máximos y mínimos

La nueva criba de Eratóstenes Efraín Soto Apolinar 1 F.I.M.E. U.A.N.L. San Nicolás, N.L. México. efrain@yalma.fime.uanl.mx

ORGANIZACIÓN INDUSTRIAL (16691-ECO) PARTE II: MODELOS DE COMPETENCIA IMPERFECTA TEMA 2: EL MONOPOLIO SOLUCIÓN A LOS PROBLEMAS PROPUESTOS

La teoría de juegos y la estrategia competitiva

1. Dominio, simetría, puntos de corte y periodicidad

Tema 5: Sistemas Monetarios Internacionales

Los números racionales

ECONOMIA DE LA INFORMACION Y DE LA INCERTIDUMBRE EJERCICIOS (TEORIA DE JUEGOS)

Aula Banca Privada. La importancia de la diversificación

Programa para el Mejoramiento de la Enseñanza de la Matemática en ANEP Proyecto: Análisis, Reflexión y Producción. Fracciones

EJERCICIOS DE MATEMÁTICAS I HOJA 4. Ejercicio 1. Se consideran los vectores

Teoría de juegos en forma extensiva (repaso)

E 1 E 2 E 2 E 3 E 4 E 5 2E 4

Apuntes de Matemática Discreta 1. Conjuntos y Subconjuntos

Tema 1: Fundamentos de lógica, teoría de conjuntos y estructuras algebraicas: Apéndice

Aproximación local. Plano tangente. Derivadas parciales.

Gestión de Retales WhitePaper Noviembre de 2009

CASO PRAÁ CTICOPREÉ STAMOS. CAÁLCULO DE CUOTAS

Juegos en Forma Estratégica de Información Completa

Notas en Eonomía de la Información *

Programación Lineal. Ficha para enseñar a utilizar el Solver de EXCEL en la resolución de problemas de Programación Lineal

5.1. Organizar los roles

Matrices Invertibles y Elementos de Álgebra Matricial

MANUAL DE EJECUCION DE LA ESTRATEGIA Ibex35 Evolución por Josep Codina

Base de datos en Excel

Descripción: dos. función. decreciente. Figura 1. Figura 2

Clase 3 19 agosto 2009

Lo esencial de la teoría de juegos

Universidad Diego Portales Facultad de Economía y Empresa

hay alguien ahi? por Marcelino Alvarez

Módulo 9 Sistema matemático y operaciones binarias

Tema 7: Juegos con información incompleta

Cálculo Simbólico también es posible con GeoGebra

Profr. Efraín Soto Apolinar. Factorización

Covarianza y coeficiente de correlación

Capítulo 0. Introducción.

Análisis y cuantificación del Riesgo

VECTORES. Módulo, dirección y sentido de un vector fijo En un vector fijo se llama módulo del mismo a la longitud del segmento que lo define.

Lección 9: Polinomios

Economía de la información y la incertidumbre 3er curso (1º Semestre) Grado en Economía

Sistemas de numeración

SISTEMAS DE ECUACIONES LINEALES

La estrategia básica para jugar blackjack.

MANUAL DE USUARIO DE LA APLICACIÓN DE ACREDITACION DE ACTIVIDADES DE FORMACION CONTINUADA. Perfil Entidad Proveedora

Curso Excel Básico - Intermedio

ANÁLISIS DE UN JUEGO DE CARTAS: LAS SIETE Y MEDIA

CASO PRÁCTICO. ANÁLISIS DE DATOS EN TABLAS DINÁMICAS

TEMA 4: Variables binarias

Unidad I. 1.1 Sistemas numéricos (Binario, Octal, Decimal, Hexadecimal)

Aplicaciones Lineales

CAPITULO V. SIMULACION DEL SISTEMA 5.1 DISEÑO DEL MODELO

Transcripción:

MASTER EN INGENIERÍA DE LA DECISIÓN ANÁLISIS DE NEGOCIACIONES. 2 CONCEPTOS BÁSICOS DE TEORÍA DE JUEGOS (NO COOPERATIVOS) EQUILIBRIOS DE NASH David Ríos Insua y Roman Efremov

Objetivo En esta sesión introducimos los dos conceptos básicos de la teoría de juegos no cooperativos: dominacia (tal vez iterada), equilibrio de Nash Tiempo esperado: 4 horas (incluida la actividad).

Plan El plan para esta sesión es el siguiente Descripción básica de juegos Conceptos de dominancia Concepto de equilibrio de Nash no cooperativo Cálculo de equilibrios de Nash Aplicaciones

Contexto básico El tipo de problemas que consideramos tienen estos rasgos: Hay varios decisores El pago que recibe cada decisor depende no sólo de su decisión, sino también de las de los demás Puede tener lugar tanto en situación de conflicto como de cooperación Los participantes o decisores se denominan jugadores Los pagos a los jugadores en función de sus acciones se denominan las funciones de pagos Un juego es un conjunto de reglas conocidas por los jugadores que determinan qué pueden hacer y las consecuencias y los pagos asociados a sus decisiones

Posibilidades Hay varios tipos de juegos en función de: Número de jugadores: 2, 3,, n, Número de estrategias disponibles: Finitas, Infinitas Función de pagos: Juegos de suma nula, (Juegos bipersonales de suma nula), Juegos de diferencia constante. Juegos de suma no nula Situación previa al juego: Cooperativos, no cooperativos Las iremos viendo a lo largo del curso

Ejemplos. Posibilidades. El conocido juego Piedra-papel-tijera es un ejemplo de Juego bipersonal Juego de suma nula (si uno gana el otro pierde) Finito (cada uno tiene 3 alternativas para elegir: piedra, papel, o tijera) Es un juego no cooperativo

Ejemplos. Posibilidades. Partir una herencia de 500000 pesos en tres partes (x, y, 500000-x-y) con x, y entre 0 y 500000, y x+y menor que 500000 Es un juego tripersonal Es un juego de suma constante Con un número de estrategias infinito Es un juego no cooperativo, si no se permite la comunicación. Podría ser cooperativo si hay sintonía entre los herederos.

Conceptos básicos de Teoría de Juegos Vamos a introducir brevemente los conceptos de la Teoría de Juegos. Para ello: Juntaos por parejas!!!! Presentamos varias situaciones que nos ayudarán a introducir algunos conceptos básicos Luego introducidos más rigurosamente

Conceptos básicos de Teoría de Juegos Las reglas serán: Tienes que actuar Tus consecuencias dependen de lo que hagas tú y los demás No sabes lo que harán, pero sabes lo que podrían hacer No saben lo que tú harás

Reglas básicas Dos jugadores, dos alternativas Estrategias fijas Información perfecta Selección simultánea, salvo que se indique lo contrario No hay discusión previa

Matriz del juego La forma normal de un juego es una matriz que muestra los jugadores, las estrategias, y las recompensas (ver el ejemplo a la derecha). Hay dos jugadores: uno elige la fila y otro la columna. En el ejemplo, cada jugador tiene dos estrategias: las estrategias del jugador 1 (o sea, el jugador de las filas) se denominan Arriba y Debajo, las del jugador 2 (o sea, el jugador de las columnas) se denominan Izda. y Dcha. Izda. Dcha. Arriba A,I A,D Debajo D,I D,D

Matriz del juego Las recompensas se especifican en el interior: el primer número es la recompensa recibida por el jugador 1 (fila); el segundo es la recompensa del jugador 2. (columna) Por ejemplo, si el jugador 1 elige arriba y el jugador 2 elige izda. entonces sus recompensas son 3 y 2, respectivamente. Cuando un juego se presenta en forma normal, se presupone que todos los jugadores actúan simultáneamente, o sea, sin saber la elección que toma el otro. Cada jugador desea maximizar su ganancia. Izda. Dcha. Arriba 3,2 1,5 Debajo 4,7 3,1

Matriz del juego: suma nula En los juegos de suma nula el beneficio total para todos los jugadores del juego, en cada combinación de estrategias, siempre suma cero (en otras palabras, un jugador se beneficia solamente a expensas del otro). Izda. Dcha. Arriba 3,-3-2,2 Debajo -4,4 1,-1

Matriz del juego: suma nula El juego del ejemplo anterior tiene información redundante (siendo de suma nula). Puede simplificarse y transformarse en esta otra que representa tan solo las ganancias del jugador 1, teniendo en cuenta que las ganancias del opositor son cantidades opuestas. Izda. Dcha. Arriba 3-2 Debajo -4 1

Ejemplo. Juego suma nula. Tenéis aquí representado el juego de Piedra-papel-tijera en forma normal. (Lee el material adicional de la Wikipedia) Piedra Papel Tijera Piedra 0-1 1 Papel 1 0-1 Tijera -1 1 0

Considera este juego Piensa que harías si fueras el jugador de las filas. Que estrategia elegirías? Y si fueras el jugador de columnas? Una vez has hecho este ejercicio abre la siguiente transparencia y mira nuestra interpretación Izda. Dcha. Arriba 4,5 10,-6 Debajo 12,7 5,9

Indeterminación Denominemos Izda. Dcha. J1 al Jugador de las filas (J1) y J2 al Jugador de las columnas. Podría ocurrir la siguiente situación J1 ha elegido Debajo, porque ha pensado que J2 elegirá Izda. para evitar la posibilidad de ganar -6. Arriba 4,5 10,-6 Debajo 12,7 5,9 Supongamos que J2 ha elegido Dcha., porque ha pensado que J1 ha pensado que J2 elegiría Izda. y, por eso, J1 elegirá Debajo y cuando J1 elige Debajo, la mejor respuesta de J2 será Dcha, pues gana 9. Pero podría ocurrir que J1 pensase que J2 elíjese Dcha, porque J2 habría pensado que J1 habría pensado que J2 elegiría Izda. y, por eso, J1 elegiría Debajo y cuando J1 elige Debajo, la mejor respuesta de J2 será Dcha, pues gana 9.

Indeterminación El problema es que: Debajo (para J1) es la mejor respuesta contra Izda (de J2) Izda es la mejor respuesta contra Arriba Arriba es la mejor respuesta contra Dcha. Dcha. es la mejor respuesta contra Debajo Conclusión: Ninguna estrategia simple y fija es mejor que otra Si el juego se repitiese, los jugadores cambiarían aleatoriamente sus estrategias en cada jugada Izda. Dcha. Arriba 4,5 10,-6 Debajo 12,7 5,9 Para algunos juegos no existen prescripciones simples... Esto es, necesitamos suponer no sólo que los jugadores son racionales, sino también que todos los jugadores saben que todos los jugadores son racionales, y que todos los jugadores saben que todos los jugadores saben que todos los jugadores son racionales, y así ad infinitum Este juego tal y como está formulado queda indeterminado lo podremos resolver más adelante

Indeterminación El problema es que: Debajo (para J1) es la mejor respuesta contra Izda (de J2) Izda es la mejor respuesta contra Arriba Arriba es la mejor respuesta contra Dcha. Dcha. es la mejor respuesta contra Debajo Conclusión: Ninguna estrategia simple y fija es mejor que otra Si el juego se repitiese, los jugadores cambiarían aleatoriamente sus estrategias en cada jugada Izda. Dcha. Arriba 4,5 10,-6 Debajo 12,7 5,9 por qué no simplemente suponer que todos los jugadores saben que todos los jugadores son racionales? Cuando un jugador conoce las reglas no emprende o asume algunos comportamientos. Sin embargo, si ese mismo jugador no está seguro de que los demás jugadores saben que él conoce las reglas, no estará seguro de que los demás jugadores sepan que él no emprenderá ni asumirá dichas comportamientos. Este tipo de incertidumbre genera dudas en la mente de los jugadores y modifica dramáticamente lo que cada uno termina por hacer. De aquí la importancia de suponer información de dominio público en todos los niveles (ad infinitum).

Considera este juego Piensa que harías si fueras el jugador de las filas. Que estrategia elegirías? Y si fueras el jugador de columnas? Una vez has hecho este ejercicio abre la siguiente transparencia y mira nuestra interpretación Izda. Dcha. Arriba 4,3 3,0 Debajo 12,8 5,4

Dominancia Una estrategia domina estrictamente a otra cuando es mejor elección independiente de la elección del otro jugador. Un jugador siempre elige estrategia no dominada y tacha las estrategias dominadas. Para el jugador 1 la estrategia Debajo domina la Arriba (tachada) porque 12 > 4 y 5 > 3. Para el jugador 2 la Izda. domina Dcha. (tachada) porque 3 > 0 y 8 > 4. La única celda no tachada es la que corresponde a las estrategias Debajo y Izda. Entonces, las recompensas de los jugadores son 12 y 8 respectivamente. Izda. Dcha. Arriba 4,3 3,0 Debajo 12,8 5,4

Considera este juego Piensa que harías si fueras el jugador de las filas. Que estrategia elegirías? Y si fueras el jugador de columnas? Una vez has hecho este ejercicio abre la siguiente transparencia y mira nuestra interpretación Izda. Dcha. Arriba 0,2 5,4 Debajo 10,3 3,8

Dominancia iterada Cada jugador predice que el otro seguirá estrategias no dominadas Es fácil comprobar que el jugador de las filas no tiene estrategia no dominada La estrategia dominante del jugador de las columnas es Dcha. Izda. Dcha. Arriba 0,2 5,4 Debajo 10,3 3,8

Dominancia iterada Cada jugador predice que el otro seguirá estrategias no dominadas Es fácil comprobar que el jugador de las filas no tiene estrategia no dominada La estrategia dominante del jugador de las columnas es Dcha. Sin embargo, el jugador de las filas elegirá Arriba ya que el sabe que Dcha. es la estrategia dominante del jugador de las columnas, y así maximizará su ganancia Izda. Dcha. Arriba 0,2 5,4 Debajo 10,3 3,8

Considera este juego Piensa qué harías si fueras el jugador de las filas. Que estrategia elegirías? Y si fueras el jugador de columnas? Una vez has hecho este ejercicio abre la siguiente transparencia y mira nuestra interpretación Izda. Dcha. Arriba 4,3 10,6 Debajo 12,8 5,4

Equilibrio En este ejemplo ninguno de los dos jugadores tiene una estrategia dominante: Si el jugador 1 uno elige Arriba es conveniente al 2 eligir Dcha. y viceversa: si el 2 elige Dcha. el 1 tiene que eligir Arriba. Si el 1 elige Debajo el 2 tiene que eligir Izda. y viceversa. Izda. Dcha. Arriba 4,3 10,6 Debajo 12,8 5,4 Asimismo, Debajo - Izda. y Arriba - Dcha. son aquellas combinaciones de estrategias en las cuales ningún jugador pueda mejorar cambiando de estrategia, supuesto que el otro jugador elija su estrategia. Por tanto, es probable que elijan los jugadores las combinaciones de estrategias. Estas estrategias se llaman equilibrios (de Nash, no cooperativos). Sin embargo, la estrategia Debajo - Izda. domina a la Arriba - Dcha

Considera este juego Hasta ahora hemos analizado los juegos bajo la condición de que ambos jugadores tomen sus decisiones simultáneamente. Ahora supongamos que uno de los dos elige primero. Izda. Dcha. Arriba 0,0 1,2 Debajo 2,1 0,0 Piensa qué harías si fueras el jugador de las filas. Que estrategia elegirías? Y si fueras el jugador de columnas? Una vez has hecho este ejercicio abre la siguiente transparencia y mira nuestra interpretación

La ventaja de elegir primero Hay dos equilibrios: {Arriba, Dcha.} y {Debajo, Izda.}. Cada jugador prefiere uno de estos equilibrios: El jugador de las filas prefiere Debajo y El jugador de las columnas Dcha. El jugador que elige el segundo no tiene otra elección salvo acceder a la elección del jugador que ha elegido el primero Izda. Dcha. Arriba 0,0 1,2 Debajo 2,1 0,0

Considera este juego Piensa qué harías si fueras el jugador por filas. Qué estrategia elegirías? Y si fueras el jugador por columnas? Una vez has hecho este ejercicio abre la siguiente transparencia y mira nuestra interpretación Izda. Dcha. Arriba 5,5-5,10 Debajo 10,-5-2,-2

Los peligros de la racionalidad Izda. Dcha. En este ejemplo, 1, como jugador racional, tachará la estrategia Arriba como dominada 2 tachará como dominada la estrategia Izda. Los jugadores acabarán con una solución ineficiente, pues (5, 5) es mejor que (-2, -2) Es este un ejemplo del dilema del prisionero Arriba 5,5-5,10 Debajo 10,-5-2,-2

El dilema del prisionero Dos delincuentes son detenidos y encerrados en celdas de aislamiento de forma que no pueden comunicarse entre ellos. El alguacil sospecha que han participado en el robo del banco, delito cuya pena es 10 años de cárcel, pero no tiene pruebas. Sólo tiene pruebas y puede culparles de un delito menor, tenencia ilícita de armas, cuyo castigo es de 2 años de cárcel. Promete a cada uno de ellos que reducirá su condena a la mitad si proporciona las pruebas para culpar al otro del robo del banco... No Conf No Conf Conf 2,2 10,0 Conf 0,10 5,5 Mira a la derecha la tabla de decisión con el dilema que se le plantea a cada uno de los prisioneros que, ahora, quieren minimizar la consecuencia relevante, el número de años en la prisión.

El dilema del prisionero Como en el ejemplo anterior el juego resulta en una decisión socialmente ineficiente, pues a los delincuentes les conviene confesar. Cada uno busca su bien de forma egoísta, lo que les lleva a una mala decisión social. Caen en una trampa (una trampa social o dilema social) No Conf No Conf Conf 2,2 10,0 Conf 0,10 5,5

Dilemas sociales en contexto de riesgos adversarios Considerad un contexto en el que hay dos compañías interconectadas que deben decidir si invierten o no en seguridad IT. La situación queda descrita cualitativamente en la tabla adjunta. A escala global, las compañías prefieren no cooperar en las cuestiones de la seguridad jugando sus estrategias egoístas. Es otro ejemplo de dilema del prisionero. Compañía A invierte en seguridad IT A no invierte en seguridad B invierte en seguridad IT Ambos incurren en costes Bajo riesgo B incurre en costes Riesgo relativament e alto B no invierte en seguridad A incurre en costes Riesgo relativamente alto Equilibrio: A,B evitan costes Riesgo alto

La carrera de armamento (60-80) Considerad la relación que se formó entre la ex-urss y EE.UU. en los años 60: URSS Desarmar Armar Cada país puede optar por continuar armándose o reducir su armamento Ambos países se dan cuenta de que las dificultades económicas producidas por la carrera hacen más deseable el desarme conjunto a la carrera Ambos países preferirían su superioridad militar a su paridad militar ordenando las cuatro situaciones posibles (1 peor, 4 mejor) EE.UU. Desarmar 3,3 1,4 Armar 4,1 2,2 1. Inferioridad militar 2. Carrera (igualdad, con penurias) 3. Desarme mutuo 4. Superioridad militar

La carrera de armamento (60-80) De nuevo, el comportamiento racional egoísta llevará a la decisión (armar, URSS Desarmar Armar Armar) ie la carrera de armamento EE.UU. Desarmar 3,3 1,4 Armar 4,1 2,2 1. Inferioridad militar 2. Carrera (igualdad, con penurias) 3. Desarme mutuo 4. Superioridad militar

Formalización de conceptos Formalizamos ahora los conceptos anteriores suponiendo que hay n jugadores en el juego: Espacio de alternativas para cada jugador: S i el conjunto de estrategias con que cuenta el jugador i, donde i {1,, n} y n es el número de los jugadores Alternativas para cada jugador Sea s i S i una estrategia arbitraria del espacio de estrategias del jugador i Evaluación para cada jugador Sea (s 1,, s i,, s n ) una combinación de estrategias, y sea u i la función de ganancias para el jugador i : u i (s 1,, s i,, s n ) es la ganancia del jugador i si los jugadores eligen las alternativas (s 1,, s i,, s n )

Formalización de conceptos Juego en forma normal: La representación en forma normal de un juego con n jugadores especifica los espacios de estrategias de los jugadores S 1,...,S n y sus funciones de ganancias u 1,...,u n. Denotamos este juego mediante G = {S 1,...,S n ; u 1,,u n }.

Ejemplo de juego en forma normal Consideremos el juego de la transparencia 12. Hay 2 jugadores (F y C) Los espacios de estrategias son Sf={A,D}, Sc={I,D} Las funciones de pago son uf (A,I)=3, uf (A,D)=1,uf (D,I)=4, uf (D,D)=3 uc (A,I)=2, uc (A,D)=5,uc (D,I)=7, uc (D,D)=1

Ejemplo de juego en forma normal Consideremos un juego en forma normal con tres jugadores 1, 2, 3. Sus conjuntos estratégicos son S 1 =S 2 =S 3 =[0, 1]. Sus funciones de pago son: u 1 (x,y,z)=x+y-z, u 2 (x,y,z)=x-yz, and u 3 (x,y,z)=xyz, donde para simplificar s 1 = x, s 2 = y, s 3 = z. Si los jugadores anuncian las estrategias x = ½, y = 0 y z=1/4, entonces sus ganancias serán:

Formalización. Estrategia no dominada Solución no dominada: En el juego en forma normal, sean s y i s i posibles estrategias del jugador i. La estrategia s está i dominada por la estrategia s i si para cada combinación (s 1,...,s i -1, s i +1,...,s n ) que puede ser construida a partir de los espacios de estrategias de los otros jugadores S 1,...,S i -1, S i +1,...,S n, la ganancia de i por utilizar s i es estrictamente menor que la ganancia de i por utilizar s i : u i (s 1,...,s i -1, s, i s i +1,...,s n ) < u i (s 1,...,s i -1, s, i s i +1,...,s n ) Los jugadores racionales no utilizan estrategias estrictamente dominadas, debiendo centrarse en las estrategias no dominadas.

Formalización. Equilibrio de Nash Equilibrio de Nash: En el juego en forma normal de n jugadores las estrategias s 1 *,, s n * forman un equilibrio de Nash si, para cada jugador i, s i * es la mejor respuesta del jugador i (o al menos una de ellas) a las estrategias de los otros n - 1 jugadores, (s 1*,...,s i * -1, s i * +1,...,s n* ): u i (s 1*,...,s i * -1, s i*, s i * +1,...,s n* ) u i (s 1*,...,s i * -1, s i, s i * +1,...,s n* ) para cada posible estrategia s i S i ; esto es, si es una solución de max u i (s 1*,...,s i * -1, s i, s i * +1,...,s n* ) s.a. s i S i Ningún jugador tiene incentivos para abandonarlo unilateralmente

Función de mejor respuesta Un concepto clave aquí es el de mejor respuesta: Supuesto que conozco las decisiones tomadas por las otras partes, cuál es mi mejor alternativa, mi mejor respuesta? La correspondiente función se denomina función de respuesta Un equilibrio de Nash se corresponde al cruce de funciones de respuesta: Una estrategia es un equilibrio si para cada jugador, toda estrategia en el soporte del equilibrio es una mejor respuesta a la estrategia complementaria.

Función de mejor respuesta Considerad el ejemplo adjunto Observad que ninguna estrategia de ninguno de los jugadores es dominada Calculad las mejores respuestas del jugador de filas y del jugador de columnas, antes de pasar a la siguiente transparencia C1 C2 C3 F1 1,4 2,2 2,3 F2 3,1 1,5 4,1 F3 2,0 3,4 1,2 Para buscar los equilibrios de Nash en juegos de forma normal se usan las funciones de mejores respuestas, construidas para cada jugador. Hazlo antes de pasar

Función de mejor respuesta Observad que ninguna estrategia de ninguno de los jugadores es dominada Denotamos la función de mejor respuesta del jugador 1 cuando el jugador 2 elige Ci como r 1 (Ci), de manera que F2 = r 1 (C1) F3 = r 1 (C2) F2 = r 1 (C3) (las mejores respuestas del J1 marcamos con ) Para buscar los equilibrios de Nash en juegos de forma normal se usan las funciones de mejores respuestas, construidas para cada jugador. Equilibrio de Nash. Otro ejemplo C1 C2 C3 F1 1,4 2,2 2,3 F2 3,1 1,5 4,1 F3 2,0 3,4 1,2

Función de mejor respuesta Análógamente, construimos la función de mejor respuesta del jugador 2: C1 = r 2 (F1) C2 = r 2 (F2) C2 = r 2 (F3) (las mejores respuestas del J2 marcamos con ) Vemos que F3 = r 1 (C2) y C2 = r 2 (F3), es decir (F3, C2) es el equilibrio de Nash. No hay otras celdas con dos cruces no hay más equilibrios Equilibrio de Nash. Otro ejemplo C1 C2 C3 F1 1,4 2,2 2,3 F2 3,1 1,5 4,1 F3 2,0 3,4 1,2

Función de mejor respuesta Equilibrio de Nash Considerad ahora este ejemplo. Calculad el equilibrio de Nash y las funciones de mejor respuesta C1 C2 F1-1,1 1,-1 F2 1,-1-1,1

Función de mejor respuesta Equilibrio de Nash Consideramos otro ejemplo Aquí, como en el ejemplo anterior las mejores respuestas del jugador filas marcamos con, y las del jugador columnas - con No existe celda que contenga dos cruces, así que no existe el equilibrio de Nash en estrategias puras C1 C2 F1-1,1 1,-1 F2 1,-1-1,1

Estrategia pura, estrategia mixta Hasta ahora nos hemos fijado sólo en estrategias puras: I, D, A, D,. Pero es concebible (y en cierta forma necesario) considerar estrategias mixtas que son distribuciones de probabilidad sobre las estrategias puras. Por ejemplo, el jugador por filas podría considerar una estrategia mixta que fuese (2/3, 1/3) que se interpreta como: Juego A con probabilidad 2/3 y Juego D con probabilidad 1/3. En particular la estrategia (1,0) del jugador por filas (Juego A con probabilidad 1, Juego D con probabilidad 0) coincide con la estrategia A: Las estrategias puras son casos particulares de las estrategias mixtas

Estrategia pura, estrategia mixta A partir de la matriz de pagos, construimos los pagos de las estrategias mixtas, como ilustramos en el ejemplo último. Consideramos las estrategias mixtas (p,1-p) para el jugador por filas y (q,1-q) para el jugador por columnas. Lo ilustramos para el jugador por filas: C1 C2 F1-1,1 1,-1 F2 1,-1-1,1 Con probabilidad p juega F1 y espera ganar ( q * (-1))+((1-q) *1) Con probabilidad (1-p) juega F2 y espera ganar (q* 1)+ ((1-q) * (-1)) En total espera ganar p*(1-2q)+(1-p)*(2q-1)=2p+2q-4pq-1 Calcula lo que espera ganar el jugador por columnas

Formalización de conceptos Derivemos de forma más general la mejor respuesta del jugador i a la estrategia mixta del jugador j. Sea J el número de estrategias puras en S 1 y K el número de estrategias puras en S 2 Escribimos S 1 = { s 11,...,s 1J } y S 2 = { s 21,...,s 2K }, y utilizamos s 1j y s 2k para denotar las estrategias puras s de S 1 y S 2 respectivamente. Si el jugador 1 cree que el jugador 2 utilizará las estrategias (s 21,...,s 2K ) con probabilidades p 2 = (p 21,...,p 2K ), la ganancia esperada del jugador 1 por utilizar la estrategia mixta p 1 = (p 11,...,p 1J ) es donde p 1j p 2k es la probabilidad de que 1 utilice s 1j y 2 utilice s 2k. Para que la estrategia mixta (p 11,...,p 1J ) sea mejor respuesta del jugador 1 a la estrategia mixta p 2 del jugador 2, debe cumplirse que p 1j > 0 sólo si

Formalización de conceptos Hacemos el mismo análisis para el jugador 2, cuya ganancia esperada por utilizar la estrategia mixta (p 21,...,p 2K ) cuando el cree que el jugador 1 utilizará la estratégia mixta (p 11,...,p 1J ), es Para que el par de estrategias mixtas (p 1*,p 2* ) forme un equilibrio de Nash, p 1* debe cumplir para cada distribución de probabilidad p 1 sobre S 1, y p 2 debe cumplir para cada distribución de probabilidad p 2 sobre S 2. (1) (2)

Formalización de conceptos. Resultados En un juego en forma normal de con n jugadores G ={S 1,...,S n ; u 1,...,u n }, si n es un número finito y S i es finito para cada i, existe al menos un equilibrio de Nash, que posiblemente incluye estrategias mixtas.

Cálculo de equilibrio de Nash Ilustramos los cálculos Con el siguiente ejemplo Supongamos que jugador 1 cree que jugador 2 elegirá C1 con probabilidad q y C2 con probabilidad 1-q. y que jugador 2 cree que jugador 1 elegirá F1 con probabilidad p y F2 con probabilidad 1-p. C1 C2 q F1 p 2,2 3,4 F2 1-p 1,3 5,1 Calcula las funciones de pagos 1-q

Cálculo de equilibrio de Nash Supongamos que jugador 1 C1 C2 cree que jugador 2 elegirá C1 q con probabilidad q y C2 con probabilidad 1-q. F1 p 2,2 3,4 y que jugador 2 cree que F2 1-p 1,3 5,1 jugador 1 elegirá F1 con probabilidad p y F2 con probabilidad 1-p. La ganancia esperada del jugador 1 será: u 1 (p,q) = p (2q+3(1-q)) + (1-p)(1q+5(1-q)) = (5-4q) + p(3q -2), La ganancia esperada del jugador 1 será: u 2 (p,q) = q(2p+3(1-p)) + (1-q)(4p +1(1-p)) = (3p +1) + 2q (1-2p), 1-q Calcula las mejores respuestas de cada jugador

Cálculo de equilibrio de Nash Supongamos que jugador 1 C1 C2 cree que jugador 2 elegirá C1 q con probabilidad q y C2 con probabilidad 1-q. F1 p 2,2 3,4 y que jugador 2 cree que F2 1-p 1,3 5,1 jugador 1 elegirá F1 con probabilidad p y F2 con probabilidad 1-p. La ganancia esperada del jugador 1 será: u 1 (p,q) = p (2q+3(1-q)) + (1-p)(1q+5(1-q)) = (5-4q) + p(3q -2), o sea, la ganancia u 1 (p,q) es creciente en p si q > 2/3 y decreciente si q <2/3. Así, la mejor respuesta del jugador 1 es F1 si q > 2/3 y F2 si q <2/3. La ganancia esperada del jugador 1 será: u 2 (p,q) = q(2p+3(1-p)) + (1-q)(4p +1(1-p)) = (3p +1) + 2q (1-2p), o sea, la ganancia u 2 (p,q) es creciente en q si p < 1/2 y decreciente p > 1/2. Así, la mejor respuesta del jugador 2 es C1 si p < 1/2 y C2 si p > 1/2. 1-q

Cálculo de equilibrio de Nash Las mejores respuestas se puede representar gráficamente. C1 C2 F1 2,2 3,4 F2 1,3 5,1 p La estrategia del jugador 1 es F1 si q > 2/3 y F2 si q <2/3. F1 o F2 (cualquiera estrategia) si q =2/3 2/3 1 q

Cálculo de equilibrio de Nash Las mejores respuestas se puede representar gráficamente C1 C2 F1 2,2 3,4 F2 1,3 5,1 p La estrategia del jugador 2 es C1 si p < 1/2, C2 si p > 1/2 y C1 o C2 si p = 1/2. 1/2 1 q

Cálculo de equilibrio de Nash Las mejores respuestas se puede representar gráficamente. En esta representación a los equilibrios de Nash les corresponden las cruces de las funciones de respuestas La estrategia del jugador 1 es F1 si q > 2/3 y F2 si q <2/3. F1 o F2 si q =2/3 La estrategia del jugador 2 es C1 si p < 1/2 y C2 si p > 1/2. C1 o C2 si p = 1/2. El punto (q, p) = (2/3, 1/2) es el equilibrio de Nash en estrategias mixtas C1 C2 F1 2,2 3,4 F2 1,3 5,1 p 1/2 2/3 1 q

Cálculo de equilibrio de Nash El razonamiento se podría generalizar a este caso. C1 C2 F1 a1,b1 a2,b2 F2 a3,b3 a4,b4 Calculamos utilidades esperadas para cada agente Calculamos mejores respuestas para cada agente Buscamos cruces de las funciones de respuesta Pero para matrices 3x3 se empieza a complicar

Test Equilibrio de Nash (para el caso continuo) Y si aprovechamos las condiciones de optimalidad (Recuerda la asignatura de Métodos de Optimización)? Sea G un juego en forma estratégica cuyos conjuntos de estrategias son los intervalos abiertos con las funciones de pago dos veces diferenciables. Supongamos que el perfil estratégico (s 1 *,, s * n ) satisface: * * u ( s,..., s ) i 1 n = 0 para cada jugador i, si cada s 1* es el único punto estacionario de la función u i (s 1*,...,s * i -1, s, i s * i +1,...,s n* ), s i S i. Si, 2 * * u ( s,..., s ) i 1 n < 0 para cada i. 2 si Entonces (s 1 *,, s * n ) es el equilibrio de Nash del juego G.

Ejemplo Test Equilibrio de Nash Consideremos un juego en forma estratégica con tres jugadores 1, 2, 3. Los conjuntos estratégicos son S 1 =S 2 =S 3 =[0, + ]. Sus funciones de pago son: Para encontrar el equilibrio de Nash debemos resolver el sistema de ecuaciones: Al calcular las derivadas obtendremos:

Ejemplo Test Equilibrio de Nash De manera que tenemos que resolver el sistema de ecuaciones: Resolviéndola, obtendremos x = y = z =1. Al calcular las segundas derivadas obtendremos: Para cualquiera elección x, y, z > 0. Entonces, (1, 1, 1) es el equilibrio de Nash (único).

Ejemplo Test equilibrio de Nash En nuestro ejemplo anterior Supongamos que jugador 1 C1 C2 cree que jugador 2 elegirá C1 q con probabilidad q y C2 con probabilidad 1-q. F1 p 2,2 3,4 y que jugador 2 cree que F2 1-p 1,3 5,1 jugador 1 elegirá F1 con probabilidad p y F2 con probabilidad 1-p. La ganancia esperada del jugador 1 será: u 1 (p,q) = p (2q+3(1-q)) + (1-p)(1q+5(1-q)) = (5-4q) + p(3q -2), La ganancia esperada del jugador 1 será: u 2 (p,q) = q(2p+3(1-p)) + (1-q)(4p +1(1-p)) = (3p +1) + 2q (1-2p), El punto estacionario de la derivada primera de u1 es 2/3 El punto estacionario de la derivada segunda de u2 es ½ Y comprobáis que es equilibrio de Nash 1-q

Ejemplo Test Equilibrio de Nash Aplicad el test introducido para calcular el equilibrio de Nash en el ejemplo de la transparencia 46. Podéis hacerlo por parejas. Envíanos la solución por email (puedes hacerlo a mano y escanearlo) antes del día 23 de Febrero a las 18.00 hora de Madrid.

Aplicación Política Puedes saltar esta sección, aunque es muy interesante. Ponemos uno de los ejemplos de uso político del concepto de equilibrio de Nash: El teorema del votante de la mediana. Viene a explicar por qué el centro político es tan codiciado en unas elecciones. Para más información véase http://en.wikipedia.org/wiki/median_voter_theory

Aplicación: Por qué el centro político es tan codiciado Supongamos que las preferencias de los votantes se distribuyen uniformemnte en una sola dimensión, a lo largo del espectro ideológico de izquierda (0) a derecha (1). Hay dos candidatos Cada votante vota al candidato que esté más cercano a su posición ideológica Bajo estas condiciones, predeciremos la posición ideológica de los candidatos Podemos ver la situación como un juego estratégico entre dos jugadores los candidatos El conjunto de las estrategias de cada jugador es [0, 1] Las función de pago para cada jugador es la parte del electorado que le vota.

Aplicación: Por qué el centro político es tan codiciado > + = < + =. si 2 si 0.5 si 2 1 ), ( 2 1 2 1 2 1 2 1 2 1 2 1 2 a a a a a a a a a a a a u Las funciones de pago de los jugadores son las siguientes: > + = < + =. si 2 1 si 0.5 si 2 ), ( 2 1 2 1 2 1 2 1 2 1 2 1 1 a a a a a a a a a a a a u En efecto, Consideremos el perfil estratégico (a 1, a 2 ), con a 1 < a 2 Las ideologías más cercanas a a 1 que a 2 se representan con el intervalo [0, (a 1 +a 2 )/2]. Eso quiere decir que (a 1 +a 2 )/2 -ecima parte del electorado votará por el candidato 1. Análogamente, [ (a 1 +a 2 )/2, 1] representa las ideologías más cercanos al a 2 que al a 1. Asimismo, 1 - (a 1 +a 2 )/2 -ecima parte votará por el candidato 2.

Aplicación: Por qué el centro político es tan codiciado El teorema del votante de la mediana dice: Se puede mostrar que el único equilibrio de Nash de este juego es (1/2, 1/2). De manera que, en las condiciones mencionadas, cada candidato intenta atraer al votante que está en el centro de la distribución del espectro ideológico. El resultado se debe a Anthony Downs http://en.wikipedia.org/wiki/anthony_downs

Aplicación: Duopolio de Cournot Puedes saltar esta parte, aunque es interesante. Explicamos una importante aplicación económica del concepto de equilibrio de Nash Cournot introdujo este ejemplo de mercado en 1838 y descubrió su equilibrio, muchos años antes que Nash introdujese su concepto. Es un modelo fundamentl en teoría de la organización industrial Mira sobre el modelo del duopolio de Cournot en Wikipedia

Aplicación: Duopolio de Cournot Dos empresas producen un mismo producto y compiten por un mercado. Sean q 1 y q 2 las cantidades producidas, P(Q) = a Q es el precio del producto, donde Q = q 1 + q 2. ciq i el coste de producción por la empresa i, suponemos que ci < a. Las empresas eligen sus producciones de forma simultánea. Cuánto debe producir cada empresa para maximizar beneficio

Aplicación: Duopolio de Cournot Traducimos el problema a un juego en forma normal: Dos jugadores dos empresas Espacio de estrategias: S i = [0, ) (el producto es continuamente divisible) Las ganancias de las empresas son: u i (q i, q j ) = q i (P(q i + q j ) ci)= q i (a - (q i + q j ) ci) El par de estrategias (s 1 *, s 2 *) forma un equilibrio de Nash si, para cada jugador u i (s i *, s j *) u i (s i, s j *) para cada posible estrategia s i de S i. para cada jugador s* i es una solución del problema max u i (s, i s ) j (*) s.a. s i S i

Aplicación: Duopolio de Cournot La condición de primer orden del problema (*) es necesaria y suficiente,con lo que se obtiene: q 1 * = 1/2(a-q 2 *-c1) Y q 2 * = 1/2(a-q 1 *-c2) de donde obtenemos: q 1 * = (a+c2-2c1)/3 q 2 * = (a +c1-2c2)/3

Críticas Indudablemente, el concepto de equilibrio de Nash es muy importante, ha conllevado importantes aplicaciones políticas, económicas, biológicas,. pero tiene sus críticas Hipótesis de conocimiento común: la hemos formulado aquí. Equilibrios múltiples A veces hay más de un equilibrio y puede ser difícil elegir entre ellos. Dilemas sociales El dilema de prisionero tiene muchas implicaciones prácticas donde los jugadores acaban con unas estrategias socialmente ineficientes. No sirven para dar consejo a una de las partes En algunos juegos sería útil comunicarse antes de empezar el juego; en otros no, para no estar amenazado; en algunos juegos mejor esperar al otro jugador para que sea el primero, en otros mejor dar el primer paso En general, sirven más bien para hacer una predicción del juego, supuesto que conocemos las preferencias de ambos participantes,

Análisis asimétrico presc/desc Este juego es casi como el juego de la transparencia Equilibrio, pero en este juego el jugador de las columnas (J2) arriesga ganar -100. Por eso, J2 podrá pensar elegir Dcha para protegerse J1 podrá intuir lo que piensa J2 y elegir Arriba pero, Hay alguna posibilidad de cuantificar las dudas de los jugadores? Izda. Dcha. Arriba 4,-100 10,6 Debajo 12,8 5,4 Podríamos intentar aplicar ideas del Análisis de Decisiones

Análisis asimétrico presc/desc Consideremos el problema del jugador J2 desde el punto de vista del análisis de decisiones Supongamos que J1 elige Arriba con una probabilidad p, y Debajo con 1-p. Izda. Dcha. Arriba 4,-100 10,6 Entonces, la utilidad esperada del J2 es -100p + 8(1-p) = 8 108p para Izda. y 6p + 4(1-p) = 4 2p para Dcha. Debajo 12,8 5,4 Así que, la probabilidad de equilibrio se encuentra al resolver la ecuación 8 108p = 4 2p, o p = 0.036. Así que J2 debe elegir Dcha. si el piensa que la probabilidad de que J1 elija Arriba es más que 0.036 Un análisis similar se puede efectuar para J1 J1 debe elegir Abajo si el piensa que la probabilidad de que J2 elija Dcha. es más que 0.38

Actividad Para el juego de piedra papel tijera en forma normal Calcula equilibrio de Nash. Interpretar solución. Podéis hacerlo por parejas. Envíanos la solución por email (puedes hacerlo a mano y escanearlo) antes del día 23 de Febrero a las 18.00 hora de Madrid. Pf haced un único envío con los dos ejercicios planteados en este capítulo

Punto final Alguna pregunta más? Hacédnoslas mediante el correo electrónico interno del Master. Dos buenas fuentes para este capítulo son Gibbons. Game Theory for Applied Economists (hay versión en Español) Aliprantis, Chakrabarti. Games and Decision Making