III. JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA



Documentos relacionados
Teoría de juegos en forma extensiva (repaso)

Por ello, también será importante la estructura del juego constituyente para efectuar una predicción del resultado.

Teoría de las decisiones y de los juegos Grupo 51 Ejercicios - Tema 3 Juegos dinámicos con información completa (0, 2) 2 D (3, 0) 1 B I

Universidad Carlos III de Madrid Teoría de Juegos Lista de Ejercicios de Juegos Repetidos y Bayesianos

I.1 Las siguientes afirmaciones son ciertas o falsas. Si una afirmación es cierta, ofrezca una explicación. Si es falsa ponga un contraejemplo.

Juegos Repetidos. Tema 2: Juegos repetidos un número infinito de veces. Universidad Carlos III de Madrid

TEORÍA DE JUEGOS. 1 Definiciónes y Conceptos Básicos. 1.1 Definición: 1.2 Elementos de un juego. 1.3 Representación de un juego.

Tema 07. LÍMITES Y CONTINUIDAD DE FUNCIONES

4.0 Inducción hacia atrás y Equilibrio de Nash Perfecto en

CASO PRÁCTICO DISTRIBUCIÓN DE COSTES

Los números racionales

Juegos Dinámicos. Tema 2: Juegos Dinámicos con Información Imperfecta. Universidad Carlos III

Examen Final 28 de Enero de 2009 Permutación 1

Teoría de Juegos Examen de junio de 2015

TEORIA DE JUEGOS (Síntesis de conceptos introductorias de J.Pérez, J.L. Jimeno y E. Cerdá, Teoría de Juegos, Madrid, Pearson, 2004, )

POLITICAS DE LA COMPETENCIA Licenciatura en Economía, 4º Curso (Grupos I y II) Profesor: Georges Siotis. Hoja 5: Integración vertical

MICROECONOMÍA II PRÁCTICA TEMA III: MONOPOLIO

Operando sobre esta relación, se obtiene

Liderazgo se genera en el lenguaje

Introducción. Ciclo de vida de los Sistemas de Información. Diseño Conceptual

Tema 5: Sistemas Monetarios Internacionales

Juegos en Forma Estratégica de Información Completa

Discriminación de precios y tarifa en dos etapas

Comente: Los bancos siempre deberían dar crédito a los proyectos rentables. Falso, hay que evaluar la capacidad de pago.

Juegos Dinámicos: Info Completa. Tema 05. Profesor: Carlos R. Pitta. Análisis de Sectores Económicos

Divisibilidad y números primos

Lección 24: Lenguaje algebraico y sustituciones

Tema 8 LA COMPETENCIA MONOPOLÍSTICA Y EL OLIGOPOLIO

Fundamentos de Investigación de Operaciones Investigación de Operaciones 1

INTRODUCCIÓN A LA CONTABILIDAD DE COSTOS DEFINICIÓN

Lección 4: Suma y resta de números racionales

Juegos y Comportamiento Estratégico Guía de ejercicios

Juegos Dinámicos Tema 4: Aplicaciones Económicas. Universidad Carlos III

Tema 1: Fundamentos de lógica, teoría de conjuntos y estructuras algebraicas: Apéndice

ÍNDICE. Introducción. Alcance de esta NIA Fecha de vigencia

Teoría del Juego - Juegos Combinatoriales Imparciales

1.0 Juegos en Forma Extensiva

PRÁCTICA N 2 SISTEMAS DE NUMERACIÓN

1. HABILIDAD MATEMÁTICA

Universidad Católica del Maule. Fundamentos de Computación Especificación de tipos de datos ESPECIFICACIÓN ALGEBRAICA DE TIPOS DE DATOS

PARTE 3 ECUACIONES DE EQUIVALENCIA FINANCIERA T E M A S

Centro de Capacitación en Informática

Tema 7: Juegos con información incompleta

Lección 9: Polinomios

Puedes Desarrollar Tu Inteligencia

Centro de Capacitación en Informática

EDICIÓN Y FORMATO (II)

Programa para el Mejoramiento de la Enseñanza de la Matemática en ANEP Proyecto: Análisis, Reflexión y Producción. Fracciones

LABORATORIO Nº 2 GUÍA PARA REALIZAR FORMULAS EN EXCEL

Líneas de espera. Introducción.

Administración de Empresas. 11 Métodos dinámicos de evaluación de inversiones 11.1

PROBLEMAS DE ECUACIONES SIMULTÁNEAS

Problemas fáciles y problemas difíciles. Cuando a los niños les planteamos problemas de suma y resta, Laura dejó sin resolver el siguiente problema:

Análisis de propuestas de evaluación en las aulas de América Latina

Matrices Invertibles y Elementos de Álgebra Matricial

MÉTODO DEL CAMBIO DE BASE PARA CÁLCULO MANUAL DE SUBREDES CON IP V4.0

El palacio de la Alhambra: La primera expansión. El favor de los visires

Explicación de la tarea 3 Felipe Guerra

RIESGO Y RENTABILIDAD DE LA EMPRESA (Riesgo y Rendimiento) Qué es lo que determina el rendimiento requerido de una inversión?

Trabajo Semanal Alternativo

Hoja1!C4. Hoja1!$C$4. Fila

MICROECONOMÍA MICROECONOMÍA

LÍMITES Y CONTINUIDAD

Reglas del juego. 2 o más jugadores

UNIDAD 4 PROCESOS DE MARKOV

Un problema sobre repetidas apuestas al azar

Sesión 3 - Movimiento Diferencial

(1) Medir el azar. ESTALMAT-Andalucía Actividades 06/07. a) Cuenta los casos en que la suma de salga múltiplo de tres y calcula la probabilidad.

ANALISIS MULTIVARIANTE

CAPÍTULO 10 Aplicaciones de la Derivada a Funciones Económicas

Apuntes de Matemática Discreta 1. Conjuntos y Subconjuntos

Aire ambiente: No se recogieron muestras en esta comunidad.

Lección 1-Introducción a los Polinomios y Suma y Resta de Polinomios. Dra. Noemí L. Ruiz Limardo 2009

Ecuaciones de primer grado con dos incógnitas

Funciones CONJUNTO EXCEL 2013 AVANZADO

Un juego curioso con conexiones interesantes

Sistemas de Calidad Empresarial

Unidad: Representación gráfica del movimiento

Ámbito Científico-Tecnológico Módulo III Bloque 2 Unidad 1 Quien parte y reparte, se lleva la mejor parte

Autómatas Finitos. Leopoldo Altamirano, Eduardo Morales. Verano, 2011 INAOE. Introducción a. Autómatas. Definición formal de un. Finito Determinístico

Colección de problemas de. Poder de Mercado y Estrategia

LA SELECCION DE PERSONAL

Llamamos potencia a todo producto de factores iguales. Por ejemplo: 3 4 =

Escuela Profesional de Ingeniería Económica Curso. Análisis Económico II (Microeconomía Intermedia II) Código

Cálculo Simbólico también es posible con GeoGebra

VECTORES. Módulo, dirección y sentido de un vector fijo En un vector fijo se llama módulo del mismo a la longitud del segmento que lo define.

Este documento ha sido generado para facilitar la impresión de los contenidos. Los enlaces a otras páginas no serán funcionales.

EVALUACIÓN DE COSTO ANUAL EQUIVALENTE (CAUE) ECONOMIA PARA INGENIEROS DENNICE OBREGÓN RENTERIA CÓDIGO:

Instrucción IrA (GoTo). Saltos no naturales en el flujo normal de un programa. Pseudocódigo y diagramas de flujo. (CU00182A)

Usamos que f( p) = q y que, por tanto, g( q) = g(f( p)) = h( p) para simplificar esta expresión:

TEORÍA A DE JUEGOS. Un marco para estudiar y aplicar en la gerencia política

T.1 CONVERGENCIA Y TEOREMAS LÍMITE

Ambas componentes del sistema tienen costos asociados que deben de considerarse.

Una publicación de la Oficina de Información al Consumidor CALL-FCC (voz), TELL-FCC (TTY)

Universidad Diego Portales Facultad de Economía y Empresa. 1. Reputación. Apuntes de Teoría de Juegos Profesor: Carlos R. Pitta

Interpolación polinómica

TABLA DE DECISION. Consideremos la siguiente tabla, expresada en forma genérica, como ejemplo y establezcamos la manera en que debe leerse.

Una desigualdad se obtiene al escribir dos expresiones numéricas o algebraicas relacionadas con alguno de los símbolos

Datos del autor. Nombres y apellido: Germán Andrés Paz. Lugar de nacimiento: Rosario (Código Postal 2000), Santa Fe, Argentina

CONCEPTOS PREVIOS TEMA 2

Transcripción:

Notas de clase de Teoría de Juegos - Marcela Eslava 3 III JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA Dinámicos: Al menos un jugador observa cómo actúa al menos otro jugador antes de tomar su propia decisión Movidas secuenciales (al menos algunas) Información Completa: Cada jugador conoce la función objetivo de cada uno de sus contrincantes Con frecuencia la representación más útil de estos juegos es la representación extensiva, que discutimos en el capítulo I Recuerde también que una estrategia para un jugador i es un plan de acción completo, es decir, especifica una acción para cada posible situación en que i es llamada a actuar Entonces en juegos dinámicos, una estrategia de i especifica una acción para cada posible secuencia de movidas previas que pueden llevar a un nodo de decisión de i Por lo anterior, en juegos dinámicos las estrategias son distintas a las acciones Solución de juegos dinámicos de información completa: Ejemplo 3 El alcalde va a someter a votación del concejo el presupuesto para el año siguiente Sabe que para que el presupuesto pase necesita los votos de 3 concejales que tienen gran apoyo en el norte de la ciudad Estos a su vez, querrían presionar al alcalde para que antes de pasar el presupuesto haga un parque en su zona de la ciudad La matriz de pagos es la siguiente: Suponga que queremos encontrar los Equilibrios de Nash, para lo que hacemos la representación normal Usaremos la notación (X,Y) para una estrategia de los concejales, donde la primera componente corresponde a lo que harían si el alcalde no hiciera parque, y la segunda lo que haría si el parque se construyera Usaremos las abreviaciones NP=no parque, P=parque, N=no aprobar, A=aprobar Concejo (A,A) (A,N) (N,A) (N,N) Alcalde NP (5,) (5,) (0,0) (0,0) P (3,4) (0,5) (3,4) (0,5)

Notas de clase de Teoría de Juegos - Marcela Eslava 4 Como usted puede comprobar, hay 3 Equilibrios de Nash: ((NP, (A, N)), (NP, (A, A)), (P, (N, N)), asociadas a los resultados posibles "se hace el parque y los concejales no aprueban" y "no se hace el parque y los concejales aprueban" La primera de estas opciones, sin embargo, no parece tener mucho sentido En el árbol de juego es claro que si el alcalde no cede a la presión por hacer el parque, lo que más convendrá a los concejales es aprobar el presupuesto, y esto maximizaría la utilidad del alcalde Tiene sentido entonces pensar que el alcalde no hará el parque Por qué hay entonces in Equilibrio de Nash que no captura esta predicción? Note que en el equilibrio (P, (N, N)) la estrategia de los concejales es óptima dado que el alcalde hizo parque (lo que refleja el carácter de EN), pero no todas las componentes de la estrategia son óptimos individualmente En particular, la estrategia de éstos les señala no aprobar si no hay parque, lo que no es óptimo para ellos Si se reconociera este hecho, el alcalde no jugaría P Cómo solucionar este problema del concepto de EN aplicado a juegos dinámicos? Se utiliza un concepto más restringido de solución, llamado Equilibrio Perfecto de Subjuegos (EPS) 3 Equilibrio Perfecto de Subjuegos Subjuego: Es una porción del juego que: Empieza en un único nodo de decisión Contiene todos los nodos que siguen a su nodo inicial Si contiene cualquier punto de un conjunto de información, entonces contiene todo el conjunto de información Ejemplo 33 Es un Subjuego Este no es un subjuego (Le falta incluir la rama inferior, que sigue al nodo en el que comienza el subjuego) Ejemplo 34 En el juego del alcalde hay 3 subjuegos:

Notas de clase de Teoría de Juegos - Marcela Eslava 5 Definición: Una combinación de estrategias (una para cada jugador) es un EPS si las estrategias constituyen un Equilibrio de Nash en cada subjuego correspondiente Esta definición implica que el Equilibrio Perfecto de Subjuegos es un Equilibrio de Nash: El EPS es un refinamiento de la noción de Equilibrio de Nash Entonces, el conjunto de EPS de un juego es siempre un subconjunto del conjunto de EN Equilibrio de Nash Equilibrio Perfecto de Subjuegos Cómo hallar los EPS de un juego? Para juegos con horizonte finito, se utiliza un procedimiento conocido como "Inducción hacia atrás" 3 Inducción hacia atrás: Es un proceso que analiza el juego de "atrás hacia adelante", es decir, desde el último período hasta el primero La intuición tiene que ver con lo que un jugador del periodo en efecto hace cuando toma su decisión: evalúa cuál sería la reacción de los siguientes jugadores a sus diferentes posibles decisiones, y con base en esto determina su decisión óptima Este proceso permite llegar a EPS porque analiza cada uno de los subjuegos del juegos, y encuentra las mejores respuestas de cada jugador en los subjuegos en los que le corresponde mover El proceso de inducción hacia atrás se puede resumir como: Empezar por el final del juego (último periodo) y encontrar la (s) estrategia (s) óptima (s) del jugador que tiene ese turno, en cada subjuego de ese periodo Basado en esas deducciones, "reducir" cada subjuego del último periodo a las opciones óptimas Devolverse a la etapa anterior del juego y encontrar las acciones óptimas en cada subjuego de ese periodo, a partir de las "reducciones" de los subjuegos posteriores encontradas en el paso Reducir estos nuevos subjuegos a esas posibilidades óptimas 3 Repetir el paso, hasta llegar a la primera etapa del juego En el ejemplo anterior (del alcalde y el Concejo): En el último periodo: Si el alcalde hace parque (subjuego que empieza después de "parque") entonces los concejales no aprueban y los pagos serian (0,5) Si el alcalde no hace parque (subjuego que empieza después de "no parque") entonces los concejales aprueban y los pagos llegarían a (5,) Funcion de * ReacciónConcejo = A, N SConcejo = Si No Parque Si Parque ( A, N) Luego devuélvase un periodo, sabiendo que el alcalde también puede deducir lo que los concejales harán Note que, para el alcalde, el juego se reduce a:

Notas de clase de Teoría de Juegos - Marcela Eslava 6 S S Alcalde Alcalde = NP Concejo A (5,) = P Concejo N (0,5) Ante lo cual el alcalde claramente prefiere no hacer parque y desencadenar una aprobación, que le genera utilidad de 5, mientras que hacer el parque lo llevaría a una utilidad de 0 Hallamos entonces el siguiente Equilibrio: (NP, (A, N)) Resultado: El Alcalde no hace parque, concejales aprueban presupuesto (NP, A) El proceso de inducción hacia atrás y el concepto de EPS eliminan amenazas no creíbles En este juego la amenaza de no aprobar el presupuesto si no se hace el parque no es creíble, dados los pagos Ejemplo 34: Duopolio de Stackelberg Considere dos firmas (i =, ) que producen el mismo bien y lo venden en el mismo mercado (entonces ambas enfrentan el mismo precio) Cada firma escoge la cantidad que produce La firma actúa primero, le informa a la firma su decisión y sólo entonces la firma escoge (en esta secuencia el juego se diferencia del duopolio de Cournot) La curva de demanda en ese mercado esta dada por: Q = a P, Q = q + q Objetivo de cada firma: Max Π i = Pq i C( q i ), donde C ( q i ) = cqi qi Espacios de estrategias: S = q, S = q donde q 0,,q 0, { [ )} { ( ) [ ) [ )} 0 q Solución por inducción hacia atrás: Periodo : Encontramos la función de reacción para la firma en términos de la producción de la producción de la firma, que ya ha observado La condición de primer orden de este problema, con q * a q c dado, implica la siguiente función d reacción: q ( q ) = Periodo : La firma decide teniendo en cuenta lo que prevé que sucederá en t = (q (q )) Entonces elimina opciones irrelevantes (todo q que no este en el recorrido de la función de reacción que hallamos arriba) La firma entonces usa q *(q ) al resolver su problema: * a c q Max Pq cq = q( a q ( q ) q) cq = q La condición de primer orden de este problema lleva a la cantidad óptima que la firma escoge, y nos permite entonces determinar el siguiente equilibrio: E P S q a c =, q Re sultado del equilibrio : ( q ) a q c = a c a q =, q = 4 c

Notas de clase de Teoría de Juegos - Marcela Eslava 7 33 Aplicación: Juegos de Negociación Las técnicas vistas para estudiar juegos dinámicos son útiles para estudiar, desde el punto de vista teórico, procesos de negociación Por ejemplo: Negociación de precios entre compradores y vendedores Negociación de salarios entre sindicatos y empresas Negociación de acuerdo humanitario para canjear secuestrados políticos por guerrilleros presos Estos procesos se caracterizan, con frecuencia, por: Oferta y contraoferta Hay número máximo de periodos que se puede negociar, pero el juego se puede acabar temprano si hay acuerdo Los jugadores valoran un acuerdo temprano más que uno tardío (y se asume que ambas partes quieren llegar al acuerdo) Entonces, hay un descuento ínter-temporal A todos les conviene llegar a un acuerdo Ejemplo 35 Alianza Summa (vendedor) y Germán Efromovich (comprador), están negociando la venta de Avianca Suponemos que el bien vale 0 para Alianza Summa y, por tanto P, si se llega a un acuerdo en el periodo por el precio P u Alianza Summa = δ P, si se llega a un acuerdo en el periodo por el precio P δ P3, si se llega a un acuerdo en el periodo 3 por el precio P3 donde δ es una tasa de descuento intertemporal, que suponemos igual para ambos agentes (y representa la valoración de llegar a un acuerdo temprano El bien vale para Germán Efromovich (es lo que él cree que puede producir mientras opera), por lo que: (- P ), si se llega a un acuerdo en el periodo por el precio P u Germán Efromovich = δ ( P ), si se llega a un acuerdo en el periodo por el precio P δ (- P3 ), si se llega a un acuerdo en el periodo 3 por el precio P3 El juego sigue la siguiente secuencia: Alianza Summa (AS) ofrece vender por un precio P Germán Efromovich (GE) acepta o rechaza Si acepta entonces toma el bien y paga el precio solicitado por Alianza Suma 3 Si rechaza entonces puede ofrecer otro precio P AS debe responder a esta oferta Si la acepta, se da la transacción Si AS rechaza entonces el juego termina y AS recibe utilidad δp y GE recibe δ(-p ) Si AS rechaza este precio, no hay acuerdo y las utilidades son (u V,u c )=(0,0) Usted puede comproba siguiendo un proceso de inducción hacia atrás que se llega a un acuerdo en el periodo, pues la Alianza Summa pide el mayor precio posible que hace que Germán Efromovich prefiera no llegar a la segunda ronda El equilibrio perfecto de subjuegos tiene como acciones: Alianza Summa : Ofrece P = δ ε δ, Germán Efromovich : Acepta donde ε es la menor unidad posible que Alianza Summa puede escoger (por ejemplo, centavo)

Notas de clase de Teoría de Juegos - Marcela Eslava 8 Este tipo de juegos involucra un EPS tal que nunca se pasa de la primera ronda de negociación Tal resultado se debe a que el primer jugador puede ofrecer el precio que más le conviene, sujeto a que se lo acepten, y además descuenta del futuro Entonces tiene incentivos para detener el juego apenas comienza 34 Juegos Repetidos Un juego puede repetirse varias veces, incluso al infinito Al repetirse se convierte en un juego dinámico Se usará la siguiente notación: si G denota el juego, entonces (G, T) denota el juego repetido T veces Los juegos repetidos son una construcción interesante, pues ofrecen la posibilidad de generar premios y castigos que coordinen a los agentes fuera del equilibrio del juego estático Por ejemplo: es posible que el juego del prisionero tenga EPS donde los jugadores escogen (NC,NC) en cada periodo? Uno podría pensar que puede coordinar a los jugadores en este resultado óptimo si los logra convencer de la siguiente estructura de premios y castigos: si juegan (NC,NC) este período (NC,NC) será equilibrio en el siguiente (un "premio, dados los pagos relativamente altos de (NC,NC)), de lo contrario el único equilibrio posible será (C,C) (el "castigo") En esta sección estudiamos la posibilidad de obtener tales resultados deseables mediante estructuras de premios y castigos en periodos futuros Vamos a ver cómo el éxito de esta posibilidad depende de las características específicas del juego en dos dimensiones: ) si se repite un número finito o infinito de periodos, ) si el juego estático tiene un equilibrio único o múltiples equilibrios Con frecuencia se utiliza un descuento intertemporal para valorar las utilidades de distintos períodos La utilidad del jugador i en el juego repetido T veces está dada por: T t u i = δ uit t=, donde T denota el periodo final del juego, δ (0,) es la tasa de descuento intertemporal y u it es la utilidad que el jugador obtiene en el periodo t Si T =, el juego se repite al infinito Ejemplo 36: Dilema del prisionero repetido finitos períodos Lo que propusimos atrás es una estrategia desencadenante, porque las acciones de un periodo "desencadenan" premios o castigos: En (t = ) ( NC,NC) Estrategia ( ) ( NC,NC) Si en todo t < t se jugó (NC,NC) En t =, 3,T ( C,C) En caso contrario La idea de la estrategia desencadenante es tratar de obtener un resultado conveniente que no sería posible si el juego básico se jugara una sola vez, usando una estructura de premios y castigos CASO T = : Dos períodos, t = y t = Los pagos de cooperar siguiendo la estrategia desencadenante son: Si se coop era en t = u ST = u RGi = u i + δu i = ( 3) + δ ( 3) Cooperar en lugar de jugar el EN de cada periodo conviene a ambos (dado que jugar el EN en cada periodo daría utilidades de -6(+δ)) La pregunta es: puede la cooperación darse en EPS? En otras palabras: son las amenazas de premio y castigo creíbles? Note que la única forma de que en equilibrio en el primer periodo no se juegue (C,C) es que los resultados del primer periodo condicionen lo que pase

Notas de clase de Teoría de Juegos - Marcela Eslava 9 en el segundo, de tal manera que se cambien los incentivos del juego completo visto desde el primer periodo Para analizar si esto es en efecto posible, hay que resolver el juego por inducción hacia atrás (pues el problema de la credibilidad del premio y castigo equivale a preguntarse si la estrategia desencadenante puede representar un EPS): t=: Note que en el periodo t= tenemos varios subjuegos, todos idénticos entre si, excepto porque en cada uno se observó un resultado distinto en t = Cada uno de esos subjuegos es idéntico al juego estático, excepto por que a los pagos de cada posible combinación de acciones se les suma la utilidad obtenida en el primer periodo (que dentro de cada subjuego es una constante) Por tanto, en cada uno de esos subjuegos, el único EN posible es (C,C) Un EPS del juego completo, entonces, requiere que en cualquier subjuego del segundo periodo se juegue (C,C) t=: dada la respuesta anterior, independientemente de lo que se haga en el primer periodo el único equilibrio posible en el segundo es (C,C) De esta forma, las acciones del periodo sólo tienen repercusiones sobre la utilidad de ese periodo El hecho de que se corten los vínculos entre los dos periodos hace que el primer periodo sea idéntico también al juego estático Por esta razón, en EPS los jugadores también escogerían (C,C) en el primer período Es este un resultado general? Por qué no pudimos modificar aquí el resultado del juego estático mediante la estructura de premios y castigos específicos? Hay dos características de este juego que nos llevaron a ese resultado: el juego estático tiene un solo EN, y el dinámico sólo se repite por un número finito de periodos Entonces, una estrategia desencadenante como la propuesta no puede representar un EPS, pues un EPS sólo puede permitir que en los subjuegos del último periodo se juegue el EN del juego estático Por tanto, o el premio o el castigo no podrían formar parte de un EPS en el último periodo A su vez, esto implica que en el período anterior no hay incentivos para desviarse del EN del juego estático, pues las acciones de ese periodo no afectarán lo que suceda en el siguiente (que es el último) Usando este raciocinio de forma iterativa llegamos al siguiente resultado: Proposición: Si el juego estático (G) tiene exactamente un Equilibrio de Nash = (S *,S *,S N*) entonces el juego repetido (G, T) tiene exactamente un Equilibrio Perfecto de Subjuegos, en el que en cada uno de T periodos el jugador (i) escoge la acción s i*, independientemente de lo que se haya jugado anteriormente Note que esta lógica aplica no sólo a casos en que el juego G es estático Si G es un juego dinámico finito que se repite T veces, con un único EPS (del juego base), también aplica que en el juego repetido el único EPS consiste en el EPS base repetido T veces Sin embargo, el resultado no se extiende a juegos repetidos donde el juego base tiene más de un EN Aunque de forma similar a la discusión anterior, en el último periodo sólo es creíble "premiar" o "castigar" con un EN, la diferencia en este caso es que hay múltiples EN que se pueden usar como premios y castigos Se puede entonces lograr que las acciones del periodo T- condicionen el resultado de T Considere el siguiente ejemplo: Ejemplo 37 Tome el siguiente dilema del prisionero modificado (G,T=)

Notas de clase de Teoría de Juegos - Marcela Eslava 30 Sonia Confesar No Confesar Parcialmente Simón trinidad Confesar (-6,-6) (-,-0) (-35,-7) No Confesar (-0,-) (-3,-3) (-7,-) Parcialmente (-7,-35) (-,-7) (-35,-35) Es posible coordinar a los agentes en el primer periodo en el resultado óptimo (No Confesar, No Confesar) si: El premio por (No Confesar, No Confesar) en (T=) y castigo por cualquiera diferente de (No Confesar, No Confesar) son creíbles Los jugadores otorgan al futuro una importancia suficientemente elevada (δ suficientemente alto) Considere la siguiente estrategia desencadenante: Estrategia Desencadenante = ( No Confesar, No Confesar) en t = ( Parcialmente, Parcialmente) Si en t = ( No Confesar, No Confesar) ( Confesar, Confesar) en t = en caso contrario El lector puede demostrar fácilmente, con un poco de álgebra, que esta estrategia desencadenante hace parte de un EPS si δ>(/5) La intuición es la siguiente: los subjuegos del último periodo son idénticos al juego base, por lo que es creíble en el último periodo implementar cualquier EN del juego base (porque cada jugador estaría jugando su mejor respuesta al otro) De esta forma, tanto el premio como el castigo propuestos son creíbles La estrategia desencadenante entonces condiciona de manera creíble el resultado de t= a lo que suceda en t= Si en t= los agentes se coordinan en (N,N) cada uno obtiene -3 vs - que obtendría si se desviara unilateralmente; esta diferencia de "útiles" es el costo de corto plazo de la corrdinación Sin embargo, hay un beneficio que se obtiene en el siguiente período: obtener -35 del premio en lugar de -6 del castigo (una diferencia de 5, que se valora como δ*5, porque sólo se obtiene en el futuro) El requisito de que el beneficio de coordinarse sea mayor que el costo es capturado por la condición δ>(/5) Algunas generalizaciones: En algunos juegos repetidos de forma finita es posible coordinar a los agentes en un "óptimo social" que no sea EN del juego base, aunque solamente en los periodos previos al último Se requiere que haya múltiples EN del juego base, uno de los cuales debe tener pagos suficientemente altos para que cada jugador lo considere un "premio", mientras otro debe tener pagos suficientemente bajos para servir como "castigo" efectivo Es también necesario que δ sea suficientemente elevado El procedimiento general para encontrar las circunstancias en que una estrategia desencadenante dada es EPS involucra inducción hacia atrás En cada periodo, se puede dividir los subjuegos en dos tipos: () no hubo desviaciones previas con respecto a la estrategia desencadenante, () hubo desviaciones previas En cada tipo de subjuego se analiza para cada jugador cuál es la mejor respuesta, si su contendor jugara lo indicado por la estrategia desencadenante (pues se trata de ver si lo sugerido por la Estrategia Desencadenante es Equilibrio de Nash de ese subjuego)

Notas de clase de Teoría de Juegos - Marcela Eslava 3 Note: En t = T cada subjuego es igual al juego base, por cuanto los únicos premios y castigos que pueden ser Equilibrios de Nash de estos subjuegos son los Equilibrios de Nash del juego Base