Juegos Repetidos. Alvaro J. Riascos Villegas Universidad de los Andes. Mayo de Introducción 2. 2 Ejemplo horizonte finito 2

Documentos relacionados
Vamos a estudiar algunos ejemplos en horizonte finito que ilustran algunas de las ideas principales. 1\2 D C D 1,1 4,0 C 0,4 3,3

Juegos repetidos. Capítulo Introducción Ejemplo horizonte nito

3.7. Colusión Tácita: juegos repetidos Colusión Tácita: juegos repetidos

Tecnología Maximización del beneficio. Teoría de la Firma. Alvaro J. Riascos Villegas Universidad de los Andes. Septiembre 2 de 2014

7.- Considere un mercado con n empresas que producen un bien homogéneo. La función

Teoría de las decisiones y de los juegos Asignatura: Profesores: Sjaak Hurkens y Flip Klijn Examen: 6 de febrero de 2008

Aplicaciones Juegos Dinámicos

Extensión mixta de un juego 1

Juegos con Comunicación

Juegos dinámicos con información completa pero imperfecta

A. Verdadero B. Falso

Teoría de las decisiones y de los juegos Asignatura: Profesores: Sjaak Hurkens y Flip Klijn Examen: 10 de julio 2008

Colusión. Organización Industrial. Leandro Zipitría. Licenciatura en Economía, 2013

ESCUELA SUPERIOR POLITECNICA DEL LITORAL

Teoría de juegos. Andrés Ramos

Auxiliares: G. Carniglia y F. Carrera. Guía 2: Juegos en forma extensiva y juegos Bayesianos

El Teorema de la función implicita versión para funciones f : R R

9. Teoría de la firma

Teoría de juegos Andrés Ramos Universidad Pontificia Comillas

MICROECONOMÍA II NOTAS DE CLASE MODULO A: LOS MERCADOS DE BIENES Y SERVICIOS FINALES

IN Oligopolio. Gonzalo Maturana. Otoño DII - U. de Chile. Gonzalo Maturana (DII - U. de Chile) IN Oligopolio Otoño / 17

Curso EJERCICIOS DE ECONOMIA INDUSTRIAL APLICADA

Modelos de Negociación

Teoría de las decisiones y de los juegos Grupo 51 Ejercicios - Tema 3 Juegos dinámicos con información completa B 2

Repaso Teoría de Juegos Jueves 30 de Julio.

UNIVERSIDAD DE LOS ANDES FACULTAD DE ECONOMIA TEORIA DE JUEGOS Profesora: Marcela Eslava. Parcial 1 2 de marzo de 2011 NOMBRE:

UNIVERSIDAD DE LOS ANDES FACULTAD DE ECONOMIA TEORIA DE JUEGOS Profesora: Marcela Eslava. Parcial 2 27 de octubre de 2016 NOMBRE:.

Sesión 11. Introducción. Contenido DECISIONES EN MERCADOS DE OLIGOPOLIO COOPERATIVO. Dr. Jorge Ibarra Salazar

Teoría de Juegos Modelos Rectangulares. Agosto 2016

Tema 2: Juegos estáticos (o de una etapa) con información completa

Tema 4: Aplicaciones del equilibrio de Nash

Contenidos. Juegos en forma estratégica. El dilema del prisionero. El dilema del prisionero

CONTENIDO. 1 Una introducción a los juegos y su teoría. Prefacio XV Guía para el lector XIX. Primera Parte Teoría básica de los juegos

Teoría de Juegos Solución Examen Final

EL OLIGOPOLIO. MODELO DE BERTRAND.

MICROECONOMIA II. PRACTICA TEMA IV: Oligopolio

Clase 12: El modelo básico de equilibrio general dinámico

Introducción a las Subastas de Múltiples Unidades

INDICE Parte Uno. Fundamentos Capitulo 1. La Organización Industrial: Qué, cómo y por qué? Capitulo 2. Algunas Herramientas Microeconómicas Básicas

Aprendizaje y extensiones mixtas

I.2 Eliminando una o más de sus estrategias, un jugador puede procurarse un mejor resultado. Explique por qué sí o por qué no. Muestre un ejemplo.

Tema 3 Conceptos básicos de solución

Economía de la información y la incertidumbre 3er curso (1º Semestre) Grado en Economía

3.3. Competencia en cantidaes modelo de Bertrand

Capítulo 2 Juegos estáticos con información asimétrica

3.4. Competencia en precios modelo de Bertrand Competencia en precios modelo de Bertrand

I.2 La inducción para atrás es un caso especial de la perfección en subjuegos? O es al revés?

Introducción a la Teoría de Códigos

Introducción a las Subastas de Múltiples Unidades

Oligopolio. José C. Pernías. Curso Índice

Aplicaciones juegos dinámicos

Extensión mixta. Capítulo Extensión mixta de un juego

1) Nome e apelidos do profesor/a que impartirá docencia J. Andrés Faíña Medín y Jesús López Rodriguez

2.1. Es un juego de información perfecta o imperfecta? Fundamente su respuesta.

Teoría de Juegos No Cooperativa

Juegos de información incompleta

Teoría de Juegos Modelos Extensivos. Agosto 2016

Amador, Díaz, Ledesma y Lorenzo

Pontificia Universidad Católica del Ecuador Facultad de Economía

π M/n[1/(1- δ)] π M +0.

Clase I. Ejemplo donde equilibrios de Nash y de Nash perfecto en subjuegos no coinciden

q c q m R 2 q 1+q 2 =q m

El hecho de que en cualquier problema de teoría de juegos existan distintos decisores con intereses generalmente contrapuestos, hace que el concepto

FACULTAD DE CIENCIAS ECONOMICAS Y EMPRESARIALES PROGRAMA ANALÍTICO TEORIA DE JUEGOS

3.5. Competencia en precios con restricciones de capacidad - Solución de Edgeworth Competencia en precios con restricciones de capacidad

La propiedad de compacidad

Ejercicios Calificados: 4 (uno por módulo) 60% Examen parcial 20% Examen Final 20%

1. Sucesiones. Sucesiones. Compacidad. {( 1) n, n N} = { 1, 1, 1, 1, 1, 1,... } es una sucesión de elementos del conjunto { 1, 1}, y la familia

Límites Laterales. El límite por la derecha se denota. x 2 + x 2 = 1. x 2. x + x 2. x = x + x 2. El límite por la izquierda se denota

Algoritmic game theory - IIC3810

MICROECONOMÍA INTERMEDIA

TEMA 1: ECONOMÍAS DE INTERCAMBIO October 6, 2015

Negociación y Cooperación con Dos Agentes

UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA

Plan de Estudios de la Licenciatura en Economía, 2007.

Bienes homogéneos Bienes diferenciados. Teoría de juegos. Microeconomía II. Leandro Zipitría. 1 Facultad de Ciencias Económicas y Administración

Jugador 2 A (2,0) (1,1) (4,2) M (3,4) (1,2) (2,3) B (1,3) (0,2) (3,0) Jugador 2 A (0,4) (4,0) (5,3) M (4,0) (0,4) (5,3) B (3,5) (3,5) (6,6) Izquier da

Teoria de subastas un único objeto

5. OLIGOPOLIO. 5.0 Repaso: Equilibrio de Nash. 5.1 Definición y Modelos de Oligopolio. 5.2 Datos. 5.3 Modelo de Cournot. 5.4 Modelo de Stackelberg

MICROECONOMÍA AVANZADA II Lista 4 de ejercicios Curso 2009/10 Universidad de Alicante

JUEGOS ESTÁTICOS T. 4 VARIABLE CONTINUA Y APLICACIONES ECONÓMICAS. Universidad Carlos III de Madrid

Juegos en Forma Estratégica de Información Completa

Teoría de Juegos Examen Final 2017-I

Riesgo Moral. Analizaremos estos problemas usando nuestras herramientas de TJ.

Propiedad de Completez (Parte 2) (3) Si A es un subconjunto de un campo ordenado F y u F, se dice que u es un máximo de A si,

Tópicos en Teoría de los Juegos Universidad del CEMA Buenos Aires, Agosto de 2008

ESCUELA SUPERIOR POLITECNICA DEL LITORAL

Tema 12: Distribuciones de probabilidad

Regulación Económica

ECONOMÍA DE LAS TELECOMUNICACIONES. (2 OCTUBRE 2012).

GUÍA DOCENTE DE LA ASIGNATURA

3.5. Competencia en precios con restricciones de capacidad - Solución de Edgeworth Competencia en precios con restricciones de capacidad

Cómo la función de reajuste de Nash genera equilibrio/os en juegos estratégicos finitos?

Juegos estáticos de información completa *

Clase 4 24 de agosto de 2016

Organizacion Industrial

Transcripción:

Juegos Repetidos Alvaro J. Riascos Villegas Universidad de los Andes Mayo de 2016 Contents 1 Introducción 2 2 Ejemplo horizonte finito 2 3 Horizonte infinito 2 4 Equilibrios de Nash 4 5 Equilibrios Perfectos en Subjuegos 5 6 Aplicaciones 5 6.1 Oligopolio............................... 5 6.1.1 Cournot con información perfecta.............. 5 6.1.2 Cournot con información imperfecta............ 7 6.1.3 Bertrand........................... 7 A Principio de una única desviación es suficiente 7 Notas de clase basadas en Mas-Colell et.al [1995], Myerson, R. [1990] y Vega - Redondo,F [2003], Zamir, Sh. [2010] en The Second Brazilian Workshop of the Game Theory Society in honor of John Nash. 1

1 Introducción Dos conceptos nuevos surgen cuando consideramos que un juego puede repetirse un número finito o infinito de veces: Coordinación y reputación. La caracteríca principal de los juegos repetidos es que cada vez que se deben tomar acciones, el juego es el mismo. Cuando las acciones o el juego que se juega van cambiando el modelo es el que se conoce como juegos estocásticos. La repetición finita de un juego puede introducir equilibrios nuevos (EN, EPS), diferentes a jugar siempre el equilibrio del juego estático. Entre mayor sea el horizonte más equilibrios pueden surguir. 2 Ejemplo horizonte finito Ejemplo 1 Considere el siguiente juego repetido dos veces: 1\2 D C D 1,1 4,0 C 0,4 3,3 En este juego, todos los equilibrios del juego repetido implican jugar (D, D) en cada etapa. Sin embargo, la estrategia C puede utilizarse por fuera del camino de equilibrio. Por ejemplo considere la siguiente estrategia para cada jugador 1: En la primera etapa jugar D y en la segunda etapa, si el adversario jugó D jugar D de lo contrario jugar la mixta: ( 1 8, 7 8 ). Ahora a diferencia del ejemplo anterior donde todos los equilibrios son equivalentes en términos del resultado, puede ocurrir que surjan equilibrio nuevos. Ejemplo 2 Considere el siguiente juego repetido dos veces: 1\2 D C P D 1,1 4,0-1,0 C 0,4 3,3-1,0 P 0,4 3,3-2,-2 El único equilibrio del juego estático es (D, D). Sin embargo existen nuevos equilibrios del juego dinámico. Jugar C en la primera etapa y si el oponente juega C en la primera etapa jugar D. Caso contrario jugar D. 3 Horizonte infinito Ejemplo 3 Considere un juego repetido una infinidad de veces del juego estático: 2

1\2 D C D -10,-10 0,-12 C -12,0-1,-1 y suponga que la utilidad de cada jugador es de la forma: π δ i = δ t 1 π i (1) donde π i es el pago para i de acuerdo al juego estático. Considere la siguiente estrategia (trigger strategy): 1. En t 1 jugar C si ningún jugador ha jugado D en t 1 o antes. 2. Caso contrario jugar D. Si δ 2 3 entonces esta estrategia es un equilibrio de Nash. Por simplicidad supongamos δ = 2 3. Para ver esto, obsérvese que el pago en el equilibrio propuesto π es: 1 π = ( 2 3 )t 1 ( 1) = 3 (2) Ahora, si alguien intenta desviarse en t 0 = 0 entonces su pago será: t 0 1 ( 2 3 )t 1 ( 1) + 0 + t=t 0+1 ( 2 3 )t 1 ( 10) < 3. (3) Obsérvese que solamente hemos considerado desviaciones del equilibrio en una sola iteración del juego. Para una demostración de que esto es suficiente véase el Apéndice a estas notas. El modelo general que vamos a considerar es el siguiente. El juego estático lo denotamos por (N, (A i ), (W i )). Este juego se repite en varias ocasiones y todos los jugadores pueden observar lo que todos han jugado en el pasado. Las funciones de pago que vamos a considerar son de la forma: π δ = (1 δ) δ t 1 π i (4) Denotamos este juego repetido una infinidad de veces por R δ (W ). 1 Donde hemos utilizado que n xt 1 = 1 xn 1 x 3

4 Equilibrios de Nash Sea V = Conv{v R n : v = (W 1 (a 1 )...W n (a n ), a i A i }. Estos son los pagos posibles del juego estático incluyendo la posibilidad de que los jugadores utilicen un mecanismo de coordinación estocástico. Sea v i el menor valor al que puede ser forzado i si todos los demás coordinan para castigarlo. Esto es: v i = min α i i max αi i W i (α i, α i ) (5) v i puede interpretarse como una restricción de racionalidad individual ya que cualquier valor menor puede ser bloqueqdo por i. Teorema 1 (Equilibrio de Nash en Horizonte Infinito) Sea(v 1,...v 1 ) V, v i > v i para todo i. Entonces si δ es lo suficentemente grande, existe un equilibrio de Nash del juego R δ (W ) con pago v i para cada jugador. Prueba. Por simplicidad supongamos que existen a i A i tal que v i = W i (a 1,..., a n ). 2 Sea (α1, i..., αn) i la estrategias que implementan el valor minmax para el jugador i. Ahora considere la estrategia para el jugador i: en t jugar a i si antes de ningún jugador j se ha desviado de forma unilateral de jugar a j. Caso contrario jugar α j i donde j es el pirmer jugador que se desvió de forma unilateral. Este es un equilibrio de Nash. Si i intenta desviarse en en t 0 a a i el pago es: t 0 1 (1 δ) δ t 1 W (a i, a i ) + (1 δ)δ t0 1 W (a i, a i ) + (1 δ) t=t 0+1 δ t 1 W (α i i, α i i) (6) (1 δ t0 1 )v i + (1 δ)δ t0 1 W (a i, a i ) + δ t0 v i (7) donde a i es la mejor respuesta de i en el juego estático a a i. Sea f(δ) = (1 δ)v i + (1 δ)δ t0 1 W (a i, a i ) + δ t0 v i y obsérvese que lim δ 1 f(δ) = v i < v i. Luego si δ es lo sufientemente cerca de 1 no existen incentivos a desviarse. Ejemplo 4 Considere los juegos estáticos de la página 290 de Vega - Redondo. En ambos casos el valor minmax en estrategias puras para cada jugador es 1. En el primer juego es posible implementar el pago eficiente (4, 4). En el segundo ejemplo, obsérvese que solo hay un equilibrio de Nash en el juego estático. Ahora en el juego repetido es posible implementar el pago (2, 2) que es inferior a jugar el equilibrio de Nash del juego estático en todas las repeticiones del juego. 2 En este caso se puede definir v i utilizando únicamente estrategias puras. 4

Ejemplo 5 Considere el juego: 1\2 A B A 3,3-1,4 B 4,1 ɛ, ɛ Si ɛ > 0 la estrategia del gatillo es un SPE. Si ɛ > 0 y los agentes no son lo suficientemente pacientes, la estrategia del gatillo no es SPE. El mensage es que los equilibrios de los juegos repetidos nos son robustas a pequenñas perturbaciones del juego. 5 Equilibrios Perfectos en Subjuegos Sea ṽ i el menor pago que el jugador i puede llegar a tenr en un algún equilibrio de Nash del juego estático. Debe ser claro que ṽ v i. El teorema principal dice que si tenemos un vector de pagos (v 1,..., v n ) tal que v i > ṽ i entonces si δ es lo suficientemente grande, existe un equilibrio perfecto en subjuegos del juego repetido R δ (W ) que implementa este vector de pagos. 6 Aplicaciones 6.1 Oligopolio 6.1.1 Cournot con información perfecta Esta aplicación pone de manifiesto como un grupo de empresas puede sostemer un cartel de forma implícita. Tenemos n firmas que producen un bien homogéneo. F : R R denota la demanda agregada. Suponemos que satisface la ley de la demanda. La función inversa la denotamos por P : R R Cada firma tiene una función de costos creciente C i : R + R +. Por simplicidad vamos a suponer que todas la firmas son homogéneas. El conjunto de estrategias de cada firma es el nivel de producción q i. El pago neto Π i (q i, q i ) = P (Q)q i C i (q i ), donde Q es la oferta total que suponemos se agota completamente en el mercado. Denotamos por x c el producto de cada firma en el equilibrio de Nash simétrico del juego estático donde las firma compiten a la Cournot. Si las firmas pudieran coordinar creiblemente en un nivel de producción eficiente y simétrico entonces ellas podrían resolver el problema de maximización de la suma de los beneficios de cada firma. Denotaremos este nivel de producción eficiente por x m. 5

Supongamos que la función de demanda inversa es lineal: max{0, M dq} (8) y los costos marginales son constantes e iguales a c. Entonces los nivles de producción respectivos son: x c = M c (n + 1)d (9) y x m = M c 2nd (10) Obviamente, con más de dos firmas: x c > x m Si las firmas anticipan que competiran durante un número finito de periodos, sabemos que no van a surgir arreglos colusivos creíbles: el único equilibrio perfecto en subjuegos es replicar el equilibrio del juego estático. Si anticipan que van a competir de forma indefinida y si son lo suficientemente pacientes, estos pueden coordinar para sustentar el equilibrio eficiente x m. En efecto, la estrategia: Jugar siempre x m excepto si alguien se ha desviado con anterioridad en cuyo caso se juega siempre x c, es un equilibrio que implementa el pago simétrico de colusión perfecta. El problema con esta estrategia es que primero, en general el castigo de desviarse en algún periodo (hacia el equilibrio de Nash del juego estático) no tiene consecuencias cuantitativamente muy importantes y segundo, está sustentada en una amenaza de castigo excesivamente prolongado que no pareceria muy razonable dado que los agentes tienen también una infinidad de tiempo para renegociar en caso de que esto suceda. Otro tipo de estrategias que mitigan estos dos problemas (castigos más relevantes y más cortos) son las estrategias de garrote y zanahoria (Abreu [1986]). Estas estrategias consistent en en escoger un nivel de producción lo suficientemente bajo para que tenga efectos importantes en el el beneficio de las firmas (cuando todas producen esa cantidad). Llamamos este el nivel producción de castigo. La estrategia se define ahora así: En el primer periodo todos juegan x m. En cualquier otro periodo: Si todos han jugado x m, jugar x m. Si todos en el periodo anterior se han castigado entonces retornar a x m. Cualquier otro caso castigar. 6

6.1.2 Cournot con información imperfecta 6.1.3 Bertrand A Principio de una única desviación es suficiente Fijemos un jugador i y un conjunto de estrategias (γ i,t ),... para los demás jugadores. Sea (γ i,t ),... una estrategia del jugador i y π el pago asociado cuando todos juegan (γ i,t ),...,i=1,...n. Supongamos que el jugador i tiene una estrategia (γ i,t ),... tal que el pago asociado es π > π cuando el usa esta estrategia y todos los demás usan (γ i,t ),... Entonces existe una estrategia (γ i,t ),... para el jugador i tal que: 1. γ i,t = γ i,t para todo t excepto un único valor de t = T. 2. π > π donde π es el pago de i cuando el usa la estrategia (γ i,t ),... y los demás usan (γ i,t ),... Para ver esto obsérvese que si π > π entonces no puede ser cierto que para todo t: π t (γi,t, γ i,t ) π t(γ i,t, γ i,t ). Sea T cualquier t para el cual: π T (γi,t, γ i,t ) < π T (γ i,t, γ i,t ) entonces la estrategia (γ i,t ),... para el jugador i tal que: 1. γ i,t = γ i,t para todo t T 2. γ i,t = γ i,t para t = T satisface las propiedad deseada. 7