IN2201 Teoría de Juegos Prof. Auxiliar: Charles Thraves
Un juego es una situación en la que los jugadores (participantes) toman decisiones estratégicas, es decir, tienen en cuenta las acciones y respuestas de los demás jugadores. Cada jugador tiene un conjunto de estrategias posibles. Una estrategia es una regla o plan de acción para jugar. La estrategia óptima para un jugador es la que maximice su utilidad esperada.
Cada jugador tendrá una utilidad según la estrategia adoptada por él y los demás jugadores. Suponemos que los jugadores son racionales, es decir, piensan en las consecuencias de sus actos, y actúan maximizando sus propios beneficios. Los jugadores piensan en que los demás agentes también son racionales.
Juegos cooperativos y no cooperativos Un juego es cooperativo si los jugadores pueden negociar contratos vinculantes que les permitan adoptar estrategias conjuntas. Ejemplo: Colusión de precios (cartel) Un juego no cooperativo no es posible negociar e imponer un contrato vinculante. Ejemplo: Competencias de precios
Dilema del prisionero Prisionero B (Miguel) Prisionero A (Iván Iván) Calla (no delata) Confiesa (delata) Calla (no delata) Confiesa (delata) -1, -1-15, 0 0, -15-10, -10 Matriz de pagos
Independientemente de lo que haga el prisionero B, el prisionero A decidirá confesar ya que en ambos casos está mejor. Así mismo para B. Para ambos, la estrategia dominante será confesar (delatar al otro). El equilibrio del juego es que ambos confiesan Si se hubiesen podido coludir, estarían mejor, decidiendo no confesar, aunque sería inestable (hay incentivos de desviarse).
Estrategia dominante es aquella que es óptima independientemente de lo que haga el adversario. Equilibrio en estrategias dominantes es cuando cada jugador tiene una estrategia dominante, luego se alcanza un equilibrio.
Equilibrio de Nash es un conjunto de estrategias en que cada jugador hace lo mejor para él, dado lo que hacen sus adversarios. Las estrategias son estables en un E.N., es decir ningún jugador tiene incentivos para desviarse del equilibrio (cambiar su decisión unilateralmente). Equilibrio en estrategias dominantes es un caso particular de Equilibrio de Nash. Un juego puede tener más de un equilibrio de Nash o puede no tener ningún equilibrio de Nash en estrategias puras, (jugar estrategias con probabilidad 1). Un EN es no cooperativo, no necesita colusión para existir.
Ejemplo de competencia de precios como dilema del prisionero Firma 2 Firma 1 Cobrar $1,40 Cobrar $1,50 Cobrar $1,40 Cobrar $1,50 $12, $12 $29, $11 $3, $21 $20, $20
La estrategia dominante para ambas es cobrar$1,40. Luego el equilibrio en estrategias dominantes es que ambas firmas cobre $1,40. Es un equilibrio de Nash, dado que ninguno de los jugadores tiene incentivos a cobrar $1,50 (es decir, es estable dado que no hay incentivos a desviarse unilateralmente).
Juego de la publicidad (donde se presencia el dilema del prisionero). Empresa B Empresa A Hacer publicidad No hacer publicidad Hacer publicidad No hacer publicidad 10, 5 15, 0 6, 8 10, 2
La estrategia dominante para cada empresa es hacer publicidad, ya que independientemente de lo que haga la otra, se obtiene una mayor utilidad. El equilibrio de Nash es que ambas empresas hagan publicidad. Que pasaría si no hubiesen estrategias dominantes para ambos jugadores?
Juego de la publicidad modificado Empresa B Empresa A Hacer publicidad No hacer publicidad Hacer publicidad No hacer publicidad 10, 5 15, 0 6, 8 20, 2
La empresa A ya no tiene una estrategia dominante, si en el caso de B. Pero B si tiene una estrategia dominante, hacer publicidad, esto es considerado por la empresa A al tomar su decisión. Luego la empresa A decide hacer publicidad (pues así gana 10 en vez de 6). Luego el equilibrio de Nash es que ambos hagan publicidad. Empresa A Hacer publicidad No hacer publicidad Empresa B Hacer publicidad 10, 5 6, 8
Juego de la elección de un producto Cada empresa de cereal debe decidir que producto lanzar Empresa 2 Crujiente Dulce Empresa 1 Crujiente -5, -5 10, 10 Dulce 10, 10-5, -5
A ambas empresas les da lo mismo que cereal producir siempre y cuando no sea el mismo que el de su competencia. Si ambas producen el mismo cereal, entonces hay incentivos de ambas partes por cambiar su decisión, producir el otro tipo de cereal. Los equilibrios de Nash son que produzcan crujiente / dulce o dulce / crujiente, sin información a priori, no es posible saber cual de los dos será el que se alcance.
Hemos visto juegos en estrategias puras, es decir, cada jugador emprende una estrategia determinada. También existen estrategias mixtas, son aquellas en las que los jugadores eligen aleatoriamente entre dos o más opciones posibles, según un conjunto de probabilidades elegidas. Todo juego tiene un equilibrio de Nash en estrategias mixtas. Estrategias puras son un caso particular de estrategias mixtas, eligiendo probabilidades = 1 ó 0.
Juego de las monedas Ambos jugadores eligen cara o sello y destapan sus monedas al mismo tiempo. A gana si ambas monedas son cara o sello, de lo contrario gana B. Jugador B Cara Sello Jugador A Cara 1, -1-1, 1 Sello -1, 1 1, -1
En este juego no hay un equilibrio de Nash en estrategias puras. Existe equilibrio en estrategias mixtas, que A elija con probabilidad ½ cara, y ½ sello, al igual que B (demostración en anexo). En este caso, el beneficio esperado para ambos es cero en el equilibrio. Se esta suponiendo (como siempre) que ambos conocen los pagos del otro.
Juego de la batalla de los sexos Constanza Estadio Teatro Esteban Estadio 2, 1 0, 0 Teatro 0, 0 1, 2
Hay dos equilibrios de Nash, que ambos vayan al estadio, o al teatro. También hay equilibrio de Nash en estrategias mixtas, que Esteban elija ir al estadio con probabilidad 2/3 y opera con probabilidad 1/3 y Constanza elija ir al estadio con probabilidad 1/3 y teatro con probabilidad 2/3. Con la estrategia anterior, se puede ver que si Constanza decide así, Esteban no tiene incentivos de cambiar su estrategia, o cambiar sus probabilidades.
Hemos visto juegos en que ambos jugadores deciden simultáneamente sus estrategias, juegos estáticos, representados mediante matrices de pago. Los juegos secuenciales o dinámicos son aquellos en donde los jugadores eligen estrategias de manera consecutiva respondiendo a las acciones y reacciones de los demás. Se puede visualizar mejor los juegos secuenciales mediante con la forma extensiva del juego.
Volvamos al ejemplo del cereal, pero modificando los pagos. Emp.1 Crujiente Empresa 2 Dulce Crujiente -5, -5 10, 20 Dulce 20, 10-5, -5 En caso de que el juego fuese simultaneo, probablemente ambos elegirían producir el cereal dulce. Pero que ocurriría si la empresa 1 a puede producir más rápido su cereal y sacarlo primero al mercado. Es un juego secuencial: Etapa 1: empresa 1 introduce un nuevo cereal. Etapa 2: empresa 2 introduce su cereal.
La empresa 1 tiene la ventaja de ser la primera en jugar (elegir que tipo de cereal producir), y elegirá el cereal dulce. Luego la empresa 2 decidirá producir cereal crujiente. Forma extensiva el juego:
Para resolver el problema, se debe resolver cada rama del árbol desde el final hacia el inicio, resolviendo las decisiones que cada agente tomara en cada caso, hasta que se llega a la raíz, donde el primero en mover ya sabe cuales serán las decisiones del otro.
La empresa 2 sabe que decisiones adoptará según lo que haga la empresa 1 en la etapa 1. Si empresa 1 produce crujiente, entonces empresa 2 produce dulce en la etapa 2, y si la empresa 1 produce dulce en la etapa 1, entonces la empresa 2 produce crujiente. Luego la empresa 1 decide producir cereal dulce dado que sabe que en este caso, la empresa 2 producirá crujiente y así obtiene una utilidad de 20 (mayor que 10 en caso que empresa 1 decida producir crujiente. Luego el equilibrio de Nash es que primero la empresa 1 decida producir cereal dulce, y luego la empresa 2 decide producir cereal crujiente.
Función de reacción o de mejor respuesta (BR: best response) de un jugador, es la mejor respuesta (estrategia) que éste pueda tomar con respecto a las estrategias adoptadas por los demás jugadores. Ejemplo para el juego de las monedas: Las funciones de mejor respuesta para cada jugador son:
Anexos: Encontrar el equilibrio en estrategias mixtas para el juego de las monedas: Ambos jugadores jugarán las estrategias con ciertas probabilidad, de la forma: Jugador B q Cara (1-q) Sello Jugador A p Cara 1, -1-1, 1 (1-p) Sello -1, 1 1, -1
Utilidades esperadas de ambos jugadores: E[U1(p,q)] = p[q1+(1-q)(-1)]+ p[q(-1)+(1-q)1] = P[2q-1]+[1-p][1-2q] E[U2(p,q)] = q[p(-1)+(1-p)1]+ (1-q)[p1+(1-p)(-1)] = q[1-2p]+[1-q][2p-1] Observemos cual será la reacción del jugador 1 (para 2 es análogo), donde su única decisión es acerca del valor de p que está entre 0 y 1. Si q<0.5, entonces el jugador 1 jugará con p=1 ( cara ), ya que [2q-1]>[1-2q] para q Є [0,1/2[ //mirar función de utilidad del jug. 1 Si q=0.5, entonces el jugador uno esta indiferente del valor de p, ya que en ambos casos se tendrá que la utilidad esperada es cero, luego p Є [0,1]. Si q>0.5, entonces el jugador 1 juega p=0, ya que: [2q-1]<[1-2q]. En resumen, la función de mejor respuesta del jugador 1 y 2 son:
Luego, ambos jugadores responderán ante las decisiones del otro mediante su función de reacción, pues es como logran maximizar su utl. Para que exista equilibrio de Nash, se tiene que dar que dado lo que juega el jugador 1, el jugador 2 responde con una determinada estrategia, tal que el jugador 1 mantiene como mejor respuesta su estrategia inicial. Es decir, ambos se responden de la mejor manera sin incentivos de cambiar su estrategia (probabilidades p y q). Analicemos los casos: Si jugador 1 juega (0,1) (sello), o sea p=0, entonces el jugador 2 jugará (1,0) (cara) q=1, luego el jugador 1 preferiría jugar (1,0) (cara) p=1. Pero dijimos que p=0, luego esto no es un EN. Si jugador 1 juega (1,0) (cara), o sea p=1, entonces el jugador 2 jugará (0,1) (sello) q=0, luego el jugador 1 preferiría jugar (0,1) (sello) p=0. Pero dijimos que p=1, luego esto no es un EN. Si jugador 1 juega (p,1-p) ( p Є ]0,1[ ) (cara con probabilidad p y sello con probabilidad 1-p), el jugador 2 decidirá jugar dependiendo del valor de p, analicemos los casos: Si p<0.5, 2 juega q=1, luego jugador 1jugará p=0, pero el jugador 1 había jugado inicialmente (p,1-p) con p Є ]0,1[, luego este no es EN. Si p>0.5, 2 juega q=0, luego jugador 1jugará p=1, pero el jugador 1 había jugado inicialmente (p,1-p) con p Є ]0,1[, luego este no es EN. Si p=0.5, 2 juega (q,1-q) con q Є [0,1], luego el jugador 1 volverá a juagar con p=0.5, (0.5,0.5), sólo si es que q=0.5. Luego {(0.5,0.5),(0.5,0.5)} es un EN.