Lógicas no clásicas: Juegos y lógica dinámica



Documentos relacionados
TEORIA DE JUEGOS. Problemas: * Político- Militares * Económicos : - Oligopolio; - Inversión - Intercambio Internacional; - Relaciones Sindicales; etc.

Juegos en Forma Extensiva

Michael Jensen (1998), postula un modelo predictivo de comportamiento humano, resaltando:

Juegos bayesianos. Microeconomía III. Leandro Zipitría. Licenciatura en Economía. Facultad de Ciencias Económicas y Administración

Algoritmos y Diagramas de flujo

Teoría a de Juegos. M. En C. Eduardo Bustos as

Pablo Cobreros Tema 7. Cuatro teoremas de la lógica de primer orden

TEORIA DE JUEGOS: NOTAS DE CLASE Marcela Eslava Universidad de Los Andes, Facultad de Economía

VALORES EXACTOS DE FUNCIONES TRIGONOMÉTRICAS (SENO Y COSENO)

Límites de una función

Geometría en una retícula

1. Conocimientos previos. 1 Funciones exponenciales y logarítmicas.

Iniciación a Microsoft Excel. Definición y descripción de una hoja de cálculo

DOCUMENTO 3: DISTRIBUCIÓN DE PROBABILIDAD DE V. A. CONTINUA: LA DISTRIBUCIÓN NORMAL

Contabilidad Gerencial. SESIÓN 8: Análisis estratégicos de costos e inventarios

DIAGRAMA MATRICIAL EN "L"

Syllabus Teoría en Juegos en Marketing. Master Universitario en Gestión Comercial y Máster en Dirección de Marketing

Ecuaciones de segundo grado

Lectura No. 6. Contextualización. Nombre: Métodos de Análisis ANÁLISIS FINANCIERO 1

Robert Aumann y la teoría de juegos *

Juegos dinámicos con información completa pero imperfecta

3.3 Funciones crecientes y decrecientes y el criterio de la primera derivada

Desde la secundaria estamos acostumbrados a trabajar con polinomios, los cuales identificamos con expresiones de la forma

Juegos Dinámicos Tema 1: Juegos dinámicos con Información Perfecta. Universidad Carlos III

Teoría de Juegos (Código: )

Práctica 1: Introducción a SPSS 1

Sucesiones y series de números reales

a) 8 triángulos equiláteros y 6 cuadrados. V=12, C=14, A=24. b) 8 triángulos equiláteros y 6 octógonos no regulares. V=24, C=14, A=36.

TEMA I. Teoría de Circuitos

3. Métodos clásicos de optimización lineal

El cuerpo de los números reales

Mercados y Regulación Económica

Cardinalidad. Teorema 0.3 Todo conjunto infinito contiene un subconjunto infinito numerable.

Probabilidades y la curva normal

NÚMEROS REALES. Página 27 REFLEXIONA Y RESUELVE. El paso de Z a Q. El paso de Q a Á

b 11 cm y la hipotenusa

El Modelo Ricardiano Introducción

1

La conducta del consumidor y las preferencias

Método de simplificación de funciones lógicas utilizando el método de Quine McCluskey

Cap. 1 Funciones de Varias variables. Moisés Villena Muñoz

Distribución muestral de proporciones. Algunas secciones han sido tomadas de: Apuntes de Estadística Inferencial Instituto Tecnológico de Chiuhuahua

ELEMENTOS DE LA NEGOCIACIÓN

EJERCICIO 16 LA COMPETENCIA PERFECTA. La función de demanda siguiente es la misma para todos los compradores: P = -20q + 164

Dependencia e independencia lineal

Método de fórmula general

Lección 6: Factorización de Casos Especiales. Dra. Noemí L. Ruiz Limardo 2009

Anexo C. Introducción a las series de potencias. Series de potencias

UNIDAD 4.- INECUACIONES Y SISTEMAS (tema 4 del libro)

DISTRIBUCIONES DE PROBABILIDAD DISCRETA (PARTE 2)

Organización de los contenidos en Joomla!

Tema 1 Las Funciones y sus Gráficas

Manual de Mensajes Recibidos Swift

Contabilidad General

UNIDAD DE APRENDIZAJE II UNIDAD DE APRENDIZAJE 2 ( 12 HORAS)

La lección de hoy es sobre ángulos interiores de un Polígono. El cuál es la expectativa para el aprendizaje del estudiante, R.4.G.

Tema 3. Análisis de riesgo. Tema 3. Análisis de riesgo

Profr. Efraín Soto Apolinar. La función racional

Tema 11: Intervalos de confianza.

Proposición: Una proposición es dos o más conceptos ligados por palabras enlace en una unidad semántica.

Diagramas de flujo. Actividad de aprendizaje 9. Realiza la siguiente lectura:

CAPÍTULO III MOMENTO DE INERCIA EN ÁREAS PLANAS. Este capítulo comprende diversas propiedades geométricas de secciones (para casos

MICROECONOMÍA II. PRÁCTICA TEMA 5: El Modelo de Equilibrio General con Intercambio Puro

TEORIA DE NUMEROS (I) REGLAS DE DIVISIBILIDAD

f (x) (1+[f (x)] 2 ) 3 2 κ(x) =

Técnicas de planeación y control

Introducción a la Teoria de Juegos

UNIDAD 3: ANALICEMOS LA FUNCION EXPONENCIAL Y LOGARITMICA.

Lección 10: Representación gráfica de algunas expresiones algebraicas

INTRODUCCIÓN A LA ECONOMÍA La Demanda de Bienes La Demanda de Bienes TEMA 6. DEMANDA AGREGADA

RELACIONES ACCESS TIPOS DE RELACIONES QUE PODEMOS UTILIZAR

Teorema de Bayes. mientras que B tiene una tasa de defectos del 4%.

Distribuciones muestrales. Distribución muestral de Medias

Uso de centinelas para la toma de decisiones. Esquemas y diagramas de flujo. Ejemplos resueltos. (CU00167A)

Juegos Repetidos. Tema 1: Juegos repetidos un número finito de veces. Universidad Carlos III de Madrid

1 Sistema de información de ejemplo.

Microsoft Outlook. Microsoft Outlook

AUTOEVALUACIÓN. ANÁLISIS DAFO PERSONAL

José María Sorando Muzás Teoría de Números Sumas de impares y de pares (2n + 1) es un cuadrado perfecto

Conjuntos disjuntos (Relaciones de equivalencia)

Gráficas de las funciones racionales

Tabla de Derivadas. Función Derivada Función Derivada. f (x) n+1. f (x) y = f (x) y = ln x. y = cotg f (x) y = ( 1 cotg 2 f (x)) f (x) = f (x)

Lógica de Predicados

DISTRIBUCIONES MUESTRALES

Historia y Filosofía de la Lógica

UNIDAD 1: QUÉ ES LA ESTADÍSTICA?

Conjuntos finitos y conjuntos numerables

Integración Contable en Ventas

Lógica Proposicional, Teoremas y Demostraciones

1 Nuevas IFRS sobre participaciones en otras entidades

Teoría de errores. Departamento de Análisis Matemático Universidad de La Laguna

DERECHO DE PETICIÓN. Qué es?

Teoría de conjuntos. Tema 1: Teoría de Conjuntos.

Robert A. Hanneman. Departmento de Sociología de la Universidad de California Riverside

II Concurso de Resolución de Problemas Curso

Leyendo imágenes Interpretación correctamente dibujos que representan procesos biológicos. Autorregulación del propio aprendizaje

TEMA 5 FUNCIONES ELEMENTALES II

Transcripción:

Lógicas no clásicas: Juegos y lógica dinámica Pedro Arturo Góngora Luna pedro.gongora@gmail.com 1. Juegos 1.1. Introducción Algunos autores definen un juego como la interacción estratégica de dos o más agentes. Dicha interacción estratégica incluye, desde luego, juegos recreativos como el póquer y el ajedrez, donde los agentes son personas (o programas de computadora). Sin embargo, el tratamiento que se le da a un juego es suficientemente abstracto para comprender otras aplicaciones. Los agentes de un juego pueden ser cualquier entidad capaz de tomar decisiones racionales, por ejemplo, corporaciones o mesas directivas decidiendo su estrategia en una batalla de precios o su oferta en una licitación pública, y hasta individuos de una población de insectos 1. Debido al número creciente de aplicaciones que ha tenido la teoría de juegos en los últimos años, se han propuesto trabajos en otras áreas aparentemente sin relación. Aquí vamos a revisar el trabajo propuesto en [1], donde se modelan algunos aspectos de un juego usando lógica modal. Para esto, nos vamos a concentrar en una clase muy particular de juegos: los juegos secuenciales, finitos y con información perfecta y completa. Por juego secuencial entendemos que las acciones que realizan los agentes suceden una después de otra, y no simultáneamente. Por finito entendemos que, además de que las posibles secuencias de acciones siempre son finitas, en cada momento un agente sólo puede elegir una acción de un conjunto finito de éstas. Por información perfecta y completa entendemos que todos los agentes siempre tienen acceso al estado en que se encuentra el juego (historia, decisiones tomadas por otros agentes) y que conocen las preferencias de cada agente (saben qué ganancia obtendría cada uno como resultado de cualquier secuencia de acciones). Desde luego aquí no podemos dar una introducción ni mínimamente detallada a la teoría de juegos, la forma de trabajo será mediante un ejemplo. Pero, si estás interesado, puedes encontrar introducciones muy accesibles en los libros [3, 4] (disponibles en la biblioteca de la facultad). También, si te interesa saber más de este tema puedes consultar [2]. 1 Una decisión racional es aquella que busca maximizar la utilidad o ganancia de un agente, en este sentido, las medidas para maximizar las posibilidades de supervivencia de un animal son racionales. 1

1.2. Árboles y juegos extensivos Existen dos posibles formas de representar un juego: la forma normal o estratégica y la forma extensiva. La forma normal es más abstracta, se basa en matrices que sólo muestran el resultado final del juego. La forma extensiva es menos abstracta, se representan los juegos como árboles cuyos nodos son los turnos de los jugadores, los arcos sus acciones posibles en ese momento, y las hojas los posibles resultados del juego. Podríamos tomar un juego como ajedrez o gato para ejemplificar (ambos cumplen las características de secuencialidad, finitud y son de información perfecta y completa), pero sus árboles son muy grandes, incluso el del gato. En lugar de éstos vamos a concentrarnos en un modelo de juguete: el dilema del prisionero. El dilema del prisionero no es estrictamente secuencial, pero puede analizarse como si lo fuera, sin afectar el resultado. Básicamente, dice así: La policía captura a una pareja cómplice de criminales, pero no tiene información suficiente para condenarlos por todos sus delitos. Al interrogarlos por separado, les pide que traicionen a su compañero. Los resultados son los siguientes: Si ninguno traiciona al compañero (i.e., cooperan entre ellos) se les condena a 1 año de cárcel a cada uno. Si sólo uno traiciona, éste sale libre y al otro se le condena a 10 años de cárcel. Si ambos se traicionan, entonces se les dan 5 años a cada uno. Podemos construir un árbol de juego de inmediato: w 3 ( 5, 5) t B La descripción es la siguiente: w 0 t A c A w 1 w 2 c B t B c B w 4 w 5 (0, 10) ( 10,0) Tenemos dos agentes o jugadores, A y B. w 6 ( 1, 1) En la raíz del árbol (w 0 ) es el turno de A, en el siguiente nivel (w 1 y w 2 ) es el turno de B. En cada estado no final, el jugador i en turno tiene dos posibles acciones: t i para traicionar al compañero o c i para cooperar. A estas acciones se les conoce como las estrategias de i. En las hojas (w 3 w 6 ) tenemos la utilidad de cada agente. Por ejemplo, si la secuencia de acciones es t A, c B (i.e., el juego termina en w 4 ), para el jugador A la utilidad es 0 (no se le condena a cárcel), pero para el jugador B la utilidad es de 10, pues se le condena a 10 años de cárcel. 2

1.3. Soluciones y equilibrio Si fueras el jugador A, cuál sería la estrategia racional a seguir?. Con el árbol de juego podemos hacer el siguiente razonamiento: Si elijo t A, entonces en w 1 B tiene la opción de t B ó c B. Si B elige t B obtendría una utilidad de 5, si elige c B tendría utilidad de 10. Por lo tanto B seguramente decidirá t B, pues 5 > 10, y mi utilidad por elegir t A sería 5. Si elijo c A, entonces en w 2 B tiene la opción de t B ó c B. Si B elige t B obtendría una utilidad de 0, si elige c B tendría utilidad de 1. Por lo tanto B seguramente decidirá t B, pues 0 > 1, y mi utilidad por elegir c A sería 10. Si mi utilidad por jugar t A es 5 y por jugar c A es 10, entonces la elección racional es t A. Intercambiando los turnos podemos hacer el mismo razonamiento desde el punto de vista de B, y veríamos que el resultado es t B. Así que hemos resuelto el juego: encontramos una tupla de estrategias (i.e., un perfil de estrategias), una para cada jugador, y encontramos que la mejor respuesta de cada jugador a ese perfil es también la estrategia que se dicta ahí mismo. En general, un perfil de estrategias es una función que asigna a cada nodo no final, una acción a realizar. En el árbol del dilema del prisionero, el perfil está señalado con líneas dobles. Nota que el nodo w 2 no es accesible si se sigue el perfil desde el nodo inicial, pero, aún así, la definición de perfil requiere que se le asigne una acción. Un perfil es un equilibrio de Nash sii para todo agente i, las estrategias contenidas en ese perfil representan la mejor respuesta para i, suponiendo que los demás agentes sólo seguirán las estrategias determinadas por el perfil. En este sentido, el perfil dado por las estrategias t A y t B (en el árbol representado con líneas dobles) es un equilibrio de Nash. 2. Codificación en PDL 2.1. Modelo La codificación propuesta por Harrenstein et al es muy sencilla, básicamente construimos un marco a partir de un árbol de juego. En el caso del dilema del prisionero, tenemos el siguiente árbol: w 0 a A,σ a A w 1 w 2 a B,σ a B a B,σ a B w 3 w 4 w 5 w 6 La descripción es la siguiente: 3

Tenemos un programa atómico a i para cada agente i. De esta forma, un estado w está relacionado con otro w por el programa a i sii el agente i tiene una estrategia que lleva el juego de w a w. Tenemos un programa σ para cada perfil de estrategia que queramos analizar. En este caso σ representa el perfil que elige siempre traicionar. Tenemos un programa atómico i para cada agente i. El programa i relaciona un estado w con w sii la utilidad del agente i en el estadio w es menor o igual a su utilidad en el estado w. En el árbol anterior omitimos estas relaciones para no saturarlo de líneas (tendríamos, por ejemplo, un arco w 3 A w 4, o un arco w 4 B w 3 ). 2.2. Mejor respuesta y equilibrio Ahora, considera el siguiente programa: π(σ, {i 1,..., i k }) def = while σ do (a i1 a ik σ) donde {i 1,..., i k } es cualquier conjunto de agentes. Particularmente nos interesan dos instancias del programa anterior: π(σ, {i}) = while σ do (a i σ) π(σ, ) = while σ do σ El programa π(σ, {i}) representa los posibles resultados que puede forzar el agente i, si suponemos que los demás agentes siguen el perfil σ. Por ejemplo, para A tenemos que si empezamos en w 0, los posibles resultados son w 3 y w 5, y para B los posibles resultados son w 3 y w 4. El programa π(σ, ) representa el resultado en donde todos los agentes siguen el perfil σ. En nuestro ejemplo tenemos que si empezamos en w 0, el único resultado posible es w 5. También, considera el siguiente teorema. Teorema 2.1. Sean F un marco, w un mundo posible de F, y ϕ cualquier fórmula. Entonces, la afirmación: F, w = a [b]ϕ [c]ϕ (i.e., la fórmula es válida en w en F ) se cumple sii para todo w y w : si (w, w ) a y (w, w ) c, entonces (w, w ) b. Utilizando el teorema anterior podemos caracterizar si un perfil es la mejor respuesta para un agente: F, w 0 = π(σ, {i}) [i]ϕ [π(σ, )]ϕ Esto es, σ representa la mejor respuesta para i sii la fórmula anterior es válida en w 0 en F (el árbol de juego), que, a su vez, es cierto sii toda posible salida forzada por i es menor o igual, en términos de utilidad, a la salida determinada por σ. 4

Finalmente, tenemos que si lo anterior se cumple para todos los agentes, entonces σ es un equilibrio de Nash. De nuestro ejemplo, tenemos que para el jugador A y el perfil de estrategias σ: {(w 0, w 3 ), (w 0, w 5 )} π(σ, {A}) {(w 0, w 3 )} π(σ, ) {(w 3, w 3 ), (w 5, w 3 )} A F, w 0 = π(σ, {A}) [A]ϕ [π(σ, )]ϕ Por lo tanto, por el teorema anterior σ representa una mejor respuesta para A. También, aplicando el mismo análisis (ejercicio) para el agente B, obtenemos que también es una mejor respuesta. Entonces, σ es un equilibrio de Nash. Referencias [1] Paul Harrenstein, Wiebe van der Hoek, John Jules Meyer & Cees Witteveen. On Modal Logic Interpretations of Games. En ECAI 2002. Online: http://www.harrenstein.nl/publications.dir/e0197.pdf [2] Wiebe van der Hoek & Marc Pauly. Modal Logic for games and information. Online: http://www.csc.liv.ac.uk/ frank/mlhandbook/20.pdf [3] Ken Binmore. Fun and games : a text on game theory. 1991. D.C. Heath. [4] Morton Davis. Introducción a la teoría de juegos. 1986. Alianza. 5