El dilema del prisionero simulado con Netlogo

Documentos relacionados

1. PLANTEAMIENTO DEL PROBLEMA. 1.1 Descripción del problema

FONDO SOLIDARIO DE JUBILADOS DE LA UNSJ

Tema : ELECTRÓNICA DIGITAL

FACULTAD DE CIENCIAS EMPRESARIALES Centro de Estudios de Opinión Ciudadana. Chile sin Pinochet. Percepción de los Santiaguinos

POR QUÉ EL GOBIERNO RAJOY ESTÁ PROFUNDAMENTE EQUIVOCADO. Vicenç Navarro. Catedrático de Ciencias Políticas y Políticas Públicas.

Agentes autónomos. Agentes. Racionalidad. Sistemas multiagentes. Dilema del prisionero. El trato

Discriminación de precios y tarifa en dos etapas

MACROECONOMÍA II Licenciatura en Administración y Dirección de Empresas Marzo 2004

CAPÍTULO 7. CONCLUSIONES Y RECOMENDACIONES CAPÍTULO 7. CONCLUSIONES Y RECOMENDACIONES

Documentación de la Práctica 1 para la asignatura de Nuevas Tecnologías de la Programación (NTP)

Informe final de evaluación del seguimiento de la implantación de títulos oficiales GRADO EN DERECHO. Facultad de Ciencias Sociales UNEB

ENTREVISTA A LIC. EN CIENCIAS SOCIALES, PROFESOR DE CIENCIAS POLÍTICAS

Se mezclan las tarjetas de azar y se coloca el mazo boca abajo en la casilla correspondiente.

VI. SINDICATOS Y RELACIONES LABORALES

Para llegar a conseguir este objetivo hay una serie de líneas a seguir:

ZUGASTI ABOGADOS.

Universidad Autónoma de Baja California Facultad de Ingeniería Mexicali

Centro de Capacitación en Informática

8. Resultados de la simulación

El Texas Hold em, la modalidad más popular

PROPUESTAS COMERCIALES

Es una persona que ayudará a que los derechos de las personas con discapacidad se hagan realidad

Proyecto Mancomunidad del Nordeste Separar Residuos tiene Bolsa. 0 - Introducción

Efecto no deseable de la ley electoral Francisco Ruiz, profesor titular, Universidad de Castilla-La Mancha

CARACTERÍSITCAS BÁSICAS DEL DESARROLLO PSICOEVOLUTIVO DE LOS NIÑOS Y NIÑAS DE LOS 6 A LOS 12 AÑOS Y SUS IMPLICACIONES EN EL PROCESO EDUCATIVO

TEORÍA A DE JUEGOS. Un marco para estudiar y aplicar en la gerencia política

TEMA 5. MUESTREO PARA LA ACEPTACIÓN.

Teoría de las decisiones y de los juegos Grupo 51 Ejercicios - Tema 3 Juegos dinámicos con información completa (0, 2) 2 D (3, 0) 1 B I

En primer lugar quiero concretar algo más ambos términos: sistemas de gestión medioambiental y empresa forestal:

Los derechos humanos son universales Las oportunidades deberían serlo

GESTIÓN DEL MEDIO AMBIENTE URBANO. (LIMPIEZA VIARIA, MANTENIMIENTO DE ZONAS VERDES, RESIDUOS URBANOS Y ABASTECIMIENTO DE AGUA)

Instrucción IrA (GoTo). Saltos no naturales en el flujo normal de un programa. Pseudocódigo y diagramas de flujo. (CU00182A)

Centro de Opinión Pública de la Universidad de Belgrano

I.1 Las siguientes afirmaciones son ciertas o falsas. Si una afirmación es cierta, ofrezca una explicación. Si es falsa ponga un contraejemplo.

Informe sobre el Equipamiento Informático y Tecnológico en los Hoteles de la Provincia de Málaga

TEMA 7: DIAGRAMAS EN UML

EN BUSCA DE INDICADORES NATURALES

Mindfulness, o la meditación occidental

Diseño de Imagen y de Marcas Trabajo Práctico Nº1

Quadice REGLAS DEL JUEGO

CAPITULO V. Conclusiones y Recomendaciones. En este capítulo se hace mención de las conclusiones que se obtuvieron al analizar los

INTRODUCCIÓN COMPONENTES

TEORIA DE JUEGOS (Síntesis de conceptos introductorias de J.Pérez, J.L. Jimeno y E. Cerdá, Teoría de Juegos, Madrid, Pearson, 2004, )

MODELOS DE RECUPERACION

La nueva maternidad divide injustamente a la mujer-madre trabajadora part-time de su hogar, de la mujer-madre trabajadora full-time de su hogar

LÍMITES DE FUNCIONES. CONTINUIDAD

LÍMITES Y CONTINUIDAD

CAPÍTULO 1 PRIMEROS PASOS

Ejemplo: Apuesta? 100 PERA PERA MANZANA La casa gana!!! Apuesta? 300 FRUTILLA FRUTILLA FRUTILLA GANASTE 600!!! Apuesta? 0 Gracias por jugar!!!

1. La tarifación eléctrica

7 Contabilidad General

PROGRAMAS OFICIALES DE POSGRADO

OncoBarómetro, Imagen social de las personas con cáncer. Resumen ejecutivo

T.1 CONVERGENCIA Y TEOREMAS LÍMITE

Estudio sobre la enfermedad de Alzheimer en cinco países

ITINERARIOS PERSONALIZADOS DE INSERCIÓN

Universidad Carlos III de Madrid Teoría de Juegos Lista de Ejercicios de Juegos Repetidos y Bayesianos

FECUNDIDAD. Número de nacimientos x K = x = 33,5 Población total

Componentes del juego

Los estados financieros proporcionan a sus usuarios información útil para la toma de decisiones

Consejo de Ministros El Gobierno aprueba los Reales Decretos que regulan la PGB y el acceso a la Universidad

2. EL PROYECTO EMPRESARIAL

Un kilobyte (KB) son 1024 bytes, un Megabyte (MB) son 1024 KB, un Gigabyte son 1024 Mb

PARA COMERCIANTES Y AUTÓNOMOS. INFORMACIÓN SOBRE TARJETAS DE CRÉDITO.

Sean capaces de resolver problemas de conteo utilizando más de un procedimiento, reconociendo cuál o cuáles son más eficaces.

El blog de Paco Ramos Francisco Ramos Solera

Para facilitar el análisis de los resultados, se han segmentado las respuestas con dos criterios:

Cierre sus cuentas con seguridad

LA RELACIÓN MÉXICO - ESTADOS UNIDOS DE AMÉRICA EN MATERIA DE CIENCIA.

Recordando la experiencia

LA MOROSIDAD PÚBLICA SE REDUCE PRÁCTICAMENTE UN 40% EN EL PRIMER TRIMESTRE DEL AÑO

DISEÑO Y CÁLCULO DE UN ORDENAMIENTO RANKING DE ENTIDADES PROMOTORAS DE SALUD INFORME EJECUTIVO DE LA METODOLOGIA

El rincón de los problemas

Un mercado de trabajo sombrío

3. PERFIL DEL TITULADO

LOS ANCIANOS Y LA SOLEDAD

Evaluación de la satisfacción. Programa Adolescente Madre

En cualquier caso, tampoco es demasiado importante el significado de la "B", si es que lo tiene, lo interesante realmente es el algoritmo.

Programa en Microsoft Visual Basic 6.0 para el análisis de riesgos eléctricos en oficinas y centros de cómputo. López Rosales, Juan Carlo.

SISTEMA InfoSGA Manual de Actualización Mensajeros Radio Worldwide C.A Código Postal 1060

VECTORES. Módulo, dirección y sentido de un vector fijo En un vector fijo se llama módulo del mismo a la longitud del segmento que lo define.

Créditos académicos. Ignacio Vélez. Facultad de Ingeniería Industrial. Politécnico Grancolombiano

CAPITULO I. 1. Planteamiento del problema 1.1 Situación Problemática

acciones para incrementar tu 0 inteligencia financiera

NUEVAS SOLUCIONES y CAMBIOS EN LA GESTION DEL NEGOCIO. JOSE LUIS LENCE Socio Director de Gesfarm Consultoria Farmacias

13Soluciones a los ejercicios y problemas PÁGINA 280

3.9. Tutorial Excavadora

1. EL CONCEPTO DE INTERÉS

Manual de usuario. Tramitación de inspecciones periódicas de ascensores: La visión de los organismos de control autorizado (OCAs)

UNIDAD 4 PROCESOS DE MARKOV

4º ESO TEORÍA 2ª EVALUACIÓN

ENERGÍA PREPAGA: UNA OPCIÓN PARA CONTROLAR Y AHORRAR EN EL CONSUMO. (Abril de 2007)

NÚMEROS NATURALES Y NÚMEROS ENTEROS

Muestreo. Introducción

AUDITORIA DE RECURSOS HUMANOS

Dossier Informativo para voluntarios

COLECCIÓN MI NEGOCIO MI NEGOCIO Guía para la Creación y Administración de tu Negocio en el Perú Guía CONTABILIDAD

MEJOR CON LÁCTEOS. Conocimientos generales sobre la leche como alimento. Propiedades nutricionales de los componentes de los productos lácteos.

Consecuencias económicas del divorcio

Transcripción:

El dilema del prisionero simulado con Netlogo Estudio de diversos tipos de estrategias de colaboración en un ambiente biológico simulado Carlos González Tardón www.carlosgonzaleztardon.com

Qué es el dilema del prisionero?: El dilema del prisionero es un desarrollo de la teoría de los juegos, en especial de los juegos de suma no constante. El concepto fue creado en 1949 por Flood y Dresher en la corporación RAND En 1950 Tucker, en una conferencia para psicólogos en Stanford, presentó por primera vez el enunciado, ya clásico, del dilema.

Enunciado clásico: La policía arresta a dos sospechosos. No hay pruebas suficientes para condenarles, y tras haberles separado, les visita a cada uno y les ofrece el mismo trato: "Si confiesas y tu cómplice continúa sin hablar, él será condenado a la pena total, 10 años, y tú serás liberado. Si él confiesa y tú callas, tú recibirás esa pena y será él el que salga libre. Si ambos permanecéis callados, todo lo que podremos hacer será encerraros 6 meses por un cargo menor. Si ambos confesáis, ambos seréis condenados a 6 años."

Enunciado actual: En la literatura clásica del dilema del prisionero se ha utilizado, habitualmente, la siguiente matriz de pagos: Matriz de Pagos Jugador 2 Col No Col Ju Col ga (3)(3) (0)(5) dor No 1 Col (5)(0) (1)(1)

Dilema del prisionero iterado: En 1984, Robert Axelrod publicó el libro: La evolución de la cooperación (Alianza Editorial, 1996), en él recoge la investigación más importante realizada a partir del dilema, intenta explicar a partir de jugar de forma repetida el dilema del prisionero, el inicio de la cooperación entre humanos, así como las estrategias mejores para conseguirlo.

Dilema del Prisionero con N-Jugadores: El dilema del prisionero se desarrolla en una interacción continuada de dos agentes, qué ocurriría si hubiera un gran número de agentes interactuando?. Seguiría siendo Toma y Daca la mejor estrategia?. Qué ocurriría si los pagos en vez de ser no significativos fueran vitales para el agente?. Evolucionará la cooperación?.

Modelo: Se ha creado un modelo muy simplificado de la situación antes expuesta, en el cual existen dos tipos de agentes: MONOS, son animales virtuales que se guían por el olfato. PLANTAS, son las que suministran el alimento, son el motivo de interacción.

Cómo se comportan los agentes: MONOS La función básica del mono es comer. Come de las plantas. Puede comer solo o encontrarse a un compañero. Cuando interaccionan puede colaborar o no colaborar. Dependiendo de la conducta de ambos recibe más o menos comida. La conducta de interacción está determinada por la estrategia de colaboración.

Regla de conducta: 1) Si tienes hambre: MONO a) Si estás sobre una planta Come. I) Si estas solo Come del suelo. II) Si estas acompañado Colabora o no colabora según tu estrategia. b) Si hueles una planta Acércate. c) Si ninguna de las dos Vagabundea. 2) Si no tienes hambre Vagabundea (En el caso de que el hambre llegue a 100 el mono muere y desaparece de la simulación)

Cómo se comportan los agentes: PLANTAS Suministran la comida a los monos en dos lugares, en las ramas y en el suelo. Su variable principal es el grado de maduración. Si un mono come de ella, esta muere y se inicia de nuevo el ciclo de maduración. Dependiendo de la fase de maduración que se encuentre la planta, suministrará mas o menos comida.

Regla de conducta: PLANTA 1) Si hay no hay un mono comiendo: a) Si tu grado de maduración es máximo muere. b) Si no lo es sigue madurando. 2) Si hay un mono comiendo muere. (Morir significa poner a cero el grado de maduración)

Matriz de comida en cada estadio de maduración de la planta: Tiempos 0-1*t 1*t-2*t 2*t-3*t 3*t-4*t Color Negro Verde Amarillo Naranja Ramas 0% 90% 50% 10% Suelo 0% 10% 50% 90% Olor 0 1 5 9

Matriz de comida que reciben los MONOS : Tiempos 0-1*t 1*t-2*t 2*t-3*t 3*t-4*t Color Negro Verde Amarillo Naranja No colabora 0% 10% (2) [2] 50% (2) [10] 90% (2) [18] Colabora 0% 10% (2) [2] 50% (2) [10] 90% (2) [18] No colabora 0% 5% (1) [1] 25% (1) [5] 45% (1) [9] No colabora 0% 5% (1) [1] 25% (1) [5] 45% (1) [9] Colabora 0% 50% (2) [10] 50% (2) [10] 50% (2) [10] Colabora 0% 50% (2) [10] 50% (2) [10] 50% (2) [10] No colabora 0% 100% (2) [20] 100% (2) [20] 100% (2) [20] Colabora 0% 0% (4) [0] 0% (4) [0] 0% (4) [0]

Estrategias implementadas: Hay cuatro bloques: 1) Estables Genética. 2) Aprendizaje de la interacciones: A) Diferencia de medias. B) Diferencia entre puntuación y media. 3) Reactivas a la partida anterior Toma y Daca. 4) Sensibles a la situación actual del agente Altruista.

Desarrollo de las estrategias: Variables que intervienen: Grado de colaboración (0-100): [ G.C. ] > 50 Colabora < 50 No colabora Puntuación obtenida [ ] Puntuación Media Acumulada [ ] X ( t) X ( t )

Desarrollo de las estrategias: Diferencia de Medias: { G.C (t-1) >50 ; G.C = G.C (t-1) + ( X ( t) X ( t 1) ) G.C (t-1) <50 ; G.C = G.C (t-1) ( X ( t ) X ( t 1) ) { ( redondear ( aleatorio(0 1))) G.C =50 ; G.C = G.C + ( 1 ) G.C 50 ; G.C = G.C

Desarrollo de las estrategias: Diferencia de Puntuación con media { G.C (t-1) >50 ; G.C = G.C (t-1) + ( X ( t) X ( t 1) ) G.C (t-1) <50 ; G.C = G.C (t-1) ( X ( t ) X ( t 1) ) { ( redondear ( aleatorio(0 1))) G.C =50 ; G.C = G.C + ( 1 ) G.C 50 ; G.C = G.C

Simulador:

Ejemplos de resultados: Dife. Punt con Media Dife. Medias Toma y Daca Genético Altruista

Ejemplos de resultados: Dife. Punt con Media Dife. Medias Toma y Daca Genético Altruista

Ejemplos de resultados: Dife. Punt con Media Dife. Medias Toma y Daca Genético Altruista

Resumen de resultados: Dif. Med. Dif. Punt. Altruista Toma Dif. y Daca Med. Genético

Conclusiones: En los ambientes simulados, en los que imperan las reglas biológicas, la estrategia toma y daca no es la más efectiva. La estrategia más efectiva ha sido la que tiene en consideración el estado actual del agente por encima de la historia de interacción. Una sociedad formada por agentes que se dejan parasitar cuando les sobra y parasitan cuando lo necesitan sobreviven más sujetos, según los resultados del modelo.

Desarrollos actuales: Se ha implementado la reproducción en el modelo, obteniendo resultados más ricos que los actuales. Sin reproducción: Con reproducción:

Desarrollos futuros: Dotar a los agentes de una memoria de interacción. Implementar la vista en los agentes para ajustarlo más a la realidad.

Bibliografía AXELROD, R., La evolución de la cooperación, Ed. Alianza Editorial, Madrid, 1996 AXELROD, R., La complejidad de la cooperación, Ed. Fondo de Cultura Económica, México, 2003 MORTON, D. D., Teoría de Juegos, Alianza Editorial, Madrid, 1979 POUNDSTONE, W., El dilema del prisionero, Alianza Editorial, Madrid, 2005 VARIOS, Matemáticas en las ciencias del comportamiento, Alianza Editorial, Madrid, 1974 VON NEUMANN, J.,MORGENSTERN, O., Theory of games and economic behavior, Ed. Princeton University Press, Princeton, 2004