Modelos Basados en Agentes Clase 8: Alcanzando Acuerdos traducción de http://www.csc.liv.ac.uk/ mjw/pubs/imas/distrib/pdf-index.html. Universidad Simón Boĺıvar 30 de mayo de 2006
Contenido Alcanzando Acuerdos 1 Alcanzando Acuerdos 2 3 en Dominios Orientados a Tareas
Alcanzando Acuerdos Cómo los agentes llegan a acuerdos cuando son egoístas?. En un caso extremo (encuentros de suma cero)) no es posible un acuerdo pero en la mayoría de los escenarios, hay potencial para un acuerdo mútuamente beneficioso en materia de interés común. Las capacidades de negociación y argumentación son centrales para la habilidad de un agente para alcanzar estos acuerdos.
Mecanismos, Protocolos y Estrategias La negociación es gobernada por un mecanismo o protocolo particular. El mecanismo define las reglas de encuentro entre los agentes. El diseño de mecanismos es diseñar mecanismos para que tengan ciertas propiedades deseables. Dado un protocolo particular, cómo puede diseñarse una estratégia particular que un agente individual pueda usar?.
Diseño de Mecanismos Propiedades deseables de los mecanismos: Convergencia/éxito garantizado. Maximización del bienestar social. Eficiencia de Pareto. Racionalidad Individual. Estabilidad. Simplicidad. Distribución.
Un subasta tiene lugar entre un agente conocido como el subastador y un conjunto de agentes conocidos como los licitadores. El objetivo de una subasta en que el subastador asigne un bien a alguno de los licitadores. En la mayoría de los escenarios el subastador desea maximizar el precio; y los licitadores desean minimizar el precio.
Parámetros de una Subasta Los bienes pueden tener: valor privado valor público común valor correlativo El ganador puede pagar de acuerdo con: primer precio segundo precio Las apuestas pueden ser: abiertas cerradas El proceso de apuestas puede ser: un disparo ascendentes descendentes
Inglesas Es el tipo de subastas más conocido: primer precio, abierta, ascendente La estrategia dominante para un agente es ofertar sucesivamente un monto un poco mayor que la mayor oferta actual hasta alcanzar su valuación, luego retirarse. Suceptible a: La maldición de los ganadores shills licitadores falsos
holandesas Las subastas holandesas son ejemplos de subastas abiertas descendentes: El subastador comienza ofreciendo el bien por un valor artificialmente alto, El subastador baja precio de oferta hasta que algún agente hace una oferta igual al precio de oferta actual, El bien entonces se le asigna al agente que hizo la oferta.
Cerradas de Primer Precio Las Cerradas de Primer Precio son subastas de un disparo: hay una sola ronda, los licitadores someten una oferta sellada por el bien, el bien se le asigna al agente que hizo el la oferta más alta, El ganador paga el precio de la oferta más alta. La mejor estrategia es hacer una oferta por una valuación menor que la verdadera.
de Vickrey Las subastas de Vickrey son: segundo-precio, ofertas-selladas. El bien se le concede al agente que hizo la oferta más alta; en el precio de la segunda oferta más alta La estrategia dominante en las subastas de Vickrey es ofertar a tu valuación verdadera. Las subastas de Vickrey son susceptibles al comportamiento antisocial.
Alcanzando Acuerdos en Dominios Orientados a Tareas Las subastas se refieren solamente a la asignación de mercancías: se requieren técnicas más ricas para alcanzar acuerdos. La negociación es el proceso de alcanzar acuerdos en asuntos de interés común. Cualquier escenario de negociación tendrá los siguientes cuatro componentes: Una conjunto de negociación: las ofertas posibles que los agentes pueden hacer. Un protocolo. Estrategias, una para cada agente, que son privadas. Una regla que se determina cuando se ha cerrado un trato y cuál es el acuerdo del trato. La negociación procede generalmente en una serie de rondas, con cada agente haciendo una oferta en cada ronda.
en Dominios Orientados a Tareas en Dominios Orientados a Tareas Imagina que tienes tres niños, hay que llevar a cada uno a una escuela diferente cada mañana. Tu vecino tiene cuatro niños, y también necesidades de llevarlos la escuela. El transporte de cada niño se puede modelar como tarea indivisible. Tú y tu vecino pueden discutir la situación, y llegar a un acuerdo que sea el mejor para ambos (por ejemplo, llevando al niño del otro a un destinano compartido, ahorrándole el viaje). No hay preocupación por poder alcanzar tu tarea por ti mismo. Lo peor que puede suceder es que tú y tu vecino no llegarán a un acuerdo sobre hacer un car-pool, en cuyo caso no estás peor que si estubieras solo. Solamente puedes beneficiarte (o no empeorar la situación) de las tareas de tu vecino. Asumir, que uno de mis niños y uno de los niños de mis vecinos van a la misma escuela (es decir, el costo de realizar estas dos entregas, o a dos tareas, es igual que el costo de realizar una de ellas). Obviamente tiene sentido para que ambos niños sean llevados juntos, y solamente mi vecino o yo necesitaremos hacer el viaje para realizar ambas tareas.
Definición de TODs Alcanzando Acuerdos en Dominios Orientados a Tareas Un TOD es una tripleta < T, Ag, c > donde T es el conjunto (finito) de todas las tareas posibles; Ag = {1,..., n} es el conjunto de los agentes participantes; c = (T ) R + define el costo de ejecutar cada subconjunto de tareas Un encuentro es un conjunto de tareas: < T 1,..., T n > donde T i T para cada i Ag
Tratos en TODs Alcanzando Acuerdos en Dominios Orientados a Tareas Dado un encuentro < T 1, T 2 > un trato será la asignación de tareas T 1 T 2 a los agentes 1 y 2. El costo para i del trato δ =< D 1, D 2 > es c(d i ), y lo denotaremos como cost i (δ) La utilidad de trato δ para el agente i es: utility i (δ) = c(t i ) cost i (δ) El trato de conflicto, Θ, es el trato < T 1, T 2 > con la asignación inicial de tareas. Notar que: utility i (Θ) = 0 para todo i Ag Un trato δ es racional individual si da una utilidad positiva.
El Conjunto de negociación en Dominios Orientados a Tareas El conjunto de tratos sobre el cual los agentes negociarán son aquellos que son: racionales individualmente, eficientes de Pareto
Conjunto de Ilustrado en Dominios Orientados a Tareas
El protocolo monotónico de la concesión en Dominios Orientados a Tareas Las reglas de este protocolo son como sigue... La negociación procede en rondas. En la ronda 1, los agentes proponen simultáneamente un trato del conjunto de la negociación. Se alcanza el acuerdo si uno de los agentes encuentra que el reparto propuesto por el otro es por lo menos tan bueno o mejor que su oferta. Si no se alcanza ningún acuerdo, la negociación procede a otra ronda de ofertas simultáneas. En la ronda u + 1, a ningún agente se le permite hacer una oferta que sea menos preferida por el otro agente que la oferta que propuso en el tiempo u. Si ninguno de los dos agentes hace una concesión en un cierta ronda u > 0, entonces la negociación termina, con el trato del conflicto.
La estrategia de Zeuthen en Dominios Orientados a Tareas Tres problemas: Cuál debe ser la primera oferta de un agente? Su trato preferido En una ronda dada, quién debe ceder? El agente menos dispuesto a arriesgar conflicto Si un agente cede, cuánto debe ceder? Lo suficiente para cambiar el equilibrio del riesgo
Voluntad de arriesgar conflicto en Dominios Orientados a Tareas Supón que has concedido mucho. Entonces: Tu oferta ahora está cerca del trato de conflicto. En caso de que ocurra el conflicto, no tienes mucho que empeorar. Estás más dispuesto a arriesgar el conficto Un agente estará más dispuesto a arriesgar el conflicto si la diferencia en utilidad entre su oferta actual y el trato de conflicto es baja
Equilibrio de Nash otra vez... en Dominios Orientados a Tareas La estrategia de Zeuthen está en el equilibrio de Nash: bajo la suposición que un agente está utilizando la estrategia, el otro puede hacer nada mejor que usarla también... Esto es de interás particular para el diseñador de agentes automatizados. Elimina cualquier necesidad de secretos de parte del programador. La estrategia de un agente puede ser de conocimiento público, y ningún otro diseñador de agentes puede explotar la información eligiendo una estrategia diferente. De hecho, es deseable que la estrategia sea conocida,para evitar conflictos inadvertidos.
Engaño en TODs Alcanzando Acuerdos en Dominios Orientados a Tareas El engaño puede beneficiar a los agentes de dos maneras: Tareas fantasma y trampa. Fingir que te han sido asignadas que no lo han sido. Tareas Ocultas. Fingir que no te han sido asignadas que si lo han sido.
Argumentación Alcanzando Acuerdos en Dominios Orientados a Tareas La argumentación es el proceso de procurar convencer otros de algo. Gilbert (1994) identificó 4 modos de la argumentación: 1 Modo Lógico Si aceptas que A y que A implica B, entonces debes aceptar ese B 2 Modo Emocional Cómo te sentirías si te sucediera a ti? 3 Modo visceral Cretino! 4 Modo de Kisceral Esto es contra las enseñanzas cristianas!
Argumentación Basada en Lógica en Dominios Orientados a Tareas La forma básica de una argumentación lógica es como sigue: Database (Sentence, Grounds) donde: Database es un conjunto de fórmulas lógicas (posiblemente inconsistentes). Sentence es una fórmula lógica conocoda como conclusión. Grounds es un conjunto de fórmulas lógicas tales que: 1 Grounds Database; and 2 Sentence puede ser probada a partir de Grounds.
Ataque y Derrota Alcanzando Acuerdos en Dominios Orientados a Tareas Sean (φ 1, Γ 1 ) y (φ 2, Γ 2 ) argumentos de una base de datos... Entonces (φ 2, Γ 2 ) puede ser vencido de una de las siguientes maneras: 1 (φ 1, Γ 1 ) refuta (φ 2, Γ 2 ) si φ 1 φ 2 2 (φ 1, Γ 1 ) socava (φ 2, Γ 2 ) si φ 1 ψ para algún ψ Γ 2 - Una refutación o un socavamiento son conocidos como ataques.
Argumentación Abstracta en Dominios Orientados a Tareas Trata sobre la estructura general del argumento (en lugar de los detalles internos del mismo) Escribimos x y El argumento x ataca al argumento y x es un contraejemplo de y x es un atacante de y donde no nos ocupamos de los que son x, y. Un sistema de argumentación abstracta es un conjunto de argumento junto con la relación, que indica quien ataca a quien. Un argumento está afuera si tiene un atacante que no es vencido y está adentro si todos sus atacantes son vencidos.
Ejemplo de un Argumento Abstracto en Dominios Orientados a Tareas