Módulo. Programación Multiobjetivo bajo Incertidumbre Patricia Jaramillo y Ricardo Smith Q. Instituto de Sistemas y Ciencias de la Decisión Facultad de Minas Universidad Nacional de Colombia, Medellín, Colombia La incertidumbre en toma de decisiones se puede manejar de dos maneras:. Mediante evaluadores de criterios de decisión considerando aspectos de incertidumbre. Ejemplo: Valor Esperado Vulnerabilidad Robustez Otros. Incluyendo los modelos de incertidumbre dentro de los modelos de toma de decisiones. Ejemplo: Programación matemática explicita Programación matemática implícita Restricciones aleatorias Otros
. Incluyendo los modelos de incertidumbre dentro de los modelos de toma de decisiones. Criterios de Decisión bajo Incertidumbre FLEXIBILIDAD: Capacidad de responder a cambios no predecibles. ROBUSTEZ: Capacidad de soportar satisfactoriamente todos los posibles estados de la naturaleza VULNERABILIDAD: Capacidad de soportar cambios predecibles. ADAPTABILIDAD: Capacidad de responder a cambios predecibles. ELASTICIDAD: Capacidad de regresar a una situación normal ante un cambio en condiciones del entorno. LIQUIDEZ: Facultad de transición desde una situación dada en un período a una situación deseada en el próximo período. PLASTICIDAD: Capacidad de permanecer en una misma situación. SATISFACCIÓN: Evalúa en ue medida es aceptable la alternativa para el decisor.
El decisor puede asignar una distribución de probabilidades a los estados de la naturaleza. Si se tienen las decisiones alternativas A,...,A m y los estados de la naturaleza θ,..., θ n se asume ue se conoce: Z ij : Retorno cuando se toma la decisión D i y el estado de la naturaleza es θ j P(θ j ): Probabilidad de ocurrencia del estado θ j θ θ A Z Z............... A m... Z m Z m...... θ n Z n Z mn P[θ] P[θ ] P[θ ]... P[θ n ] EJEMPLO: Un comercializador ue participa en el mercado eléctrico colombiano debe decidir sobre cómo participar en ese mercado. El comercializador tiene opciones de participar en la bolsa de energía o de realizar diferentes contratos o ambos. Hacia el futuro se pueden presentar diferentes posibilidades de precios. Después de un análisis de sus opciones y de precios futuros (ue incluye estudios del comportamiento hidrológico futuro), el comercializador concluye ue los rendimientos de sus opciones ante las diferentes posibilidades de precios son las siguientes: 3
Precios Tipo de contrato A Portafolio Contratos A Participar sólo En Bolsa A3 Bolsa y contratos A4 Portafolio Contratos Probabilidad 00-00 00 0.40 Mediobajos Medio- 40 0 80 0.5 50 50-00 0.0 Bajos -00 00 70 0 0.5. Criterios de esperanza Este criterio selecciona la alternativa con mayor valor esperado de Z(x) de la siguiente manera: e Max E[ Z( x )] = Z j( x ) P ( θ j ) j= Sujeto a x X 4
Precios Tipo de contrato A Portafolio Contratos 00 Mediobajos Medio- 40 Bajos -00 A Participar sólo en Bolsa -00 50 00 A3 Bolsa y contratos A4 Portafolio Contratos Probabilidad 00 0.40 0 80 0.5 50-00 0.0 70 0 0.5.E[A ] = 0.4 00+0.5 40+0.0 (- 5)+0.5 (- 00)=30 E[A ] = - 6.5 E[A 3 ] = 5.50 **E[A 4 ] = 4.50.Criterios de vulnerabilidad Son muy útiles cuando se consideran posibles estados de la naturaleza críticos como seuías, grandes avenidas etc. Los más aplicados son: la distancia al peor valor las funciones de arrepentimiento Criterio Hurwicz :Criterios maximin y maximax minimizar el máximo arrepentimiento. 5
.. Criterio de la distancia al peor valor Si Z Min, corresponde al conjunto de los peores valores posibles de Z j (x) en cada estado de la naturaleza θ j. La mejor alternativa será la ue esté a mayor distancia de ese punto, así: Max D ( x )= e j= P ( θ j ( j( x ) Z ) ) Z Sujeto a x X Donde Z j,min es el peor valor respecto al estado θ j y define la norma o métrica utilizada. j,min Z (x) 4 R 6 Z (x) Precios Tipo de contrato A Portafolio Contratos 00 Mediobajos Medio- 40 Bajos -00 A Participar sólo en Bolsa -00 50 00 A3 Bolsa y contratos A4 Portafolio Contratos Probabilidad 00 0.40 0 80 0.5 50-00 0.0 70 0 0.5 Los peores niveles para cada estado de la naturaleza son: Z,Min = -00, Z,Min =, Z 3,Min = -00, Z 4,Min = 0 Las distancias al peor nivel considerando = son: D (A ) =0.4 (00-(-00)+0.5 (40-()+0. (-(-00))+0.5 (-00-(0) = 33.75 D (A ) = 97.50 D (A 3 ) = 9.5 D (A 4 ) = 46.5 6
. Funciones de arrepentimiento Compara cada alternativa con una alternativa ideal Z Max. La mejor alternativa es, por lo tanto, la más cercana a esa referencia y se obtiene de: Min D ' ( x )= e j= P ( θ j ( Z Max Z ( x ) ) ) j, j Sujeto a x X donde Z j,max es el valor ideal respecto al estado θ j. Las distancias a la alternativa ideal son llamadas arrepentimientos porue euivalen a los retornos no obtenidos a causa de no conocer con certeza el estado futuro de la naturaleza. Z (x) Solución Ideal Alternativa Arrepentimiento Distancia al peor Peor Solución Z (x) 7
Precios Tipo de contrato A Portafolio Contratos 00 Mediobajos Medio- 40 Bajos -00 A Participar sólo en Bolsa -00 50 00 A3 Bolsa y contratos A4 Portafolio Contratos Probabilidad 00 0.40 0 80 0.5 50-00 0.0 70 0 0.5 Las distancias a la alternativa ideal considerando = son entonces: D (A ) = 0.40 (00-00)+0.5 (80-40)+0. (50-()+0.5 (00-(- 00) = 0 D (A ) = 46.5 D (A 3 ) = 4.50 D (A 4 ) = 97.50.3.Criterio Hurwicz :Criterios maximin y maximax Maximin: el decisor actúa de manera pesimista y opta por la decisión ue impliue mayor utilidad para el peor de los casos de cada una de las alternativas. La mejor alternativa se obtiene de: Max { ( ) } D* ( x )= Min Z j( x ), j =,,...,e Sujeto a x X j 8
Precios Tipo de contrato A Portafolio Contratos 00 Mediobajos Medio- 40 Bajos -00 A Participar sólo en Bolsa A3 Bolsa y contratos A4 Portafolio Contratos Probabilidad -00 00 0.40 0 80 0.5 50 50-00 0.0 00 70 0 0.5 Los mínimos para cada alternativa son: D(A ) = -00 D(A ) = -00 D(A 3 ) = D(A 4 ) = 0 maximax el decisor tiende a actuar de manera arriesgada por su exceso de optimismo. La mejor alternativa se obtiene de: Max { D** ( x )= Max( Z j( x ) ), j =,,...,e} Sujeto a x X j En el ejemplo, se obtiene: D**(A ) = 00 D**(A ) = 00 D**(A 3 ) = 70 D**(A 4 ) = 00.maximin = conservador maximax = arriesgado 9
3.. Criterio β-robustez selecciona la solución más robusta, respecto a un nivel de aceptabilidad β, de la siguiente manera: e Max Rβ ( x ) = P(θk ) φk ( x ) k = Sujeto a x X En la ue β representa la máxima diferencia con respecto a la solución ideal ue se considera aceptable para el decisor. La función φ k (x) indica si la alternativa x es aceptable en el estado k y corresponde a la función: Z k,max Z k ( x ) si β φ ( k x ) = Z k,max Z k, 0 en otro caso Min R β (x) es la probabilidad de los estados de la naturaleza ue resultan en retornos aceptables, Ejemplo: R β (x)= 0.80, la alternativa x tiene una probabilidad de 0.80 de estar en el rango aceptable para el decisor. Déficit β Región aceptable Z Max. φ =0 φ = 0 φ =0 si φ k ( x ) = 0. φ = β Z k,max Z k ( x ) β Z k,max Z k,min en otro caso Déficit 0
considerando β=0.4, la matriz de decisiones se convierte en la matriz de los arrepentimientos normalizados: Precios Tipo de contrato Medio- Mediobajos Bajos A Portafolio Contratos 0.33 () 0.38 () 0.50 0.67 A Participar sólo en Bolsa.00.00 0.00 () 0.00 () A3 Bolsa y contratos 0.75 0.57 0.00 () 0.9 () A4 Portafolio Contratos 0.00 () 0.00 ().00.00 Probabilidad 0.40 0.5 0.0 0.5 R 0.4 (A ) = 0.4 + 0.5 = 0.65 R 0.4 (A ) = 0.35 R 0.4 (A 3 ) = 0.35 R 0.4 (A 4 ) = 0.65 Según el criterio β-robustez, A y A 4 son las alternativas seleccionada. Criterios bajo Incertidumbre Esperanza Vulnerabilidad Robustez Valor esperado Distancia al peor Arrepenti miento maximin maximax Minimax arrepent imiento β- robustez β=0.4 + + - + + - + A 30.00 33.75 0.00-00 00 300 0.65 A -6.5 97.50 46.5-00 00 300 0.35 A3 5.50 9.5 4.50 70 5 0.35 A4 4.50 46.5 97.50 0 00 450 0.65
PROTRADE Programming tradeoff Development Si se tiene el siguiente problema con objetivos estocásticos n j= Maximizar Z(x) = [Z (x), Z (x),... Z (x)] Sujeto a g l (x) b l, l=,...m Donde cada objetivo es Z i (x) =c ij x j i =,... Y los coeficientes de costos de las funciones objetivo son variables aleatorias tal ue: c ij N[E(c ij ),var(c ij )]. Mediante evaluadores de criterios de decisión considerando aspectos de incertidumbre.
METODO PROTRADE: Diseñado por Goicoechea NUEVA PROPUESTA DEL PROTRADE Para una solución eficiente x* cada objetivo será representado por el vector V i = [, G i (x*),(-α i )*] Donde = Z i (x*) es el valor actual del objetivo en las unidades originales min G i (x*) es el valor normalizado de Z i (x*), así: Zi( x) Zi Gi = max min Z Z y (-α i ) Es la probabilidad de alcanzar el valor de Z i (x*). i i M G G M G α α M α x* 3
-α i es tal ue, * Pr[ Z i ( x) Z i ( x )] i f(z i ) α -α i Z i (x*) Z i (x) Su euivalente determinístico es: E(c ij )x + K αi [x t Ax] / Z i (x * ) Donde K αi es un valor normal estándar tal ue Φ( K αi ) = α i y Φ representa la función de distribución acumulativa normal. Suponga ue en una iteración j se obtiene la solución no dominada x j M G G M G α α M α j x Y el decisor no se encuentra satisfecho con esta solución. 4
En un problema MO determinístico, dada una solución actual, si deseo mejorar en un objetivo k, tiene ue ser a expensas de disminuir en otro objetivo i k. En el problema MO estocástico: dada una solución actual, si deseo mejorar en un objetivo k sin afectar los logros de los demás objetivos y sus probabilidades asociadas, tiene ue ser a expensas de sacrificar la probabilidad de alcanzar ese logro (-α k ). Si para un objetivo k deseo mejorar tanto su logro como la probabilidad de alcanzarlo (-α k ), tiene ue ser a expensas de disminuir en alguna meta o en alguna probabilidad de alcanzarla respecto a un objetivo i k. Se propone un Ecualizador Estocástico Multiobjetivo en el ue se debe dar los siguientes pasos: Paso inicial: hallar una solución x 0 indiferente al riesgo y a la importancia de los objetivos. Esta se halla aplicando el método de programación de compromiso con métrica infinito, pesos iguales, y valores esperados de los coeficientes. La solución encontrada por este método aportará iguales logros normalizados para todos los objetivos, es decir, G =G =..=G e iguales probabilidades de alcanzarlos (-α )= (-α )=...= (-α )=0.50. G α G α M M G M α x 0 5
G (-α )=0.5 G (-α )=0.5 G (-α )=0.5 Objetivo Objetivo Objetivo Paso : El decisor debe ahora elegir sobre ue objetivo desea mejorar ya sea respecto a su meta, respecto a su probabilidad de alcanzar la ue ya tiene, o los dos. Para ello debe expresar ue sacrificios está dispuesto a aceptar. 6
Por ejemplo, el podría expresar ue:. Desea mejorar el logro del objetivo k, (en valores de unidades de k o en unidades normalizadas G k entre 0 y. a. Sacrificando en su propia probabilidad de alcanzarla. Para ello debe expresar ue nuevo nivel (-α k ) está dispuesto a aceptar b. Sacrificando en el logro alcanzado por otro objetivo j k. Para ello debe expresar ue nuevo nivel j está dispuesto a aceptar c. Sacrificando en la probabilidad de alcanzar el logro actual de algún objetivo j k. Para ello debe expresar ue nuevo nivel (-α j ) está dispuesto a aceptar d. Sacrificando tanto en logro alcanzado por otro objetivo j k, como en su probabilidad de alcanzarlo (-α j ).. Desea mejorar la probabilidad de alcanzar el logro del objetivo k, (-α k ) a.sacrificando en su propio logro. Para ello debe expresar ue nuevo logro k (o G k ) está dispuesto a aceptar. b.sacrificando en el logro alcanzado por otro objetivo j k. Para ello debe expresar ue nuevo nivel j está dispuesto a aceptar c.sacrificando en la probabilidad de alcanzar el logro actual de algún objetivo j k. Para ello debe expresar ue nueva probabilidad (-α j ) está dispuesto a aceptar d.sacrificando tanto en logro alcanzado por otro objetivo j k, como en su probabilidad de alcanzarlo (-α j ). 7
egún la petición del decisor debe encontrarse una nueva solución x, a partir de una nueva formulación del problema: or ejemplo en el caso.a, el problema uedaría así: ejorar el logro del objetivo k, sacrificando en su propia probabilidad de alcanzarla. Para ello debe expresar ue nuevo nivel (-α k ) está dispuesto a aceptar Maximizar k Sujeto a: - restricciones originales S - restricciones ue condicionen la permanencia de algunos niveles or ejemplo, para el caso.a ejorar la probabilidad de alcanzar el logro del objetivo k, (-α k ) sacrificando en su propio logro. Para ello debe expresar ue nuevo logro k (o G k ) está dispuesto a aceptar. inimizar K αk ujeto a: - restricciones originales S - restricciones ue condicionen la permanencia de algunos niveles (c ij- ) x j + K α0 i [x t Ax] / Z i (x 0 ) i k 8
9 Al final de cualuier iteración el decisor evalúa la nueva solución x k actual, y el conjunto de valores asociados: Debe decidir si está satisfecho con estos valores o propone nuevas mejoras a expensas de algunos sacrificios ue está dispuesto a hacer. x k G G G α α α M M M Los pasos anteriores se repiten iterativamente cambiando las aspiraciones de los objetivos hasta obtener un vector satisfactorio V*: 0 * x G G G V = α α α M M M
En este momento el usuario puede estar satisfecho con la solución encontrada y sus respectivas probabilidades, y tiene suficiente información de las limitaciones del problema. En términos generales, el decisor puede aumentar el nivel del objetivo pero disminuyendo la probabilidad de alcanzar ese nivel. En caso de ue las variables aleatorias sigan una distribución diferente a la normal, el mismo proceso puede adecuarse a sus particulares euivalentes determinísticos. 0