TEORÍA DE DECISIONES (Versión Preliminar)



Documentos relacionados
MATEMÁTICAS APLICADAS A LAS C.C. SOCIALES

Métodos Cuantitativos para la toma de Decisiones. MSc. Ing. Julio Rito Vargas A. 2014

V.4 Incertidumbre, Métodos Probabilísticos de Análisis de Alternativas

Análisis y cuantificación del Riesgo

Administración de Empresas. 11 Métodos dinámicos de evaluación de inversiones 11.1

Las razones financieras ayudan a determinar las relaciones existentes entre diferentes rubros de los estados financieros

CAPÍTULO IV: ANÁLISIS, INTERPRETACIÓN Y DISCUSIÓN DE RESULTADOS

POR QUÉ EL VALOR PRESENTE NETO CONDUCE A MEJORES DECISIONES DE INVERSIÓN QUE OTROS CRITERIOS? ( Brealey & Myers )

MICROECONOMÍA MICROECONOMÍA

Los estados financieros proporcionan a sus usuarios información útil para la toma de decisiones

Finanzas de Empresas Turísticas

Por qué es importante la planificación?

Universidad Diego Portales Facultad de Economía y Empresa

MOOC UJI: La Probabilidad en las PAU

Guía de Ejercicios. Teoría de Juegos

Fundamentos de Investigación de Operaciones Investigación de Operaciones 1

4 Teoría de diseño de Experimentos

CAPÍTULO 1 INTRODUCCIÓN. En México existen miles de micro, pequeñas y medianas empresas que constituyen una

Hasta el momento hemos analizado como los agentes económicos toman sus decisiones de consumo o producción en condiciones de certeza total.

LINEAMIENTOS PARA LA ELABORACIÓN DEL PROGRAMA ANUAL DE TRABAJO

CAPÍTULO 1: INTRODUCCIÓN. Todas las personas sabemos que la gran mayoría de las actividades humanas conllevan lo

Adaptación del producto

TALLER 2. MEJORA CONTINUA

Tres clases de modelos de decisión

GESTIÓN Y CONTROL DEL DESARROLLO E IMPLANTACIÓN DE APLICACIONES

Línea Base Juan Carlos Bajo Albarracín Qué es una línea base Cómo implantar la Ley 29783: El concepto sistema de gestión en la Ley 29783

PROYECTO DE CALIDAD TURÍSTICA

FINANZAS: Gestionando para el emprendimiento

Toma de decisiones en situación de certeza, riesgo e incertidumbre

Soluciones de los ejercicios de Selectividad sobre Probabilidad de Matemáticas Aplicadas a las Ciencias Sociales II

Evaluación del desempeño: los miembros de la familia, a examen

Estudio Técnico INTRODUCCIÓN

1. Generalidades. Nombre de la asignatura o unidad de aprendizaje. Apertura de negocios. Clave asignatura. Ciclo LA945. Modulo tercero (integración)

Universidad Carlos III de Madrid Teoría de Juegos Lista de Ejercicios de Juegos Repetidos y Bayesianos

EL CONTRATO DE DISTRIBUCIÓN*

Introducción. Ciclo de vida de los Sistemas de Información. Diseño Conceptual

Programación Lineal. Ficha para enseñar a utilizar el Solver de EXCEL en la resolución de problemas de Programación Lineal

Diana del Pilar Cobos del Angel. Experimento: Es una prueba o ensayo. Es el proceso de obtener una observación.

Diseño de una estrategia tecnológica de Customer Relationship Management (CRM) para la empresa BPM de México. CAPITULO 6

UNIVERSIDAD DE ATACAMA FACULTAD DE INGENIERÍA / DEPARTAMENTO DE MATEMÁTICA

Qué requisitos deben cumplir los albaranes o notas de entrega?

GUÍA TÉCNICA PARA LA DEFINICIÓN DE COMPROMISOS DE CALIDAD Y SUS INDICADORES

Análisis de Resultados

CAPITULO VI ESTRATEGIAS DE OUTSOURCING

Selectividad Septiembre 2013 OPCIÓN B

Análisis de Estados Financieros

1.1. Introducción y conceptos básicos

CAPÍTULO 6 CONCLUSIONES Y RECOMENDACIONES

Juegos Dinámicos: Info Completa. Tema 05. Profesor: Carlos R. Pitta. Análisis de Sectores Económicos

LA EXTERNALIZACIÓN EN EL PROCESO DE INTERNACIONALIZACIÓN

Boletín de Consultoría Gerencial

CÓMO MEDIR CORRECTAMENTE LA EFICIENCIA DE LA GESTIÓN DE RRHH. Dr. Pablo Bastide

Guía para ser un empresario formal del Turismo en Chile

EJERCICIOS PAU UMBRAL RENTABILIDAD PUNTO DE EQUILIBRIO

MODELOS DE RECUPERACION

ASEGURAMIENTO DE LA CALIDAD EN LABORATORIO

Wise Up Kids! En matemáticas, a la división de un objeto o unidad en varias partes iguales o a un grupo de esas divisiones se les denomina fracción.

DESARROLLO COMUNITARIO Y EDUCACIÓN

CAPÍTULO III MARCO TEÓRICO. Cada día cambian las condiciones de los mercados debido a diferentes factores como: el

5.1. Organizar los roles

TEORÍA DE JUEGOS. 1 Definiciónes y Conceptos Básicos. 1.1 Definición: 1.2 Elementos de un juego. 1.3 Representación de un juego.

INTRODUCCION AL CONTROL AUTOMATICO DE PROCESOS

UNIVERSIDAD DE ORIENTE UNIVO FACULTAD DE CIENCIAS ECONÓMICAS

CUESTIONARIO DE AUTOEVALUACIÓN

Información Financiera en Economías Hiperinflacionarias

Manejo de la Información

Capitulo II: Fundamento Teórico. Los conceptos que sustentan la investigación se presentan a continuación:

Comente: Los bancos siempre deberían dar crédito a los proyectos rentables. Falso, hay que evaluar la capacidad de pago.

SENA: CENTRO BIOTECNOLOGIA INDUSTRIAL PROGRAMA DE FORMACIÓN: TECNOLOGO GESTION LOGISTICA

Cómo Desarrollar un plan Estratégico

Actividades para mejoras. Actividades donde se evalúa constantemente todo el proceso del proyecto para evitar errores y eficientar los procesos.

Trabajo Semanal Alternativo

EJEMPLO DE REPORTE DE LIBERTAD FINANCIERA

4. METODOLOGÍA. 4.1 Materiales Equipo

PRUEBAS DE HIPÓTESIS

2. LOS SISTEMAS DE COSTOS

ANÁLISIS DE DATOS NO NUMERICOS

CAPÍTULO III ANÁLISIS DE INVERSIONES GANADERAS

El alumno conocerá el diseño y la planificación de estrategias corporativa y competitiva, para proyectar a la empresa en una posición de ventaja

El Futuro de la Computación en la Industria de Generación Eléctrica

Campos de golf: el gran reclamo inmobiliario

Tema 4. Números índice

Introducción a la estadística y SPSS

Su éxito se mide por la pertinencia y la oportunidad de la solución, su eficacia y eficiencia.

2. Elaboración de información financiera para la evaluación de proyectos

Localización de clientes

Como lo expresamos cuando describimos el problema objeto de

RIESGO Y RENTABILIDAD DE LA EMPRESA (Riesgo y Rendimiento) Qué es lo que determina el rendimiento requerido de una inversión?

ÍNDICE. Ficha técnica Encuesta y cuestionario Finalidad y resultados de la encuesta Primera parte: conocimiento...

MAYOR PRODUCTIVIDAD CON UNA MEJOR CALIDAD EN LOS COSTOS

Programa 25 Atractivo de la formación UPM

DESCRIPCIÓN DE SERVICIOS

5. PROCEDIMIENTOS DE CONTROL POR ÓRDENES DE PRODUCCIÓN Y POR CLASE

Tema 5: Sistemas Monetarios Internacionales

CAPÍTULO III. MARCO METODOLÓGICO. del Hotel y Restaurante El Mandarín S.A. de C.V. en la ciudad de San Miguel.

Unidad 7. Activos intangibles. Objetivos. Al i nalizar la unidad, el alumno:

CASO PRÁCTICO DISTRIBUCIÓN DE COSTES

1. Introducción al evaluación de proyectos

Cómo las herramientas en línea están revolucionando la implementación de ITIL e ISO 20000

Transcripción:

Facultad de Ciencias Exactas y Tecnologías - UNSE Apuntes de Cátedra: Investigación Operativa Año: 2008 TEORÍA DE DECISIONES (Versión Preliminar) Introducción: Decisión e Investigación Operativa: La mayoría de las definiciones de la Investigación Operativa coinciden en que esta disciplina matemática es una herramienta sumamente útil para la toma de decisiones. El éxito o fracaso de cualquier operativo, ya sea económico, comercial, militar, político, social, etc., depende de la correcta o errónea decisión que se tome frente a distintas alternativas que se presentan. En tales circunstancias, se debe decidir. Consecuentemente podemos decir que: decidir, es la preferencia por una, o la elección de una, frente a un conjunto de alternativas que se puedan presentar. Si este proceso de elección lo efectuamos teniendo en cuenta criterios que nos permitan establecer un orden de preferencias, entonces estamos buscando una decisión óptima. La decisión se traduce en coordinar un conjunto de actividades cuyas consecuencias se sentirán en el futuro. El decididor decide en base a la intuición y en base al razonamiento. De manera que esta situación se puede expresar como: D I + R o bien podríamos decir que: D f(r,i) Es decir la decisión como una función de una componente racional y una componente intuitiva. I intuición ; R razonamiento ; D decisión. De manera que la Investigación Operativa, tendría como misión tratar de darle mayor peso a la componente racional, es decir procurar que la decisión sea mucho más racional que intuitiva. Pero se debe tener en cuenta que no se puede tomar una decisión puramente racional, porque quien decide, a veces tiene en cuenta en el acto de decisión, otros aspectos subjetivos que no pueden evaluarse cuantitativamente o racionalmente. La valoración de estos aspectos, que por lo general dependen de la experiencia del decididor, puede ser de carácter religioso, político, etc., y que no son tenidos en cuenta por el analista. Quien decide es un ser humano, y este no es exclusivamente racional, admitirlo, sería olvidar que como mínimo, posee una componente emocional. El analista, suministra al sujeto, objeto de la decisión (decididor), bases racionales, le sugiere alternativas, dado que es el sujeto de la decisión, (empresario, tomador de riesgo, gerente general, etc.) quién seleccionará la alternativa que a su criterio sea la más conveniente. De manera que la función del analista es sugerir alternativas racionales y el decididor es el que finalmente decide. Es por ello que una buena organización debe poseer un grupo de analistas interdisciplinarios para analizar los múltiples problemas que se puedan presentar, es decir, debe ser un staff (estado mayor, o de primera línea) y no elementos de línea en la organización.

Metodología científica en la toma de decisiones. En toda decisión la componente racional surge de la aplicación de una metodología científica y no de la improvisación, consecuentemente la Teoría de Decisión, procura darle mayor peso a dicha componente en un proceso de la toma de decisión. En este caso, la metodología científica consiste en la aplicación secuencial de los siguientes pasos: a. Observar el sistema en el cual incide la decisión. b. Identificar y formular claramente el o los problemas sobre los cuales se quiere decidir. Es imposible obtener una solución correcta partiendo de planteos incorrectos del problema. c. Establecer una serie de hipótesis, que pueden ser verificadas mediante modelos que han sido diseñados para tal fin. d. Experimentar, es decir hacer funcionar los modelos suministrándole datos pasados. e. Verificar que los resultados suministrados por el modelo sean universalmente aplicables a problemas similares en idénticas circunstancias y en tiempos diferentes. Elementos que componen el acto de la toma de decisión. En un acto de toma de decisión, se distinguen los siguientes elementos: a. Uno o más sujetos de la decisión o decisores que tienen objetivos bien determinados. b. Un conjunto conocido de alternativas que llamamos: A {a 0, a 1, a 2, a 3,...,a i,...,a n }. De dicho conjunto deseamos elegir el elemento particular a i, tal que dicho elemento sea preferible o indiferente a cualquier otro elemento del conjunto A. Esto implica definir en dicho conjunto, una relación de orden completo que llamamos relación de preferencia, tal que cualquier par de elementos a 0 y a 1 que pertenecen a A, podemos decir que a 0 es preferible a a 1 ó a 1 es preferible a a 0. c. Un conjunto de resultados posibles que lo designamos como: θ {θ 0, θ 1, θ 2,...,θ j,...,θ n }, tal que cada vez que el sujeto de la decisión elige un elemento a i del conjunto A, se presenta independientemente del valor seleccionado, un elemento particular θ j del conjunto θ, de manera que el par ordenado (a i, θ j ) con a i A θ j θ, determinan un resultado o consecuencia determinada de la decisión. Podemos decir también, que a cada par ordenado (a i, θ j ), le corresponde un número real w f(a i, θ j ), que mide el grado de satisfacción que le produce la conveniencia de haber tomado la decisión a i. d. Un entorno a los resultados, dado por los posibles estados que guarda la naturaleza. Frecuentemente, el resultado o la consecuencia de una decisión están condicionados no sólo por la elección efectuada para la toma de decisión, sino también por un conjunto de circunstancias o hechos que no dependen del sujeto que toma la decisión, sino del mundo exterior. A este conjunto de circunstancias o variables que el sujeto de la decisión no puede manejarlos, lo llamamos Universo de la Decisión o Estados de la Naturaleza. e. Una función o aplicación f que liga la decisión con el resultado, de manera que: f : A x θ W { f(a i, θ j ) /a i A θ j θ}, a i en el sentido cardinal u ordinal, a 0 produce el doble grado de preferencia frente a a 1, o a 0 < a 1 o a 0 > a 1, respectivamente. 2

En la cual W es un conjunto de números reales que mide la compensación que le produce al sujeto de la decisión, el hecho de haber tomado la decisión a i que da como resultado f(a i, θ j ), tal que, dados: w 0 f(a 0, θ 0 ), con f(a 0, θ 0 ) W, y w 1 f(a 1, θ 1 ), con f(a 1, θ 1 ) W, se prefiere tomar la compensación w 0 y no w 1, si w 0 > w 1, o bien: w 1, si w 1 > w 0. f. Un proceso de selección de políticas o estrategias en relación con los objetivos del grupo de decisión. g. Un criterio que enmarca el proceso de decisión. Por ejemplo maximizar beneficios. Para graficar esta situación, consideramos el siguiente ejemplo elemental: Un comerciante pide diariamente un producto perecedero cuyo costo por unidad es de 100 $. El precio de venta de dicho producto es de 300 $, lo que le produce una rentabilidad de 200 $ por unidad de producto. Las unidades no vendidas en el día, representan una pérdida para el comerciante. Suponemos que la demanda del producto (θ), que es aleatoria y no se conoce su ley de probabilidad, adopta uno de los siguientes tres valores: 0, 1, 2. El problema de decisión óptimo es maximizar la ganancia del comerciante. Para ello, el sujeto de la decisión (comerciante), debe decidir que cantidad de producto adquirir. Con esta información podemos construir la siguiente tabla en la que, en la primera columna figure el conjunto de acciones o alternativas a i, en la primera fila el conjunto (θ j ) de resultados o estados que guarda la naturaleza independientes de la voluntad del decisor, con lo cual, el cuerpo de la tabla, llamada matriz de consecuencias, representa la compensación o satisfacción wf(a i,θ j ). a i θ 0 1 2 0 0 0 0 1-100 200 200 2-200 100 400 Aspectos que caracterizan la toma de decisión. Según cual sea el entorno o estado que guarda la naturaleza, la decisión puede realizarse en un marco de: a. De completa certeza. b. De riesgo o estocástico. c. De conflicto u hostil. d. De completa incertidumbre. Conviene aclarar que prácticamente nunca se encuentra una situación real que reúna exactamente todas las características de cada uno de estos grupos, el hecho de que a un determinado problema lo ubiquemos en una u otra de estas categorías, se debe exclusivamente al grado de similitud que presente el problema o bien a la información que se pueda poseer. 3

Decisión frente a un universo de completa certeza o determinístico. En este caso se trabaja bajo la hipótesis de que frente a cada decisión a i A, el sujeto de la decisión sabe exactamente cuál es el estado que guarda la naturaleza en relación a sus objetivos, es decir, conoce la respuesta θ j θ, que se presentará. Por lo tanto sabe apriorísticamente la compensación w f(a i, θ j ) que se obtendrá. Dado que en este caso, f(a i, θ j ) depende únicamente de a i, dicha función puede ser tomada como función de decisión. Esto ocurre cuando el conjunto θ {θ 1, θ 2,..., θ j }, está formado por un solo elemento, en consecuencia su probabilidad de presentación es igual a uno. De manera que estando determinada la función de decisión f(a i, θ j ), será necesario solamente tomar los distintos valores de a i A y determinar cuál de estas alternativas maximiza la función o produce la mayor compensación. Ejemplos típicos de estas situaciones son los siguientes: a) Problemas de asignación: Por ejemplo la asignación de determinadas máquinas a la ejecución de determinadas tareas. b) Problemas de transporte: Determinación de un plan óptimo de transporte para el traslado de recursos de distintos orígenes a distintos destinos. c) Problemas de mezclas: Determinar las cantidades óptimas de los componentes de un determinado producto. Y muchos ejemplos más. Dentro de la Investigación Operativa, hay métodos específicos tales como la programación lineal, por ejemplo, que permiten tomar decisiones óptimas en este tipo particular de problemas. De manera que en un problema de decisión en un universo de completa certeza o determinístico, el objetivo de la decisión será: a. Minimizar pérdidas, costos, etc. b. Maximizar beneficios, ganancias, etc. Decisión frente a un universo de riesgo o estocástico En este caso no se conoce cuál es el estado que guarda la naturaleza, en consecuencia, el conjunto θ es un conjunto aleatorio cuya ocurrencia puede asociarse a una distribución de frecuencias sobre la base del conocimiento de la ocurrencia de tales sucesos en el pasado. Es decir que a cada θ j θ puede asignársele un valor estimado de probabilidad a partir de la distribución de frecuencias o bien, a partir de criterios personales y subjetivos avalados por la experiencia o información que disponga el decisor. La toma de decisión frente a un universo de riesgo es la situación que más a menudo ocurre. Ejemplos típicos de estas situaciones son: a) Problemas de fallas en los procesos de producción. b) Rechazo de artículos en proceso de control de calidad. c) Estudio de la ocurrencia de determinados fenómenos meteorológicos para la aplicación en situaciones específicas. Etcétera. De manera que para cada alternativa de decisión a i A, la función de consecuencia, f(a i, θ j ) será también una variable aleatoria cuya distribución de probabilidad conocemos. 4

Siendo f(a i, θ j ) una variable aleatoria con una determinada distribución de probabilidad, al tomar una decisión a i A, no queda determinado como en el caso anterior un número real que representa el valor de compensación, sino una variable aleatoria a la que está asociada una distribución de probabilidad. Frente a esta situación resulta racional elegir como función de decisión, la esperanza matemática de f(a i, θ j ) que dependerá de a i, ya que para cada valor de a i, queda determinada una variable aleatoria y en consecuencia un valor para la esperanza matemática de la función de consecuencias. En este caso podemos definir una función de decisión como: f (a) E{f(a i,θ j )}. De manera que la decisión óptima estará dada por el valor de a i que maximice la esperanza matemática. Se concluye que, en el caso de un problema de decisión en un universo de riesgo o estocástico, el objetivo de la teoría de decisión es optimizar (maximizar o minimizar) la esperanza matemática de la función de decisión. Decisión frente a un universo de conflicto u hostil En este caso el elemento θ j θ que se presentará frente a cada elección de un elemento a i A, depende de otro individuo que tiene intereses contrapuestos con los individuos sujetos de las decisiones. Esta situación se presenta por ejemplo, en la lucha de dos empresas competidoras que se disputan la conquista de los consumidores de un determinado producto. La compensación que puede recibir una de las empresas frente a cada una de sus decisiones o elección de un elemento a i A, depende fundamentalmente de la decisión que tome la otra empresa cuyos intereses estarán representados por la elección de los elementos θ j θ Por las características que presentan este tipo de problemas, el estudio de las decisiones se ha englobado bajo el nombre de Teoría de Juegos de Estrategias. En el caso de un problema de decisión en un universo de conflicto u hostil, el objetivo de la decisión será: Minimizar las máximas pérdidas o su equivalente, Maximizar las mínimas ganancias. Decisión frente a un universo de completa incertidumbre. Este es un caso similar a la toma de Decisión en un Universo de Riesgo o Estocástico, con la diferencia de que ahora no se conoce la distribución de probabilidad que define la esperanza matemática de la función de decisión. Es decir, se desconocen completamente las probabilidades de los estados que guarda la naturaleza y ni siquiera se tiene la capacidad para hacer una ponderación probabilística de los resultados posibles. En otras palabras, el decisor se enfrenta con situaciones que nunca ocurrieron y que quizás no se repitan de la misma forma en un futuro previsible. De esta manera, los criterios adoptados para la toma de decisión cuando existe completa incertidumbre, reflejan claramente, los valores fundamentales y actitudes personales que tiene frente al riesgo, el sujeto de la decisión. O sea que, frente a un problema planteado en este contexto, el decisor puede adoptar un criterio optimista, pesimista o bien intermedio. En este caso no hay un criterio universalmente aceptado que conduzca a escoger el mejor curso de acción que permita adoptar la decisión más conveniente, solamente existen las sugerencias de diversos autores recomendando uno u otro criterio. Si bien es cierto que estos criterios se asientan sobre razonamientos válidos, también existen críticos a estos razonamientos que hacen que objetivamente no se pueda adoptar uno de ellos como preferible a los restantes. Consecuentemente, sólo se exponen algunos de los criterios más difundidos. 5

a. Criterio del pesimismo o de Wald. b. Criterio de optimismo relativo o de Hurwicz. c. Criterio de Laplace. d. Criterio de Savage o del arrepentimiento máximo. e. Estrategias mixtas. Éste último se analiza mediante la Teoría de Juegos. Sintetizando, se puede decir que un problema de decisión establece la existencia de un conjunto de acciones posibles definidas como A {a 0, a 1, a 2, a 3,...,a i,...,a n }. Cuando el grupo decisor escoge una acción a i A, se produce como consecuencia o respuesta un resultado que depende de los estados de la naturaleza. El conjunto: θ {θ 0, θ 1, θ 2,...,θ j,...,θ n }, que representa los estados de la naturaleza, son a su vez, la situación real donde incide la acción a i A. La consecuencia de instrumentar una acción a i A, dado un estado de la naturaleza θ j θ, se mide a través de una función f(a i, θ j ) que normalmente se evalúa en términos monetarios o de algún tipo de utilidad. Se puede o no conocer la distribución de probabilidad que estima el comportamiento de la variable asociada a la ocurrencia de cualquier θ j θ Si tal distribución de probabilidad es conocida, nos encontramos ante la toma de decisiones en un universo de riesgo o estocástico, en caso contrario, si no es conocida la distribución de probabilidad, la toma de decisión se produce en un universo de completa incertidumbre. En el caso de que el suceso θ j θ, sea único, probabilidad de ocurrencia igual a uno, la toma de decisión se realiza en un universo de completa certeza. La experimentación y recolección de información, son herramientas muy importantes que permiten estimar una distribución de probabilidad asociada a los distintos estados que guarda la naturaleza. TEORÍA BAYESIANA DE DECISIÓN En este caso se conviene que el sujeto de la decisión tiene un único objetivo. La Teoría Bayesiana de Decisión se aplica cuando se debe decidir en un universo de riesgo o estocástico, de manera que en este caso, se puede o no disponer de una distribución de frecuencias de los estados naturales. Cuando se decide aplicando este principio, se asume que la función de consecuencias f(a i, θ j ), que mide la compensación de haber elegido una alternativa a i A ante un conjunto de estados de la naturaleza θ j θ, está dada exclusivamente en términos monetarios. En este caso la decisión tiene por objetivo: Máx E[f(a i, θ j )], o Mín E[f(a i, θ j )] j j Según se trate de maximizar beneficios o minimizar pérdidas. En muchas situaciones, cuando se debe decidir en un universo riesgo o estocástico, el sujeto de la decisión no conoce la distribución de probabilidades o frecuencias relativas de los estados que guarda la naturaleza, en consecuencia debe estimar o ponderar valores de probabilidad asociados a dichos estados. Para ello el sujeto de la decisión, puede o no, disponer de información previa o haber realizado alguna experimentación con relación a los estados que guarda la naturaleza. 6

Los sujetos que deben decidir en un universo de riesgo o estocástico, por lo general tienen una firme convicción con respecto a la certeza con que pueden ocurrir determinados eventos, y los valores subjetivos de probabilidad que le asignan a los mismos, surgen de la propia experiencia del decisor y del conocimiento de la situación o problema analizado. Esta asignación de valores de probabilidad a los estados de la naturaleza, recibe el nombre de Distribución Apriori. Para poder asignar o ponderar adecuadamente estos valores subjetivos de probabilidad, es necesario tener un conocimiento claro y completo de los posibles estados que guarda la naturaleza y contemplar todas las situaciones involucradas en el problema, teniendo en cuenta los siguientes aspectos: a) Se deben considerar todos los eventos posibles de los estados de la naturaleza, la omisión de alguno de ellos, implica directamente la exclusión de su consecuencia en la evaluación de las estrategias. b) Un evento toma el carácter de imposible, si el decisor así lo considera. c) Del listado de eventos considerados, necesariamente debe ocurrir uno. d) Los eventos considerados deben reunir la condición de ser mutuamente excluyentes. Sobre la base de estas consideraciones, se formulan las reglas básicas que definen los valores numéricos que representan las ponderaciones que el decisor debe asignar a cada evento aleatorio. Estas reglas básicas son las siguientes: 1. La suma de todas las ponderaciones o probabilidades asignadas al conjunto de eventos debe ser igual a 1. 2. La ponderación o probabilidad asignada a cualquier evento debe ser: 0 p 1. El valor 0 representa el evento imposible y el valor 1, la ocurrencia cierta del evento. 3. Si dos o más eventos mutuamente excluyentes se agrupan en un solo evento compuesto, la ponderación asignada a este evento compuesto, debe ser igual a la suma de los eventos elementales integrantes. Como puede observarse, estas reglas no son otra cosa que los axiomas básicos del cálculo de probabilidad para el caso de un espacio muestral de eventos finitos. El conjunto de ponderaciones o probabilidades asignadas a los eventos según estas reglas, representan ponderaciones subjetivas personales del sujeto de la decisión y recibe el nombre de Distribución Apriori. De esta manera, una misma situación evaluada por distintos sujetos, puede arrojar distintas ponderaciones. Es decir que la ponderación de los eventos, es única o propia de cada decisor. Ejemplo para la aplicación del Criterio Bayesiano de Decisión con Distribución Apriori. Cierto empresario debe decidir sobre el tamaño de una fábrica para producir un nuevo producto. Se puede iniciar la fabricación del producto con un tamaño de planta elaboradora que sea capaz de satisfacer la demanda de los próximos 2 años pero sin posibilidades de expansión. Por otro lado se pronostica que la demanda del producto crecerá en los próximos años y por lo tanto será 7

necesario incrementar la producción de manera importante, razón por la cual deberá construirse una planta más grande de manera que al cabo de 2 años la misma esté terminada. Teniendo en cuenta la situación, las estrategias de acción son: a) Construir una planta grande con capacidad para satisfacer la mayor demanda futura. b) Construir una planta chica para satisfacer la demanda de los próximos 2 años y sin posibilidades de expansión. La construcción de una planta chica cuesta $ 6.000.000 y la de una planta grande, $ 25.000.000. Los beneficios netos condicionales asociados con cada una de estas estrategias, se dan en la siguiente tabla. Estrategias o cursos de acción Estados de la naturaleza E 1 : Demanda alta E 2 : Demanda baja A 1 : Planta grande 36 x 10 6 3 x 10 6 A 2 : Planta chica 18 x 10 6 6 x 10 6 Para un decisor racional esta situación es muy compleja dado que no dispone de mayor información de como serán los futuros niveles de demanda y además involucra un gran riesgo en cuanto a la alternativa de inversión. El decisor luego de consultar, recabar toda la información posible inherente a su problema y analizar la situación, resuelve asignar subjetivamente valores de probabilidad a los posibles estados que guarda la naturaleza. Considera que a la posibilidad de que se presente una demanda alta, estado de la naturaleza E 1, le puede asignar un valor de probabilidad de 0,65. A la posibilidad de que se presente el estado E 2, demanda baja, 0,35. O sea que ha definido una distribución a priori tomando: P (E1) 0,65 y P (E2) 0.35. Con esta distribución apriori, el decisor selecciona aquella estrategia a i que le maximice el beneficio neto esperado o le minimice su pérdida esperada. Los valores de compensación o beneficios netos condicionales para cada estrategia y estado de la naturaleza correspondiente, se indican en el cuerpo de la tabla en millones de pesos. Es decir: Máx. E[f(a i, θ j )], o Mín. E[f(a i, θ j )] como : E[f(a i, θ j )] Σ f(a i, θ j ).P (θj) entonces: j j j Para A 1 : Planta grande: 36.10 6.0,65+ 3.10 6.0,35 $ 24.450.000 Para A 2 : Planta chica : 18.10 6.0,65+ 6.10 6.0,35 $ 13.800.000 Según el criterio Bayesiano de decisión, el empresario debe optar por aquella alternativa que le produce el mayor beneficio neto esperado. Por lo tanto el sujeto de la decisión deberá optar por la estrategia A 1, es decir construir una planta grande. En general, esta sola consideración del mayor beneficio neto esperado, no caracteriza plenamente todas las consecuencias de las situaciones que puedan ser importantes para el decisor. Este criterio también llamado como VME (valor monetario esperado), es muy razonable o adecuado cuando se aplica a eventos que se producen con cierta frecuencia, Sin embargo en situaciones de decisiones únicas, sin antecedentes o inéditas, en los cuales el comportamiento de 8

la ocurrencia de los eventos es totalmente desconocida, éste criterio no resulta conveniente y se debe optar por el criterio de decisión de la Máxima Utilidad Esperada que se mide en términos de probabilidad, como se verá más adelante. Criterio Minimax en la Decisión sin experimentación En este caso, el sujeto de la decisión no conoce cuales son los estados de la naturaleza ni tampoco dispone de experimentación que le brinde información con respecto a los mismos, por lo tanto debe optar por un criterio Minimax. Éste criterio similar al que se aplica en Teoría de Juegos, consiste en elegir el mínimo o menor de los valores máximos de la función de consecuencias f(a i, θ j ). Es decir que para cada estado de la naturaleza θ jk el decisor elige aquella alternativa a i A que genere la máxima f(a i, θ j ) y de dicho conjunto de valores elige el menor valor de consecuencia f(a i, θ j ). Llamamos: a * ij Máx.f(a i, θ j ), a i A con i 1,2,..,m θ jk, de dicho conjunto de valores a * ij se elige el Mín.a * ij. Por ejemplo, sea la siguiente matriz de consecuencias. Alternativas Estados de la naturaleza θ 1 θ 2 θ 3 a 1-100 - 80-50 a 2 70 70 40 a 3 30 20 10 a 4-10 - 20 0 Máx.f(a i, θ 1 ) Máx.{- 100, 70, 30, - 10} 70 Máx.f(a i, θ 2 ) Máx.{- 80, 70, 20, -20} 70 Máx.f(a i, θ 3 ) Máx.{- 50, 40, 10, 0} 40 Entonces el Mín.a * ij 40 Éste es un criterio extremadamente conservador y supone que los estados de la naturaleza responden en contra de los intereses del decisor. Este criterio es común en sujetos que tienen aversión por el riesgo. Decisión con experimentación Es evidente que cuando se debe decidir en un Universo de completa incertidumbre, disponer de información o contar con experimentación relacionada con los posibles estados que guarda la naturaleza contribuye de manera importante a una mejor toma de decisión. Debe tenerse en cuenta también, que la información o experimentación tiene un costo que debe evaluarse comparándolo con los beneficios netos esperados. Supongamos que la variable aleatoria X representa el resultado de la información o experimentación. El sujeto de la decisión dispone de estrategias que lo orientan con relación al uso que debe darle a la información o mejor dicho cómo debe usar la información para una mejor toma de decisión. De manera que cualquier alternativa a i A puede ser considerada como una función de X. Suponemos que dicha función es: 9

a g(y) si y X. Dicho de otra manera, se selecciona la alternativa a si y sólo si y X. Como X es una variable aleatoria, también lo es la función g(y), en consecuencia debemos hablar de valores esperados. Definimos como función de riesgo. R[g(y), θ j ] a aquella función que vincula las alternativas de decisión a i A, mediante g(y) con los posibles estados de la naturaleza θ j θ y el costo de experimentación o información. De manera que: R[g(y), θ j ] E[f(g(y), θ j )] C. Donde el valor esperado está relacionado con la distribución de la variable X, y C, es el costo de la experimentación o información. Como se ve, la función de riesgo incluye el costo de experimentar. En este caso el sujeto de la decisión selecciona aquella alternativa a i A mediante g(y), que minimice la función de riesgo. Para comprender mejor como se evalúa esta función de riesgo cuando hay información, analizamos un ejemplo. Una empresa manufacturera de productos de consumo dispone de infraestructura ociosa que le ocasiona importantes pérdidas por mantenimiento, impuestos, etc. Para eliminar estos costos improductivos, los directivos planean lanzar un nuevo producto de consumo al mercado. Estiman que puede haber regiones del país con distintos niveles de aceptación del nuevo producto y resuelven clasificarlas como: θ 1 : Regiones con posibilidades de alto consumo del nuevo producto. θ 2 : Regiones con posibilidades de consumo medio del nuevo producto. θ 3 : Regiones con posibilidades de consumo bajo a nulo del nuevo producto. Dado que el acondicionamiento de la fábrica para el lanzamiento del nuevo producto representa una importante inversión, los directivos de la empresa analizan los siguientes cursos de acción. a 1 : No hacer nada, es decir no reacondicionar la fábrica para la elaboración del nuevo producto y seguir soportando las pérdidas por el aprovechamiento ineficiente de la infraestructura fabril. a 2 : Hacer la inversión para el reacondicionamiento de las instalaciones y producir el nuevo producto con posibilidades de obtener una aceptable rentabilidad siempre y cuando el producto tenga una buena aceptación. a 3 : Alquilar la infraestructura ociosa para la utilización en otros fines. Los directivos de la empresa no disponen de información conveniente que les permita definir claramente cuales pueden ser las regiones con buena aceptación del nuevo producto, no obstante esta realidad y tomando como referencia antecedentes del lanzamiento de otros productos de similares características, resuelven definir la siguiente distribución apriori. Es decir convienen en asignarle los valores de probabilidad a los estados de la naturaleza definidos anteriormente. Estado de la Naturaleza θ j Probabilidad θ 1 : Regiones con alto consumo 0.30 θ 2 : Regiones con consumo medio 0.50 θ 3 : Regiones con consumo bajo a nulo 0.20 10

Los directivos de la empresa analizan los distintos cursos de acción, los posibles estados de la naturaleza, definen una función de consecuencias y confeccionan la siguiente matriz. Estados Naturales θ j θ 1 : Regiones con posibilidades de alto consumo θ 2 : Regiones con posibilidades de consumo medio θ 3 : Regiones con posibilidades de consumo bajo a nulo Estrategias A i a 1 : No hacer nada Pérdidas de 120.000$ Pérdidas de 80.000$ Pérdidas de 30.000$ a 2 : Invertir en reacondicionar Ganancias de 200.000$ Ganancias de 100.000$ Pérdidas de 20.000$ a 3 : Alquilar las instalaciones Ganancias de 20.000$ Ganancias de 20.000$ Ganancias de 20.000$ No obstante la distribución apriori confeccionada y considerando la importante inversión que representa el acondicionamiento de la fábrica para el lanzamiento del nuevo producto, el directorio analiza la conveniencia de contratar una empresa especializada en mercadotecnia para que le brinde información sobre la potencialidad de la demanda del nuevo producto de manera que garantice el éxito del nuevo producto. La empresa especialista en mercadotecnia informa que hay que realizar una encuesta nacional para conocer dicha información y que realizar dicho trabajo cuesta 80.000$. En conocimiento del presupuesto que presenta la empresa de mercadotecnia y el tiempo que le demandará realizar la encuesta, los directivos de la empresa manufacturera quieren hacer un análisis pre-a posteriori, es decir un análisis previo a disponer de la información de la encuestadora de manera que les permita definir si es preferible actuar de inmediato sobre la base de la distribución apriori para saber el éxito o fracaso del nuevo producto o bien contratar a la empresa de mercadotecnia y actuar después sobre la base de los resultados obtenidos por la encuestadora. Para realizar el análisis pre-a posteriori, la empresa manufacturera ha conseguido información de estudios realizados en otras oportunidades relacionadas con el lanzamiento de nuevos productos cuyos consumos pueden ser comparables. Dicha información está categorizada y refleja la opinión de 1.000 encuestados. Categoría I: Regiones con buen poder adquisitivo que evidencian condiciones favorables para un alto consumo. Categoría II: Regiones con poder adquisitivo medio que hacen prever un consumo regular del producto. Categoría III: Regiones con bajo poder adquisitivo que hacen suponer un bajo consumo del producto. Categoría IV: Regiones sin posibilidades de adquirir el producto. La información obtenida por la empresa, se indica en la siguiente tabla. 11

Estados Naturales Categorías. θ j θ 1 : Regiones con posibilidades de alto consumo θ 2 : Regiones con posibilidades de consumo medio θ 3 : Regiones con posibilidades de consumo bajo a nulo I 250 96 30 II 100 150 60 III 50 33 90 IV 0 21 120 Total 400 300 300 En base a esta información se determinan las frecuencias relativas para cada estado de la naturaleza y categoría: y j θ 1 θ 2 θ 3 I 0.625 0.32 0.10 II 0.250 0.50 0.20 III 0.125 0.11 0.30 IV 0 0.07 0.40 En base a esta información, el directorio de la empresa resuelve implementar la siguiente política de acción. 1) Adoptar la estrategia a 2, si la información es de la categoría I o II. 2) Adoptar la estrategia a 1, si la información es de la categoría IV. 3) Adoptar la estrategia a 3, si la información es de la categoría III. Matemáticamente esta política la podemos expresar como: a 1 si X IV g (x) a 2 si X I o X II a 3 si X III Aceptando que en este caso se dispone de información, distribución pre-a posteriori, con esta distribución y con la distribución a priori, aplicando la Regla de Bayes para probabilidades condicionales, calculamos una nueva distribución de probabilidades llamada a posteriori como: n [ QX θ j ( y) ] Pθ ( j) hθ X y ( j) n la expresión: QX θ j ( y) Pθ ( j) se conoce como j 1 QX θ j ( y) Pθ ( j) j 1 h ( j) distribución marginal. θ X y se define como la probabilidad del evento aleatorio θ condicionado a la ocurrencia del evento X. Para nuestro ejemplo, si ocurre el evento: X I entonces: 12

0.625 0.30 0.1875 (1) 0.625 0.30 + 0.32 0.50 + 0.10 0.20 0.3675 h θ X I 0.32 0.50 (2) 0.3675 h θ X I 0.10 0.20 (3) 0.3675 h θ X I Para X II 0.4354 0.0544 0.25 0.30 0.075 (1) 0.25 0.30 + 0.50 0.50 + 0.20 0.20 0.365 h θ X II 0.50 0.50 (2) 0.365 h θ X II 0.20 0.20 (3) 0.365 h θ X II Para X III 0.6849 0.1096 0.125 0.30 0.0375 (1) 0.125 0.30 + 0.11 0.50 + 0.30 0.20 0.1525 h θ X III 0.11 0.50 (2) 0.1525 h θ X III 0.30 0.20 (3) 0.1525 h θ X III Para X IV 0.3607 0.3934 0.0 0.30 0 (1) 0.0 0.30 + 0.07 0.50 + 0.40 0.20 0.115 h θ X IV 0.07 0.50 (2) 0.115 h θ X IV 0.40 0.20 (3) 0.115 h θ X IV 0.3043 0.6957 0 0.5102 0.2055 Con estos valores construimos la matriz de probabilidades a posteriori. 0.2459 y θ j θ 1 θ 2 θ 3 I 0.5102 0.4354 0.0544 II 0.2055 0.6849 0.1096 III 0.2459 0.3607 0.3934 IV 0 0.3043 0.6957 13

Con esta distribución de probabilidades y aplicando el criterio de Bayes a cada uno de los estados de la naturaleza definidos a partir de los resultados de la información X, seleccionamos aquella alternativa a i A que minimiza la función de riesgo. Para X I E[f(a 1,θ j )] -C -120.000*0.5102-80.000*0.4354-30.000*0.0544-80.000-177.688 Máx E[f(a 2,θ j )] -C -200.000*0.5102 +100.000*0.4354-20.000*0.0544-80.000 64.492 a i A E[f(a 2,θ j )] -C 20.000*0.5102 +20.000*0.4354 +20.000*0.0544-80.000-60.000 De manera que si la información o experimentación arroja resultados de la categoría I, entonces la mejor opción es adoptar la estrategia a 2, o sea, invertir en el reacondicionamiento de la fábrica. Para X II E[f(a 1,θ j )] -C -120.000*0.2055-80.000*0.6849-30.000*0.1096-80.000-162.740 Máx E[f(a 2,θ j )] -C -200.000*0.2055 +100.000*0.6849-20.000*0.1096-80.000 27.398 a i A E[f(a 2,θ j )] -C 20.000*0.2055 +20.000*0.6849 +20.000*0.1096-80.000-60.000 También en este caso, si la información o experimentación es de la categoría II, la mejor opción es la estrategia a 2, invertir en el reacondicionamiento de la fábrica. Para X III E[f(a 1,θ j )] -C -120.000*0.2459-80.000*0.3607-30.000*0.3934-80.000-150.166 Máx E[f(a 2,θ j )] -C -200.000*0.2459 +100.000*0.3607-20.000*0.3934-80.000-2.618 a i A E[f(a 2,θ j )] -C 20.000*0.2459 +20.000*0.3607 +20.000*0.3934-80.000-60.000 Nuevamente en este caso, si la información o experimentación es de la categoría III, la mejor opción es la estrategia a 2, invertir en el reacondicionamiento de la fábrica. Para X IV E[f(a 1,θ j )] -C -120.000*0-80.000*0.3043-30.000*0.6957-80.000-125.215 Máx E[f(a 2,θ j )] -C -200.000*0 +100.000*0.3043-20.000*0.6957-80.000-63.484 a i A E[f(a 2,θ j )] -C 20.000*0 +20.000*0.3043 +20.000*0.6957-80.000-60.000 En este caso si la información o experimentación arroja resultados de la categoría IV, la mejor alternativa es la estrategia a 3, es decir, alquilar las instalaciones. Si no hubiera información, la función de riesgo se debe evaluar utilizando la distribución a priori. O sea: Opt. R[g(y), θ j ] E[f(a i, θ j )] C. También en este caso, utilizando la distribución a priori, la mejor estrategia es a 2. E[f(a 1,θ j )] - C -120.000*0.30-80.000*0.50-30.000*0.20-80.000-162.000 Opt. E[f(a 2,θ j )] - C -200.000*0.30 +100.000*0.50-20.000*0.20-80.000 26.000 Ef(a 2,θ j )] - C 20.000*0.30 +20.000*0.50 +20.000*0.20-80.000-60.000 14

Costo de la Información Perfecta Si bien es cierto que la experimentación (distribución a posteriori) contribuye a una mejor toma de decisión, también es cierto que la misma tiene un costo que en muchos casos puede ser prohibitiva disponer de dicha información, entonces cabe la pregunta, hasta que punto es conveniente pagar el costo de la información. El criterio de Bayes establece que si sólo se dispone de una distribución a priori, el beneficio o perjuicio de una decisión está dada por. E(I) ΣOpt. f(a i, θ j ).P(θj) donde la palabra óptimo significa maximizar o minimizar según se j a i trate de ganancias o pérdidas respectivamente. Si se conoce la información perfecta, es decir si se conoce cuál será el estado de la naturaleza θ j, en la expresión anterior solamente se deberá elegir aquella alternativa a i A que optimice la función de consecuencias f(a i, θ j ), para un determinado θ jk. Si no se conocen los estados de la naturaleza, el valor de la función de consecuencias estará dada por la esperanza matemática de dicha función: Opt.E[f(a i, θ j )], con igual criterio anterior, óptimo significa maximizar ganancias o minimizar pérdidas. En consecuencia el Costo de la Información Perfecta estará dada por la diferencia de ambos valores. Es decir: C ΣOpt. f(a i, θ j ).P(θj) - Opt.E[f(a i, θ j )] o bien: C E(I) - Opt.E[f(a i, θ j )]. j a i De manera que si el costo de la información o experimentación C, es menor o igual que C, entonces se debe llevar a cabo la experimentación o bien abonar el precio de la información, en caso contrario no. Consideremos un ejemplo: un ingeniero inventa un dispositivo nuevo y lo patenta. Un determinado banco está dispuesto a facilitarle dinero para que él mismo pueda fabricarlo y vender el producto. De acuerdo a la investigación del mercado se estima que los próximos 5 años serán un buen período para la comparación de los beneficios que redituará el invento. De acuerdo con su análisis y en el evento de que las ventas sean altas, el inventor prevé un beneficio de 12 millones de pesos durante los próximos 5 años; si las ventas son regulares, espera ganar 3 millones de pesos y si las ventas son bajas, espera perder 750.000 pesos. Una gran empresa le ofrece comprarle los derechos de patente. Basado en el trato que le ofrecen, el ingeniero estima que si vende los derechos de patente y las ventas son altas, puede obtener un beneficio de 6 millones de pesos; si las ventas son regulares espera ganar 1 millón de pesos y si las ventas son bajas, espera ganar solamente 150 mil pesos. En base a toda la información recolectada, investigaciones, consulta con expertos, etc., el ingeniero asigna los siguientes valores subjetivos de probabilidad a los distintos estados de la naturaleza. E 1 -Ventas altas: P(E 1 ) 0.20 ; E 2 -Ventas regulares: P(E 2 ) 0,50 y E 3 -Ventas bajas: P(E 3 ) 0,30 Con la información anterior se construye la siguiente matriz de decisiones: 15

Estrategias Estados de la naturaleza E 1 E 2 E 3 A 1 : Manufacturar él mismo 12.10 6 3.10 6-750.000 A 2 : Vender los derechos de patente 6.10 6 10 6 150.000 En este caso el cálculo del beneficio esperado o ganancia esperada, con ayuda de la información perfecta se hace suponiendo que el decisor tiene acceso a un pronosticador perfecto que le brinda tal información o predice con exactitud de cuál será el estado de la naturaleza que ocurrirá en particular. O sea que, si el pronosticador dice que ocurrirá el evento E 1, entonces el sujeto de la decisión escogerá la alternativa A 1, si el pronosticador dice que ocurrirá el evento E 2, el sujeto de la decisión optará también por la alternativa A 1, si el pronosticador dice que ocurrirá el evento E 3, entonces el decisor optará por la alternativa A 2. Es decir, que el decisor escoge la alternativa más conveniente, a partir de la información que le brinda el pronosticador perfecto avisándole cuál será el estado de la naturaleza que se producirá. En este caso, desde el punto de vista de la teoría probabilística, los valores de probabilidad o ponderaciones asignadas a los eventos por el sujeto de la decisión, a partir de la aseveración del informador perfecto de cuáles serán los estados de la naturaleza que se presentarán, toman el carácter de frecuencias relativas y la ganancia esperada con información perfecta está dado por: E(I) ΣOpt. f(a i, θ j ).P(θj) Evento pronosticado Ganancias condicionales Probabilidades Ganancias esperadas E 1 : ventas altas $ 12.000.000 0.20 $ 2.400.000 E 2 : ventas medias $ 3.000.000 0.50 $ 1.500.000 E 3 : ventas bajas $ 150.000 0.30 $ 45.000 Totales $ 3.945.000 Este valor de $ 3.945.000, también llamado como Valor Esperado con Información Perfecta (VEIP), se puede interpretar como un beneficio promedio, a partir del carácter de frecuencias relativas que toman los valores de probabilidad asignados subjetivamente a los eventos o estados de la naturaleza. Las ganancias esperadas a partir de la distribución a priori, o bien los valores medios esperados (VME) para cada alternativa están dadas por: E[f(a i, θ j )] Para A 1 : VME A1 $ 12.000.000.(0.2) + $ 3.000.000.(0.5) - $ 750.000.(0.3) $ 3.675.000 Para A 2 : VME A2 $ 6.000.000.(0.2) + $ 1.000.000.(0.5) + $ 150.000.(0.3) $ 1.745.000 De manera que las ganancias esperadas para cada alternativa son: 16

Estrategias Ganancias esperadas A 1 $ 3.675.000 A 2 $ 1.745.00 Es decir que en condiciones de incertidumbre, la mejor alternativa para el decisor es la alternativa A 1, que le produce un beneficio esperado de $ 3.675.000. De manera que el precio o costo de la información perfecta será, la diferencia entre : VEIP VME. Es decir: C ΣOpt. f(a i, θ j ).P(θj) - Opt.E[f(a i, θ j )] 3.945.000 3.675.000 270.000 $, sería lo máximo que se debe abonar para recibir o por la adquisición de la información perfecta. Teoría de Utilidad de Von Neuman. La Función de Utilidad. La función de consecuencias, f(a i, θ j ) con a i A, y θ j θ, no necesariamente debe tener carácter monetario, sino que puede representar cualquier otro evento que resulte de interés para el decisor. Cuando las decisiones deben tomarse en un universo de completa incertidumbre, la Teoría de la Utilidad proporciona un modelo matemático que guía el comportamiento de un decisor racional. Esta teoría establece lo siguiente: Si el decisor actúa con el propósito de satisfacer una serie de supuestos razonables que son los axiomas del comportamiento racional, existe una función de utilidad del decisor que elige como estrategia más apropiada a la que maximice la utilidad esperada. De manera que, para cualquier decisor racional, existe una función de utilidad que permite maximizar la utilidad esperada a partir de la selección de la alternativa asociada a su preferencia. Con el fin de introducir el concepto de la Función de Utilidad, utilizamos un juego de azar llamado Lotería. Un juego de lotería puede ser de una etapa o de n etapas.(n > 1). Una lotería de una etapa es un experimento aleatorio que tiene un conjunto de resultados posibles que lo definimos como: E {e 1, e 2, e 3,..,e j,..,e m }, de manera que cada evento e j, con j 1, 2,.. m, tiene un valor de probabilidad asociado tal que: P( ) 1, con, 0 P ( e ) 1, j 1, 2,... m. Matemáticamente, una lotería se expresa como: L {(e 1,p 1 ) ; (e 2,p 2 ) ; (e 3,p 3 ) ;... ; (e m,p m )}. O sea, un conjunto de pares ordenados donde cada par está formado por un suceso específico, premio o castigo e j, y un valor de probabilidad p j, asociado a ese suceso. Una lotería de una etapa podría ser por ejemplo que un sujeto apueste a un número en una ruleta. Si la ruleta se detiene en el número seleccionado, el sujeto recibe un premio o gana una determinada cantidad de dinero si la apuesta fue monetaria, en cambio si la ruleta no se detiene en el número seleccionado, el jugador recibe un castigo que consiste en la pérdida del dinero apostado. Pero reiteramos, los premios o castigos no necesariamente deben ser monetarios, podría tratarse de un interés particular del jugador. m j 1 e j j 17

Una lotería puede representarse gráficamente mediante un diagrama arbóreo como el siguiente. p 1... e 1 p 2... e 2 L p 3... e 3... p j... e j... p m... e m Tenemos m ramas (e 1, e 2,..., e j,..., e m ), que emanan de un nodo común L. Hay una rama para cada premio e j que se ha consignado en el extremo, y un valor de probabilidad p j para cada rama. 0,3... e 1 (un televisor) Por ejemplo: L 0,4... e 2 (1.500$) 0,3... e 3 (un viaje) Como se observa, al premio e 1 que está representado por un televisor, se le asigna una probabilidad de 0.30, al segundo premio e 2, una probabilidad de 0.40, y así sucesivamente. Es decir que en términos de conjunto de pares ordenados, a este ejemplo de lotería lo podemos expresar como: L {(e 1,0.30) ; (e 2,0.40) ; (e 3,0.30)}. Con buen criterio podemos considerar a una lotería de una etapa, como un problema de decisiones en el que la naturaleza establece cual será el resultado del juego, es decir, en que número debe detenerse la ruleta, o bien cual es el premio que debe salir. En cada caso hay m cursos de acción o estados que guarda la naturaleza, en el primer caso, m, representa la totalidad de los números en que la bola puede parar cuando la ruleta se detenga, y en el segundo caso, m, representa el conjunto de premios de los cuales uno debe salir cuando se realice el sorteo. Una lotería de 2 etapas es un experimento aleatorio doble que lo podemos describir de la siguiente manera. Supongamos que un jugador adquiere un boleto para participar de un sorteo de k números, los k números representan un conjunto de nuevos juegos con premios de distintas categorías, por ejemplo si el jugador obtiene el número 1, participa en un sorteo o lotería de una etapa cuyos premios son artículos de vestir, si obtiene el número 2 participa en otra lotería de una etapa cuyos premios son electrodomésticos, así sucesivamente. Es decir que si el jugador ha obtenido el número i, con probabilidad q i, dicho número le permite acceder al segundo experimento aleatorio que consiste en una lotería de una etapa L i recibiendo en consecuencia uno de los premios de dicha lotería. El primer experimento tiene un conjunto de eventos o resultados: {1, 2, 3,..., k} a los cuales hay asociados un valor de probabilidad: q i con i 1, 2, 3,..., k tal que 1 con 0 q i 1 i 1, 2, 3,..., k. 18 k q i i 1

En honor a la simplificación y generalización del concepto, asumamos hipotéticamente, que el conjunto de premios posibles es el mismo independientemente de cuál sea la lotería de una sola etapa en la que el jugador juegue por último, a dicho conjunto lo representamos por:(e 1,e 2,.., e m ) de manera que la última lotería de una etapa queda representada como: L i {(e 1,p i1 ) ; (e 2,p i2 ) ; (e 3,p i3 ) ;... ; (e t,p it ) ;... ; (e m,p im )}, i 1, 2, 3,..., k. Donde p it, es la probabilidad de ocurrencia del suceso: e t con t 1, 2, 3,..., m, de la lotería m p it t 1 L i con i 1, 2, 3,..., k, tal que 1, i 1, 2,..., k y 0 p it 1, con t 1, 2,..., m. Matemáticamente, una lotería de 2 etapas la podemos representar como: L {(L 1,q 1 ) ; (L 2,q 2 ) ; (L 3,q 3 ) ;... ; (L k,q k )}, o más explícitamente como: L {[(e 1,p 11 ),(e 2,p 12 ),(e 3,p 13 ),..., (e m,p 1m ), q 1 ] ; [(e 1,p 21 ),(e 2,p 22 ),(e 3 p 23 ),..., (e m,p 2m ), q 2 ] ;... ; [(e 1,p k1 ),(e 2,p k2 ),(e 3,p k3 ),..., (e m,p km ), q k ]}. Con idéntico criterio, se pueden definir loterías de 3 etapas como una lotería de una etapa en la que los sucesos o premios son loterías de dos etapas, y así sucesivamente, hasta definir loterías de n etapas como una lotería de una etapa en la que los sucesos o premios son loterías de n-1 etapas. De esta manera, a una lotería doble la podemos expresar como una lotería simple en la cual los sucesos o eventos son loterías simples. Su representación gráfica es: q 1 e 1 p 11 L 1 p 12 e 2... p 1m e m q i L L i... q k p k1 e 1 L k p k2 e 2... p km e m Definición de la Función de Utilidad. Sea un conjunto de sucesos aleatorios: E {e 1, e 2, e 3,..., e m }, asociados a una lotería de una etapa. El decisor tiene capacidad para ordenar dicho conjunto según un orden de preferencias. Supongamos que para el decisor, e 1 es el más favorable o preferido y e m el menos favorable o preferido. Consideremos además, que para cada evento o suceso e j, con j 2, 3,...,m-1, existe una lotería de una etapa con 2 premios e 1 y e m, que se define como: 19

L* {(e 1,μ) ; (e m, 1-μ)}, con 0 μ 1, siendo μ la probabilidad de recibir el premio o castigo e 1 y el complemento, 1-μ, la probabilidad de recibir el premio o castigo e m. En esta situación le preguntamos al decisor para que valor de probabilidad μ le resulta indiferente entre recibir el premio e j con j 2, 3,..., m-1 con certeza, o jugar a la lotería L* cuyos premios son e 1 y e m con probabilidades μ y 1-μ respectivamente. Un decisor racional tiene capacidad para explicitar ese valor μ j para todo j 2, 3,..., m-1 y 0 μ j 1. De esta manera, el decisor racional ha definido una función de utilidad: μ j f(e j ), cuyo dominio es el conjunto: E {e 1, e 2, e 3,..., e m }. El número μ j recibe el nombre de utilidad del suceso e j o también índices de utilidad para los premios e j. La función de utilidad no es única, cada decisor racional será capaz de definir su propia función de utilidad, más aún, un mismo decisor racional podrá cambiar su función de utilidad en el tiempo, conforme cambien sus preferencias en relación a las condiciones del problema. La función de utilidad μ j f(e j ), define una variable aleatoria μ que representa la utilidad de la lotería. Sintetizando, se puede decir que la utilidad se define como la actitud de un decisor racional ante la posibilidad de ganar o perder algo en situación de decidir en un universo de completa incertidumbre. Otra definición, no relacionada con la definición clásica de Von Neuman y Morgenstern es la siguiente: La función de utilidad de un decisor es una variable aleatoria que mide su actitud ante el riesgo, esta variable aleatoria es una función cuyo dominio es el espacio de eventos aleatorios {e 1, e 2, e 3,..., e m } y su recorrido es el conjunto de números reales del intervalo [0,1] Basado en la teoría de utilidad y en el concepto de lotería, se enuncian 6 axiomas que rigen el comportamiento lógico de un decisor racional. 1. Axioma de la preferencia y transitividad. Dados dos eventos e i y e j, con i j e i,j 1, 2,.., m. sólo puede ocurrir uno y sólo uno de los siguientes eventos mutuamente excluyentes: e i > e j, o sea que e i es preferible a e j. e j > e i, o sea que e j es preferible a e i. e i ~ e j, o sea que la ocurrencia de e i es indiferente a la ocurrencia de e j. si: e i > e j, y e j > e k, e i > e k. 2. Axioma de independencia. Si p 1 es la probabilidad de L lotería de una sola etapa, p 2 la probabilidad de L lotería de dos etapas y p 1 p 2, a un decisor racional le es indiferente L a L ya que lo que importa es el valor de probabilidad y no la naturaleza del experimento. 3. Axioma de continuidad. Dado un evento e j que pertenece a E, diferente de e 1 el más preferido y e m el menos preferido, para un decisor racional le es indiferente que ocurra con certeza el evento e j o bien jugar a una lotería que tiene solamente dos premios, e 1 el más preferido y e m el menos preferido. Esta lotería de dos premios se expresa como: L (ej) {(μ j,e 1 ), (1-μ j,e m )}. Por ejemplo consideremos los siguientes sucesos: a- Ganar $ 1.000 con probabilidad p y perder $ 500 con probabilidad (1-p). b- La certeza de ganar $ 0. A un decisor racional le es indiferente el suceso a o el b. 20

4. Sea L {(e 1,p 1 ) ; (e 2,p 2 ) ; (e 3,p 3 ) ;...; (e m,p m )} lotería de una etapa y L {(L 1,p 1 ) ; (L 2,p 2 ) ; (L 3,p 3 ) ;... ; (L k,p k )}, una lotería de dos etapas donde la probabilidad de obtener e j es la misma que la de obtener L j, j 1, 2,..., m. A un decisor racional le es indiferente L o L. 5. Dados dos loterías, L y L* de n y k etapas respectivamente, con n 1 y k 1, prevalece uno y sólo uno de los tres estados mutuamente excluyentes: L > L*. L* > L. L ~ L* o sea que la ocurrencia de L es indiferente a la ocurrencia de L*. si: L > L*, y L* > L, L > L. 6. Sean las loterías L a y L b, ambas con dos premios o castigos e 1 y e m, siendo e 1 el evento de mayor preferencia y e m el de menor preferencia, p a el valor de probabilidad asociada al evento e 1 en la lotería L a y p b el valor de probabilidad asociada al evento e 1 en la lotería L b, para un decisor racional se cumple: L a > L b si p a > p b. L b > L a si p b > p a. L a ~ L b si p a p b. Una persona que toma decisiones racionales será aquella cuyo proceso lógico, para la toma de decisiones, cumpla con estos axiomas. Aplicación del Criterio de la Máxima Utilidad Esperada-Construcción de la Función de Utilidad. Un empresario tiene la posibilidad de firmar uno de 2 contratos de trabajo. Debido a sus limitaciones operativas, sólo puede ejecutar uno. Como existe cierto grado de incertidumbre acerca de los resultados finales o consecuencias de cualquiera de los 2 contratos, resuelve asignarle un valor de probabilidades a cada evento. La siguiente tabla, muestra las consecuencias, pérdidas o ganancias, y sus respectivas probabilidades. Contrato A Contrato B Beneficio Probabil. Beneficio Probabil. $ 50.000 0.70 $ 40.000 0.60 $ 10.000 0.10 $ 30.000 0.20 $ - 20.000 0.20 $ - 10.000 0.20 Cada contrato puede considerarse como una lotería de una sola etapa, en la cual los beneficios serían los premios con sus respectivas probabilidades. De manera que el problema, que el decisor debe resolver, podría considerarse como un problema de jugar a una de las dos loterías o no jugar a ninguna de ellas en cuyo caso el beneficio sería de 0 pesos. Dado que el sujeto de la decisión tiene capacidad para establecer un orden de preferencias, organiza los premios (beneficios) de la siguiente manera. E { 50.000, 40.000, 30.000, 10.000, 0, -10.000, - 20.000} Identifiquemos con e 1 50.000$ el evento más favorable o beneficioso, con e 7-20.000$ el menos favorable o beneficioso. Con estos datos queremos determinar un conjunto de índices de utilidad para el cual μ (e1) 1 premio más favorable y μ (e7) 0 premio menos favorable. Esta lotería queda explicitada como: L {(e 1, μ), (e 7, 1-μ)}, con 0 μ 1. Donde e 1 y e 7, son los sucesos más, y menos favorables respectivamente, del conjunto E. 21

Ahora para el subconjunto de premios e j, con j 2,3,4,5,6, o sea: E { 40.000, 30.000, 10.000, 0, -10.000 }, se le pregunta al decisor para que valor de μ en L con 0 μ 1, le resulta indiferente entre recibir el premio de 40.000$ con certeza o bien jugar a la lotería L. Dicho de otra manera, cuál es el valor de μ que hace que las dos ramas del árbol de decisión siguiente le resulte indiferente al decisor. 1,0 40.000$ L μ 50.000$ 1-μ -20.000$ El valor de μ que define el sujeto de la decisión viene a ser el índice de utilidad o valor de probabilidad para el premio de 40.000$. El sujeto de la decisión reflexiona detenidamente y determina que tal valor de μ es 0.95. De manera que se puede escribir como μ (40.000) 0.95. Se le hace la misma pregunta para los premios o sucesos e j restantes con j 3, 4, 5, 6 y se definen los siguientes índices de utilidad, μ (30.000) 0.80 ; μ (10.000) 0.50 ; μ (0) 0.30 ; μ (-10.000) 0.20. De esta manera se ha definido una función de utilidad que se representa en la siguiente tabla. e j 50.000 40.000 30.000 10.000 0-10.000-20.000 μ (ej) 1.0 0.95 0.80 0.50 0.30 0.20 0 a) Para la estrategia contrato A, la máxima utilidad esperada medida en términos de probabilidad es: E (A) 1.(0.70) + 0.50.(0.10) + 0.(0.20) 0.75. b) Para la estrategia contrato B, la máxima utilidad es: E (B) 0.95.(0.60) + 0.80.(0.20) + 0.20.(0.20) 0.77. c) Para la estrategia no firmar ningún contrato, la máxima utilidad esperada es: E (0) 1.(0.30) 0.30. De acuerdo con el criterio de la Máxima Utilidad Esperada, entonces el empresario debe firmar el contrato B. Este criterio no necesariamente debe coincidir con el criterio del Valor Monetario Esperado que se calcula aplicando el principio de la teoría Bayesiana de decisión. Se analiza este aspecto calculando el VME para cada una de las estrategias. a) para el contrato A tenemos: 50.000*0.7 + 10.000*0.1 20.000*0.2 $ 32.000 b) para el contrato B tenemos: 40.000*0.6 + 30.000*0.2 10.000*0.2 $ 28.000. Como puede observarse, aplicando el criterio VME convendría firmar el contrato A y no el contrato B que surge del criterio de la Máxima Utilidad Esperada. Esta aparente incongruencia podría explicarse teniendo en cuenta el perfil de la función de utilidad, dicha función refleja la actitud de un sujeto que tiene aversión al riesgo, en consecuencia en el contrato B la máxima 22

pérdida es menor que en el contrato A, por lo tanto el decisor ha aceptado una ganancia esperada menor para evitar el riesgo de una mayor pérdida. De esta comparación surge de manera evidente que el perfil de la función de utilidad está en directa relación con la actitud de riesgo del sujeto de la decisión. Es decir de la aversión, indiferencia o propensión al riesgo que pueda tener el decisor. Gráficamente la función de utilidad queda: Índice de utilidad 1 0,8 0,6 0,4 0,2 0-20 -10 0 10 20 30 40 50 Beneficios En el eje de las abscisas se expresan los beneficios en miles de pesos y en ordenadas los índices de utilidad o valores de probabilidad asignado a cada evento. Las curvas de la página siguiente, muestran las características de la actitud de un decisor frente al riesgo. La curva A representa la actitud de un decisor que tiene aversión al riesgo. Esto se comprende tomando como referencia la línea vertical punteada. Puede observarse que si nos desplazamos hacia la derecha de dicha línea sobre un eje horizontal, el índice de utilidad del decisor aumenta en menos de lo que lo disminuye un desplazamiento equivalente hacia la izquierda de dicha línea. Es decir que el índice de utilidad que se asigna a un incremento del beneficio, es menor que el índice que le asigna a igual decrecimiento. También se puede decir que si la concavidad de la función de utilidad es hacia abajo o negativa, la actitud del decisor es de aversión al riesgo. Se puede decir también, que este es un caso en que el sujeto de la decisión actúa con cautela. Siguiendo igual razonamiento, se puede analizar la curva B que representa la actitud de un decisor que es indiferente ante el riesgo. En este caso, la variación del índice de utilidad es igual, ya sea para un incremento como para un decrecimiento, razón por la cual la función de utilidad es una función lineal que une el punto de coordenadas (e 1,p 1 ) con el punto (e m,p m ), a 45º si las escalas de los ejes son iguales. La curva C representa la actitud de un decisor que tiene propensión al riesgo, de manera que su comportamiento es contrario en relación a lo analizado para la curva A. Es decir que si nos desplazamos hacia la derecha de la línea punteada vertical sobre un eje horizontal, el índice de utilidad crece de manera importante en relación al crecimiento de igual desplazamiento hacia la izquierda de dicha línea. De manera que la concavidad positiva de la función de utilidad, refleja la actitud del decisor con propensión al riesgo. Cualquiera sea el caso, el grado de concavidad refleja la mayor o menor, aversión o propensión al riesgo. Hay funciones teóricas que sirven de modelos para expresar estas curvas. Se aclara que la función de utilidad no pretende representar exclusivamente los beneficios netos condicionales de un decisor, sino que representa la integración de un conjunto de elementos que el decisor debe tener en cuenta en la toma de decisión. Es decir que la actitud del decisor tiene una íntima relación con el contexto de solvencia económica o condiciones empresariales en que 23

le toque tomar una decisión. Algunos de los elementos que se tienen en cuenta para la construcción de la función de utilidad son: a) Beneficios o pérdidas potenciales en el problema sobre el cual se debe decidir. b) Patrimonio financiero del decisor y las posibilidades de su evolución, en un sentido u otro, a corto plazo. c) La actitud intrínseca o personal del decisor en cuanto a su preferencia o aversión al riesgo. d) Celo por el cuidado del prestigio del decisor o empresa de la cual es responsable. e) Cambios imprevistos en el estado financiero o patrimonial del decisor, que pueden influir en su actitud frente al riesgo. Etcétera. Utilidad A B C Evento Criterios para la toma de decisiones en un universo de completa incertidumbre. Criterio del Pesimismo o de Wald en la toma de decisiones. Éste criterio pretende limitar las consecuencias desfavorables de una decisión. Por ello considera que el sujeto de la decisión que debe elegir una alternativa a i A, lo debe hacer suponiendo que la presentación de los estados de la naturaleza está manejados por sujetos que pretenden provocar el mayor perjuicio posible, de manera que la compensación frente a una decisión a i A sea la menor posible. En consecuencia, Wald sugiere una selección lo mejor de lo peor, como una manera razonable de protegerse. O sea que Wald propone elegir el curso de acción que reditúe el máximo de las consecuencias mínimas. De acuerdo con éste criterio, frente a cada decisión, se debe determinar la compensación más desfavorable y considerar a la misma como una función de decisión. O sea: f (a) mín.c(a i, θ j ), θ j θ Una vez que se ha definido que es lo peor que le puede ocurrir al sujeto de la decisión, se trata de elegir un valor de a i A, de manera que mejore lo máximo posible esa situación. máx. f (a) máx. mín.c(a i, θ j ) a i A a i A θ j θ Estos procesos se conocen como: Maximin maximizar los mínimos beneficios o Minimax minimizar los máximos riesgos o perjuicios. 24

De esta manera, el criterio de Wald procura cubrirnos de las situaciones desfavorables asegurándonos que la compensación no será inferior a: máx. mín.c(a i, θ j ) a i A θ j θ Supongamos que el decisor se enfrenta ante la siguiente situación que se refleja en al siguiente matriz de consecuencias. Cursos de Acción Estados de la Naturaleza E 1 E 2 E 3 E 4 A 1 100 60 20 10 A 2 60 100 30 40 A 3 20 40 80 50 Siguiendo el criterio de Wald, construimos una tabla consignando los peores eventos para cada estrategia. Estrategia Resultado mínimo A 1 10 A 2 30 A 3 20 De manera que el decisor debe escoger la estrategia A 2 que le reditúa un beneficio maximin, de 30. Criterio del Coeficiente de Optimismo Relativo o de Hurwicz en la toma de decisión. Contrariamente al criterio de Wald, de pesimismo total, Hurwicz sostiene que cada sujeto tiene un cierto nivel de optimismo y que sólo excepcionalmente puede adoptar el carácter de optimismo absoluto o pesimismo total. Un individuo con optimismo absoluto, frente a cada posible decisión, pensaría lo mejor que le puede ocurrir y tomaría dichos valores para la determinación de su decisión. Es decir que tomaría como función de decisión: M (a) máx. c(a i, θ j ) θ j θ En cambio que un individuo totalmente pesimista pensaría en lo peor que le puede ocurrir frente a cada una de las decisiones posibles y consideraría como función de decisión:m (a) mín.c(a i,θ j ) θ j θ Frente a estas situaciones extremas, Hurwicz sostiene que el optimismo puede medirse mediante un cierto coeficiente α de manera que 0 α 1. O sea que si: α 0 estaríamos ante un caso de pesimismo total y si α 1, estaríamos ante un caso de optimismo absoluto. De manera que podremos decir que si α mide el optimismo, su complemento (1 - α), mide el pesimismo. Planteado de esta manera el problema, es racional tomar como función de decisión, la media ponderada de los resultados que se obtienen cuando hay total optimismo y total pesimismo, siendo los factores de ponderación, precisamente los factores que miden el optimismo y el pesimismo, o sea: [α, (1 - α)]. De manera que en éste criterio la función de decisión toma la forma de: 25

f (a) α.máx. c(a i, θ j ) + (1 - α).mín. c(a i, θ j ) o lo que es lo mismo: f (a) α.m (a) + (1 - α).m (a) θ j θ θ j θ Si A y θ son conjuntos finitos, se construye la matriz c ij y se elige de cada fila de la misma, que corresponde a las compensaciones de cada decisión a i, el mayor elemento M i y el menor elemento m i y se calcula el promedio ponderado como: f (a) α.m (a) + (1 - α).m (a) De todos los promedios ponderados calculados para cada fila, se toma el mayor y será el que corresponda a la decisión que debe ser tomada. Para una mejor ilustración, apliquemos este criterio al ejemplo presentado precedentemente, suponiendo que en este caso el decisor adopta un índice de optimismo relativo: α 0.30 Estrategia Beneficio Mínimo Beneficio Máximo Ponderaciones: f (a) αm (a) + (1-α)m (a) A 1 10 100 0.3*100 + 0.7*10 37 A 2 30 100 0.3*100 + 0.7*30 51 A 3 20 80 0.3*80 + 0.7*20 38 Por lo tanto el decisor debe optar por la estrategia A 2 que le brinda el mayor coeficiente de optimismo relativo o de Hurwicz. Las observaciones que se le pueden hacer a éste criterio son: 1) Toma solamente los valores extremos de α para calcular las compensaciones sin tener en cuenta los valores intermedios. 2) La dificultad que representa poder evaluar correctamente el valor de α que mide el grado de optimismo, en razón de ser un valor que surge de una decisión eminentemente subjetiva. Criterio de Laplace Laplace sostiene que si no se conoce la distribución de probabilidades de los estados de la naturaleza, se puede suponer que todos tienen la misma probabilidad. Con este criterio, sugiere calcular los valores monetarios esperados de cada estrategia y adoptar como decisión, aquella que produzca el mayor beneficio. Aplicando el criterio de Laplace, resolvemos el ejemplo anterior asumiendo que las probabilidades iguales que guardan los estados de la naturaleza es de 0.25. Para A 1 : 100*0.25 + 60*0.25 + 20*0.25 + 10*0.25 47,5 Para A 2 : 60*0.25 + 100*0.25 + 30*0.25 + 40*0.25 57,5 Para A 3 : 20*0.25 + 40*0.25 + 80*0.25 + 50*0.25 47,5 Por lo tanto el decisor debe escoger la estrategia A 2 que le reporta un valor monetario esperado de 57,5. 26

Criterio de la Mínima Aflicción o de Savage en la toma de decisión. Savage cuestiona y pone en duda de que la compensación c(a i, θ j ), mida adecuadamente el grado de satisfacción que le produce a un individuo al haber tomado la decisión a i A, cuando se presenta un estado de la naturaleza θ j θ. Sostiene que si se toma una cierta decisión a 0 A y luego se presenta un cierto estado de la naturaleza θ 0 θ, el sujeto compara la compensación obtenida c(a 0, θ 0 ) con la decisión más conveniente que hubiera tomado habiendo conocido previamente el estado de la naturaleza. La pérdida de ganancia con respecto a la decisión más conveniente, el individuo debe evaluarla como pérdida producida por haberse equivocado en la decisión. De manera que si a 1, hubiera sido la decisión más conveniente para el estado de la naturaleza θ 0, tendríamos: c(a 1, θ 0 ) máx. c(a 1, θ 0 ), en consecuencia a i A : c(a 1, θ 0 ) c(a 0, θ 0 ). a i A Si el sujeto tomó la decisión a 0 A y se presenta el estado de la naturaleza θ 0, recibirá una compensación c(a 0, θ 0 ), pero como a 0 no es la más conveniente sino a 1, sentirá que ha dejado de ganar la cantidad : c(a 1, θ 0 ) - c(a 0, θ 0 ) por haber tomado la decisión a 0 en vez de a 1. Esta pérdida, por no haber elegido la decisión más conveniente, produce una aflicción o pesadumbre que puede medirse o expresarse mediante una función: r(a i, θ j ) máx. c(a i, θ 0 ) - c(a 0, θ 0 ) que mide lo que el sujeto pierde de ganar. a i A Esta función recibe el nombre de Función de Aflicción o de Pesadumbre. Una vez obtenida la función: r(a i, θ j ), Savage aconseja aplicar el criterio de Wald. En la aplicación de éste criterio debe tenerse en cuenta que r(a i, θ j ) representa lo peor que puede ocurrir frente a cada decisión a i A, en consecuencia se debe tomar el mayor valor de dicha función y por lo tanto la función de decisión será: f (a) máx. r(a i, θ j ), la que debe ser minimizada. θ j θ En consecuencia la decisión óptima estará dada por: mín. f (a) mín. máx. r(a i, θ j ) a i A a i A θ j θ De manera que el criterio de Savage, no sólo consiste en definir la función de aflicción o pesadumbre r(a i, θ j ), sino también en aplicar el criterio de Wald. De la misma manera que aplicamos el criterio de Wald, una vez definida la función r(a i, θ j ), podríamos aplicar algún otro criterio de decisión con las adaptaciones que correspondan. Si A y θ son conjuntos finitos será posible construir la matriz de las compensaciones C [c ij ], conforme al criterio de Savage, que será: R [r ij ] siendo : r [ij] máx. c ij - c ij i Es decir que cada elemento de R, se obtiene restando cada elemento de la matriz C, del mayor de su columna. En este caso, cada columna corresponde a un diferente estado de la naturaleza. Una vez obtenido la matriz R, (matriz de las aflicciones o matriz de los lamentos), se le aplica el criterio de Wald, es decir se determina el mayor elemento de cada fila y luego se selecciona la decisión que corresponde al menor valor de ellos. Retomando el ejemplo que se venía analizando, luego de hacer las diferencias del elemento mayor de cada valor, la matriz de las aflicciones o de los lamentos queda de la siguiente manera: 27

Matriz de los arrepentimientos: Cursos de Acción Estados de la Naturaleza E 1 E 2 E 3 E 4 A 1 0 40 60 40 A 2 40 0 50 10 A 3 80 60 0 0 Savage propone que para definir el curso de acción o estrategia, se aplique a la matriz de los arrepentimientos el criterio minimax o de Wald. De esta manera obtenemos: Estrategia Arrepentimiento máximo A 1 60 A 2 50 A 3 80 En la tabla observamos que el arrepentimiento minimax es de 50 y en consecuencia el decisor debe escoger la estrategia A 2. La Estadística Clásica resuelve problemas de decisión en un Universo con Riesgo o Estocástica, pero tratándose de un problema de decisión en un Universo de Total Incertidumbre, solamente es aplicable si hay experimentación. Si la experimentación no es posible, el análisis estadístico clásico no alcanza y se recurre a otras técnicas conocidas como Teoría de la Decisión Estadística. Nota de cátedra: Se deja aclarado que las presentes notas no tienen otro propósito más que, el de servir de orientación al estudiante en el aprendizaje de la Teoría de Decisiones. Prof. Adjunto: Ing. Abel Enrique Tévez. Prof. Adjunto: Ing. Gustavo López. 28