1. Introducción y objetivos 3

Documentos relacionados
Tema 3. Circuitos capacitivos

Experimento 3. Análisis del movimiento en una dimensión. Objetivos. Teoría

DERIVACIÓN BAJO EL SIGNO INTEGRAL. 1. Hallar el punto del intervalo [0,2] en el que la función =

Ecuaciones diferenciales, conceptos básicos y aplicaciones

Cobertura de una cartera de bonos con forwards en tiempo continuo

Modelo de regresión lineal simple

1.10 Aplicaciones de las ecuaciones diferenciales de primer orden

IGEP Tema 2. Leyas financieras básicas: estudio usando aplicaciones informáticas.

Tema 3. El modelo neoclásico de crecimiento: el modelo de Solow-Swan

UNA APROXIMACION A LA SOSTENIBILIDAD FISCAL EN REPUBLICA DOMINICANA Juan Temístocles Montás

Lección 3. Curvas. 4. Curvas parametrizadas: ejemplos.

Las señales pueden ser también, señales continuas o señales alternas.

Técnicas cualitativas para las Ecuaciones diferenciales de primer orden: Campos de pendientes y líneas de fase

PROPIEDADES DE LOS ESTIMADORES MCO Profesor Rafael de Arce

PROCESOS ESTOCÁSTICOS PROCESOS ESTOCÁSTICOS INTEGRAL ESTOCÁSTICA ECUACIONES DIFERENCIALES ESTOCASTICAS: LEMA DE ITO

1 Introducción Tiempo de vida Función de fiabilidad Vida media Tasa de fallo Relación entre conceptos...

6 METODOLOGÍA PROPUESTA PARA VALORAR USOS IN SITU DEL AGUA

Representación gráfica de curvas en forma paramétrica x a(t sent) 1.- Representar la curva dada por

ECONOMETRÍA EMPRESARIAL II ADE

Metodología de cálculo del diferencial base

Un algoritmo para la Planificación de Producción en un Sistema en Red de Fabricación basada en Sistemas Multiagente 1

Métodos de Previsión de la Demanda Datos

Problemas de Matemáticas 2º Bachillerato OPTIMIZACIÓN

CAPÍTULO 5. INTEGRACIÓN DE FUNCIONES TRIGONOMÉTRICAS 5.1. Introducción 5.2. Cambios de variable 5.3. Transformación en sumas 5.4. Problemas resueltos

13.0 COSTOS Y VALORACIÓN ECONÓMICA

Práctica 4: Hoja de problemas sobre Tipos de cambio

GUÍA DE MOVIMIENTO RECTILÍNEO UNIFORME

UNA MODELIZACIÓN PARA LOS ACCIDENTES DE TRABAJO EN ESPAÑA Y ANDALUCÍA

Tema 3: Juegos secuenciales o dinámicos con información completa

Análisis de inversiones y proyectos de inversión

TEMA 1 INTRODUCCIÓN A LA ELECTRÓNICA DIGITAL. 1. Sistemas analógicos y digitales.

4. INDICADORES DE RENTABILIDAD EN CERTIDUMBRE

MMII_L3_C5: Problema de la cuerda finita: Métodos directo y de las imágenes. Guión:

Cómo se debe contabilizar la deuda de pensiones en el sector público? 1/

MECANISMOS DE TRANSMISIÓN

ECONOMÍA. Teoría del control óptimo: Una guía para principiantes! David Bardey y Hélène Bonnet ISSN

( ) m / s en un ( ) m. Después de nadar ( ) m / s. a) Cuáles

Solución: El sistema de referencia, la posición del cuerpo en cada instante respecto a dicha referencia, el tiempo empleado y la trayectoria seguida.

TEMA 1: SISTEMAS DE ECUACIONES LINEALES. MÉTODO DE GAUSS.

3 Aplicaciones de primer orden

MACROECONOMÍA II ADE GRUPOS 20 Y 21 (ECTS) FECHA DE ENTREGA: Martes 11 de Mayo de 2010 Práctica nº 5: Hoja de problemas sobre Tipos de cambio

Keywords: seguro de vida, provisión matemática, probabilidad, función de distribución, solvencia, value at risk, VAT, valor actual neto, VAN.

Departamento de Ingeniería Hidráulica y M.A. de la U.P.V HIDROGRAMA UNITARIO

1-Características generales del movimiento

SUPERFICIES Y CURVAS EN EL ESPACIO

CAPÍTULO II. Conceptos de Confiabilidad

LÍNEAS DE FASES. Fig. 1. dx (1) dt se llama Ecuación Diferencial Ordinaria (E.D.O.) de Primer Orden definida en Ω.

Método desarrollado en el año de 1889, pero por su sencillez todavía se sigue utilizando.

Anexo SNIP 22 Lineamientos para PIP mediante APP cofinanciada

La Conducción de la Política Monetaria del Banco de México a través del Régimen de Saldos Diarios

Universidad Austral de Chile Escuela de Ingeniería Comercial

Práctica 20. CARGA Y DESCARGA DE UN CONDENSADOR ELÉCTRICO

Introducción a la Estadística Empresarial. Capítulo 4.- Series temporales Jesús Sánchez Fernández

Control de un péndulo invertido usando métodos de diseño no lineales

Circuitos para observar la descarga y carga de un capacitor.

Master en Economía Macroeconomía II. 1 Problema de Ahorro-Consumo en Horizonte Finito

Luis H. Villalpando Venegas,

ELECTRONICA DE POTENCIA

Observatorio * EL AUMENTO DEL IVA EN ESPAÑA: UNA CUANTIFICACIÓN ANTICIPADA DE SUS EFECTOS **

MATEMÁTICAS II. x x x d) ( ) b) Como el grado del numerador y del denominador son iguales, hay que empezar por hacer la división.

Investigación y Técnicas de Mercado. Previsión de Ventas TÉCNICAS CUANTITATIVAS ELEMENTALES DE PREVISIÓN UNIVARIANTE.

UN MODELO DE METAS DE INFLACIÓN CON PREFERENCIAS ASIMÉTRICAS DEL BANCO CENTRAL

Modelos de Ajuste Nominal Incompleto. Por Agustín Casas, UdeSa. Diego Hofman, Princeton. Analía Olgiati, BID. Javier DiFiori, Morgan Stanley

ÁREA DE FÍSICA DE LA TIERRA SISMOLOGÍA E INGENIERÍA SÍSMICA (PRÁCTICAS)

Y t = Y t Y t-1. Y t plantea problemas a la hora de efectuar comparaciones entre series de valores de distintas variables.

2 El movimiento y su descripción

Jesús Botero García. Universidad EAFIT.

Tema 8: SERIES TEMPORALES

Foundations of Financial Management Page 1

Master en Economía Macroeconomía II. 1 Learning by Doing (versión en tiempo discreto)

INSTITUTO NACIONAL DE PESCA

LOS RECURSOS AMBIENTALES:

Las derivadas de los instrumentos de renta fija

En el campo del control industrial se diferencian dos tipos de sistemas: MONITORIZACIÓN. Display S A L I D A. Alarmas S A L I D A

MÉTODO DE DEFLACIÓN DE VARIABLES ECONÓMICAS: CUENTAS ECONÓMICAS Y TABLAS INPUT-OUTPUT CRISTINA PRADO

Actividades del final de la unidad

Estadística de Valor Tasado de Vivienda

Macroeconomía III (Grado en Economía) Universidad de La Laguna. Tema 2. El modelo Neoclásico con tasa de ahorro endógena

Análisis Estadístico de Datos Climáticos

Construcción de señales usando escalones y rampas

Recursos Naturales No Renovables y posición fiscal en economías en desarrollo: efectos e implicaciones de política

Medición del tiempo de alza y de estabilización.

APUNTE: ELECTRICIDAD-1 INDUCCIÓN ELECTROMAGNÉTICA

Estadística de Vivienda Libre

TEMA: FUNCIONES: Cuadrantes 3 er cuadrante, x 0, 4º cuadrante, x 0,

ESTIMACIÓN DE LAS NECESIDADES DE VIVIENDA EN EL MUNICIPIO DE CORVERA DE ASTURIAS

5. ESPACIOS VECTORIALES EUCLÍDEOS. PROYECCIONES ORTOGONALES. MÍNIMOS CUADRADOS.

UN MODELO DE PESQUERÍAS BAJO EL ENFOQUE MULTICRITERIO. Nancy Dávila Cárdenes 1 Rafael Caballero Fernández 2

FÍSICA. PRUEBA ACCESO A UNIVERSIDAD +25 TEMA 8. Corriente eléctrica

Matemática financiera

TEMA I: FUNCIONES ELEMENTALES

ESTIMACION DE LA TASA DE DESEMPLEO NO ACELERADORA DE LA INFLACION PARA LA ECONOMIA ECUATORIANA RESUMEN

MATRICES. M(n) ó M nxn A =

PRÁCTICA 3: Sistemas de Orden Superior:

CURVAS PLANAS, ECUACIONES PARAMETRICAS Y COORDENADAS POLARES 2.1 CURVAS PLANAS Y ECUACIONES PARAMETRICAS

REVISTA INVESTIGACION OPERACIONAL Vol. 24, No. 1, 2003

Procesamiento Digital de Señal

Unidad 3. Índice de contenidos (I) Unidades: Unidad 3. Índice de contenidos (II) Unidades:

Solución y criterios de corrección. Examen de mayores de 25 años Matemáticas aplicadas a las ciencias sociales.

MACROECONOMIA II. Grado Economía

Transcripción:

Índice. Inroducción y objeivos 3 2. Teoría del conrol ópimo 6 2.. El principio del máximo de Ponryagin 4 2.2. Conrol ópimo con varias variables 5 2.3 Variables acoadas 6 3. Ejemplos en la aplicación de la Teoría del Conrol Ópimo 7 3.. Tiempo Ópimo de ala de una planación foresal 7 3.2. Modelo de la exploación de las pesquerías 22 3.3. Modelo de la exploación de los recursos no renovables 23 4. Programación dinámica 27 4.. Programación dinámica deerminisa 3 4.2. Programación dinámica probabilísica 3 4.3. Ejemplo en la aplicación de la Programación dinámica 32 5. Oros modelos de gesión de los recursos naurales 37 5.. Modelo de Fausmann en gesión foresal 37 5.2. Modelo de exploación de un recurso no renovable: la regla de Hoelling 38 5.3. Modelo de exploación de pesquerías 39 6. Conclusiones 4 7. Bibliografía 44

Índice de Figuras Figura : Parón ópimo de la gesión de una planación foresal 2 Figura 2: Problema de rua aplicando programación dinámica 28 Figura 3: Esquema emporal del problema de exracción de la mina 33 Índice de Cuadros Cuadro : Beneficios obenidos según el nivel de exraccion y la canidad de sock 32 Cuadro 2: Valor de la variable de esado en cada período 33 Cuadro 3: Valores para el período 4 34 Cuadro 4: Valores ópimos según 3) 34 Cuadro 5: Valores para el período 3 35 Cuadro 6: Valores ópimos según 2) 35 Cuadro 7: Valores para el período 2 35 Cuadro 8: Valores ópimos según ) 36 Cuadro 9: Valores para el período 36

. Inroducción y objeivos Anes de comenzar cualquier análisis, conviene aclarar primero a qué nos esamos refiriendo con los recursos naurales y porqué son an imporanes para el desarrollo económico de un país. Mencionando una definición más convencional nos referimos a los recursos naurales como aquellos aribuos de la ierra, vivos o inanimados, que exploa el ser humano como fuene de alimenos, maerias primas y energía (Reed, 994a). Se podrían idenificar res cualidades fundamenales de funciones económicas que cumplen los recursos naurales: como insumos para el proceso producivo, como almacén de residuos por su generación ano en el consumo como en el proceso producivo, y como servicio recreaivo o sopore general para la vida. Y es aquí donde podría definirse la economía de los recursos naurales, como aquella área que se encarga de cómo asignar eficienemene a la sociedad los recursos naurales a lo largo del iempo. Pues consanemene, nos enconramos ane siuaciones en las que hay que decidir de qué manera usar un recurso naural, por ejemplo: un bosque, se debería exploar para obener madera, o sin embargo, preservándolo como un espacio naural proegido favoreciendo las acividades recreaivas?, o cómo disribuir en el iempo la exracción de peróleo de un pozo cuyas reservas son finias? Denro de los recursos naurales, se puede realizar una clasificación basada en la emporalidad, es decir, en la capacidad que iene el recurso de regenerarse una vez haya sido uilizado. Enonces disinguimos enre: recursos renovables, que son aquellos recursos que ienen la capacidad de regenerarse una vez se haya uilizado, en algunos casos habiendo pasado un iempo al que le permia regenerarse; y recursos no renovables, son aquellos recursos que no ienen la capacidad de regenerarse y por ano su uso coninuado puede provocar su desaparición. Ahora bien, aquí cabe señalar que un recurso renovable puede converirse en no renovable, es decir, que la mala exracción o uso puede inducir a su agoamieno. Eso sucede cuando el iempo de exracción es inferior al iempo que arda el recurso en regenerarse, es decir, la capacidad de exracción es superior a la capacidad de regeneración del recurso. Por ejemplo, en una pesquería, si la capura de peces es coninuada y un nivel superior a la asa de regeneración biológica de la especie, conllevará al agoamieno del género. Pero, cuándo realmene se le da imporancia al esudio de los recursos naurales? Realizando un breve repaso por la hisoria, a principios del siglo XX, el esudio de los recursos era casi exclusivamene rabajo de biólogos y no había originado inquieud alguna enre los economisas para el esudio de su aprovechamieno debido a la abundancia relaiva de los 3

mismos. Así pues, fue durane los años 7 cuándo se le dio real imporancia su esudio, provocada con la crisis del peróleo producida durane esa época. La resricción de la exporación de peróleo impuesa por la Organización de Países Árabes Exporadores de Peróleo hacia países de Occidene en una época de gran dependencia del crudo del mundo indusrializado, condujo a una drásica subida de precios y consecuenemene a una disminución de la acividad económica. Fue enonces cuando se produjo un puno de inflexión en algunos países occidenales, donde se comenzó a planear políicas de mayor conciencia energéica. Si bien, anes de eso exisieron grandes auores que consruyeron pilares fundamenales que ayudaron a cimenar la disciplina de la economía de los recursos naurales. Cabe mencionar a algunos auores como Thomas Rober Malhus, con la denominada ley de crecimieno Malhusiano, quién esimó un rimo de crecimieno poblacional alarmane, pudiendo originar consecuencias caasróficas debido a que la canidad de recursos exisene en el mundo era muy inferior a al crecimieno, como para saisfacer la demanda de necesidades. Oro auor influyene fue Arhur Cecil Pigou con su obra The Economics of Welfare publicada en 99, que inrodujo la idea de exernalidad negaiva y la inroducción de un impueso como forma de corregir dicha exernalidad y de esa manera conseguir alcanzar el ópimo social o exernalidad ópima, es lo que se conoce acualmene como impueso pigouviano. Sobre esas mismas líneas y coninuando con un orden cronológico, aparece Harold Hoelling, con su obra The Economics of Exhausible Resourses (93), donde dealla la denominada regla de Hoelling, en la que se indica la manera ópima de exracción de un recurso no renovable, siendo la misma la siuación de equilibrio en el que la asa de variación del precio del recurso coincida con el ipo de inerés. Un enfoque alernaivo al de Pigou, lo planeó Ronald Coase en su arículo The problem of Social Cos, publicado en el Journal of Law and Economics en 96. Su idea se basa en demosrar que no es necesario ningún ipo de inervención, por conra al planeamieno de Pigou, para alcanzar la exernalidad ópima, sino que basa que exisa una correca definición de los derechos de propiedad (eso es, en el senido amplio, el derecho del uso del recurso en cuesión) en donde exisa una negociación enre el agene que provoca la exernalidad negaiva, y el agene que la sufre, para llegar de esa forma al ópimo social. Así pues, la problemáica fundamenal a la que se enfrena en economía para la gesión de los recursos naurales se refiere a la oma de decisiones presenes de asignación de ales recursos que afecan a aconecimienos fuuros, haciendo posible que sean disponibles cieras 4

oporunidades. Todo ello, ane un mundo infiniamene compeiivo de agenes en los cuales cada uno vela por sus inereses propios. Siguiendo a Fernández y García (2) en el libro Méodos maemáicos en economía dinámica, uno de los méodos analíicos parar solucionar problemas de planificación es resolviendo problemas de Opimización Dinámica. El objeivo es opimizar una función objeivo a ravés de variables insrumenos que pueden omar valores denro de un rango de valores, permiiendo que dichas variables cambien en el iempo. Para solvenar los problemas de opimización dinámica exisen res aproximaciones: Cálculo de Variaciones, Teoría del Conrol Ópimo y la Programación Dinámica. Siendo los dos méodos principales y de nuesro inerés la Teoría del Conrol Ópimo y la Programación Dinámica dado que nos cenraremos en su esudio. En la Teoría del Conrol Ópimo nos siuaremos principalmene en la formulación del problema de opimización definiendo las dos variables principales que componen cada problema: las variables de conrol y las variables de esado; así como la obención de las condiciones necesarias y suficienes para la solución ópima del problema a parir de la función Hamiloniana. Además se expone el méodo de resolución del mismo por medio del Principio del Máximo de Ponryagin. Por oro lado, se explica el raamieno de los problemas de conrol en los que exisen más de una variable de conrol o de esado, o ambas a la vez. A su vez, se redaca los casos pariculares de acoación de los dos ipos de variables. Poseriormene, a modo ilusraivo se expone como ejemplos de aplicación prácica de la Teoría de Conrol Ópimo, los casos de ala de una planación foresal, modelo de exploación de una pesquería y modelo de exploación de un recurso no renovable. Luego, se procede a exponer el ercer méodo de aplicación para la resolución de los problemas de opimización dinámica, la Programación Dinámica basada en el principio de opimalidad de Bellman. Para ilusrar al caso, se expone un problema de opimización resuelo por el méodo. Finalmene se exponen oros conocidos modelos empleados en la Teoría de Gesión de Recursos Naurales. En concreo, se dealla el modelo de Fausmann para la gesión de foresal, la regla de Hoelling en busca del ópimo de exracción de un recurso no renovable, y los rabajos realizados por Gordon (954) y Sco (955) para explicar el rendimieno económico ópimo de una pesquería. 5

El objeivo del rabajo se cenra en realizar una revisión bibliográfica de méodos de raamieno de los problemas de gesión de recursos naurales, fundamenalmene en aquellos problemas en los que se emplea la opimización dinámica, incidiendo en dos méodos de resolución: la Teoría de Conrol Ópimo y la Programación Dinámica. 2. Teoría del Conrol Ópimo El principio máximo de la Teoría de Conrol Ópimo fue desarrollado por L.S. Ponryagin y su grupo de rabajo a finales de 95. Aparece como consecuencia de una generalización del Cálculo de Variaciones, amplificando el rango de esudio de ése, aplicable a odos los problemas de Cálculo de Variaciones en la resolución de problemas de Opimización Dinámica. Siguiendo la obra Dynamic Opimizaion: The Calculus of Variaions and Opimal Conrol in Economics and Managemen de Kamien y Schwarz (99), exisen dos ipos de variables en los problemas de conrol ópimo: las variables de conrol y las variables de esado. Así pues, se define una función de conrol que ejerza un predominio consane sobre las variables que especifican el esado del problema, obeniendo de esa forma la rayecoria ópima. Luego, la solución al problema consise en opimizar dicha función de conrol. Para explicar el planeamieno del problema, comenzamos por exponer el problema de conrol más simple que se compone de una función de conrol coninua a rozos u ( represena de la siguiene forma:, al que se ma,(),()) s. a.: x '()(,(),()) g x u ) x fijo ) f x u d libre (2.) Donde es la variable de conrol que debe ser una función de iempo coninua por pares. Por oro lado, la variable de esado viene represenada por x (, que va cambiando su rayecoria a lo largo del iempo, deerminado su movimieno por la ecuación diferencial x' ( g(,, ). Se puede apreciar que la variable de esado esá en función de la variable de conrol. Por ano, la variable de conrol influye en la función objeivo de dos formas: direcamene a ravés de su propio valor; e indirecamene, a ravés de su impaco 6

sobre el valor de la variable de esado x ( coninuas diferenciables.. Las funciones f y g se consideran funciones Cabe señalar que un problema de conrol ópimo puede esar compueso por varias variables de conrol y de esado, no eniendo que coincidir la canidad de ambas, es decir, el número de variables de conrol puede ser mayor o menor que el número de variables de esado. Para deducir las condiciones necesarias para que la solución maximice el problema de conrol ópimo, el procedimieno es similar al de resolución de problemas de programación no lineal mediane la formación de la función de Lagrange y la obención de los muliplicadores. Así pues, vamos a ener un muliplicador de Lagrange ( para cada resricción del problema siendo su inerpreación cómo la valoración marginal de la variable de esado asociado a cada insane de (recordar que en programación lineal, el muliplicador se inerprea como la valoración marginal de la resricción asociada) (Dorfman, 969). Y luego, a parir del Lagrangiano se crea una nueva función, denominada función Hamiloniana que nos permie obener las condiciones necesarias de opimización. A modo explicaivo, se expone el planeamieno de Lagrange del problema de conrol ópimo y la obención de las condiciones necesarias a parir de dos formas: de forma analíica desarrollando el ejemplo expueso, y de forma más rivial a parir de la función Hamiloniana. (ver Kamien y Schwarz, 99). El planeamieno de Lagrange para el problema de conrol ópimo expueso aneriormene, queda de la siguiene forma: f (,, ) d Inegrando el segundo érmino ( x'( : [ f (,, ) ( g(,, ) ( x'( ] d (2.2) ( x'( d ( ) ) ( ) ) '( d (2.3) Ahora lo susiuimos en la primera expresión quedando: (2.4) f (, ) d [ f (,, ) ( g(,, ) '( ] d ( ) ) ( ) ) 7

Aquí se puede deerminar que el problema de conrol ópimo radica principalmene en buscar la función de conrol u ( ), ya que la elección de la misma juno con las condiciones de x y x ( ) libre, deerminan la senda de la variable de esado correspondiene x (. Y por lo ano, ambién deermina el valor de la úlima expresión. Para obener las condiciones necesarias de opimización, primero se alcanzan a parir del desarrollo analíico del siguiene problema: max f (,, ) d s. a. : x'( x ( x ) (2.5) Para al caso, se supone un parámero de comparación de conroles u *( ah( donde u *( es la solución de conrol ópimo al problema de maximización, h( es una función fija y a es un parámero. Luego la función y(, a) expresa la variable de esado que ha sido generada por las condiciones iniciales ( x' ( g(,, ) y ) x ; ) libre ) con la variable de conrol u *( ah( denro del inervalo. Por ano, se iene: y( x (2.6), a) Se puede apreciar que cuando a, se alcanza el ópimo de la variable de esado x*: y(,) x *( (2.7) A modo resumen, con las soluciones ópimas de u*, x* y h siendo fijas, el valor de la ecuación diferencial x' ( g(,, ) valorada a lo largo de la función de conrol u *( ah( y la función y(, a) que denoa la variable de esado y depende del valor de a, podemos escribir: J ( a) f (, y(, a), u*( ah( ) d (2.8) Ahora susiuyendo esos valores ( u *( ; y(, a) ) en la ecuación (4) obenida por Lagrange aneriormene enemos: J ( a) ( ) y( [ f (, y(, a), u * ( ah( ) ( g(, y(, a), u * ( ah( ) y(, a) ' ( ] d, a) ( ) y(, a) (2.9) 8

Enonces siendo u* la variable de conrol maximizada, se deermina que la función J(a) adopa su máximo cuando a. Diferenciando la función con respeco a y evaluando en dicho puno, se obiene: J '() [( f x g x ') ya ( fu gu ) h] d ( ) ya (,) (2.) Donde f x y g x son las derivadas parciales de las funciones f y g con respeco a su segundo argumeno, y f u y g u son las derivadas parciales de las mismas con respeco a su ercer argumeno. Por su pare, y a es la derivada parcial de y con respeco a su segundo argumeno. Se puede apreciar que el úlimo érmino no se deriva ya que es independiene de a dado que para odo valor de a la expresión y a (, a) x, como se recoge aneriormene. En esa fase es complicado especificar la función (, a) que deermina la modificación de la senda de la variable de esado provocado por la variable de conrol. Para eviar esa siuación, se hace a parir de ( y a la cuál saisface la siguiene ecuación diferencial: '( [ f con ( ) x (, x*, u*) ( g x (, x*, u*)] (2.) Enonces, con λ dado, la ecuación (2.) se cumple siempre y cuando: [ f (, x*, u*) g (, x*, u*)] hd (2.2) u u Eso es para una función h( arbiraria, que debe cumplir: h( f (, x*, u*) ( g (, x*, u*) (2.3) u u Tal que: Y ello implica la condición necesaria: 2 [ f (, x*(, u*( ) ( g (, x*(, u*( )] d (2.4) u f (, x *(, u *( ) ( g (, x *(, u *( ) u u u (2.5) Resumiendo lo expueso, se pueden obener las condiciones necesarias. Siempre que se cumpla que las funciones u* y v* son soluciones ópimas que maximizan la ecuación 9

max f (,, ) d sujeo a las resricciones x' ( g(,, ), x fijo y ) ) libre enonces se cumple que exise una función coninua diferenciable ( u*, x* y λ simuláneamene cumplen: al que La ecuación de esado: x'( g(,, ) ) x (2.6) La ecuación del muliplicador: '( [ f ( ) x (,, ) ( g x (,, )] (2.7) Dónde ( ) se considera la condición de ransversalidad que se implana cuando x ) no se le asigna un valor fijo. Y la condición de opimalidad: fu (,, ) ( g u (,, ) (2.8) Cómo se ha expresado con anerioridad, la ora forma para obener las condiciones necesarias de forma más simple, es a parir de la función Hamiloniana. Así pues, del problema expueso inicialmene, obenemos el Hamiloniano asociando un muliplicador de Lagrange a cada resricción, quedando de la siguiene forma: H (,,, ( ) f (, x, u) g(, x, u) (2.9) Para obener las condiciones necesarias, se realiza a parir de las derivadas parciales de la función Hamiloniana con respeco a la variable de conrol, la variable de esado y el muliplicador de Lagrange λ: ( H u H x ' H x' (2.2) (2.2) (2.22)

Se puede comprobar que cada condición obenida genera la misma condición obenida aneriormene de forma analíica. Así pues: H u H f u g u (2.23) u H H ' '( ( f x g x ) (2.24) x x H H x' x' g (2.25) Además, cabe reflejar las condiciones necesarias que debe cumplir la variable de conrol u* para maximizar o minimizar el problema si se raa de un problema de máximo o de mínimo respecivamene. Las condiciones necesarias son (ver Fernández y García, 2): Para un problema de máximo: 2 H (, x*, u*, *) 2 u (2.26) H (, x*, u*, *) H (, x, u, ) (2.27) Siendo esa úlima condición, la que deermina que el puno maximiza la función respeco a u. Para un problema de mínimo: 2 H (, x*, u*, *) 2 u (2.28) H (, x*, u*, *) H (, x, u, ) (2.29) Siendo esa úlima condición, la que deermina que el puno minimiza la función respeco a u. A modo ilusraivo, se muesra el siguiene ejemplo numérico sobre la obención de la variable de conrol y la variable de esado y las condiciones necesarias mediane la función Hamiloniana (Kamien y Schwarz, 99). Pariendo del problema de opimización inicial compueso por la variable de conrol y una variable de esado: s. a. : max x' u ) ( x u) d 2 (2.3)

La función Hamiloniana queda: 2 H (, x, u, ) x u ( u ) (2.3) Ahora ya podemos obener las condiciones necesarias: H u 2 u (2.32) H ' H x '() (2.33) x H x ' (2.34) Luego comprobamos la condición de máximo: 2 H 2 u 2 (2.35) Se cumple la condición de máximo del problema. Ahora se procede a obener las variables de conrol y de esado. Para ello, primero inegramos H la condición ' y empleando la condición de ransversalidad ( ) obenemos x el valor de λ: (2.36) Luego a parir de la primera condición, podemos despejar u y dejarlo en función de λ: H u 2u u 2 (2.37) Susiuyendo por el valor de λ: u 2( (2.38) Ahora podemos susiuir el valor de u en la resricción del problema. De ese modo obenemos x : 2 x' u x' (2.39) 2 ( Inegrando y usando la condición de ransversalidad ) obenemos x: 2

3 4 5 ) 4( ) ( x (2.4) En resumen, enemos: x u ) ( 4 5 ) ( 4 ) ( ) ( 2 ) ( (2.4) Ahora, a parir de la obención de las condiciones necesarias, se procede a esudiar que además de ser necesarias, son ambién suficienes en un problema de ópimo. La eoría es similar a las condiciones de Kuhn-Tucker aplicadas en problemas no lineales. Así pues, para ese caso se considera condiciones necesarias y suficienes cuando la función objeivo cóncava o convexa es para ser maximizada o minimizada sobre una región convexa cerrada. Ahora bien, para problemas de conrol ópimo, las condiciones necesarias son suficienes si la inegral de la función ) ',, ( x x F es cóncava o convexa en x, x. Veamos eso expresado de forma analíica. (Kamien y Schwarz, 99) Supongamos que se iene dos funciones cóncavas diferenciables de u y x, ales que: ) ( ),, ( ' :. ),, ( max x x odo para u x g x a s d u x f (2.42) Ahora se supone que las soluciones al problema de conrol ópimo x*, u* y λ cumplen las condiciones necesarias: ) ( ),, ( ),, ( ' ),, ( ),, ( u x g u x f u x g u x f x x u u (2.43) Y además, que x y λ son funciones coninuas. Enonces, para al caso, si las funciones f y g son funciones conjunamene cóncavas de x y u y se maniene la condición de ) (, enonces las condiciones necesarias expuesas aneriormene son ambién suficienes.

2. El Principio del Máximo de Ponryagin Siguiendo a Cerdá (2) en su libro Opimización dinámica, el Principio del máximo de Ponryagin es el méodo que nos permie obener las condiciones necesarias que iene que obedecer el conrol ópimo de los problemas de Teoría de Conrol. Así pues, es el procedimieno de resolución explicado y expueso aneriormene en el que se aplica la función Hamiloniana deerminando la solución ópima que insaura las condiciones necesarias de opimalidad. Sin embargo, Kamien y Schwarz (99), señalan que el principio iene una diferencia con respeco al uso convencional que se ha dado hasa ahora para resolver los problemas. Para reflejar al diferencia, se procede a exponer el principio. Se pare del problema de opimización con el objeivo de enconrar un vecor de conrol y un vecor de esado que se defina en el inervalo emporal, : s. a.: max ' i i i i f (,, ) d x ( g (,, ) i condiciones iniciales x ( ) x i,..., n i condiciones finales xi ( ) xi i,..., p x ( ) x i p,..., q i ( x i x ( ) libre i q,..., n ( x fijo) i resricción de la var iable de conrol, i,..., q fijos) (2..) U conjuno dado en R m Enonces el eorema de Ponryagin anuncia lo siguiene (ver Kamien y Schwarz, 99; y Tu, 99): Para que x*(, u*( sea ópimo para el problema expueso aneriormene, es necesario que exisa una consane λ y una función coninua ( ( (,..., ( ) donde para odo enemos (, ( ) (,) al que para cada H (, x *(, u, ( ) H (, x *(, u *(, ( ) (2..2) Donde la función Hamiloniana H es definida por: Excepo los punos de disconinuidad de u*(, n i i u i H (, x, u, ) f (, x, u) g (, x, ) (2..3) 4 n

' H (, x*(, u *(, ( ) i ( i,..., n x i (2..4) Además ó (2..5) Y por úlimo, las condiciones de ransversalidad son saisfechas: ( ) no hay condiciones i,..., p i ( i ( i ) ) * i ( si x ( ) x ) i q,..., n i i p,..., q (2..6) Ahora bien, de ese planeamieno con respeco al planeamieno que se ha desarrollado en el aparado anerior, exisen dos diferencias: una diferencia de precisión écnica, y ora de ipo esilísica. (Kamien y Schwarz, 99). La diferencia exisene de precisión écnica se basa en la especificación de la variable λ. Hasa ahora siempre se ha enido la condición de ransversalidad como condición para que el problema de conrol enga solución. Sin embargo, se puede apreciar que, el eorema recoge que hay problemas en los que la solución ópima requiere que. Con respeco a la diferencia esilísica, se alude a la especificación de la región de la variable de conrol u (, que en al caso se precisa que el vecor u se encuenra en algún conjuno U. 2.2 Conrol ópimo con varias variables La dinámica del sisema del problema de conrol ópimo se puede presenar con más de una variable de esado o variables de conrol. En al caso, el planeamieno de resolución es similar a lo expueso hasa ahora. De forma ilusraiva, se expone el siguiene problema en el que se aplica el principio del máximo de Ponryagin (Fernández y García, 2): s. a.: max 2 F( x, y, u, d x f ( x, y, u, y g( x, y, u, ) x y() y (2.2.) 5

Como se puede apreciar, el problema esá compueso por dos variables de esado x e y. Enonces, siguiendo con el procedimieno habiual, obenemos la función Hamiloniana: H F x, y, u, f ( x, y, u, g( x, y, u, ) (2.2.2) ( 2 Luego las condiciones necesarias son: H x H y 2 H u H x 2 H y (2.2.3) Y la condición de máximo: 2 u H 2 (2.2.4) Luego se redaca que si las variables de esado x ) e y ) son libres, se obienen dos ( 2 ( 2 condiciones de ransversalidad ( 2 ) y ( 2 ) de inegración. 2 que permien especificar las consanes 2.3 Variables acoadas Hasa ahora, para explicar la resolución de los problemas de conrol ópimo se ha especificado que ano las variables de conrol como las variables de esado siguen una rayecoria denro del inervalo emporal [, ]. Ahora bien, esa designación no ocurre en odos los problemas. Se pueden dar los casos en que las variables de conrol o de esado, o ambas al mismo iempo, se encuenren acoadas y sólo se muevan en un inervalo emporal específico. Para visualizar de forma prácica lo expueso, se muesran algunos ejemplos recogidos de disinas fuenes. El planeamieno del problema de acoación de la variable de conrol se muesra de la siguiene forma (Kamien y Schwarz, 99): 6

max f (, x, u) d s. a.: x ' g (, x, u ), x ( a u b ) x (2.3.) Para el caso, donde la variable de conrol y de esado esán acoadas (Fernández y García, 2): T 2 max u ( d 2 s. a.: x ( x ( x x 2 2 2 ( x () () (2.3.2) También exisen casos donde el horizone emporal en el problema de conrol ópimo es infinio, como en el siguiene planeamieno (Tu, 99): s. a.: max g(,, x ( x ) f (,, ) d (2.3.3) En función del problema y el objeivo que se quiera conseguir (maximizar o minimizar), esá claro que la exensión del inervalo emporal es un componene deerminane en el resulado obenido en el problema de conrol ópimo. Así pues, se puede predecir que aquellos problemas con una ampliud de inervalo emporal coro se obendrán resulados con rendimienos alos a coro plazo y crecimienos lenos a largo plazo; y al conrario, aquellos problemas en los que se iene un inervalo emporal infinio se presenan cuando no hay limiaciones de clase emporal. 3. Ejemplos de aplicación de la Teoría del Conrol Ópimo 3. Tiempo ópimo de ala de una planación foresal La principal problemáica para la gesión de un bosque consise en el iempo ópimo de ala de cada especie, con el fin de eviar su desaparición por sobreexploación. En ese aparado se dealla el modelo de exploación de un bosque planeándolo como un problema de Conrol Ópimo y aplicando el principio del máximo de Ponryagin que nos permie obener las condiciones necesarias que proporcionarán la solución ópima (Reed, 994b). 7

En el ejemplo se exponen dos siuaciones, en la que se quiere obener el parón ópimo de ala de una planación foresal. Un primer escenario en que se procede acomeer alas selecivas; y luego una segunda siuación en la que se vaicina una ala oal de la población. Se dealla que la canidad de madera de una planación foresal en un momeno deerminado viene represenado por x ( ecuación diferencial:. El crecimieno de dicha variable viene deerminado por la dx a( F( x) d ) (3..) Donde a( es una función que muesra la paua de crecimieno de los árboles, siendo ésa decreciene posiiva, dado que a medida que envejecen los árboles el crecimieno disminuye. Luego F(x) muesra el volumen de densidad de la planación, siendo una función cóncava posiiva de x, ya que el incremeno del volumen depende de la densidad de la especie. En el primer caso se permie acomeer alas selecivas en un período comprendido en el inervalo [, T], eso es, la eapa anerior de someer la población foresal a la ala oal. Para ese caso, el crecimieno de la planación ( x ( ) viene dado por: dx a( F( x) h( d ) x (3..2) Donde h( es el rimo de la ala que represena unidades de volumen de la población por unidad de iempo. El ingreso neo viene represenado por p( h( siendo p(h) el valor uniario de la ala desconando el cose propio de la ala. En el segundo escenario se irrumpe con una ala oal de la población el momeno T. El ingreso neo en ese caso viene represenado por q( T ) T ), definiéndose q( como el valor uniario de la madera alada siendo desconado el cose de la propia ala. Cabe señalar que la ala oal se considera más económica que la ala seleciva, por ano, p( q(. Aplicando la Teoría del Conrol Ópimo, el objeivo fundamenal del problema es deerminar la paua emporal de las alas que se producen con la finalidad de maximizar el valor acual de 8

los ingresos, ano de la ala seleciva como de la ala oal, es decir, se raa de buscar la variable de conrol h( que maximice: max T e dx s. a.: a( F( x) h( d h( h T p( h( d e max T q( T ) T ) (3..3) Donde hmax es el máximo rimo en que se puede ejecuar la ala seleciva. Para resolverlo aplicamos el Principio del máximo de Ponryagin. Siguiendo con el procedimieno aneriormene expueso, definimos la función Hamiloniana: H e p( h( [ a( F( x) h( ] (3..4) Veamos las condiciones para que la función h( sea ópima: H ' x ( a( F ( x) x H ' ( a( F ( x) x ( T ) e T q( T ) (3..5) Siendo la úlima condición la de ransversalidad. Es necesario, obviamene, que el rimo ópimo de ala h* ( maximice la función Hamiloniana en cada insane del iempo, es decir, durane odo el inervalo [, T]. Luego, la función Hamiloniana se puede formular en función de ( siguiene manera:, resulando de la H ( h( ( a( F ( x) (3..6) Denominándose ( función de conmuación y definiéndose de la siguiene forma: (3..7) ( [ e p( ( ] Por ano se deduce que la variable de conrol h( se expresa en función del valor de ( con el fin de maximizar H. Así pues, si ( ineresa que h ome un valor an grande 9

como sea posible, es decir, h. Por el conrario, si ( el valor de h debe ser para hmax maximizar H. A ese ipo de conrol se le denomina bang-bang. En el caso de que ( en algún inervalo de iempo, cualquier valor de h es válido para maximizar la función Hamiloniana, aunque para esa siuación solo se esablece un único valor de h. Es por ello que a esa posibilidad se denomina esraegia de conrol singular. Así pues, para deducir dicha esraegia, es decir, el valor de h( cuando (, parimos de las siguienes condiciones: ( (3..8) d d (3..9) A parir de la condición (3..8), se resuelve: ( [ e siendo ( ( e p( ( ] p( (3..) Luego a parir de la condición (3..9), resolvemos derivando y obenemos: ( [ e d d '( [ e '( e p( ( ] ln e ( )] p( e [ p( p'( ] '( p'( '( e [ p( p'( ] '( (3..) Ahora susiuyendo en esa expresión el valor de ' ( expueso en (3..5): e [ p( p'( ] ( a( F '( x) (3..2) Y susiuyendo el valor de ( que obenemos de la expresión (3..): e (3..3) [ p( p'( ] e p( a( F'( x) Para finalizar, despejando a( F '( x) y simplificando, se obiene para el conrol singular: [ p'( p( ] e a( F'( x) e p( p'( p( a( F'( x) p( p( 2

p'( a( F'( x) (3..4) p( Según se dealla, la solución de esa expresión nos muesra la rayecoria o senda singular x s (, que para seguir en ella, requiere que: x'( a( F( x) h( x o bien h( a( F( x) x ' s ( ' s ( (3..5) A modo ilusraivo, veamos los dos escenarios propuesos inicialmene (ala seleciva y ala oal) y el ipo de esraegia de conrol ópimo que ocurre en cada uno de ellos. De inicio no se conempla realizar ningún ipo de ala porque hay poco volumen de madera y exise un gran poencial de crecimieno. En ese caso ocurre x x () y la función de s conmuación será (, donde h para maximizar la función Hamiloniana. Luego en el momeno, es cuando el volumen de la exploación alcanza la rayecoria singular, y comienza en ese mismo insane la ala seleciva, donde la función de conmuación será ( y h. El proceso de opimización coninúa con la ala seleciva a lo largo de la senda singular hasa el momeno 2. A parir de ese momeno, no se realiza ninguna ala hasa el momeno T, donde se ejecua la ala oal de la población. Gráficamene veamos lo expueso hasa ahora: Se comprueba que el parón ópimo de la ala seleciva consa de res pares: una primera en la que no se produce ala alguna, una segunda en la se produce una ala que sigue la senda 2

singular, y una úlima pare en la que no se produce ala alguna juso anes de que se produzca la ala oal. La demosración analíica de la úlima pare, en la que no se produce ala seleciva, se obiene a parir de la condición de ransversalidad: T (3..6) ( T) e q( T) Susiuyendo en la expresión de la función de conmuación ( 3..7), se obiene la función de conmuación en el momeno T. ( [ e ( [ e ( T ) e T p( ( ] p( e q( T )] [ p( T ) q( T )] (3..7) Por ano, se argumena que el conrol ópimo en T es h *, dado la coninuidad de p, q y λ para el inervalo anerior a T. 3.2 Modelo de exploación de las pesquerías Ese esudio se enfoca en deerminar las pauas ópimas de exploación del recurso, con la finalidad de eviar una sobreexploación del mismo que pueda causar una desaparición de la especie. De forma ilusraiva, se expone un caso (Fernández y García, 2) en el que se considera un mercado perfecamene compeiivo formado por numerosas empresas oferanes y demandanes, por lo que no pueden ejercer conrol sobre el precio del pescado ( p). El volumen de la especie viene dado por la variable x (, y el crecimieno neo de la población considerando que no se producen capuras viene dado por la ecuación diferencial: x F(x) (3.2.) Donde la función F(x) muesra el crecimieno de la especie. En caso de que se produzcan capuras de la misma la ecuación diferencial se modifica de al forma que: x F( x) h( (3.2.2) Siendo h( la canidad de capuras que se realizan el insane. A parir de lo expueso, se puede idenificar a la variable como la variable de esado, y la variable h( como la variable de conrol. Eso se explica porque ( refleja el cambio de la población de especies provocado por condiciones medioambienales o la propia acividad humana. Siendo esa 22

úlima condición, la que se puede conrolar a parir de la variable h(. De esa forma, dicha variable podrá omar valores denro del inervalo [, h max ]. En su exremo inferior, se considera la ausencia de capuras, y por el conrario, h max represena el máximo de capuras facible que se puede realizar, debido a una siuación de resricción insiucional en la que sólo se permia capurar un número deerminado de especies o a una limiación dado las condiciones físicas o logísicas para la capura del pescado. En el ejemplo, a su vez, se recoge que cada empresa se enfrena a un único cose (c ), siendo ése el cose de licencia de pesca para acceder al caladero durane el inervalo (, T), que se paga anes de comenzar la acividad pesquera. El objeivo de cada empresa es el de maximizar la suma de los beneficios obenidos por la exploación pesquera en cada período, enfrenándose a la decisión de no agoar el caladero de pesca. Por ano el problema resuelve de forma ópima cuál es la asa ópima de exracción de pescado en cada insane ( h ( ).Tal cuesión se resuelve a parir del problema de conrol: s. a.: max { h} T e ) x T ) x r x F( ) h( h( h T p( h( d max (3.2.3) Ahora para obener el nivel de capuras ópimo h *(, planeamos el Hamiloniano: Luego las condiciones para que el puno sea ópimo: r H e p( h( [ F( ) h( ] (3.2.4) H ' x ( F ( ) x H ' ( F ( ) x ( T ) e rt p( T ) condición de ransversalidad (3.2.5) 3.3 Modelo de exploación de los recursos no renovables Los recursos no renovables presenan una gran imporancia en las decisiones de rimo emporal de su exploación debido al carácer de disponibilidad limiada de los mismos, 23

raando de que se opimice la renabilidad de su consumo denro de un inervalo emporal esimado. Para mosrar la problemáica expuesa aneriormene de forma analíica se expone la siuación (Fernández y García, 2) en la que se considera una sociedad que dispone de una canidad S de recurso no renovable, que puede emplear durane un iempo fijo T. Luego se considera q( la asa de consumo del recurso en cada insane de iempo, siendo, q( la canidad de recurso uilizada en el insane de iempo. Si se quiere deerminar la canidad de recurso consumido enre dos inervalos de iempo a y b: b q ( d. Enonces, el planeamieno a del problema pare de una función de uilidad de la que se quiere deerminar el aprovechamieno ópimo del recurso especificando las pauas emporales de exracción permiiendo el consumo sin pausa de cada generación. Así pues: s. a.: max T T U ( q) e q( d S d (3.3.) Donde se ha considerado el inervalo emporal,t. La variable de conrol viene deerminada por q (. Luego U (q) creciene ( U '( q) ) y cóncava ( U ''( q) ). represena la función de uilidad, siendo la misma Ahora se puede apreciar que es un problema de variaciones. Para ransformarlo en un problema de conrol ópimo, es necesario definir y añadir la variable de esado. Se considera ésa variable como la canidad de recurso que queda por consumir en cada insane de iempo: S q( ) d (3.3.2) De donde se comprueba que que: ) S y x ( T ). Por consiguiene, ambién se comprueba x x ( s q( ) d q( (3.3.3) Enonces, el problema de conrol ópimo se represena de la siguiene forma: 24

s. a.: T max U( q) e x ( q( ) S T) d (3.3.4) Ahora se sigue con el procedimieno habiual. Se realiza la función Hamiloniana: H U( q) e ( q( (3.3.5) Luego se exrae las condiciones de ópimo: H q U '( q) e q H eso deermina x ( consane) (3.3.6) Luego: H q U '( q) e U '( q) e q (3.3.7) Por ano: e U '( q) e (3.3.8) Ahora bien, según el valor que enga δ obendremos un resulado u oro con diferene inerpreación del consumo del recurso. Para un primer caso, se supone que, luego U '( q) la función de uilidad marginal aumena con el paso del iempo a una asa exponencial. Se comprueba que lim U '( q), eniendo en cuena la ley de rendimienos marginales q decrecienes de la función de uilidad U ''( q) U '( q). Eso explica que la asa de consumo ópimo del recurso, q *(, debe ser decreciene en el iempo, eso es, que las generaciones acuales consuman más recurso que las fuuras, para que se produzcan de esa forma los crecimienos exponenciales en la uilidad. Por el conrario, si, enonces U '( q), eso quiere decir, que la uilidad marginal es consane, por lo que se considera que odas las generaciones consumen la misma canidad de recurso q (. 25

A modo ilusraivo, se expone el siguiene ejemplo de resolución maemáica del planeamieno expueso aneriormene (Fernández y García, 2). Se supone que la función de uilidad es igual a: U( q) q (3.3.9) Se obiene la función de uilidad marginal: U' ( q) 2 q (3.3.) Luego pariendo de la condición expuesa aneriormene y empleando el valor de la uilidad marginal, se iene: U '( q) e (3.3.) e 2 q (3.3.2) Se despeja q: q q 2 e 4 e 2 2 (3.3.3) Ahora, a parir de la condición x q, enemos el valor de x : 2 (3.3.4) x 4 e Inegrando, obenemos el valor de la variable de esado: x 4 e d e 8 2 2 k (3.3.5) Luego, aplicando x ( T ), se obiene el valor de la consane k: e 8 k 2 T e 8 k 2 T (3.3.6) 26

Agrupando, la solución será: x*( e 8 q*( 4 e 2 2 e 8 2 T (3.3.7) A parir de la condición x *() S, podemos obener el valor de : 2 T e (3.3.8) 8 S 4. Programación Dinámica La Programación Dinámica es la ercera alernaiva empleada para resolver los problemas de opimización dinámica. Dicha écnica, fue desarrollada por Richard Bellman, con el Principio de opimalidad de Bellman en 957, fundamenal para resolver los problemas de Programación Dinámica, que dice lo siguiene: una políica ópima iene la propiedad de que cualquiera que sea el esado inicial y las decisiones iniciales, las resanes decisiones deben consiuir una políica ópima con respeco al esado resulane de la primera decisión. Eso es, los problemas de opimización en los que se aplica ese méodo, son separados por eapas en subproblemas obeniéndose para cada eapa una solución ópima que se requiere que se asocie al valor ópimo del problema. Así pues, la rayecoria oal del problema sólo será ópima si las soluciones de los subproblemas adyacenes a cada eapa consiuyen ambién al mismo iempo una solución ópima. Esa es la principal diferencia con respeco a la Teoría de Conrol en donde el esudio se cenraba de forma globalizada en deerminar la variable de conrol u *(. El planeamieno de un problema de programación dinámica de forma generalizada para el caso discreo, iene la siguiene forma (ver Esco, Olmedo y Pozo, 22): s. a T V [ ] F[, ] G( ) ) A ( A es dado) T ) Z ( T, Z son dados) ) f [, ] U para T (4.) 27

donde y represenan la variable de esado y de conrol respecivamene, siendo (,,..., T ) la variable que indica cada período. Luego A y Z represenan la eapa inicial y final respecivamene. La función F[, ] represena la ecuación de movimieno en iempo discreo. Por su pare, la variable de esado del sisema se desarrolla siguiendo una ecuación recursiva, es decir, que puede repeirse indefinidamene: ) f [, ] (,,..., ) (4.2) La solución a al problema consise en deerminar el valor ópimo de la variable de conrol u *( que maximice o minimice el valor de la función V ( en cada eapa. El problema se ransforma en n problemas de opimización, siendo n el número de eapas o períodos en la que esá dividido el problema en cuesión. El procedimieno para resolver ales problemas es parir del méodo de inducción hacia arás, en el que se preende deerminar el valor ópimo de la variable de conrol en el úlimo período, se dice de ese modo que el problema se soluciona de forma rerospeciva, empezando por el final. Enonces, en cada ineracción endremos: V ( x, * Max ó Min [ F( x, u) V ( f ( x, u), )] u U (4.3) con V ( T ), T )* G( T ) A modo ilusraivo se expone el siguiene ejemplo de aplicación prácica de Programación Dinámica. Se considera el siguiene problema de buscar la rua ópima para llegar del puno a 8 de la manera más rápida posible. Enre cada puno viene reflejada la disancia exisene enre cada uno de ellos. De forma esquemáica: Figura 2: Problema de rua aplicando programación dinámica 28

Se considera d ij la disancia exisene enre las dos eapas i y j. Ahora, aplicando el principio de opimalidad de Bellman, consise en buscar el camino ópimo V i enre cada puno y el puno siguiene para conseguir llegar al puno final especificado en 8. Así pues: V i min{ di 6} min{ dik dk6} min{ dik min{ dk6}} min{ d V, ik k } Donde k 2,3,4,5,6, 7 son los consecuivos esados inermedios. Como ya se ha mencionado, el problema se resuelve comenzando por la úlima eapa. Así pues, es lógico deducir que en la úlima eapa la disancia exisene es: V 8 Ahora, para el puno 7, el camino ópimo viene reflejado por: d V min5 5 V7 min 78 8 Se deermina, que si la rua comenzara en el puno 7, su rua ópima sería ir direcamene a 8, como es obvio. Ahora veamos que sucede con desde el puno 6, en el cual exisen dos posibilidades de recorrido: ir al puno 7 previamene para finalizar en 8, o ir direcamene a 8: V6 min{ d67 V7, d68 V8} min{2 5,8 } min{7,8} 7 Se comprueba que, empezando el camino en 6, la rua ópima pasa por ir al puno 7 anes que a 8 direcamene. El mismo procedimieno es empleado en el reso de punos. Para el puno 5: V5 min{ d56 V6, d58 V8} min{4 7, 4 } min{,4} 4 Si se comenzara el puno 5, la rua ópima pasa por que el siguiene puno sea el 8 direcamene. Para el puno 4: V4 min{ d 46 V6, d 47 V7} min{5 7,6 5} min{2,} Se puede apreciar que las eapas poseriores al puno 4 son la 6 y la 7. Se ha comprobado que su camino ópimo pasa por seguir hasa el puno 7. Para el puno 3: 29

V3 min{ d35 V5, d36 V6, d37 V7} min{2 4,7 7,7 5} min{6,4,2} 6 Teniendo res posibilidades de recorrido, su rua ópima pasa por seguir hasa el puno 5. Para el puno 2: V2 min{ d 25 V5, d 26 V6} min{4 4, 3 7} min{8,} 8 Si se comenzara desde ese puno, su rayeco ópimo pasa por seguir hasa 5. Para el puno : V min{ d2 V2, d3 V3, d4 V4} min{3 8,4 6,2 } min{,,3} Vemos que comenzando desde ese puno, la rua ópima endrías que pasar por el puno 3. Ahora agrupando los resulados obenidos y comenzando por el puno, podemos deerminar que la rua ópima del problema pasa por los punos:, 3, 5 y 8. Es el camino que viene represenado en la figura 2 en razo más grueso. Las principales caracerísicas de los problemas de programación dinámica, algunas mencionadas al comienzo del aparado, son los siguienes (ver Hillier y Lieberman, 22): - El problema se divide en eapas o períodos que precisan una solución ópima para cada una de ellas. Así pues, se debe escoger una sucesión de decisiones inerrelacionadas en donde cada decisión perenece a una eapa del problema. Veamos para el problema anerior, se puede deducir que exisen res eapas de decisión. - En cada eapa puede exisir una ciera cifra de esados. Eso es, las disinas siuaciones posibles donde se puede localizar el procedimieno en cada eapa. En el ejemplo, en la eapa 2 se encuenran los esados 2,3 y 4 donde el sisema se podría enconrar. - El objeivo de la decisión o políica ópima aplicada en cada eapa consise en ransformar el esado acual en un esado asociado en la siguiene eapa. En el ejemplo, pariendo del puno, omando la decisión ópima de realizar el camino más coro, nos desplazamos hasa el puno o esado 3 en la siguiene eapa. - El procedimieno de resolución permie obener una solución ópima para el problema compleo, pariendo de las disinas soluciones ópimas en cada eapa. En nuesro ejemplo, la solución ópima al problema viene dado por la rua, 3, 5 y 8. 3

- Las decisiones ópimas son independienes en cada eapa, es decir, la decisión ópima que se ome en la eapa acual, sólo depende del esado acual y no de cómo se ha llegado hasa esa siuación. - El procedimieno de resolución del problema es mediane el méodo de inducción hacia arás, comenzando a resolver el problema, por ano, por la úlima eapa, hasa llegar a la eapa inicial. Es por ello que se iene una relación recursiva que deermina la solución ópima para la eapa n, a parir de la políica ópima de la eapa n+. Ahora, según cómo se deermine el siguiene esado pariendo del esado acual, la programación dinámica se clasifica en: programación dinámica deerminísica y programación dinámica probabilísica. (Hillier y Lieberman, 22) 4. Programación Dinámica deerminísica Para ese caso, el esado de la siguiene eapa se esablece ínegramene por la decisión ópima que se ome en la eapa acual. De forma analíica, se supone que el sisema se encuenra en un esado x en la eapa. Ahora, cuando se oma la decisión u en dicho esado, el sisema se mueve al esado x + en la eapa. Luego el objeivo es deerminar la decisión ópima que opimice la función objeivo con respeco al esado x, resulando f ( x ) f ( x, u ). A parir de aquí se sigue con el méodo de resolución de inducción hacia arás. Los problemas de programación dinámica deerminísica, a su vez, se pueden clasificar según: el propósio de opimización de la función objeivo, pudiendo ser de maximización o minimización; o la forma del conjuno de esados exisenes en las disinas eapas, pudiendo esar caracerizados por una variable coninua o una variable de esado discrea. 4.2 Programación Dinámica probabilísica En la programación dinámica probabilísica el esado en la siguiene eapa se deermina por el esado acual y la políica de decisión omada en dicho esado, y además, a diferencia de la siuación anerior, por una disribución de probabilidad. Dicha disribución de probabilidad si queda esablecida por el esado y la políica de decisión que se ha deerminado previamene en la eapa acual. Enonces para ese caso, siendo X el número de esados posibles denro de la eapa, el sisema cambia al esado i ( i, 2, 3,... S * * * u ) con probabilidad p i dados el esado x y la políica de decisión u en la eapa. En esa siuación se puede represenar con un 3

árbol de decisión en el que se refleja odas las decisiones y esados posibles para cada eapa. Ahora para ese caso la función objeivo queda: f n con ( x n, u f S ) pi[ C n i * * ( i) max o min f u i f ( i)] ( i, u ) (4.2.) Donde f x, u ) represena la suma esperada máxima o mínima (dependiendo de la forma n ( n n de la función objeivo) de la eapa hacia adelane, dado que en la eapa acual, el esado y la políica de decisión ya esán definidos, siendo x y u respecivamene. Luego C i represena la conribución de la eapa a la función objeivo. La maximización o minimización se realiza sobre odos los valores facibles de u. 4.3 Ejemplo de aplicación de la Programación Dinámica En ese aparado, se expone el ejemplo de gesión de una mina (Cerdá, 2). Se supone que se posee una mina cuyo sock consa de 8 unidades de mineral. Para la exracción de dicho mineral se dispone de cuaro períodos de iempo, dado que una vez ranscurrido ese iempo la valoración del mineral que queda en la mina es cero. El problema para la empresa o auoridad encargada de la gesión de la mina, consise en deerminar la canidad de mineral que exrae en cada período, sujeo a la resricción de que en cada período solo puede exraer, o 2 unidades del mineral, debiendo ser dicha canidad igual o inferior a la canidad de sock de mineral que exise en el momeno de la exracción. El beneficio obenido en cada período depende de la canidad de mineral que se exrae (u) en un período, siendo ésa nuesra variable de conrol, y del sock resulane (x) en dicho período, siendo ésa nuesra variable de esado. Por ano, la función de beneficio viene represenada por,. Así pues, para cada nivel de exracción y canidad de sock, se muesran en el siguiene cuadro los beneficios que se obienen: x 2 3 4 5 6 7 8-5 -5-5 -5 - - - -5-5 -35-25 -2 5 5 2 25 2-35 -25-5 - 3 4 Cuadro : Beneficios obenidos según el nivel de exracción y la canidad de sock u Esquemáicamene, el proceso emporal del problema es el siguiene (figura 3): 32

Figura 3: Esquema emporal del problema de exracción de la mina. Se debe señalar que es la canidad de sock exisene en el insane, y es la canidad de mineral que se exrae durane el período. El planeamieno del problema es el siguiene: s. a.: max 3 { } ) ) 8, {,, 2}, para, 3 J [, ] para,, 2,3,, 2,3, Ahora, eniendo en cuena las resricciones, se pueden obener los valores que puede omar la variable de esado en cada período. Dichos valores se recogen en el siguiene cuadro: Variable de esado en cada período Valores que puede omar ) 8 ) 8,7,6 2) 8,7,6,5,4 3) 8,7,6,5,4,3,2 4) 8,7,6,5,4,3,2,, Cuadro 2: Valor de la variable de esado en cada período Ahora, por el méodo de inducción hacia arás, se procede a calcular la canidad de exracción y el sock resulane para cada período. Por ano, comenzando por el final del período cuaro, sabemos que la mina conendrá 4) dado que carece de valoración a parir de ese período, por lo que: unidades de mineral, que no apora ningún beneficio * J4{ 4)} Ahora para el período cuaro, se sabe el conjuno de valores en los que se puede enconrar la variable de esado para el período 3, recogidos en el cuadro 2. Luego la ecuación de Bellman para el período será: 33

* J3{ 3)} max { [ 3), 3)] J 4{ 3) 3)}} 3) {,,2} En el cuadro 3, se recogen los diferenes resulados de la ecuación anerior para cada valor de x (3), en función de la canidad de mineral que se exrae u (3) : * 3) 3) π[3),3)] 8 2-5 25 4 MÁXIMO 7 2 6 2 5 2 4 2 3-5 2 3 MÁXIMO - 5 MÁXIMO - 5 MÁXIMO - - MÁXIMO -5-5 MÁXIMO -2 2-25 2-5 MÁXIMO -25 2-35 Cuadro 3: Valores para el período 4 Ahora, a modo resumen en el cuadro 4 se recoge la canidad de exracción ópima u (3) según la canidad de mineral exisene que maximiza la función objeivo de beneficio * 3 x J { (3)} : * 3) u*(3) J * 3 {3)} 8 7 6 5 4 3 2 2 2 4 3 5 5-5 -5 Cuadro 4: Valores ópimos según 3) Se realiza el mismo procedimieno para el ercer período. Con 2) dado, la ecuación de Bellman de ese período es: * J2{ 2)} max { [ 2), 2)] J3{ 2) 2)}} 2) {,,2} * 34