Metodologías de Pronóstico del Precio de la Energía

Documentos relacionados
Pronósticos Automáticos

Análisis de Series de Tiempo

Procesos autorregresivos

Universidad Mariano Gálvez Ingeniería Electrónica Estadística inferencial. Presenta Dra. En Ing. Rita Victoria de León Ardón

Modelación estadística: La regresión lineal simple

Curso de nivelación Estadística y Matemática

ANÁLISIS DE REGRESIÓN

Más Allá del Modelo de Regresión Lineal. Dante A. Urbina

Estadística Industrial. Universidad Carlos III de Madrid Series temporales Práctica 5

Nombre y Apellidos:... EXAMEN ECONOMETRÍA II (Septiembre 2010)

Regresión con errores autocorrelacionados

Análisis de Series de Tiempo. Universidad Nacional Autónoma de México. M. en C. César Almenara Martínez. 10 de Noviembre de 2010.

Econometría II Grado en finanzas y contabilidad

COMPARACIÓN DE TRES MÉTODOS DE REGRESIÓN LINEAL USANDO PROCEDIMIENTOS DE SIMULACIÓN

Pronóstico con Modelos ARIMA para los casos del Índice de Precios y Cotizaciones (IPC) y la Acción de América Móvil (AM)

Econometría Aplicada

Eigenvalores y eigenvectores

Análisis de datos del Aguacate Hass (presentación caja 10 kilogramos)

Ajustando Curva SnapStat

Análisis Estadístico de Datos Climáticos. Análisis de espectro singular. Facultad de Ciencias Facultad de Ingeniería 2013

Ejemplos de estudios de series de tiempo

Máster en comunicaciones. Clase 2. Modelos predictores.

Modelo de Regresión Lineal

Índice General de Ventas en Grandes Almacenes y su logaritmo

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)

Series temporales. 1. Introducción. 2. Análisis de la serie. 3. Modelos ARMA y ARIMA. 4. Predicción. Est.Ind. 08/09 - fjnm 1

SERIE TEMPORAL TASA PASIVA REFERENCIAL ECUADOR MAT. GEOVANNY TOALOMBO Agosto 2006

5. Estimación del Modelo y Resultados

METODOLOGÍA DE PROYECCIONES A CORTO PLAZO DE LLEGADA DE TURISTAS PARA EL AÑO 2017 Box and Jenkins

Se trata de: Explicar el comportamiento de una variable dependiente ( Y ) en función de otras variables ( i ) 2 Investigar si las variables están asoc

Modelos de Calibración

REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE

Información sobre Gastos de Consumo Personal y Producto Interno Bruto ( ) en miles de millones de dólares de 1992.

Part III. Modelos Box-Jenkins. Series de Tiempo. Germán Aneiros Pérez. Introducción. Procesos ARMA: Procesos ARIMA:

Econometría II Grado en finanzas y contabilidad

Introducción a la Econometría

Regresión Lineal Múltiple. Dr. Víctor Aguirre Torres, ITAM. Guión 12.

Regresión ponderada y falta de ajuste

TALLER DE INTRODUCCIÓN A LOS NEGOCIOS

EJC 22: METODOLOGÍA BOX JENKINS

Pronóstico. Pronósticos. Factores Controlables. Porqué? Objetivo. Factores Incontrolables

Multicolinealidad Introducción. Uno de los supuestos básicos del modelo lineal general. y = Xβ + u

Capítulo 8. Selección de variables Introducción

ECONOMETRIA ORDEN DE INTEGRACIÓN N Y RAÍCES UNITARIAS. Mtro. Horacio Catalán Alonso

Econometría de series de tiempo aplicada a macroeconomía y finanzas

Predicción con modelos ARIMA

Para hacer predicciones de una serie temporal se debe estimar la tendencia por el método de los

Regresión lineal. Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística

Diplomado en Econometría Coordinadora académica: M.F. Esperanza Sainz López

Augmented Dickey-Fuller test statistic (Ho=Raíz Unitaria) Tendencia e Intercepto. Intercepto Diagrama 1. Diagrama 2. Tendencia(0.

Sobre el Pronóstico del Precio de la Energía en Bolsa. Una comparación entre ARX-NN y procesos ARMAX

Hoja de ejercicios 4 Econometría II Curso 2011/2012

Algoritmos Genéticos para la Construcción de Modelos Autorregresivos para Series de Tiempo y Funciones de Transferencia Discretas.

D to de Economía Aplicada Cuantitativa I Basilio Sanz Carnero

MODELO DE RESPUESTAS Objetivos 2, 3, 4, 5, 6, 7, Y 8.

Análisis de regresión y correlación lineal

Descomposición Factorial de la In ación en Perú

Práctica 4. Los datos para está práctica provienen de Brockwell and Davis, Introduction to time series and forecasting, Springer, 2001.

Determinantes de la Demanda de Especies Monetarias* US dólares en El Salvador

PRACTICAS SOBRE LA MODELIZACIÓN DE SERIES TEMPORALES MENSUALES CON LA METODOLOGÍA DE BOX-JENKINS

METODOS ESTADÍSTICOS

LA MODELACIÓN DEL PRECIO MENSUAL DE LA ELECTRICIDAD EN COLOMBIA: ELEMENTOS ECONOMÉTRICOS. Elkin Castaño V.

ANÁLISIS DE SERIES DE TIEMPO. Luis Ángel Patiño Jiménez Diego Fernando Silva Salcedo

Tema 5: Planteamiento de los modelos de series temporales. Coro Chasco Yrigoyen Universidad Autónoma de Madrid (UAM) Asignatura: Econometría II

DIPLOMADO EN MODELOS ECONOMÉTRICOS DINÁMICOS. Coordinador: M.F. Esperanza Sainz López

ANÁLISIS DE COMPONENTES PRINCIPALES

Nombre y Apellidos:... EXAMEN ECONOMETRÍA II (Enero 2010)

Simulación a Eventos Discretos. Clase 8: Análisis de resultados

Análisis y mejora del proceso de previsión de ventas de una empresa embotelladora de agua Página 1. Resumen

Programa abierto de. Complementación y ampliación de la currícula de la Maestría 2017 Maestría en Generación y Análisis de Información Estadística

Escuela de Economía Universidad de Carabobo Profesor: Exaú Navarro Pérez.

Diplomado en Modelos Econométricos Dinámicos Coordinadora académica: M.F. Esperanza Sainz López

ECONOMETRÍA II: ECONOMETRÍA DE SERIES TEMPORALES. Modelos ARMA

SOLUCION TALLER 1 SOLUCION PUNTO 1. - Función de producción cuadrática. Se espera que: >0 porque x2 es un insumo de producción

TRATAMIENTO DE DATOS CON MS EXCEL. Modulo 2

PROYECCIONES DEL TURISMO INTERNACIONAL

UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS NATURALES Y MUSEO CÁTEDRA DE ESTADÍSTICA CLASE ESPECIAL. Tema:

Modelos Arma y método Box & Jenkins

ANÁLISIS DE LAS SERIES DE TIEMPO - NIVEL II

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Modelado y simulación en Ingeniería Química. Manuel Rodríguez

Relación 3 de problemas

Método de cuadrados mínimos

Guía breve de análisis de series temporales unidimensionales con Gretl

Estadística II Ejercicios Tema 5

Análisis de coyuntura con series temporales. Metodología A. Espasa (dt 9003 BE)

INSTITUTO UNIVERSITARIO PUEBLA HOJA: 1 DE 5

Regresión múltiple. Demostraciones. Elisa Mª Molanes López

CURSO: ECONOMETRÍA Y ANÁLISIS DE POLÍTICAS FISCALES INSTRUCTOR: HORACIO CATALÁN ALONSO. Especificación de los modelos VAR

Regresión polinomial y factores

Metodología del ajuste estacional

Linear Regression and the Least-squares problem

Examen de Grado Sección de Econometría Agosto y se obtienen los siguientes resultados. Observe que parte de la información ha sido omitida.

Econometría 2. Modelos no estacionarios y contrastes de raíz unitaria = 0 8. (0 4) 1 +, (0 2 ), y valores críticos

Regresión Lineal Múltiple

Transcripción:

Teoría Básica de Series de Tiempo: Box - Jenkins Aplicación Hacia un Modelo Dinámico de Factores Pronósticos Intermedios Pronóstico del Precio de la Energía Validación de Modelos Metodologías de Pronóstico del Precio de la Energía Seminario DERIVEX Octubre 24 de 2012 Metodologías de Pronóstico del Precio de la Energía Quantil Matemáticas Aplicadas

Teoría Básica de Series de Tiempo: Box - Jenkins Aplicación Hacia un Modelo Dinámico de Factores Pronósticos Intermedios Pronóstico del Precio de la Energía Validación de Modelos Contenido 1 Teoría Básica de Series de Tiempo: Box - Jenkins 2 Aplicación 3 Hacia un Modelo Dinámico de Factores 4 Pronósticos Intermedios 5 Pronóstico del Precio de la Energía 6 Validación de Modelos Metodologías de Pronóstico del Precio de la Energía Quantil Matemáticas Aplicadas

Teoría Básica de Series de Tiempo: Box - Jenkins Esta metodología procura el mejor modelo ARIMA para una serie de tiempo por medio de los siguientes pasos 1 Verificar si la serie es estacionaria Graficar la serie Revisar el autocorrelograma, un autocorrelograma que decae lentamente se considera evidencia de falta de estacionariedad en la serie. Prueba de Dickey-Fuller Para solucionar la falta de estacionariedad se diferencia la serie. 2 Verificar si la serie tiene un componente estacional. La estacionalidad puede observarse como patrones que se repiten al graficar la serie. Las series con estacionalidad también presentan patrones en su autocorrelograma. Se soluciona aplicando diferencias estacionales y agregando términos AR y MA estacionales en el modelo. 3 Identificar el orden p del proceso autoregresivo La herramienta principal para este fin es la gráfica del autocorrelograma parcial. Un AR(1), tien un autocorrelograma que va decreciendo (exponencial u oscilando). Para un AR(p) su autocorrelograma parcial deja de ser significativo después del rezago p. 4 Identificar el orden de q del proceso MA Se utiliza el autocorrelograma (grafica la correlación entre las observaciones de un proceso en diferentes momentos del tiempo). En un MA(q), su autocorrelograma no presenta rezagos significativos después del q. 5 Después de modelar la serie al mirar el autocorrelograma de los residuos no se debe encontrar ningún rezago significativo.

Teoría Básica de Series de Tiempo: Box - Jenkins Aplicación Hacia un Modelo Dinámico de Factores Pronósticos Intermedios Pronóstico del Precio de la Energía Validación de Modelos Contenido 1 Teoría Básica de Series de Tiempo: Box - Jenkins 2 Aplicación 3 Hacia un Modelo Dinámico de Factores 4 Pronósticos Intermedios 5 Pronóstico del Precio de la Energía 6 Validación de Modelos Metodologías de Pronóstico del Precio de la Energía Quantil Matemáticas Aplicadas

Datos Se recolectó información con una periodicidad mensual (de acceso público) sobre: La demanda de energía Los caudales en energía de los ríos que aportan agua a algún embalse del SIN Nivel de embalses (reserva de energía) Precio de la energía La anomaĺıa en la temperatura en la región del niño 3.4 (5 N - 5 S, 120 W - 170 W) El índice de precios al productor 1 La información sobre la demanda, el nivel del embalse, y el precio de la energía se encuentran en el sistema NEON 2. La anomaĺıa en la región del niño 3.4 es publicada por The National Oceanic and Atmospheric Administration (NOAA) 3. 1 Fuente Banco de la República 2 http://sv04.xm.com.co/neonweb/ 3 ftp://ftp.cpc.ncep.noaa.gov/wd52dg/data/indices/sstoi.indices

Precio de la Energía La serie del precio de la energía carece de estacionaridad. Al realizar un test se comprueba que la serie tiene una raíz unitaria. Se trabaja con la diferencia logarítmica de la serie. Las gráficas corresponden al precio de la energía en Kwh y a su diferencia logarítmica. Precio promedio en bolsa Diferencia logarítmica del Precio promedio en bolsa pesos corrientes 0 50 100 150 200 1.0 0.5 0.0 0.5 1.0 1.5 1995 07 31 2001 12 23 2008 05 18 1995 07 31 2001 12 23 2008 05 18 Fecha Fecha En todo el análisis que sigue se trabaja con el precio de la energía deflactado por el IPP.

Teoría Básica de Series de Tiempo: Box - Jenkins Aplicación Hacia un Modelo Dinámico de Factores Pronósticos Intermedios Pronóstico del Precio de la Energía Validación de Modelos Contenido 1 Teoría Básica de Series de Tiempo: Box - Jenkins 2 Aplicación 3 Hacia un Modelo Dinámico de Factores 4 Pronósticos Intermedios 5 Pronóstico del Precio de la Energía 6 Validación de Modelos Metodologías de Pronóstico del Precio de la Energía Quantil Matemáticas Aplicadas

Hacia un Modelo Dinámico de Factores El precio de la energía se modelará a partir de modelos lineales que tienen como variables independientes La anomaĺıa El nivel del embalse El caudal en los ríos La demanda de energía Rezagos del precio de la energía La estrategia para generar el modelo consistirá en: Generar pronósticos independientes para las variables: anomaĺıa, ríos, demanda y embalse. A partir de estos pronósticos generados (llamada pronósticos intermedios) se alimentará el modelo del precio de la energía. El precio de la energía se pronosticará recursivamente apoyándose en los pronósticos intermedios.

Teoría Básica de Series de Tiempo: Box - Jenkins Aplicación Hacia un Modelo Dinámico de Factores Pronósticos Intermedios Pronóstico del Precio de la Energía Validación de Modelos Contenido 1 Teoría Básica de Series de Tiempo: Box - Jenkins 2 Aplicación 3 Hacia un Modelo Dinámico de Factores 4 Pronósticos Intermedios 5 Pronóstico del Precio de la Energía 6 Validación de Modelos Metodologías de Pronóstico del Precio de la Energía Quantil Matemáticas Aplicadas

Modelos SARIMA Para cada una de las series se calculó un modelo SARIMA (p,d,q,p,d,q). Para determinar el orden de los modelos se utilizaron los auto-correlogramas y los auto-correlogramas parciales que ayudan a dictaminar el orden auto-regresivo y de media móvil de los modelos. Los modelos SARIMA se usaron para modelar el nivel del embalse, el caudal en los ríos, la demanda de energía y la parte tendencial de la anomaĺıa.

4 Demanda del SIN, la cual se calcula con base en la generacion neta de las plantas e incluye: hidraulicas, termicas, plantas menores, cogeneradores, demanda no atendida, limitacion del suministro e importaciones. Pronóstico de la Demanda de Energía Variable: Demanda del SIN en Neon 4 Demanda de energia Primeras Diferencias en la Demanda KW/h 3.0e+09 4.0e+09 5.0e+09 2e+08 2e+08 1991 01 31 2003 08 19 1991 01 31 2003 08 19 Fecha Fecha 2e+08 2e+08 6e+08 Diferencia Estacional de la Demanda 1992 01 31 2004 01 12 Fecha Primeras Diferencias de la Diferencia Estacional de la Demanda 4e+08 0e+00 4e+08 1992 01 31 2004 01 12 Fecha

Pronóstico de la Demanda de Energía Modelo Escogido: SARIMA(0, 1, 7) (0, 1, 1) 12 Autocorrelogramas de la Demanda de Energía ACF 0.5 0.0 0.5 1.0 0 1 2 3 4 LAG PACF 0.5 0.0 0.5 1.0 0 1 2 3 4 LAG

Pronóstico de la Demanda de Energía Modelo Escogido: SARIMA(0, 1, 7) (0, 1, 1) 12 Pronóstico Demanda de Energía Fecha KW/h 2004 2006 2008 2010 2012 2014 2016 4.0e+09 4.5e+09 5.0e+09 5.5e+09 6.0e+09

Pronóstico de la Variable Ríos Variables: Aportes hídricos (Energía) en NEON. 5 Caudales en Energía de los Rios Logarítmo de Ríos kwh 2e+09 6e+09 1e+10 21.0 21.5 22.0 22.5 23.0 1998 06 30 2006 08 06 1998 06 30 2006 08 06 Fecha Fecha Primeras Diferencias Estacionales de log(rios) Primeras Diferencias del las Diferencias Estacionales de log(rios) 1.0 0.5 0.0 0.5 1.0 0.6 0.2 0.2 0.6 1998 06 30 2006 08 06 1998 06 30 2006 08 06 Fecha Fecha 5 Caudales en energia de los rios que aportan agua a algun embalse del SIN

Pronóstico de la Variable Ríos Modelo Escogido: SARIMA(0, 1, 3) (0, 1, 1) 12 Autocorrelogramas de Ríos ACF 0.4 0.0 0.4 0.8 0 1 2 3 4 LAG PACF 0.4 0.0 0.4 0.8 0 1 2 3 4 LAG

Pronóstico de la Variable Ríos Modelo Escogido: SARIMA(0, 1, 3) (0, 1, 1) 12 Pronóstico nivel de Ríos Fecha KW/h 2004 2006 2008 2010 2012 2014 2016 4.0e+09 4.5e+09 5.0e+09 5.5e+09

Pronóstico del Nivel del Embalse Variables: Volumen Embalse (Energía) en NEON. 6 Nivel del embalse Primeras Diferencias del Embalse MW/h 6.0e+09 1.0e+10 1.4e+10 2e+09 0e+00 2e+09 1995 01 31 2005 03 25 1995 01 31 2005 03 25 Fecha Fecha Diferencia Estacional del Embalse Primeras Diferencias de la Diferencia Estacional del Embalse 4e+09 0e+00 4e+09 1996 01 31 2005 08 18 2e+09 0e+00 2e+09 1996 02 29 2005 08 30 Fecha Fecha 6 Es la reserva de energia de un embalse de acuerdo con la cantidad de agua almacenada en el mismo

Pronóstico del Nivel del Embalse Modelo Escogido: SARIMA(9, 1, 2) (0, 1, 1) 12 Autocorrelogramas de Embalse ACF 0.5 0.0 0.5 1.0 0 1 2 3 4 LAG PACF 0.5 0.0 0.5 1.0 0 1 2 3 4 LAG

Pronóstico del Nivel del Embalse Modelo Escogido: SARIMA(9, 1, 2) (0, 1, 1) 12 Pronostico nivel del embalse KW/h 8.0e+09 1.0e+10 1.2e+10 1.4e+10 1.6e+10 1.8e+10 2004 2006 2008 2010 2012 2014 2016 Fecha

Pronóstico de la Anomaĺıa La Anomaĺıa es una serie que presenta un comportamiento bastante estacional y complejo, ampliamente documentado en la literatura especializada. En lugar de medir la temperatura de la superficie del mar, mide las anomaĺıas en la temperatura de la superficie marítima las cuales están asociadas con los fenómenos del Niño y la Niña 7. Para modelar su comportamiento el análisis se dividió en tres partes: Se filtró la serie con una media móvil para eliminar parte de la estacionalidad. Para terminar de eliminar el componente estacional de la serie se le aplicó una descomposción espectral La parte no estacional de la serie se modelo por medio de un modelo ARIMA 7 Una anomaĺıa mayor a uno se asocia con el fenómeno del Niño. Una anomaĺıa menor a menos uno se asocia con el fenómeno de la Niña.

Media Móvil de la Anomaĺıa Anomalia en la region del niño 3.4 Media Móvil de la Anomalia C 2 1 0 1 2 3 C 2 1 0 1 2 1950 03 31 1962 08 06 1974 12 12 1987 04 19 1999 08 25 2011 12 31 1950 03 31 1962 08 06 1974 12 12 1987 04 19 1999 08 25 2011 12 31 año año

Descomposición Espectral Shunway & StufferTime Series Analysis and Its Applications With R Examples.Springer. 2006 x La idea detrás de esta técnica es descomponer una serie en una sumatoria de términos sinusoidales: x t = q U k1 cos(2πω k t) + U k2 sin(2πω k t) k=1 2*cos(2*pi*t*6/100) + 3*sin(2*pi*t*6/100) 4*cos(2*pi*t*10/100) + 5*sin(2*pi*t*10/100) x1 15 5 0 5 10 15 x2 15 5 0 5 10 15 0 20 40 60 80 100 Time 0 20 40 60 80 100 Time 6*cos(2*pi*t*40/100) + 7*sin(2*pi*t*40/100) suma x3 15 5 0 5 10 15 15 5 0 5 10 15 0 20 40 60 80 100 Time 0 20 40 60 80 100 Time

Descomposición Espectral Shunway & StufferTime Series Analysis and Its Applications With R Examples.Springer. 2006 Para esto se usa el periodograma: P(j/n) = ( 2 n n x t cos(2πtj/n)) 2 + ( 2 n t=1 n x t sin(2πtj/n)) 2 t=1 La idea detrás del periodograma es correr una regresión de x t con respecto a los sinusoides variando las frecuencias fundamentales j/n Esto se hace usando la Transformación Rápida de Fourier

Descomposición Espectral Sugiere los componentes: 6, 10,,12 13, 14, 16, 17, 18, 22, 25, 26 y 29 Espectograma P[1:51] 0.00 0.02 0.04 0.06 0.08 0.10 0.12 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 frecuencia

Descomposición Espectral Media Movil de la Anomalia y su Descomposición Espectral C 2 1 0 1 2 1950 1960 1970 1980 1990 2000 2010 Año

Pronóstico de la Anomaĺıa Esto sugiere que la serie de la anomalia se puede descomponer en funciones sinusoidales que tienen las frecuencias indicadas en el espectograma. Esta función sinusoidal se estima y se utiliza para filtrar (linealmente) la serie original de la Anomalia. Por lo tanto la serie que se estima con el modelo Arima es: y t = MA(Anomalia) DescEspectral(MA(Anomalia))

Pronóstico de la Anomaĺıa Sugiere un ARIMA(4,0,0) Series: y ACF 0.5 0.0 0.5 1.0 0 1 2 3 4 LAG PACF 0.5 0.0 0.5 1.0 0 1 2 3 4 LAG

Pronóstico de la Anomaĺıa El pronóstico final se calcula como Anomalia F = ARIMA Anomalia F + Seasonal Anomalia F Anomalia en la region del niño 3.4 C 2 1 0 1 2 3 1950 03 31 1976 06 24 2002 09 18 Fecha

Teoría Básica de Series de Tiempo: Box - Jenkins Aplicación Hacia un Modelo Dinámico de Factores Pronósticos Intermedios Pronóstico del Precio de la Energía Validación de Modelos Contenido 1 Teoría Básica de Series de Tiempo: Box - Jenkins 2 Aplicación 3 Hacia un Modelo Dinámico de Factores 4 Pronósticos Intermedios 5 Pronóstico del Precio de la Energía 6 Validación de Modelos Metodologías de Pronóstico del Precio de la Energía Quantil Matemáticas Aplicadas

Pronóstico del Precio de la Energía Se utilizaron tres modelos combinando técnicas de backward selection y componentes principales: 1 Modelos de regresión lineal. 2 Modelo de factores. 3 Combinación de pronósticos. Este tipo de modelos permite reducir en gran medida la dimensionalidad pues se usan las 5 variables descritas en la sección Base de Datos y diferentes rezagos de cada variable.

Backward Selection La técnica de backward selection es usada en estadística para reducir la dimensionalidad de un modelo. Ésta es una de las modalidades de stepwise regressions: Se empieza con todas las variables que se cree podrían incluirse en el modelo. En cada paso de la selección se elimina la variable que aporte menos a la explicación de la variable objetivo. En este caso se eliminará la variable que tenga el mayor p-valor correspondiente a la prueba t de significancia. La selección elimina una sola variable por paso hasta que todas las variables que se incluyan en el modelo sean significativas a un nivel predeterminado.

Modelo Backward Selection Regresión Lineal Se toman como variables predictoras la anomaĺıa, el nivel de los embalses y la demanda, doce rezagos de cada una de estas tres variables y doce rezagos del precio de la energía en bolsa (X t). Se pronostica el precio de la energía en bolsa usando backward selection con p-valores 0.01 y 0.05 para disminuir el número de variables predictoras. Y 1 t = β 1 X 1 t + µ1 t (1) Y 5 t = β 5 X 5 t + µ5 t (2) Los superindices 1 y 5 hacen referencia al p-valor usado en el backward selection X 1 y X 5 son las variables explicativas que quedan después de hacer backward selection a todas las variables contenidas en X. Los pronósticos obtenidos con los dos modelos estimados anteriormente se promedian y este es el pronóstico final: Ŷ t = 1 2 (Ŷ t 1 + Ŷ t 5 ) + ɛt. (3)

Modelo Backward Selection Regresión Lineal Tomando como última fecha observada diciembre 2011, el pronóstico obtenido 48 meses hacia adelante por medio de este modelo sería: Precio promedio en bolsa deflactado Precio promedio en bolsa Precio deflactado 0.0 0.5 1.0 1.5 Pesos constantes 0 50 100 150 200 250 300 2000 2005 2010 2015 Año 2000 2005 2010 2015 Año

Bootstrapping para la obtención de Intervalos de Confianza Se tiene una serie de observaciones y 1,..., y T. Para obtener un intervalo de confianza por medio de bootstrapping se sigue el siguiente procedimiento 8 : 1 Sean û t t = 1,..., T los residuos de estimación del modelo. 2 Se calculan los residuos centrados û 1 ū,..., û T ū y se obtienen los residuos de bootstrapping u1,..., u T tomando una muestra aleatoria con remplazo de los residuos centrados. 3 Se obtiene la serie de tiempo de bootstrapping recursivamente: y t = ˆv + Â 1 y t 1 +... + Â p y t p + u t donde se toman los mismo valores iniciales para la serie de bootstrapping, (y p+1,..., y 0 ) = (y p+1,..., y 0 ) 4 Basándose en la serie de bootstrapping se vuelven a estimar los parametros A 1,..., A p. 5 Se generan pronósticos de yt +1,..., y T +h a partir del modelo estimado en el paso anterior. 6 El procedimiento de los pasos 3 a 5 se repite n veces y se obtiene así una distribución de los pronósticos a partir de la cual se puede calcular el intervalo de confianza. 8 Lüthepohl, H. New Introduction to Multiple Time Series Analysis. Springer. 2005.

Intervalos de Confianza: Modelo Backward Selection Regresión Lineal La obtención del intervalo de confianza del pronóstico se hizo por medio de bootstrapping. Se toma una muestra aleatoria de los errores centrados del modelo, ɛ t. Los errores de bootstrapping se denominarán ɛ t. Se construye el precio de la energía de bootstrapping por medio de los dos modelos de backward selection con p-valores 0.01 y 0.05 usando los errores de bootstrapping. Se comienza con las doce primeras observaciones del precio de la energía, Y 1,..., Y 12. a partir de éstas se van estimando recursivamente los demás valores de Y t por medio de las ecuaciones: Ŷ t Y t 1 1 = β X 1 t Y t 5 5 = β X 5 t = 1/2(Ŷ t 1 + Ŷ t 5 ) + ɛ t. Basado en la serie del precio de la energía de bootstrapping, Yt, se estiman de nuevo los modelos de backward selection con p-valores 0.01 y 0.05 y se pronostica a partir de estos modelos Yt. Este procedimiento se lleva acabo N veces, donde N es un número grande. A partir de este procedimiento se obtienen los intervalos de confianza del pronóstico.

Intervalos de Confianza: Modelo Backward Selection Regresión Lineal

Componentes Principales El análisis de Componentes Principales (PC) consiste en llevar a cabo una transformación ortogonal para convertir las observaciones de un grupo de variables, posiblemente correlacionadas, en un grupo de variables independientes a las cuales se les llama componentes principales. La transformación se define de manera que los componentes principales queden ordenados de manera que del primero al último cada componente explique la mayor varianza de los datos originales.

Modelo Dinámico de Factores La metodología usada se basa en el trabajo de Stock y Watson (2002) 9 El objetivo es utlizar método de componentes principales para mitigar el problema de dimensionalidad utilizando la covariabilidad de la serie en términos de un número menor de factores no observados. El pronóstico se lleva acabo estimando primero los factores a partir de las variables usadas para predecir la variable independiente. Posteriormente, se estima por medio de una regresión lineal la relación entre los factores y la variable independiente. 9 Forecasting Using Principal Components from a Large Number of Predictors. American Statistical Association. Deccember 2002, Vol 97, No. 460

Modelo Dinámico de Factores Supóngase que Y t es la serie a predecir y sea X t un objeto de N series de tiempo las cuales se cree predicen Y t. El modelo para predecir Y t usando factores calculados por medio de componentes principales asume que (X t, Y t) se puede representar de la siguiente manera: X t = ΛF t + e t (4) Y t+h = β F F t + β w w t + ɛ t+h (5) donde Λ es una matriz β F y β w son vectores e t es un vector de N 1 errores indiosincráticos w es un vector de m rezagos de Y t h es el horizonte del pronóstico ɛ t+h es el error del pronóstico.

Modelo Dinámico de Factores Para estimar los factores por medio de componentes principales se considera la función objetivo: V (F ) = (NT ) 1 (X it Λ i F t ) 2 (6) donde Λ i es la i-ésima fila de Λ. Este es elproblema clásico de componentes principales. Se soluciona tomando Λ como los eigenvectores de X X correspondientes a los eigenvalores más grandes. El estimador de F por componentes principales correspondiente sería, F = X Λ/N. Cuando N > T se puede estimar este problema de una manera equivalente tomando F como los eigenvectores con eigenvalores más grandes de XX.

Modelo Dinámico de Factores En este modelo se toman como variables predictoras la anomaĺıa y 24 rezagos de ésta, El nivel de los embalses Los caudales en energía de los ríos que aportan agua a algún embalse del SIN La demanda Las últimas tres con tres rezagos cada una y doce rezagos del precio de la energía en bolsa Se llamará X t el conjunto de todas las variables predictoras.

Modelo Dinámico de Factores Se calculan los 10 primeros componentes principales de todas las variables en X t menos los rezagos del precio de la energía; estos se llamarán F t. Los 10 componentes principales y los 12 rezagos del precio se usan como variables independientes en el modelo lineal para el precio de la energía. La dimensionalidad del modelo se reduce por medio de backward selection con un p-valor de 0.05.

Modelo Dinámico de Factores Siendo Y t el precio de la energía en bolsa este modelo es el modelo de Stock y Watson (2002) Se usa adicionalmente backward selection para dismnuir la dimensionalidad del modelo. Las ecuaciones del modelo son las siguientes: X = ΛF t + e t (7) Y t+h = β F Ft + β w w t + ɛ t+h (8) En la ecuación 7 tan solo se está llevando acabo la estimación de los factores por medio de componentes principales. En la ecuación 8 se lleva acabo el backward selection a los primeros 10 componentes principales F t y a los doce rezagos del precio de la energía en bolsa w t Siendo F t y w t las variables que quedan de F t y w t después de aplicar backward selection.

Modelo Dinámico de Factores Tomando como última fecha observada diciembre 2011, el pronóstico obtenido 48 meses hacia adelante por medio de este modelo sería: Precio promedio en bolsa deflactado Precio promedio en bolsa Precio deflactado 0.4 0.6 0.8 1.0 Pesos constantes 50 100 150 200 2000 2005 2010 2015 Año 2000 2005 2010 2015 Año

Combinación Óptima de Modelos Este modelo es una combinación del Modelo Dinámico de Factores con la parte del modelo de Backward Selection Regresión Lineal que hace el backward selection con p-valor 0.01. Una vez se tienen los respectivos valores pronósticados por estos dos modelos para Y t, Ŷ p1 t y Ŷ t DFM respectivamente, se combinan de manera óptima. Para combinar los modelos se quiere encontrar el γ óptimo tal que: Y t = γy p1 t + (1 γ)yt DFM (9) con t = 1,..., T. Para esto se transforma la ecuación 9 restando Yt DFM y se usan los valores pronósticados para Y p1 t y Yt DFM obteniendo: Y t Ŷ DFM t a ambos lados = γ(ŷ p1 t Ŷ t DFM ) (10) Así se obtiene el valor estimado para γ por medio de una regresión. Una vez estimado γ se pueden combinar los pronósticos Ŷ p1 t y Ŷ t DFM, t = (T + 1),..., (T + h) siendo h el horizonte del pronóstico, usando la ecuación 9.

Combinación Óptima de Modelos Tomando como última fecha observada diciembre 2011, el pronóstico obtenido 48 meses hacia adelante por medio de este modelo sería: Precio promedio en bolsa deflactado Precio promedio en bolsa Precio deflactado 0.4 0.6 0.8 1.0 Pesos constantes 50 100 150 200 2000 2005 2010 2015 Año 2000 2005 2010 2015 Año

Intervalos de Confianza: Combinación Óptima de Modelos Aplicando la técninca de bootstrapping los intervalos de confianza obtenidos para el pronóstico son: Figura: Pronostico del precio de la energía en Kw/h

Teoría Básica de Series de Tiempo: Box - Jenkins Aplicación Hacia un Modelo Dinámico de Factores Pronósticos Intermedios Pronóstico del Precio de la Energía Validación de Modelos Contenido 1 Teoría Básica de Series de Tiempo: Box - Jenkins 2 Aplicación 3 Hacia un Modelo Dinámico de Factores 4 Pronósticos Intermedios 5 Pronóstico del Precio de la Energía 6 Validación de Modelos Metodologías de Pronóstico del Precio de la Energía Quantil Matemáticas Aplicadas

Validación de los Modelos de Pronóstico Los criterios de comparación usados son: Root Mean Square Error (RMSE) Root Mean Square Percentage Error (RMSPE) Mean Absolute Error (MAE) Mean Absolute Percentage Error (MAPE) Mean Percentage Error (MPE). Estos criterios se calculan de la siguiente manera: RMSE = 1 N RMSPE = 1 N t MAE = 1 N t MAPE = 1 N t MPE = 1 N t t (Y t Ŷt)2 (11) (Y t Ŷt)2 Y t (12) Y t Ŷt (13) Y t Ŷt Y t (14) Y t Ŷt Y t (15)

RMSE y RMSPE El RMSE es una medida usada frecuentemente para medir la precisión de un modelo, compara las diferencias entre lo valores estimados y los valores reales. Al no ser una medida relativa, sino absoluta, no permite comparar entre modelos para diferentes series. RMSE = 1 (Y t N Ŷt) 2 t El RMSPE es la versión relativa del RMSE donde la diferencia entre el valor estimado y el real se divide por el valor real. RMSPE = 1 (Y t Ŷt) 2 N t Y t

MAE y MAPE El MAE es el promedio de las desviaciones absolutas entre el valor predecido y el valor real, es una medida de que tan cerca estan los pronósticos de los valores reales Al no ser una medida relativa, sino absoluta, no permite comparar entre modelos para diferentes series. MAE = 1 Y t N Ŷt t Su versión relativa es el MAPE, donde las desviaciones entre el valor estimado y el real son divididas por el valor real presentando asi la bondad de ajuste del modelo como un porcentage. MAPE = 1 N t Y t Ŷt Y t

MPE MPE = 1 N t Y t Ŷt Y t Finalmente, el MPE al igual que es MAPE es un porcentage de la desviación de los valores estimados frente a los reales. En el caso del MPE al no tomarse valor absoluto al sumar las desviaciones relativas éste representa el sesgo del modelo. Si el modelo se desvía siempre en la misma dirección, por encima o por debajo de los valores reales, estos errores se van a ir sumando. Mientras que si lo hace igual cantidad de veces en la misma magnitud en ambas direcciones el MPE debería ser aproximadamente cero.