Introducción al Análisis de Series Temporales

Documentos relacionados
Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

SERIES TEMPORALES. Isabel Molina Peralta. Departamento de Estadística Universidad Carlos III de Madrid. Roland Fried

Estadística Industrial. Universidad Carlos III de Madrid Series temporales Práctica 5

Modelos de predicción. Presentación de la asignatura

Introducción a las series temporales

Estadística II Tema 4. Regresión lineal simple. Curso 2010/11

Econometría Aplicada

Segunda práctica de REGRESIÓN.

ANALISIS DE LA ESTATURA

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

CAPITULO 4 4. SOFTWARE UTILIZADO PARA EL ANÁLISIS DE SERIES DE TIEMPO. En el presente capitulo se realizara una descripción del tipo de software

Ejemplos de estudios de series de tiempo

Pronósticos Automáticos

MÉTODOS DE PRONÓSTICO TEMA 1: ANÁLISIS DE SERIES DE TIEMPO Y ELABORACIÓN DE PRONÓSTICOS

Procesos Integrados. Si (Y t ) no es estacionario pero la serie (Z t ) de las primeras diferencias. Z t = Y t = Y t Y t 1,

T R A B A J O D E I N V E S T I G A C I O N D E O P E R A C I O N E S I

Un modelo para representar una relación aproximadamente

Intervalos de confianza con STATGRAPHICS

Práctica 3: Regresión simple con R

Teoría de la decisión

Análisis de Series de Tiempo. Universidad Nacional Autónoma de México. M. en C. César Almenara Martínez. 10 de Noviembre de 2010.

Aplicación del Análisis de la Varianza para estudiar el tiempo de acceso en las aulas informáticas

peso edad grasas Regresión lineal simple Los datos

Introducción al Tema 3. Tema 3. Correlación y regresión Covarianza y correlación. Propiedades y relación con el diagrama de dispersión. Regresión.

Motivación. Motivación PRONOSTICOS DE DEMANDA

Modelos de Series de Tiempo

Tercera práctica de REGRESIÓN.

Los datos siguientes contienen indicadores demográficos y criminales sobre 47

Tema 4. Regresión lineal simple

INSTITUTO UNIVERSITARIO PUEBLA HOJA: 1 DE 5

ESTADÍSTICA. Tema 4 Regresión lineal simple

Ajuste de Regresión Lineal Simple

Los datos son de la forma (y t, t) donde: Variable endógena o dependiente Variable exógena o independiente. y t

El ejemplo que utilizaremos en este artículo ha empleado los siguientes precios:

Números. Índice y otros conceptos de series de tiempo. Ref: algunas secciones tomadas de los apuntes del Prof. JOSÉ MIGUEL RODRÍGUEZ MORALES

Métodos de Suavizamiento (con Eviews y Stata)

ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL

Modelos Lineales. Regresión Lineal Múltiple. Práctica 5

Regresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A

Precio del alquiler de pisos durante una serie de meses. Evolución del índice del precio del trigo con mediciones anuales.

SERIES TEMPORALES. Autores: Manuel Terrádez Ángel A. Juan Series Temporales. Análisis de la tendencia

Estructura de este tema. Tema 4 Regresión lineal simple. Ejemplo: consumo de vino y dolencias cardíacas. Frecuencias

TEMA 3 REGRESIÓN Y CORRELACIÓN

CAPÍTULO IV. DESARROLLO DE LA INVESTIGACIÓN. presente capítulo. A continuación se procederá a escribir la metodología y a describir el

CALIFICACION: - P C: precio medio de los productos sustitutivos existentes en el mercado en euros.

7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE

Abstract. Keywords: Econometric Models Human Rights Basic Areas of Law JEL: C5, R15, K1

Procesos autorregresivos

LA FUNCIÓN DE DISTRIBUCIÓN DE PROBABILIDAD DE LA LLUVIA ANUAL CUANDO OCURRE UN CAMBIO CLIMÁTICO

Se permite un folio escrito por las dos caras. Cada problema se realiza en hojas diferentes y se entregan por separado.

Estadística; 3º CC. AA. Examen final, 23 de enero de 2009

Multiple Linear Regression

Análisis de Series de Tiempo

GEOESTADÍSTICA. Preparado por: Dr. Manuel Fuenzalida-Díaz / Departamento de Geografía, Universidad Alberto Hurtado.

Análisis de los resultados de la evaluación del aprendizaje de procedimientos de análisis descriptivo en ingeniería informática

Tema 2: Análisis de datos bivariantes

Tema 2: Estadística Bivariante Unidad 1: Correlación y Regresión

ANÁLISIS DE VARIACIÓN ESTACIONAL EN SERIES TEMPORALES

Análisis de series temporales

SERIES DE TIEMPO. La aplicación de estas técnicas requieren de trabajo computacional que debe ser complementado en la ejercitación de este curso.

Capítulo 2 Modelos de Pronósticos

Proyecciones del PBI para el 2003.

CLASE 0- MÉTODOS DE ALISADO EXPONENCIAL

2.3.1 Métodos cuantitativos para los pronósticos. MÉTODOS CUANTITATIVOS

ANÁLISIS EN EL DOMINIO DEL TIEMPO

SERIES TEMPORALES. Notación: Dada la magnitud numérica (variable) Y designaremos las observaciones mediante alguna de las dos siguientes notaciones:

ANÁLISIS DE REGRESIÓN

Séptima Entrega. New Workfile Daily (5 days week) 1:1:1991 a 2:16:1998. File Import Read Text Lotus Excel

Predicción económica y empresarial. Modelos para predicciones incondicionales deterministas

Parte de las notas tomadas de: Prof. Edgar Acuña UNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYAGUEZ

EJEMPLOS DE PRONÓSTICOS

Se quiere medir la dispersión de una muestra a través de su localización. En primer lugar, definimos una medida relacionada con la media.

Universidad Nacional Autónoma de México Laboratorio de Cómputo Científico, F. C.

Tema 8: Regresión y Correlación

Estadística. Convocatoria ordinaria. 23 de mayo de Nombre Grupo.. Titulación.Número de Examen..

Series temporales. Series temporales

Tema 1: Estadística descriptiva. Probabilidad y Estadística (Ing. Informática). Tema 1: Estadística descriptiva 1

REGRESIÓN LINEAL SIMPLE

Econometría II Grado en finanzas y contabilidad

Econometría II Grado en finanzas y contabilidad

ESTADISTICA PARA LA ADMINISTRACION

Capitulo. Describir la relación entre dos variables Pearson Prentice Hall. All rights reserved

Regresión: implica la obtención de una ecuación mediante la que podamos estimar el valor medio de una variable.

TEMA 4 CUESTIONARIO DE AUTOEVALUACIÓN

CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES

PP: gran cantidad de faltantes. Mejor solución no siempre es la misma: 1) Trabajar con datos incompletos (ojo con no sesgar la serie!!

MODELO DE RESPUESTAS Objetivos 2, 3, 4, 5, 6, 7, Y 8.

Estacionalidad Determinista Segmentada, Efecto Calendario, Efecto Semana Santa y predicción de modelos con Raíces Unitarias

Econometría II Grado en finanzas y contabilidad

ECONOMETRÍA II PRÁCTICAS DE ORDENADOR. Práctica 3

UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS NATURALES Y MUSEO CÁTEDRA DE ESTADÍSTICA CLASE ESPECIAL. Tema:

Ajuste por mínimos cuadrados

Universidad Técnica de Babahoyo CORRELACIÓN DE VARIABLES Y REGRESIÓN LINEAL

ANÁLISIS DE SERIES TEMPORALES CON SPSS

Práctica 4. Los datos para está práctica provienen de Brockwell and Davis, Introduction to time series and forecasting, Springer, 2001.

INTRODUCCION AL ECONOMETRIC VIEWS. Aquí se introduce la frecuencia y las fechas de comienzo y final de los datos.

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

LA ESTACIONALIDAD DE LA INFLACION EN BOLIVIA

Selección de distribuciones de probabilidad

Cointegración El caso bivariado

Transcripción:

Cálculo de Tendencias y Estacionalidad Los contenidos a desarrollar en este tema son los siguientes: Gráficos temporales. Series estacionarias y no estacionarias. Descomposición de una serie: tendencia, estacionalidad y componente irregular. Predicción.

Cálculo de Tendencias y Estacionalidad Lecturas recomendadas: Peña, D. (2005) Análisis de series temporales, Alianza Editorial. Box, G.E.P., Jenkins,G.M. y Reinsel, G. (1994) Time Series Analysis: Forecasting and Control, Editorial Prentice-Hall. Brockwell, J.P. y Davis, R.A. (1996) Introduction to Time Series and Forecasting, Editorial Springer Verlag. Peña, D., Tiao, G.C. y Tsay, R.S. (2005) A Course in Time Series Analysis, Editorial John Wiley.

Introducción Definición 1. Una serie temporal es una sucesión de observaciones de una variable tomadas en varios instantes de tiempo. Nos interesa estudiar los cambios en esa variable con respeto al tiempo. Predecir sus valores futuros. Ejemplos de series temporales podemos encontrarlos en muchos campos de conocimiento: Economía: producto interior bruto anual, tasa de inflación, tasa de desempleo, etc. Demografía: nacimientos anuales, tasa de dependencia, etc. Meteorología: temperaturas máximas, medias o mínimas, precipitaciones diarias, etc. Medio ambiente: concentración media mensual de nitratos en agua, alcalinidad media anual del suelo, emisiones anuales de CO 2, etc.

Representación gráfica de una serie temporal A menudo, se representa la serie en un gráfico temporal, con el valor de la serie en el eje de ordenadas y los tiempos en el eje de abscisas. Ejemplo 1. El siguiente gráfico temporal muestra la media de los pluviómetros peninsulares (Fuente I.N.M.) para el período Octubre/1989 a Septiembre/2006. 150 Pluviometria (mm) 120 90 60 30 0 10/89 10/91 10/93 10/95 10/97 10/99 10/01 10/03 10/05 10/07

Ejemplos de gráfico temporal Rio Santa Cruz (Washigton, USA) Rio Santa Cruz (Washigton, USA) 7.2 24 ph del agua 7 6.8 6.6 Temperatura (Celsius) 20 16 12 8 4 6.4 1972 1976 1980 1984 1988 1992 1996 2000 2004 0 1972 1976 1980 1984 1988 1992 1996 2000 2004 Rio Santa Cruz (Washigton, USA) Rio Santa Cruz (Washigton, USA) 12.2 141 Oxigeno disuelto mg/lt 10.2 8.2 6.2 Conductancia microsiemes/cm 121 101 81 4.2 61 1972 1976 1980 1984 1988 1992 1996 2000 2004 1972 1976 1980 1984 1988 1992 1996 2000 2004

Otros tipos de gráficos temporales Gráficos por períodos de observación. Ejemplo 2. Distribución mensual de la precipitación media en España Tomado de www.hispagua.cedex.es.

Otros tipos de gráficos temporales Gráficos por períodos de observación plurianuales. Ejemplo 3. Reserva hidrológica peninsular. Tomado de www.mma.es.

Otros tipos de gráficos temporales Boxplot anual. Ejemplo 4. Alcalinidad total (mg/lt). Tomado de www.gemstat.org.

Otros tipos de gráficos temporales Boxplot por períodos de observación. Ejemplo 5. Concentración de sulfatos (mg/lt). Tomado de www.gemstat.org.

Clasificación de series temporales Definición 2. Una serie temporal es una sucesión de observaciones de una variable tomadas en varios instantes de tiempo. Estas observaciones provienen de una distribución que puede ser diferente en cada instante del tiempo. No somos capaces de tratar cualquier tipo de serie temporal, ya que en cada instante tenemos una variable con distinta distribución de la que sólo observamos un dato. Ignoramos mucho y tenemos poca información. Necesitamos imponer condiciones a la serie

Clasificación de series temporales Una serie es estacionaria si la media y la variabilidad se mantienen constantes a lo largo del tiempo. Una serie es no estacionaria si la media y/o la variabilidad cambian a lo largo del tiempo. Series no estacionarias pueden mostrar cambios de varianza. Series no estacionarias pueden mostrar una tendencia, es decir que la media crece o baja a lo largo del tiempo. Además, pueden presentar efectos estacionales, es decir que el comportamiento de la serie es parecido en ciertos tiempos periódicos en el tiempo.

Clasificación de series temporales - Series estacionarias Definición 3. Una serie temporal es estacionaria en sentido amplio si: E[X t ] = µ para todo t V ar(x t ) = σ 2 para todo t. Cov(X t, X t+k ) = γ k para todo t y k. El ejemplo más simple es el RUIDO BLANCO, cuando la media y la covarianza son siempre cero.

Clasificación de series temporales - Series estacionarias Por qué es bueno que las series sean estacionarias? Con series estacionarias podemos obtener predicciones fácilmente. Como la media es constante, podemos estimarla con todos los datos, y utilizar este valor para predecir una nueva observación. También se pueden obtener intervalos de predicción (confianza) para las predicciones asumiendo que X t sigue una distribución conocida, por ejemplo, normal.

Clasificación de series temporales - Ejemplos Serie estacionaria: Variaciones anuales de la media de los pluviómetros peninsulares para el período Octubre/1990 a Septiembre/2006. 130 90 Variación anual 50 10-30 -70-110 10/89 10/91 10/93 10/95 10/97 10/99 10/01 10/03 10/05 10/07

Clasificación de series temporales - Ejemplos Serie no estacionaria: Emisiones mundiales de CO 2. 7 Emisiones mundiales de CO 2 6 5 4 3 2 1 0 1950 1960 1970 1980 1990 2000 Tendencia

Clasificación de series temporales - Ejemplos Serie no estacionaria: Superficie de hielo en el Ártico. Cambios en la tendencia

Clasificación de series temporales - Ejemplos Serie no estacionaria: Precipitaciones medias (mm). 120 Coopermine (1933-1976) Precipitaciones medias (mm) 100 80 60 40 20 0 JAN 1942 OCT 1939 JUL 1937 APR 1935 JAN 1933 OCT 1975 JUL 1973 APR 1971 JAN 1969 OCT 1966 JUL 1964 APR 1962 JAN 1960 OCT 1957 JUL 1955 APR 1953 JAN 1951 OCT 1948 JUL 1946 APR 1944 Fuente de datos: P.C. Baracos, K.W. Hipel & A.I. McLeod (1981) Modeling hydrologic time series from the Arctic, Water Resources Bulletin, Vol. 17. Estacionalidad

Clasificación de series temporales - Ejemplos Serie no estacionaria: Agua embalsada y energía disponible (hm 3 ). 44 Años hidrológicos 2003/2004 a 2005/2006 40 Reserva total 36 32 28 24 20 1 27 53 79 105 131 157 Fuente de datos: Boletín hidrológico, Ministerio de Medio Ambiente. Tendencia + Estacionalidad

Clasificación de series temporales - Ejemplos Serie no estacionaria: Número mensual de pasajeros de avión, USA, Enero:1949 a Diciembre:1960 Time Series Plot for No. de pasajeros 750 No. de pasajeros 600 450 300 150 0 1/49 1/50 1/51 1/52 1/53 1/54 1/55 1/56 1/57 1/58 1/59 1/60 1/61 Tendencia, Heteroscedasticidad y Estacionalidad Fuente de datos: Box, G. & Jenkins, G. (1976) Time Series Analysis: Forecasting and Control.

Componentes de una serie temporal En muchos casos, se supone que la serie temporal es la suma de varias componentes: X t = T t + S t + I t Valor observado = Tendencia + Estacionalidad + Irregular Tendencia: comportamiento o movimiento suave de la serie a largo plazo. Estacionalidad: movimientos de oscilación dentro del año. Irregular: variaciones aleatorias alrededor de los componentes anteriores. En esos casos, es interesante obtener o aislar los distintos componentes.

Análisis de la tendencia En algunos casos, se puede suponer una relación determinista entre T t y t, por ejemplo una tendencia lineal T t = a + bt que se estima mediante el método de mínimos cuadrados. Ejemplo 6. 800 Linear trend = 87.6528 + 2.65718 t 200 Residual Plot for No. de pasajeros No. de pasajeros 600 400 200 Residual 150 100 50 0-50 0-100 1/49 1/50 1/51 1/52 1/53 1/54 1/55 1/56 1/57 1/58 1/59 1/60 1/61 1/49 1/50 1/51 1/52 1/53 1/54 1/55 1/56 1/57 1/58 1/59 1/60 1/61

Análisis de la tendencia - Ejemplo 6 Ejemplo 6. En primer lugar, eliminamos la heteroscedasticidad mediante una transformación logarítmica. 6.6 Log(No. de pasajeros) 6.2 5.8 5.4 5 4.6 1/49 1/50 1/51 1/52 1/53 1/54 1/55 1/56 1/57 1/58 1/59 1/60 1/61

Análisis de la tendencia - Ejemplo 6 Ejemplo 6. log(no. de pasajeros) 6.6 6.2 5.8 5.4 5 Sobre la serie transformada estimamos una tendencia lineal. Linear trend = 4.81367 + 0.0100484 t actua forec 95.0% 4.6 1/49 1/50 1/51 1/52 1/53 1/54 1/55 1/56 1/57 1/58 1/59 1/60 1/61 Se observa una clara tendencia creciente lineal, además de efectos estacionales.

Análisis de la tendencia - Ejemplo 6 Ejemplo 6. Obtenemos la serie de residuos, X t T t : 0.49 0.29 Residual 0.09-0.11-0.31 1/49 1/50 1/51 1/52 1/53 1/54 1/55 1/56 1/57 1/58 1/59 1/60 1/61 Se mantienen los efectos estacionales.

Análisis de la tendencia - Ejemplo 7 Ejemplo 7. Oxígeno disuelto (ml/lt). Rio Santa Cruz (Washington, USA). Linear trend = -24.9531 + 0.0168516 t Linear trend = -24.9531 + 0.0168516 t Oxigeno disuelto 12.2 10.2 8.2 6.2 3.9 actual forecast 1.9 95.0% limits Residual -0.1-2.1 4.2 1972 1976 1980 1984 1988 1992 1996 2000 2004-4.1 1972 1976 1980 1984 1988 1992 1996 2000 2004 Una tendencia determinista (lineal) no parece adecuada.

Tendencia evolutiva A menudo, la tendencia de la serie no sigue una recta y evoluciona a lo largo del tiempo. En ese caso, un método general de estimar T t es suponer que evoluciona lentamente en el tiempo, y que se puede aproximar con una función sencilla para intervalos cortos del tiempo. Ejemplo 8. consecutivos: Si una recta es una representación válida para tres periodos T t 1 = T t T T t = T t T t+1 = T t + T Si hacemos la media de las tres observaciones consecutivas, m t = x t 1+x t +x t+1 3, tendríamos que: m t = T t + I t 1 + I t + I t+1 3 es decir descubriríamos la tendencia subyacente.

Tendencia evolutiva Definición 4. serie como Para instante t, se define la media móvil de orden 3 de la m t = x t 1 + x t + x t+1. 3 Suponemos que la tendencia T t satisface T t = m t I t 1 + I t + I t+1. 3 Como la media del componente irregular es cero, podemos suponer que la media de los tres valores (I t 1, I t, I t+1 ) es pequeña, de esta manera m t recoge fundamentalmente la tendencia de la serie en el instante t. Es posible calcular medias móviles de ordenes más altos. Cuando crece el orden, el valor de m t cambia más suavemente.

Análisis de la tendencia - Ejemplo 7 Ejemplo 9. Smoothed Time Series Plot for Oxigeno disuelto Time Series Plot of Residuals for Oxigeno disuelto Oxigeno disuelto 12.2 10.2 8.2 6.2 2.6 data smooth 1.6 0.6-0.4 4.2 1972 1976 1980 1984 1988 1992 1996 2000 2004-1.4 1972 1976 1980 1984 1988 1992 1996 2000 2004 En los residuos no se observa una tendencia clara.

log(no. de pasajeros) Ejemplo 10. 6.6 6.2 5.8 5.4 5 Análisis de la tendencia - Ejemplo 6 Tendencia evolutiva en el número de pasajeros. Simple moving average of 3 terms log(no. de pasajeros) actual 6.6 forecast 6.2 95.0% limits 5.8 5.4 5 Simple moving average of 12 terms actual foreca 95.0% 4.6 1/49 1/50 1/51 1/52 1/53 1/54 1/55 1/56 1/57 1/58 1/59 1/60 1/61 4.6 1/49 1/50 1/51 1/52 1/53 1/54 1/55 1/56 1/57 1/58 1/59 1/60 1/61 Con medias móviles de ordenes altos, suavizamos los efectos estacionales.

Diferenciación de la serie Es un método más general que consiste en no hacer ninguna hipótesis sobre la forma de la tendencia a corto plazo y suponer simplemente que evoluciona lentamente en el tiempo. Asumimos que la tendencia en el instante t es muy próxima a la tendencia en el instante t 1, y construimos una nueva serie: y t = x t x t 1 que denominamos serie diferenciada. Diferenciar la serie equivale a suponer que la tendencia en t es el valor de serie en t 1: T t = x t 1.

Diferenciación de la serie - Ejemplo 6 Ejemplo 11. Obtener la serie diferenciada para los datos del Ejemplo 6. 0.27 0.17 0.07-0.03-0.13-0.23 1/49 1/50 1/51 1/52 1/53 1/54 1/55 1/56 1/57 1/58 1/59 1/60 1/61 La serie diferenciada no muestra una tendencia clara y mantiene los efectos estacionales.

Diferenciación de la serie - Ejemplo 7 Ejemplo 12. Obtener la serie diferenciada para los datos del Ejemplo 7. Residual Plot for Oxigeno disuelto 3.8 Random walk 1.8-0.2-2.2-4.2 1972 1976 1980 1984 1988 1992 1996 2000 2004 La serie diferenciada no muestra una tendencia clara.

Análisis de la estacionalidad Un método de estimar el efecto estacional (v.g., de cada mes) es considerar cómo varía la media del período (mes) respecto de la media global. Meses Años 1 2 n Medias S enero x 11 x 12 x 1n x 1 S 1 febrero x 21 x 22... x 2n. x 2. S 2. noviembre x 11 1 x 11 2 x 11 n x 11 S 11 diciembre x 12 1 x 12 2 x 12 n x 12 S 12 Medias x 1 x 2 x n x Los coeficientes estacionales son: S i = x i M para i = 1,..., 12. Suponemos que el efecto estacional S t satisface: S t = S t+12 = S t+24 =...

Ejemplo 13. estacionales. Volvemos al Ejemplo 6. El gráfico muestra los coeficientes Seasonal Index Plot for log(no. de pasajeros) 0.28 seasonal index 0.18 0.08-0.02-0.12-0.22 0 1 2 3 4 5 6 7 8 9 10 11 12 13 season

Ejemplo 13. Obtenemos la serie desestacionalizada, X t S t : Seasonally Adjusted Data Plot for log(no. de pasajeros) 6.7 6.3 5.9 5.5 5.1 4.7 1/49 1/50 1/51 1/52 1/53 1/54 1/55 1/56 1/57 1/58 1/59 1/60 1/61 No muestra efectos estacionales.

Ejemplo 14. Obtener los coeficientes estacionales de la serie mensual de pluviómetros peninsulares (Fuente I.N.M.) para el período Octubre/1989 a Septiembre/2006 (Ejemplo 1). Seasonal Indices for Pluviometria Seasonal decomposition method: Additive Season Index ------------------------ 1 29.0565 2 21.1044 3 18.8623 4 5.59299 5-7.70493 6-4.37706 7 4.22346 8 4.78362 9-19.1383 10-28.394 11-23.1034 12-0.905707 seasonal index 31 21 11 1-9 -19-29 Seasonal Index Plot for Pluviometria 0 1 2 3 4 5 6 7 8 9 10 11 12 13 season

Ejemplo 14. Obtenemos la serie desestacionalizada, X t S t : 140 Seasonally Adjusted Data Plot for Pluviometria 110 80 50 20-10 10/89 10/91 10/93 10/95 10/97 10/99 10/01 10/03 10/05 10/07 No muestra efectos estacionales.

Ejemplo 15. Obtener los coeficientes estacionales de la serie mensual de Oxígeno disuelto (ml/lt). Rio Santa Cruz (Washington, USA). (Elaboración propia a partir de http://waterdata.usgs.gov). Seasonal Indices for Oxigeno Seasonal decomposition method: Additive Season Index ------------------------ 1 1.75095 2 1.82438 3 1.66915 4 1.45595 5-0.989603 6-1.57851 7-2.56157 8-2.76155 9-1.56786 10-0.657377 11 1.23205 12 2.184 seasonal index 2.2 1.2 0.2-0.8-1.8-2.8 Seasonal Index Plot for Oxigeno 0 1 2 3 4 5 6 7 8 9 10 11 12 13

Ejemplo 15. Obtenemos la serie desestacionalizada, X t S t : 15 Seasonally Adjusted Data Plot for Oxigeno seasonally adjusted 12 9 6 3 0 1/72 1/76 1/80 1/84 1/88 1/92 1/96 1/00 1/04 1/08 Todavía muestra efectos estacionales.

Diferenciación estacional de la serie Es un método más general que consiste en no hacer ninguna hipótesis sobre la forma general de la estacionalidad a corto plazo y suponer simplemente que evoluciona lentamente en el tiempo. Construimos una nueva serie: y t = x t x t s que denominamos serie diferenciada estacionalmente. Diferenciar estacionalmente la serie equivale a suponer que la estacionalidad en t es el valor de serie en t s: S t = x t s.

Diferenciación estacional de la serie - Ejemplos Ejemplo 16. Obtener la serie desestacionalizada mediante diferenciación estacional para las series de los datos 15 y 6. Time Series Plot for SDIFF(log(No. de pasajeros),12) Time Series Plot for SDIFF(Oxigeno, 12) 0.44 10 0.34 7 0.24 4 0.14 1 0.04-2 -0.06-0.16-5 1/721/741/761/781/801/821/841/861/881/901/921/941/961/981/001/021/041/061/08-0.26 1/50 1/51 1/52 1/53 1/54 1/55 1/56 1/57 1/58 1/59 1/60 1/61 En ambas no se observan efectos estacionales.

Descomposición de la serie en componentes Ejemplo 17. Con los datos del Ejemplo 6, obtenemos los siguientes gráficos: Time Series Plot for log(no. de pasajeros) Time Series Plot for TREND 6.6 6.6 6.2 6.2 5.8 5.8 5.4 5.4 5 5 4.6 1/49 1/50 1/51 1/52 1/53 1/54 1/55 1/56 1/57 1/58 1/59 1/60 1/61 4.6 1/49 1/50 1/51 1/52 1/53 1/54 1/55 1/56 1/57 1/58 1/59 1/60 1/61 Time Series Plot for INDICES Time Series Plot for IRREGULAR 0.28 0.12 0.18 0.08-0.02-0.12 0.08 0.04 0-0.04-0.08-0.22 1/49 1/50 1/51 1/52 1/53 1/54 1/55 1/56 1/57 1/58 1/59 1/60 1/61-0.12 1/49 1/50 1/51 1/52 1/53 1/54 1/55 1/56 1/57 1/58 1/59 1/60 1/61 La componente irregular parece aproximadamente estacionaria y sin patrones de tendencia o estacionalidad.

Descomposición de la serie en componentes Ejemplo 18. Con los datos del Ejemplo 1, obtenemos los siguientes gráficos: Time Series Plot for Pluviometria Time Series Plot for TREND 150 150 120 120 90 90 60 60 30 30 0 10/89 10/93 10/97 10/01 10/05 0 10/89 10/93 10/97 10/01 10/05 Time Series Plot for INDICES 31 21 11 1-9 -19-29 10/89 10/93 10/97 10/01 10/05 Time Series Plot for IRREGULAR 80 50 20-10 -40-70 10/89 10/93 10/97 10/01 10/05 La componente irregular parece aproximadamente estacionaria y sin patrones de tendencia o estacionalidad.

Predicción de una serie temporal Una vez que hemos obtenido la descomposición de la serie temporal: X t = T t + S t + I t Podemos obtener predicciones de los valores futuros mediante los valores para t + 1, t + 2,..., t + h de las componentes T t y S t. Ejemplo 19. Si T t = a + bt y S t se obtuvo mediante índices estacionales trimestrales, i.e., tenemos S 1, S 2, S 2, y S 4, entonces: S 1 si t + 1 = Q1 S T t+1 = a + bt y S t+1 = 2 si t + 1 = Q2. S 3 si t + 1 = Q3 si t + 1 = Q4 Las predicciones para t + 2, t + 3,..., t + h se obtienen de manera análoga. S 4

Predicción de una serie temporal - Ejemplos Ejemplo 20. Con los datos del Ejemplo 1 obtenga las predicciones para el año hidrológico 2006/2007 con los siguientes procedimientos: Tendencia lineal, T t = a + bt, e índices estacionales. Medias móviles de orden 3, m t = X t 3+X t 2 +X t 1 3, e índices estacionales. Indices estacionales. Diferencia estacional. X t = X t 1 X t 12.

Predicción de una serie temporal - Ejemplos Time Sequence Plot for Pluviometria Time Sequence Plot for Pluviometria 150 Linear trend = 51.6349 + -0.0091951 t 160 Simple moving average of 3 terms 120 actual forecast 120 actual forecast 90 95.0% limits 80 95.0% limits 60 30 40 0 0-30 10/89 10/93 10/97 10/01 10/05 10/09-40 10/89 10/93 10/97 10/01 10/05 10/09

Predicción de una serie temporal - Ejemplos Time Sequence Plot for Pluviometria Time Sequence Plot for Pluviometria 150 Constant mean = 46.3064 190 ARIMA(0,0,0)x(0,1,0)12 with constant 120 actual forecast 150 actual forecast 90 95.0% limits 110 95.0% limits 60 70 30 30 0-10 -30 10/89 10/93 10/97 10/01 10/05 10/09-50 10/89 10/93 10/97 10/01 10/05 10/09

Predicción de una serie temporal - Resultados Modelo 1 Modelo 2 Modelo 3 Modelo 4 Observado Modelo 1 Modelo 2 Modelo 3 Modelo 4 Octubre 74.42 77.46 75.36 93.11 85.3 Octubre 0.128 0.092 0.116 0.092 Noviembre 66.46 69.51 67.41 73.01 89.9 Noviembre 0.261 0.227 0.250 0.188 Diciembre 64.21 67.26 65.17 46.21 45.2 Diciembre 0.421 0.488 0.442 0.022 Enero 50.93 53.99 51.90 47.21 33.9 Enero 0.502 0.593 0.531 0.393 Febrero 37.62 40.70 38.60 46.41 58.5 Febrero 0.357 0.304 0.340 0.207 Marzo 40.94 44.02 41.93 61.31 50.3 Marzo 0.186 0.125 0.166 0.219 Abril 49.53 52.62 50.53 37.81 64.9 Abril 0.237 0.189 0.221 0.417 Mayo 50.08 53.18 51.09 22.01 61 Mayo 0.179 0.128 0.162 0.639 Junio 26.15 29.26 27.17 21.61 Julio 16.89 20.01 17.91 13.21 Media 0.284 0.268 0.279 0.272 Agosto 22.17 25.30 23.20 19.21 S.D. 0.131 0.183 0.147 0.200 Septiembre 44.36 47.50 45.40 60.11 ECM 0.098 0.105 0.099 0.114

Otra alternativa para la predicción de una serie temporal Alisados Exponenciales Se emplean fundamentalmente para predecir nuevos valores de la serie. Se basan en modelos paramétricos deterministas que se ajustan a la evolución de la serie. Las observaciones más recientes tienen más peso en la predicción que las más alejadas. Se resuelven por métodos recursivos. Pueden ser poco realistas para explicar la evolución de la serie.

Alisado exponencial simple, se emplea para series sin tendencia ni estacionalidad: ˆX T = αx T + (1 α) ˆX T 1, ˆX T = α T 1 (1 t=0 α)t X T s, ˆX T +k = ˆX T, para todo k. Alisado exponencial lineal de Holt: se emplea para series con tendencia lineal y sin estacionalidad: ˆX T = αx T + (1 α)( ˆX T 1 + B T 1 ), ˆbT = β( ˆX T ˆX T 1 ) + (1 β)b T 1, ˆX T +k = ˆX T + B T k, con ˆX 1 = X 1, ˆX2 = X 2, B 1 = 0 y B 2 = X 2 X 1.

Alisado exponencial estacional de Holt-Winters: se emplea para series con tendencia y estacionalidad. ˆX T = α X T S t s + (1 α)( ˆX T 1 + B T 1 ), ˆbT = β( ˆX T ˆX T 1 ) + (1 β)b T 1, Ŝ T = δ X T ˆX T + (1 δ)s T s, ˆX T +k = ( ˆX T + B T k)s T s+k. El factor estacional no es constante como en los índices estacionales.

Alisado exponencial - Efecto y selección de los pesos Time Sequence Plot for Oxigeno disuelto Time Sequence Plot for Oxigeno disuelto Time Sequence Plot for Oxigeno disuelto 12.2 Simple exponential smoothing with alpha = 0.1 13.1 Simple exponential smoothing with alpha = 0.9 13.5 Simple exponential smoothing with alpha = 0.7992 actual actual actual 10.2 11.1 forecast 95.0% limits 11.5 forecast 95.0% limits forecast 95.0% limits 9.1 9.5 8.2 7.1 7.5 6.2 5.1 5.5 4.2 1970 1980 1990 2000 2010 3.1 1970 1980 1990 2000 2010 3.5 1970 1980 1990 2000 2010 Los pesos determinan el peso que damos a las componentes de la predicción, un peso cercano a la unidad le asigna más peso a las observaciones recientes.

Predicción de una serie temporal - Ejemplos Ejemplo 21. Con los datos del Ejemplo 1 obtenga las predicciones para el año hidrológico 2006/2007 utilizando los métodos de alisados simple, de Holt y de Time Holt Winters. Sequence Plot for Pluviometria Time Sequence Plot for Pluviometria Time Sequence Plot for Pluviometria Simple exponential smoothing with alpha = 0.0089 Holt's linear exp. smoothing with alpha = 0.0491 and beta = 0.044 Winter's exp. smoothing with alpha = 0.0033, beta = 0.0001, gamma = 0.3079 160 150 180 130 100 actual 120 forecast 95.0% limits 90 actual 140 forecast 95.0% limits 100 actual forecast 95.0% limits 70 60 60 40 30 20 10 0-20 -20 10/89 10/93 10/97 10/01 10/05 10/09-30 10/89 10/93 10/97 10/01 10/05 10/09-60 10/89 10/93 10/97 10/01 10/05 10/09

Predicción de una serie temporal - Resultados Modelo 1 Alisado 1 Alisado 2 Alisado 3 Observado Modelo 1 Alisado 1 Alisado 2 Alisado 3 Octubre 74.42 46.01 39.98 97.54 85.3 Octubre 0.128 0.461 0.531 0.144 Noviembre 66.46 46.01 39.82 71.98 89.9 Noviembre 0.261 0.488 0.557 0.199 Diciembre 64.21 46.01 39.66 58.19 45.2 Diciembre 0.421 0.018 0.123 0.287 Enero 50.93 46.01 39.50 43.86 33.9 Enero 0.502 0.357 0.165 0.294 Febrero 37.62 46.01 39.35 48.38 58.5 Febrero 0.357 0.213 0.327 0.173 Marzo 40.94 46.01 39.19 56.09 50.3 Marzo 0.186 0.085 0.221 0.115 Abril 49.53 46.01 39.03 47.15 64.9 Abril 0.237 0.291 0.399 0.273 Mayo 50.08 46.01 38.87 40.58 61 Mayo 0.179 0.246 0.363 0.335 Junio 26.15 46.01 38.72 21.87 Julio 16.89 46.01 38.56 14.26 Media 0.284 0.270 0.336 0.228 Agosto 22.17 46.01 38.40 21.94 S.D. 0.131 0.166 0.160 0.080 Septiembre 44.36 46.01 38.24 50.16 ECM 0.098 0.101 0.138 0.058

Ejemplo con datos faltantes Ejemplo 22. Temperatura media en la superficie y en el fondo en Lago Murray - Carolina del Sur, Octubre/1992 a Septiembre/2006. 35 Lago Murray, Carolina del Sur Temperatura media Temperatura media en el fondo 30 25 20 15 10 5 0 12 24 36 48 60 72 84 96 108 120 132 144 156 168

Ejemplo con datos faltantes Podemos predecir la temperatura del fondo? 24 Lago Murray, Carolina del Sur 22 Temperatura media en el fondo 20 18 16 14 12 10 8 5 10 15 20 25 30 35 Temperatura media

Interpolación de los datos faltantes La relación entre Temperatura y Temperatura en el fondo es no lineal Multiple Regression Analysis ----------------------------------------------------------------------------- Dependent variable: Temperatura Fondo ----------------------------------------------------------------------------- Standard T Parameter Estimate Error Statistic P-Value ----------------------------------------------------------------------------- CONSTANT 3.6386 1.22333 2.97435 0.0035 Temperatura 0.982518 0.144872 6.78196 0.0000 Mes -1.21715 0.155993-7.80261 0.0000 Temperatura^2-0.0363928 0.00396844-9.17058 0.0000 Temperatura*Mes 0.10833 0.0092613 11.697 0.0000 ----------------------------------------------------------------------------- Analysis of Variance ----------------------------------------------------------------------------- Source Sum of Squares Df Mean Square F-Ratio P-Value ----------------------------------------------------------------------------- Model 1446.01 4 361.502 208.78 0.0000 Residual 219.905 127 1.73154 ----------------------------------------------------------------------------- Total (Corr.) 1665.91 131 R-squared = 86.7997 percent R-squared (adjusted for d.f.) = 86.384 percent

Interpolación de los datos faltantes Plot of Temperatura Fondo 23 20 observed 17 14 11 8 8 11 14 17 20 23 predicted

Interpolación de los datos faltantes 35 Lago Murray, Carolina del Sur Temperatura media Temperatura media en el fondo 30 25 20 15 10 5 0 12 24 36 48 60 72 84 96 108 120 132 144 156 168

Interpolación - Una alternativa basada en series temporales Winter's exp. smoothing with alpha = 0.3343, beta = 0.0001, gamma = 0.1693 80 actual 60 forecast 95.0% limits 40 20 0-20 -40 10/92 10/94 10/96 10/98 10/00 10/02 10/04 10/06

Interpolación - Una alternativa basada en series temporales 35 Lago Murray, Carolina del Sur Temperatura media Temperatura media en el fondo Ajuste e interpolación 30 25 20 15 10 5 0 12 24 36 48 60 72 84 96 108 120 132 144 156 168

Ejemplo con datos faltantes Ejemplo 23. Oxígeno disuelto media en la superficie y en el fondo en Lago Murray - Carolina del Sur, Octubre/1992 a Septiembre/2006. 14 Lago Murray, Carolina del Sur Oxígeno disuelto Oxígeno disuelto en el fondo 12 10 8 6 4 2 0 0 12 24 36 48 60 72 84 96 108 120 132 144 156 168

Ejemplo con datos faltantes Podemos predecir los datos faltantes? 14 Lago Murray, Carolina del Sur 12 Oxígeno disuelto en el fondo (mg/lt) 10 8 6 4 2 0 3 4 5 6 7 8 9 10 11 12 13 Oxígeno disuelto (mg/lt)

Interpolación de los datos faltantes Podemos predecir los datos faltantes? Multiple Regression Analysis ----------------------------------------------------------------------------- Dependent variable: Oxigeno Fondo ----------------------------------------------------------------------------- Standard T Parameter Estimate Error Statistic P-Value ----------------------------------------------------------------------------- CONSTANT 6.29991 10.4769 0.601317 0.5492 Oxigeno 0.830319 1.67511 0.495681 0.6214 Oxigeno^2-0.106926 0.0698998-1.52971 0.1297 Mes -0.483242 1.01006-0.478427 0.6335 Oxigeno*Mes 0.0205182 0.110638 0.185454 0.8533 ----------------------------------------------------------------------------- R-squared = 8.5047 percent R-squared (adjusted for d.f.) = 4.29802 percent Multiple Regression Analysis ----------------------------------------------------------------------------- Dependent variable: Oxigeno Fondo ----------------------------------------------------------------------------- Standard T Parameter Estimate Error Statistic P-Value ----------------------------------------------------------------------------- CONSTANT -9.22845 8.81297-1.04714 0.2979 Oxigeno 0.882918 0.893172 0.98852 0.3256 Temperatura 0.509903 0.388381 1.31289 0.1926 Oxigeno*Temperatu -0.0330939 0.0419215-0.789424 0.4320 ----------------------------------------------------------------------------- R-squared = 9.61981 percent R-squared (adjusted for d.f.) = 6.53866 percent

Interpolación - Una respuesta basada en series temporales O2 interpolado 12 10 8 6 Random walk + Seasonal adjustment actual forecast 95.0% limits 4 10/92 10/94 10/96 10/98 ------------------------------------------------------------------------------ Lower 95.0% Upper 95.0% Period Forecast Limit Limit ------------------------------------------------------------------------------ 9/99 6.67861 5.13383 8.22338 10/99 6.0107 4.04454 7.97686 ------------------------------------------------------------------------------

Interpolación - Una respuesta basada en series temporales O2F interpolado Simple exponential smoothing with alpha = 0.9126 14 11 8 5 2 actual forecast 95.0% limits -1 12/96 12/97 12/98 12/99 12/00 ------------------------------------------------------------------------------ Lower 95.0% Upper 95.0% Period Forecast Limit Limit ------------------------------------------------------------------------------ 11/00 6.64211 4.35922 8.925 12/00 7.85614 4.76551 10.9468 ------------------------------------------------------------------------------

Interpolación de los datos faltantes 14 Lago Murray, Carolina del Sur Oxígeno disuelto Oxígeno disuelto en el fondo 12 10 8 6 4 2 0 0 20 40 60 80 100 120 140 160 180

Datos faltantes al inicio de la serie Predicción inversa (backcasting) O2F inverso 15 12 9 6 3 ARIMA(0,0,0)x(0,1,0)12 with constant Observado Ajuste Pronóstico 0 0 60 120 180

Datos faltantes al inicio de la serie Predicción inversa (backcasting) 14 Lago Murray, Carolina del Sur Oxígeno disuelto Oxígeno disuelto en el fondo 12 10 8 6 4 2 0 0 20 40 60 80 100 120 140 160 180

Recapitulación Cálculo de Tendencias y Estacionalidad Gráficos temporales. Series estacionarias y no estacionarias. Descomposición de una serie: tendencia, estacionalidad y componente irregular. Predicción. Interpolación.

Grupo de investigación en análisis de series temporales <andres.alonso@uc3m.es> José R. Berrendero <joser.berrendero@uam.es> Ana E. García <anaelizabeth.garcia@urjc.es> Carolina García <garcia.martos@upm.es> Adolfo Hernández <A.Hernandez@exeter.ac.uk> Ana Justel <ana.justel@uam.es> Julio Rodríguez <jr.puerta@uam.es> María J. Sánchez <mjsan@etsii.upm.es>