Un procedimiento completo para la detección de estacionalidad en series económicas



Documentos relacionados
Metodología. del ajuste estacional. Tablero de Indicadores Económicos

Series de Tiempo. Una Introducción

Covarianza y coeficiente de correlación

Estacionalidad. Series de tiempo. Modelos econométricos. Modelos econométricos. Q= T Kα Lβ

TEMA 4: Variables binarias

1.1. Introducción y conceptos básicos

Análisis y cuantificación del Riesgo

8.1. Introducción Dependencia/independencia estadística Representación gráfica: diagrama de dispersión Regresión...

Procesos de Media Móvil y ARMA

Decisión: Indican puntos en que se toman decisiones: sí o no, o se verifica una actividad del flujo grama.

Técnicas de valor presente para calcular el valor en uso

Capítulo 8. Tipos de interés reales Introducción

T.3 ESTIMACIÓN PUNTUAL

BREVE APUNTE SOBRE EL PROBLEMA DE LA MULTICOLINEALIDAD EN EL MODELO BÁSICO DE REGRESIÓN LINEAL

Tema 3. Espacios vectoriales

Otras medidas descriptivas usuales

Tema 2. Espacios Vectoriales Introducción

K2BIM Plan de Investigación - Comparación de herramientas para la parametrización asistida de ERP Versión 1.2

COMO MEDIR LA EFECTIVIDAD DE LA CONCIENTIZACIÓN

Precio del alquiler de pisos durante una serie de meses. Evolución del índice del precio del trigo con mediciones anuales.

TIPO DE CAMBIO, TIPOS DE INTERES Y MOVIMIENTOS DE CAPITAL

ANÁLISIS DE DATOS NO NUMERICOS

CAPÍTULO IV METODOLOGÍA PARA EL CONTROL DE INVENTARIOS. En este capítulo se presenta los pasos que se siguieron para la elaboración de un sistema de

Espacios generados, dependencia lineal y bases

REGRESION simple. Correlación Lineal:

Determinación de primas de acuerdo al Apetito de riesgo de la Compañía por medio de simulaciones

Estas visiones de la información, denominadas vistas, se pueden identificar de varias formas.

TEMA 4: Introducción al Control Estadístico de Procesos

TEMA 2. FILOSOFÍA DE LOS GRÁFICOS DE CONTROL. Principios básicos de los gráficos de control. Análisis de patrones.

Subespacios vectoriales en R n

BASES Y DIMENSIÓN. Propiedades de las bases. Ejemplos de bases.

LÍMITES Y CONTINUIDAD DE FUNCIONES

Aula Banca Privada. La importancia de la diversificación

DESCRIPCIÓN DE LA METODOLOGÍA UTILIZADA EN EL PROGRAMA DE CESTAS REDUCIDAS ÓPTIMAS

Tema 3. Medidas de tendencia central Introducción. Contenido

App para realizar consultas al Sistema de Información Estadística de Castilla y León

CAPÍTULO III. FUNCIONES

ESTIMACIÓN. puntual y por intervalo

CONCEPTO DEL ÍNDICE ACCIONARIO

Administración de Empresas. 11 Métodos dinámicos de evaluación de inversiones 11.1

- MANUAL DE USUARIO -

Análisis de Regresión Múltiple con Información Cualitativa: Variables Binarias o Ficticias

CAPÍTULO 6 SIMULACIONES Y RESULTADOS

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso

Capítulo 5: METODOLOGÍA APLICABLE A LAS NORMAS NE AI

DOMINIO Y RANGO DE UNA FUNCIÓN I N D I C E. martilloatomico@gmail.com. Página. Titulo:

ANALISIS MULTIVARIANTE

1. Dominio, simetría, puntos de corte y periodicidad

Análisis de Resultados

Capítulo 10. Estudio de un caso con parámetros reales: acuífero de Borden

Elementos requeridos para crearlos (ejemplo: el compilador)

INFORME DE ANÁLISIS DE ENCUESTAS DE SATISFACCIÓN DE USUARIOS PERÍODO

SERIES DE TIEMPO INTRODUCCIÓN

CAPITULO 4 JUSTIFICACION DEL ESTUDIO. En este capítulo se presenta la justificación del estudio, supuestos y limitaciones de

Aproximación local. Plano tangente. Derivadas parciales.

Cómo?: Resolviendo el sistema lineal homógeneo que satisfacen las componentes de cualquier vector de S. x4 = x 1 x 3 = x 2 x 1

MODELO ESTACIONAL DE LLUVIAS EN BASE A PROCESOS DE POISSON NO HOMOGÉNEOS.

TEMA 7: Análisis de la Capacidad del Proceso

Análisis de medidas conjuntas (conjoint analysis)

Estructuras algebraicas

2.1 INFORMACION BASICA Y PRINCIPALES DEFINICIONES.

DISEÑO DE UN MODELO DE APROXIMACIÓN TRIMESTRAL PARA LA ECONOMÍA DE MADRID

Se podría entender como una matriz de filas y columnas. Cada combinación de fila y columna se denomina celda. Por ejemplo la celda A1, B33, Z68.

ISO 9001:2000 DOCUMENTO INFORMATIVO DOCUMENTO ELABORADO POR CHRISTIAN NARBARTE PARA EL IVECE

Indicaciones específicas para los análisis estadísticos.

SISTEMAS INTELIGENTES

Tema 12: Contrastes Paramétricos

3. Métodos para la evaluación de proyectos

4 Pruebas y análisis del software

Reestructuración y Cancelación de deudas: La baja de pasivos del balance

Anexo 1: Demostraciones

TEMA 3: MÉTODO CONTABLE. LAS CUENTAS

Métodos y Modelos Cuantitativos para la toma de Decisiones

- se puede formular de la siguiente forma:

Fundamentos de Investigación de Operaciones Investigación de Operaciones 1

de la empresa Al finalizar la unidad, el alumno:

Los valores de las respuesta son las puntuaciones que, de cada individuo, o cluster, obtenemos semanalmente durante cinco semanas consecutivas:

VII. Estructuras Algebraicas

Clasificación de métricas.

PRESENCIA DE ESTACIONALIDAD EN EL CREDITO OTORGADO AL SECTOR PRIVADO

Álgebra Lineal Ma1010

Una serie temporal o cronológica es en una sucesión de valores que adopta una variable (Y):

a < b y se lee "a es menor que b" (desigualdad estricta) a > b y se lee "a es mayor que b" (desigualdad estricta)

DETERMINACIÓN DEL VOLUMEN DE PEDIDO.

EL FONDO DE MANIOBRA Y LAS NECESIDADES OPERATIVAS DE FONDOS

Capitulo 3. Primer Año de Operaciones

ENERGÍA DE DEFORMACIÓN DE UNA ESTRUCTURA

Econometría de Económicas

Costos de Distribución: son los que se generan por llevar el producto o servicio hasta el consumidor final

Control Estadístico del Proceso. Ing. Claudia Salguero Ing. Alvaro Díaz

ANÁLISIS DE BALANCES CON EL NUEVO PGC DE 2008

2.2 Transformada de Laplace y Transformada Definiciones Transformada de Laplace

ENTIDAD DE CONTRAPARTIDA CENTRAL CONDICIONES GENERALES. Contratos de Operaciones con Valores de Renta Fija

Módulo 7: Los activos de Seguridad de la Información

Diseño orientado al flujo de datos

COMPARACIÓN DE ÁREAS DE FIGURAS POR ESTUDIANTES DE PRIMERO DE MAGISTERIO

Matemáticas 2º BTO Aplicadas a las Ciencias Sociales

ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS

Transcripción:

Un procedimiento completo para la detección de estacionalidad en series económicas José Antonio Caracena BBVA Tesina CEMFI No. 0208 Febrero 2002 Estetrabajoconstituyeunaversiónrevisadadelatesinapresentadaalcompletarel Programa de Estudios de Postgrado 1999-2001 del Centro de Estudios Monetarios y Financieros (CEMFI). Mi más sincero agradecimiento a Agustín Maravall, por su labor de supervisión y por haberme demostrado ser un tío muy majo y competente; y a mis compañeros de clase, especialmente a Laura, por su valor, a Esther, por su bizcocho, a Merci, por su inglés, a María, por ser lo peor, a Tatiana, por su genio, a Pau, por su diplomacia, a Sergio, por su demagogia y a Roque, por su inocencia, y, por supuesto, a todos por ser como son, han sido lo mejor de estos dos últimos años. Sorte on guztioi eta ikusi arte lagunak. El esfuerzo puesto en este trabajo está especialmente dedicado a Mari, Cristinita y Mila y a mi familia, por seguir estando ahí. (E-mail: jose.caracena@grupobbva.com). CEMFI, Casado del Alisal 5, 28014 Madrid, Spain. www.cemfi.es

Resumen El objetivo de este trabajo es hallar un procedimiento simple, robusto y fiable que sirva para detectar y clasificar la estacionalidad en series temporales económicas. Primero se describen los principales procedimientos existentes: Kendall, HEGY, CH, DHF, TRAMO-SEATS y X12-ARIMA, a continuación se propone uno alternativo integrado en la modelización ARIMA de la serie y finalmente se compara la versatilidad de todos ellos mediante un ejercicio de simulación.

1 Introducción Entia non sunt multiplicanda sine necessitate La navaja de Ockham Muchas series temporales económicas presentan un importante comportamiento estacional. Otras muchas no. Pero, qué es la estacionalidad?, cuándo se considera una serie estacional?. No existe una definición generalmente aceptada de estacionalidad. En este trabajo se adopta la definición de estacionalidad que probablemente sea la más compartida y que aparece ya en Box-Jenkins (1976, pág. 303-04): la característica fundamental de las series temporales estacionales de periodo s es que las observaciones que están separadas s periodos son similares y (para observaciones mensuales) el efecto estacional implica que una observación de un mes en particular, por ejemplo abril, está relacionada con las observaciones de los abriles previos. Se considera estacionalidad la relación existente entre las observaciones para el mismo mes en años sucesivos. Dada esta definición intuitiva de estacionalidad, parece tarea fácil determinar si una serie es estacional o no, y en ocasiones es suficiente un análisis detallado de los datos o una simple representación gráfica para obtener una respuesta contundente. Otras veces, en cambio, esta herramienta subjetiva puede no ser concluyente y es necesaria una herramienta objetiva que determine si las observaciones para el mismo mes en años sucesivos están relacionadas o no. Una vez admitida la presencia de estacionalidad en una serie económica, se plantea el problema de especificar una forma funcional para la misma. Existen diversas formas de modelizar la estacionalidad. El modo más simple de modelizarla es a través de una función determinista con variables ficticias esta- 1

cionales: x t = 12X i=1 β i d it con d it =1para el mes i y 0 en caso contrario y β i sus respectivos coeficientes (el presente estudio se centra en el caso de datos mensuales, aunque todos los resultados son fácilmente generalizables a cualquier otra frecuencia muestral). De modo que el componente estacional podría predecirse sin error si los parámetros β i fuesen conocidos. Si la estacionalidad cambia en el tiempo, como ocurre, por ejemplo, con el clima, uno de los principales responsables de la estacionalidad en las series económicas, la estacionalidad determinista no es la forma idónea de modelización. En estos casos el modelo adecuado es el de estacionalidad estocástica, en el cuál se representa la estacionalidad mediante un proceso estocástico, permitiendo de este modo que el componente estacional evolucione en el tiempo. En el marco del análisis ARIMA de Box y Jenkins un proceso estacional estocástico puro, x t, es: Φ(B 12 ) D 12x t = Θ(B 12 )a t (1) donde a t es ruido blanco, Φ( ) y Θ( ) son polinomios en el operador retardo estacional B 12 (B 12 s t = s t 12 ), Φ(B 12 ) tiene todas sus raíces fuera del círculo unidad (es estacionario) y 12 =(1 B 12 ) es el operador diferencia estacional. En la literatura se consideran habitualmente dos posibilidades en el modelo (1): D =0y D 6= 0, esto es, el modelo de estacionalidad estocástica estacionaria y el de estacionalidad estocástica integrada. Un ejemplo del primero de estos dos modelos es el proceso de medias móviles estacional de orden 1: x t = a t + θ 12 a t 12 con a t ruido blanco. En este proceso la observación de un determinado mes, por ejemplo abril, está relacionada con el abril del año anterior, pero no guarda 2

ninguna relación con ningún otro abril en toda la historia de la serie. Puede considerarse este proceso como estacional?, y si es de orden 2 y sólo guarda relación con los dos abriles anteriores?, y si es autoregresivo estacional estacionario con parámetro 0, 4, de modo que la correlación con los abriles anteriores es 0, 4, 0, 16, 0, 064,...?. Estos modelos de estacionalidad estacionaria no entran dentro de la definición de estacionalidad que se ha considerado. En estos casos es más adecuado caracterizar al proceso como poseedor de cierta correlación estacional y no como un proceso puramente estacional. Por otro lado, el concepto de estacionalidad que se ha definido se asocia también con un comportamiento diferente de la serie temporal dependiendo del mes al que corresponde la observación (mayor número de turistas en agosto y menor en febrero...). Por tanto, lo más frecuente es que conlleve una media distinta en cada mes. Esto viola la definición de estacionariedad en media. Estacionalidad y no estacionariedad son conceptos estrechamente relacionados, por tanto, en el presente estudio, no se consideran los procesos con estacionalidad estacionaria como procesos estacionales. Dar respuesta a las dos preguntas que se han planteado, existe estacionalidad? y cuál es el modelo más adecuado para el componente estacional?, puede tener, básicamente, tres objetivos finales: predicción, modelización o desestacionalización de series temporales. A la hora de predecir o ajustar un modelo que recoja las características fundamentales de una serie hay que tener en cuenta que las distintas especificaciones del componente estacional conllevan diferentes propiedades estadísticas, por lo que imponer una de ellas cuando está presente otra puede ocasionar pérdidas de información y sesgos importantes. La forma de modelizar el componente estacional también es un factor clave a la hora de desestacionalizar una serie. La desestacionalización y el empleo de 3

series ajustadas estacionalmente es una práctica frecuente en diversas áreas. En política económica el estudio se lleva a cabo, en general, sobre series ajustadas estacionalmente, que proporcionan una señal más limpia de la evolución subyacente de las variables y permiten realizar predicciones y tomar decisiones sin el ruido que supone la estacionalidad. Por su parte, en el análisis económico y la investigación su empleo responde a la creencia de que facilitan la interpretación de los resultados y simplifican la modelización 1. Por otro lado, desde el punto de vista de la producción de datos es práctica generalizada la desestacionalización de series (quizás cientos o miles todos los meses). Ello conlleva la necesidad de un procedimiento simple, robusto y fiable, que sea fácilmente implementable en aplicaciones a gran escala, para determinar si una serie presenta estacionalidad, y en caso de presentarla, para decidir cuál es la manera más adecuada de modelizarla de entre las dos opciones consideradas: estacionalidad determinista o estacionalidad estocástica integrada. La búsqueda de un procedimiento de estas características es el objetivo principal de este trabajo. En la siguiente sección se analiza la relación existente entre los dos modelos de estacionalidad considerados: determinista y estocástica integrada, como un paso previo a la descripción y el análisis de los principales procedimientos existentes, que se realiza en la sección 3. En la sección 4 se propone un procedimiento alternativo que se compara con los anteriores mediante una simulación descrita en la sección 5 y se presentan los resultados en la sección 6. La forma en que se han comparado los distintos procedimientos ha sido en función del porcentaje de series simuladas que se clasifican correctamente dentro del grupo al que realmente pertenecen, dado el modelo estacional o no 1 La controvertida discusión sobre la necesidad o no de desestacionalizar queda fuera de los propósitos de este estudio. 4

estacional con que fueron generadas. Esta forma de proceder presupone que el objetivo final no es únicamente la predicción, en cuyo caso considerar como criterio de comparación, por ejemplo, el error cuadrático medio de predicción extramuestral sería más acertado. 2 Estacionalidad integrada estable Considérense los siguientes modelos: x t =(1+θ 1 B)a t (i) x t =(1+θ 1 B)a t + 12X i=1 β i d it donde B es el operador retardo y a t ruido blanco. El primero es un modelo no estacional, IMA(1,1) y el segundo es estacional determinista. Los dos modelos tienen características muy distintas, en cuanto a estacionalidad se refiere, pero si tomamos una diferencia estacional, en ambos casos se obtiene: (ii) 12 x t =(1+θ 1 B)(1 + θ 12 B 12 )a t, (iii) con θ 12 = 1. De modo que, si se ajusta un modelo puramente ARIMA a la serie y se presenta una situación análoga a la que recoge el modelo (iii) con b θ12 cercano a 1, puede que no haya estacionalidad o que se pueda considerar que la serie presenta estacionalidad determinista y en ambos casos se haya sobrediferenciado, lo que deberá determinarse en cada caso. Por razones que se argumentarán más adelante no se considera el caso de presencia de estacionalidad determinista e integrada simultáneamente. Si se concluye que la serie presenta estacionalidad, el modelo de estacionalidad determinista, (ii), y el modelo de estacionalidad integrada estable, (iii) con θ 12 cercano a 1, son prácticamente indistinguibles en cuanto a ajuste intramuestral se refiere para 5

los tamaños de muestra habituales en series económicas. El modelo integrado estable es equivalente a permitir una pequeña variación en el tiempo de los coeficientes de las variables ficticias en (ii). Ahora bien, si el modelo estimado para la serie es (iii), pero con b θ 12 À 1, entonces no surge ningún dilema: la serie presenta estacionalidad estocástica integrada, ya que no hay peligro de que se haya sobrediferenciado la serie. Resta aún una última cuestión por responder: a partir de qué valor del parámetro de medias móviles estacional, θ 12, se considera la estacionalidad integrada como estable?. El valor crítico, θ 12 < 0, hasta el cual se considera que se está próximo a la no invertibilidad, y a la cancelación de los polinomios estacionales, va a depender del tamaño muestral y se va a fijar mediante simulación. Se han simulado 10.000 series del modelo (iii) con a t iidn(0, 1), θ 1 U( 1, 1) y θ 12 = 1, es decir, no invertible, para los dos tamaños muestrales considerados en la simulación de la sección 5, T=120 y T=300. Corresponden a 10 y 25 años respectivamente, dos tamaños de muestra frecuentes en series económicas. Se ha estimado imponiendo el modelo de líneas aéreas a dichas series y obteniendo como resultado las estimaciones de θ 1 y θ 12 que aparecen representadas en los histogramas del gráfico 1. Para las dos longitudes muestrales se observa que b θ 1 se distribuye aproximadamente como una U( 1, 1) y que c θ 12 se condensa más en torno al verdadero valor, θ 12 = 1, alincrementar el tamaño muestral 2. Los valores críticos correspondientes a los percentiles 10%, 5%, 2,5% y 1% de la cola superior para los dos tamaños muestrales aparecen en la tabla 2. Al 5% se considerará la estacionalidad integrada como estable si c θ 12 < θ 12 = 0, 728 2 La simulación se ha realizado empleando el generador de números aleatorios del programa estadístico Splus 4.0 y la estimación se ha llevado a cabo mediante el programa TRAMO- SEATS 2001. 6

cuando T=120 y si θ c 12 < θ 12 = 0, 887 cuando T=300. Estos valores críticos no se van a ver afectados en gran medida por variaciones en la parte regular o estacional del modelo empleado, el de líneas aéreas representado en (iii), uno de los más frecuentes en series económicas. En parte debido a que empíricamente es raro enfrentarse a modelos con órdenes mayores que la unidad en la parte estacional y porque la correlación entre la parte estacional y regular de los modelos comúnmente empleados es reducida, ver por ejemplo Box y Jenkins (1976, pág. 319-20). 3 Procedimientos disponibles En esta sección se presentan los principales procedimientos de decisión disponibles para clasificar una serie en uno de los 3 grupos descritos: series no estacionales, series con estacionalidad determinista o series con estacionalidad estocástica integrada. Primero se presenta el contraste de Kendall, que únicamente clasifica las series en dos grupos, estacionales o no estacionales. A continuación, se analiza el procedimiento de Pierce, que permite la coexistencia de diferentes tipos de estacionalidad en el mismo modelo. Posteriormente, dada la relevancia que se ha comprobado tiene la estacionalidad integrada, se exponen los procedimientos basados en los contrastes de raíces unitarias estacionales como una de las principales opciones. Por último, dos procedimientos de especial relevancia son los basados en los modelos de componentes inobservables y que se hallan implementados en los programas econométricos TRAMO-SEATS y X11 y X12-ARIMA y que permiten tratar simultáneamente gran número de series. 7

3.1 Contraste de Kendall Kendall y Ord (1990) proponen un sencillo contraste de estacionalidad basado en rangos. Consiste en ordenar las observaciones de cada año y asignarles un valorde1,alamenor,hasta12,alamayor. Paracadamessesumantodoslos valores de todos los años, obteniendo cx M i = rank(mes i) j j=1 donde c es el número de años en la muestra. Finalmente, bajo la hipótesis nula de no existencia de estacionalidad, el estadístico: K = 12 cr(r +1) rx i=1 µ M i 2 c(r +1), 2 donde r es el número de observaciones por año, 12 con datos mensuales, se distribuye como una X 2 con (r 1) grados de libertad. Para valores grandes de K se concluye que existe componente estacional y para valores inferiores al cuantil considerado de la X 2 r 1 se asigna la serie al grupo de las no estacionales. 3.2 Procedimiento de Pierce Pierce (1978) desarrolla un modelo general en el que permite la coexistencia de estacionalidad determinista y estocástica. Para contrastar la presencia de estacionalidad determinista realiza la siguiente aproximación al contraste F habitual que tiene en cuenta la estructura estocástica presente en los residuos: 1. Se estima la regresión de la serie sobre variables ficticias mensuales. 2. Se ajusta un modelo ARIMA a los residuos de la regresión anterior y se calcula la suma de cuadrados de los nuevos residuos, SCNR (desempeña el papel de suma de cuadrados del modelo no restringido). 8

3. Se ajusta el mismo modelo ARIMA identificado para los residuos a la serie original (incluyendo una constante) y se halla la suma de cuadrados residual de este modelo, SCR (es la suma de cuadrados bajo la hipótesis nula de no significatividad de las variables ficticias estacionales). 4. Se computa el estadístico F del siguiente modo: F = (SCR SCNR)/11 SCNR/(T 12) que bajo la hipótesis nula de no estacionalidad determinista se distribuye como una FdeSnedecorcon 11 y T 12 grados de libertad 3,siendoT el número de observaciones. Para valores grandes del estadístico se rechaza la hipótesis nula y se estima un componente estacional determinista. Para ello se transforma en estacionaria la serie original, tomando diferencias y/o logaritmos cuando sea necesario, de modo que la estimación por MCO de la regresión de la serie sobre variables ficticias mensuales proporciona una estimación consistente de la estacionalidad determinista. A continuación, a la serie resultante de restar a la serie original el componente determinista, en caso de haberlo, se le ajusta un modelo ARIMA. La parte estacional de este proceso es el componente estacional estocástico (estacionario en general) del modelo global. Su significatividad se contrasta prestando atención a las autocorrelaciones estacionales de la serie a la que se ajusta el modelo ARIMA. Pierce sugiere una versión de la QdeLjung-Boxestacional. El gráfico 2 resume el procedimiento de Pierce. Debido a la forma en que se contrasta y se estima la estacionalidad determinista, el procedimiento de Pierce la favorece enormemente. Aunque la estacional- 3 Son 11 restricciones debido a que se ha excluido una variable ficticia estacional para evitar colinealidad con la constante. 9

idad presente en la serie no sea en absoluto fija o determinista, prácticamente de cualquier componente estacional se puede extraer una parte determinista. Un segundo problema de este procedimiento es que, debido al carácter residual del componente estacional estocástico, proporciona, en general, estacionalidades estocásticas estacionarias, que como ya se ha mencionado, no se pueden considerar como verdadera estacionalidad. Este problema queda perfectamente ilustrado en el ejemplo representado en el gráfico 3. En la parte superior aparece representado el logaritmo del Índice de Producción Industrial de Bienes de Consumo en España (1975:1 a 2000:12, 300 observaciones) y la transformación que convierte en estacionaria la parte regular de dicha serie. En la parte central se representan los componentes estacionales que se obtienen aplicando el procedimiento de Pierce (ambos significativos). El componente estacional estocástico es un autoregresivo estacional estacionario de coeficiente 0, 36. Puedereal- mente considerarse dicho componente como estacionalidad?. Realmente no, el componente estacional estacionario representado tiene poco sentido y una interpretación dudosa. Unos componentes como los representados en los dos gráficos inferiores, fruto de modelos puramente estocásticos, recogen de modo más coherente la estacionalidad presente en la serie a través de modelos integrados. Debido a estos problemas, en la simulación de la sección 5 se ha obviado el procedimiento de Pierce y en el resto de las secciones no se ha considerado la posibilidad de coexistencia de más de uno de los tipos de estacionalidad expuestos anteriormente. 3.3 Contrastes de raíces unitarias estacionales Dickey, Hasza y Fuller (DHF, 1984) desarrollaron un procedimiento para contrastar la presencia de raíces unitarias estacionales. Sin embargo, no contemplan la posibilidad de que dicha raíz exista únicamente en alguna de las frecuencias 10

estacionales y su hipótesis alternativa tiene una forma muy cerrada, en la que todas las raíces tienen el mismo módulo. Hylleberg, Engle, Granger y Yoo (HEGY, 1990) proponen un procedimiento más refinado que soluciona este problema y que permite contrastar la presencia de raíces unidad en cada una de las frecuencias estacionales por separado, así como en la frecuencia cero. Franses (1991) y Beaulieu y Miron (BM, 1993) extienden el contraste HEGY para el caso de datos mensuales. Empíricamente se ha constatado que tanto el contraste DHF, como el HEGY, presentan poca potencia en los tamaños de muestra habituales (Hylleberg, 1995; Canova y Hansen, 1995; y Franses y Kunst, 1999) y que surgen serios problemasdetamañocuandoseestápróximoalacancelacióndelospolinomios estacionales (Ghysels, Lee y Noh, GLN, 1994; y Clements y Hendry, 1997). Canova y Hansen (CH, 1995) tratan de paliar este problema considerando la raíz unitaria como parte de la hipótesis alternativa y no, como en DHF y HEGY, de la hipótesis nula, de modo que un rechazo de la hipótesis nula tendría la fuerte implicación de existencia de raíz unitaria. En las siguientes subsecciones se describen los procedimientos basados en estos tres contrastes. 3.3.1 Procedimiento HEGY El operador diferencia estacional 12 =(1 B 12 ) puede expresarse como (1 B 12 )=(1 B)(1 + B)(1 + B 2 )(1 + B + B 2 )(1 B + B 2 )(1 B + B 4 ) de modo que las doce raíces unidad que se derivan son 1; 1; ±i; 1 ³ 1 ± 3i ; 1 ³ 1 ± 3i ; 1 ³ 3 ± i ; 1 ³ 3 ± i 2 2 2 2 (2) que corresponden a las frecuencias 0, π, ± π 2, ± 2π 3, ± π 3, ± 5π 6 y ± π 6 respectivamente. 11

El contraste HEGY presupone que el proceso generador de los datos es puramente autoregresivo ϕ(b)x t = µ t + ε t, ε t iid(0, σ 2 ) (3) donde µ t son elementos deterministas (constante, tendencia lineal y variables ficticias estacionales) y se linealiza el polinomio autoregresivo en torno a las 12 raíces unidad dadas en (2) más un resto 4 : ϕ(b) = 12X k=1 λ k (B) 1 δ k(b) δ k (B) + (B)ϕ (B) (4) donde ϕ (B) es el resto, un polinomio posiblemente infinito o racional, δ k (B) = Q 1 1 θ k B, (B) = 12 δ k (B) y λ k = Q ϕ(θ k) constantes. θ δ k (θ k ) k son los puntos en k=1 j6=k torno a los cuales se considera la expansión y que en nuestro caso son las 11 raíces unitarias estacionales y la raíz unitaria de la frecuencia cero que aparecen en (2). Por definición de las constantes λ k es inmediato comprobar que el polinomio ϕ(b) tendrá como raíz θ k si y solo si el λ k correspondiente es cero. Contrastar la hipótesis nula de presencia de raíces unidad se va a reducir a contrastar la nulidad de los coeficientes de la regresión auxiliar que resulta al sustituir las raíces de (2) en (4) e introducir el resultado en la ecuación (3): ϕ (B)y 13t = 12X k=1 π k y k,t 1 + µ t + ε t (5) donde ϕ (B) es un polinomio en el operador de retardos con todas las raíces fuera del círculo unidad, y 1t = (1+B + B 2 + B 3 + B 4 + B 5 + B 6 + B 7 + B 8 + B 9 + B 10 + B 11 )x t 4 Mediante un teorema empleado en teoría de la aproximación y debido originalmente a Lagrange. Para más detalles, ver HEGY (1990). 12

y 2t = (1 B + B 2 B 3 + B 4 B 5 + B 6 B 7 + B 8 B 9 + B 10 B 11 )x t y 3t = (B B 3 + B 5 B 7 + B 9 B 11 )x t y 4t = (1 B 2 + B 4 B 6 + B 8 B 10 )x t 3 y 5t = 3 (y 6t +2y 6t 1 ) 3 y 6t = 2 (1 B + B3 B 4 + B 6 B 7 + B 9 B 10 )x t 3 y 7t = 3 (y 8t 2y 8t 1 ) 3 y 8t = 2 (1 + B B3 B 4 + B 6 + B 7 B 9 B 10 )x t ³ y 9t = 3y10t +2y 10t 1 y 10t = 1 2 (1 3B +2B 2 3B 3 + B 4 B 6 + 3B 7 2B 8 + 3B 9 B 10 )x t ³ y 11t = 3y12t 2y 12t 1 y 12t = 1 2 (1 + 3B +2B 2 + 3B 3 + B 4 B 6 3B 7 2B 8 3B 9 B 10 )x t y 13t = (1 B 12 )x t y π k son combinaciones lineales de las constantes λ 5 k. La ecuación (5) se puede estimar por mínimos cuadrados ordinarios, posiblemente con retardos adicionales de 12 x t debido a ϕ (θ k ), para blanquear el término de error, ya que, mientras que la introducción de retardos no altera la distribución de los estadísticos de interés, la autocorrelación destruye las propiedades del contraste. Para contrastar la hipótesis ϕ(θ k )=0,siendo θ k las raíces unitarias, frente a la alternativa de estacionariedad ϕ(θ k ) > 0, es suficiente contrastar que λ k =0. Para las raíces 1 y -1, frecuencias 0 y π respectivamente, es equivalente a contrastar H 0 : π k =0, frente a H 1 : π k < 0, k =1, 2. En el resto de las frecuencias habrá integración cuando el par {π j, π j+1 } sea simultáneamente igual a cero (j =3, 5, 7, 9, 11), debido a que cada una de estas 5 Para más detalles ver Beaulieu y Miron (1993). 13

frecuencias estacionales está asociada a un par complejo conjugado de raíces unidad 6. Los valores críticos para los dos estadísticos t a una cola (π 1 y π 2 ) yparalos cinco contrastesf ({π 3, π 4 }, {π 5, π 6 }, {π 7, π 8 }, {π 9, π 10 }, {π 11, π 12 }) en muestras finitas se obtienen mediante una simulación de Montecarlo. En Franses y Hobijn (1997) se proporcionan valores críticos generados mediante Gauss para T=120, pero no para T=300, el otro tamaño muestral considerado en la simulación de la sección 5. En el presente estudio se emplea Splus 4.0 yparaevitar cualquier posible sesgo en los valores críticos debido al generador de números aleatorios y hallar los valores críticos para T=300 se han recomputado dichos valores, tabla 1. Los computados para T=120 son similares a los obtenidos por Franses y Hobijn. Para mostrar que no existe raíz unitaria en ninguna frecuencia estacional hay que probar que π 2 y al menos un miembro de cada par {π 3, π 4 }, {π 5, π 6 }, {π 7, π 8 }, {π 9, π 10 } y {π 11, π 12 } deben ser no nulos. El tamaño conjunto de estos contrastes es mucho mayor debido a la desigualdad de Bonferroni, (Dickey, 1993; y Taylor, 1998). La solución es realizar un contraste F conjunto sobre {π j } 12 j=2. Otro contraste que puede resultar interesante en algunos contextos es el de existencia de raíces unitarias estacionales complejas, un contraste F conjunto sobre {π j } 12 j=3, (GLN, 1994). Valores críticos para estos dos estadísticos aparecen tambiénenlatabla1. El término µ t en las ecuaciones (3) y (5) recoge la parte determinista y puede consistir en una constante, una tendencia y/o variables ficticias estacionales, dependiendo de la hipótesis que se considere como alternativa a la nula de 6 Hasta ahora otra alternativa era contrastar a dos colas la significatividad de π j y, si no se rechaza, contrastar la significatividad de π j+1 a una cola. Pero, recientemente, Burridge y Taylor (1999) han probado que la distribución de estos estadísticos t se puede ver afectada por la introducción de retardos de 12 x t para blanquear el ruido. 14

raíces unidad. Su especificación altera considerablemente la distribución de los estadísticos de contraste, tal y como se aprecia en la tabla 1. A la hora de analizar las conclusiones sobre estacionalidad que extraería un individuo que realizara el contraste HEGY, dos hipótesis alternativas van a ser relevantes: µ t simplemente una constante (contraste A) y µ t una constante y 11 variables ficticias estacionales (contraste B). Setienendoscontrastesconhipótesisalternativasanidadas 7, Contraste A ½ H0 : raíz unitaria estacional en alguna frecuencia H A 1 : no estacionalidad ½ H0 : raíz unitaria estacional en alguna frecuencia Contraste B H1 B : estacionalidad determinista Para un tamaño de contraste dado, el contraste B tiene menos potencia que el contraste A. Esto es debido a que parte de la estacionalidad, en caso de haberla, será recogida por las variables ficticias y los coeficientes cuya nulidad se contrasta tenderán a ser menos significativos. Si el proceso generador de los datos no presenta estacionalidad determinista y se lleva a cabo el contraste B, se están incluyendo regresores irrelevantes en la ecuación auxiliar del contraste HEGY, ecuación (5). Esta inclusión infla la varianza de los coeficientes estimados y favorece su no significatividad. Por otro lado, si el proceso generador de los datos presenta variables ficticias estacionales y no se incluyen éstas en la regresión auxiliar (5), habrá un sesgo por omisión de variables relevantes en la estimación de los parámetros. BM (1993, pág. 318) y Ghysels, Lee y Noh (GLN, 1994, pág. 432 y 436) recomiendan incluir las variables ficticias en la regresión, ya que la pérdida de potencia por incluirlas es insignificante en comparación con el sesgo que resultaría de su omisión cuando son necesarias, incluir una constante y variables 7 Dentro de la hipótesis alternativa del contraste A se engloba también la estacionalidad estacionaria y dentro de la del contraste B, como ya se argumentó anteriormente, no se considera la coexistencia de estacionalidad determinista y estacionaria. 15

ficticias estacionales parece una decisión prudente y la estrategia más segura en las aplicaciones empíricas es la inclusión de estos (posiblemente irrelevantes) términos en el modelo. Otro factor importante que conduce al mismo dilema que la inclusión o no de variables ficticias es la selección del número de retardos de 12 x t a incluir en la regresión para blanquear el ruido. Demasiados retardos generarían una pérdida de potencia, pero por otra parte su número debe ser suficiente para blanquear el ruido. En la literatura se han empleado diversos criterios: por ejemplo BM (1993) y Taylor (1998) emplean la estrategia general a específico. Introducen inicialmente cierto número de retardos y van quitando los no significativos. BM también consideran la posibilidad de emplear el AIC o el BIC. Otra estrategia es la seguida, por ejemplo, por Clements y Hendry (1997) y Paap, Franses y Hoek (1997), que emplean un contraste LM de correlación serial de hasta cuarto orden en los residuos. Por último otra estrategia considerada y la seguida en el presente estudio es incluir retardos en la regresión hasta que el estadístico QdeLjung-Boxde los residuos no sea significativo al 5% y un máximo de 12 retardos 8. Un problema crucial del contraste HEGY es que el procedimiento es muy sensible tanto a la especificación del componente determinista, µ t,quealtera las distribuciones, como al número de retardos incluidos en la regresión (Taylor, 1997). Como el proceso generador de datos es desconocido, el problema es cómo determinar qué variables incluir en la regresión. La estrategia sugerida de incluir las variables ficticias por defecto en la regresión no es, por tanto, adecuada. Conviene realizar los dos contrastes propuestos para obtener conclusiones más robustas. Al realizar los dos contrastes anteriores se pueden presentar cuatro posi- 8 Se ha escogido Q(18) para las series de 120 observaciones y Q(24) para las de 300. 16

bles casos, según se rechace o no la hipótesis nula en cada uno de ellos. Cada escenario llevará a unas conclusiones distintas con relación a la clase de estacionalidad presente en la serie y que aparecen esquematizadas en el gráfico 4: - Si no se rechaza H 0 en los dos contrastes: en este caso indudablemente existe raíz unitaria estacional en la serie y por tanto se clasifica la serie en el conjunto de series con estacionalidad estocástica integrada. - Si se rechaza H 0 en B y no se rechaza en A: en este caso en el contraste A se acepta la presencia de raíz unitaria estacional, que se rechaza en B a favor de la estacionalidad determinista. Ocurre cuando la inclusión de las variables ficticias en la regresión ocasiona la no significatividad de los coeficientes. Se concluye que la serie presenta estacionalidad determinista. - Si no se rechaza H 0 en B y se rechaza en A: del mismo modo que en el caso anterior se concluye que la serie no es estacional. - Si se rechaza H 0 en los dos contrastes: en este caso se va a complementar el contraste HEGY con un contraste F de significatividad conjunta de las variables ficticias mensuales en una regresión de la serie sobre las mismas, de modo que se pueda asignar la serie a una de las dos hipótesis alternativas. Para incrementar la potencia del contraste F se diferencia previamente la serie si el contraste HEGY detecta raíz unitaria regular, facilitando así la detección de la posible estacionalidad al quitar parte de la tendencia. Si se rechaza la hipótesis nula de no significatividad de las variables ficticias, la serie presenta estacionalidad determinista, y si no se rechaza se concluye que la serie carece de estacionalidad. 17

3.3.2 Procedimiento DHF La metodología es completamente análoga a la expuesta para el contraste HEGY y presenta los problemas ya comentados. Se basa en la siguiente regresión auxiliar: px x t = αx t 12 + 12 x t j + µ t + ε t j=1 donde la notación es igual a la del contraste HEGY y p de nuevo es el mínimo suficiente para blanquear ε t. El procedimiento de decisión se basa en dos contrastesanálogosalosdelcontrastehegy(gráfico 4), donde ahora H 0 : α =1, frente a las alternativas de no estacionalidad (contraste A) o estacionalidad determinista (contraste B). Los valores críticos se toman de DHF (1984). En la simulación para incrementar la potencia del contraste de significatividad de las variables ficticias mensuales se diferencian todas las series (que como se verá, es lo correcto, dado que todas han sido simuladas con una raíz unitaria en la frecuencia cero) sin contrastarlo previamente, lo cual supondría otra posible fuente de errores adicional. Como se apreciará en los resultados, esta pequeña ventaja otorgada a este procedimiento será irrelevante, ya que será ampliamente mejorado por el procedimiento HEGY. Se limita a 24 el número máximo de retardos de 12 x t a introducir para blanquear el ruido, lo que supone la pérdida, como máximo, de 3 años de muestra. Prácticamente todos los problemas y matizaciones comentadas para el procedimiento HEGY también son extensibles al procedimiento basado en el contraste de DHF. 3.3.3 Procedimiento CH Los contrastes de DHF y HEGY tienen como hipótesis nula la existencia de raíz unitaria estacional. El rechazo de su H 0 implica que la serie no tiene 18