Estacionalidad Qué es la estacionalidad? La estacionalidad es una componente que se presenta en series de frecuencia inferior a la anual (mensual, trimestral,...), y supone oscilaciones a corto plazo de período regular, inferior al año y amplitud regular. Se trata de la componente que introduce los matices más interesantes de cara a la predicción. En general, todas las series de frecuencia inferior a la anual presentan en mayor o menor medida estacionalidad. Estacionalidad Estacionalidad En el gráfico se recoge la evolución del Índice de Producción industrial de España, desde enero de 1998 hasta junio de 2003. Son datos mensuales, en base 2000=100, obtenidos del INE. Podríamos discutir si la serie presenta nítidamente tendencia o ciclo (realmente es un período muy pequeño, 5 años, para detectarlo gráficamente), pero este es un ejemplo de serie con estacionalidad. Obsérvese que año tras año, la serie presenta un comportamiento en los distintos meses de cada año muy similar. Todos los años la serie parece crecer en los primeros meses, decae ligeramente en abril, y, sobre todo, sufre una drástica caída de forma sistemática en el mes de agosto. Y así año tras año. Se detecta pues un patrón regular. Efectivamente, esa evolución de la serie responde a hechos sencillos. En los meses de agosto y de abril (si en este mes cae la Semana Santa) las empresas notan el bajón en su producción debido a las vacaciones. Una práctica relativamente frecuente en la modelización econométrica consiste en la utilización del logaritmo en lugar del valor directo de la variable observada. Esta transformación resulta habitual en econometría en distintos contextos: 1. permite la resolución de algunos de los problemas que suelen presentar los modelos econométricos como problemas simples de heteroscedasticidad. Este tipo de transformación tiene la importante propiedad de mantener la evolución temporal de la variable original, reduciendo proporcionalmente la variación relativa entre los distintos valores de la serie. 2. Permite la linealización de modelos originalmente especificados en términos no lineales. Ejemplo, estimar una función de producción de tipo Cobb-Douglas. Q= T Kα Lβ donde K, L representan las dotaciones de factores productivos (capital y trabajo, respectivamente); Q el nivel de producción, y T es una medida de la eficiencia técnica. A partir de esta formulación de la teoría económica, podríamos obtener un modelo econométrico como: 1
Obviamente este modelo no es lineal en los parámetros, por lo cual no es estimable a partir de los métodos usuales. Ahora bien si tomamos logaritmos a ambos lados de la ecuación anterior Se obtiene: lnq = ln T +α ln K + β ln L que podemos presentar como: y* = T * +α k * +β l * Como se observa este modelo ya es lineal, y puede ser estimado por mínimos cuadrados. La simple transformación de las variables lo permite. Una última razón hace interesante esta transformación, y es que los parámetros asociados a variables sobre las que previamente se han tomado logaritmos pueden ser interpretados directamente como elasticidades. ln Q = β ln L Lo cual, como es conocido, puede ser aproximado por la elasticidad parcial de la variable Q con respecto a la variable L. Los modelos econométricos exigen que las series a utilizar sean estacionarias en media y varianza. Es decir, que la serie no tenga tendencia, y que presente un grado de dispersión similar. La eliminación de la tendencia se consigue con diferenciación sucesiva, mientras que para obtener una dispersión similar se recurre a la transformación logarítmica. La transformación logarítmica, es útil en otras circunstancias. Por ejemplo, muchos modelos de especificación no lineal pueden ser fácilmente linealizados mediante una transformación logarítmica. Además, cuando tomamos logaritmos a ambos lado de una ecuación, podemos tener una aproximación al concepto de elasticidad. La metodología de los modelos estructurales no ha prestado gran atención al problema de la estacionalidad puesto que estos modelos suelen trabajar con datos de frecuencia anual. De hecho, cuando la estacionalidad de la variable endógena es similar a la que presentan las variables explicativas, no presenta especiales problemas ni precisa de tratamiento diferenciado. Cuando tal estacionalidad no coincide es preferible, frente a la posibilidad de desestacionalizar la serie, la de introducir variables ficticias estacionales. 2
Estacionariedad Qué se entiende por estacionariedad de una serie? Para definir la estacionariedad de una serie, se dispone de dos posibilidades: por una parte se dice que un proceso es estrictamente estacionario si sus propiedades, no se ven afectadas por cambios de origen temporal, esto es, cuando al realizar un mismo desplazamiento en el tiempo de todas las variables de cualquier distribución conjunta finita, resulta que esta distribución no varía. A efectos prácticos : 1) que la media sea aproximadamente constante en el tiempo; y 2) que la varianza o dispersión sea igualmente constante. Ello implica que si dividiéramos la muestra en varios sub-períodos (teóricamente infinitos períodos) la media y la varianza deben ser aproximadamente iguales. Un instrumento sencillo para detectar cuando la serie cumple o no esta propiedad es mediante la representación gráfica de la serie objeto de estudio. Efectivamente, una media constante implica la ausencia de tendencia en la serie, por lo que su representación debería arrojar algo muy parecido a una línea paralela al eje de abscisas. Igualmente, una varianza constante supone que las oscilaciones alrededor de tal media sean semejantes en cualquier momento del tiempo, lo cual técnicamente se conoce como homoscedasticidad, esto es, igual (homos) dispersión (cedasticidad). El gráfico puede ser suficiente para comprobar el cumplimiento de la homoscedasticidad. Cuando la serie es heteroscedástica, puede solucionarse de forma satisfactoria tomando logaritmos en la serie original. Efectivamente, la toma de logaritmos tiene la importante propiedad de disminuir la variabilidad de la serie, manteniendo el patrón de comportamiento. En la mayor parte de los casos, la toma de logaritmos ha de ser suficiente para que la heteroscedasticidad deje de ser un problema. Para la eliminación de la tendencia se utiliza, la diferenciación adecuada de la serie original. En la mayor parte de las series la toma de una diferencia será suficiente para eliminar la tendencia. En ese caso, la representación gráfica nos mostrará una línea oscilante sobre una línea horizontal al eje de abscisas. Si se mantiene la tendencia, se puede tomar una segunda diferencia. Veámoslo con un ejemplo: en la figura, se puede ver la evolución mensual, durante algo más de ocho años, del consumo de gasolina en España (variable CONGA, en trazo grueso). Esta misma serie nos servirá de ejemplo posteriormente. Evidentemente, la serie no es estacionaria, dado que muestra una clara tendencia al alza. Puesto que la tendencia puede ser adecuadamente recogida mediante una línea recta, parece que bastaría con realizar una sola diferencia a la serie original. Pero, por otra parte, da la impresión de que la serie presenta algo más de dispersión en los últimos años, por lo que podría interesar trabajar, antes de la diferenciación, con la serie en logaritmos (variable LCONGA, en trazo fino y representada con la escala de la derecha del gráfico). La nueva serie transformada presenta, en general, una menor dispersión y ésta parece, además, más similar para los diferentes años en subperiodos en que pudiera dividirse el gráfico. 3
Por supuesto que la toma de logaritmos no elimina la tendencia, por lo que, a continuación, será preciso calcular las primeras diferencias. En un nuevo gráfico, representamos la serie en logaritmos (LCONGA, ahora en trazo grueso y con la escala de la izquierda), así como la serie en diferencias (DLCONGA=LCONGA-LCONGA(- 1), en trazo fino y con la escala de la derecha del gráfico). La tendencia ha sido ahora eliminada en DLCONGA, cuyos valores oscilan alrededor de cero. Por tanto, esta última serie, con transformación logarítmica y en primeras diferencias, ya es estacionaria en media y varianza. La modelización ARIMA o Box-Jenkins parte de considerar que el valor observado de una serie (un dato de una variable) en un momento determinado de tiempo t es una realización de una variable aleatoria definida en dicho momento de tiempo. Por tanto, una serie de t datos es una muestra de un vector de t variables aleatorias ordenadas en el tiempo al que denominamos proceso estocástico. En ocasiones pretendemos predecir el comportamiento de una variable y en un momento futuro t, a partir del comportamiento que la variable tuvo en un momento pasado, por ejemplo, en el período anterior, Y(t-1) Formalmente notaríamos Yt = f(y(t-1)) Es decir, que el valor de la variable y en el momento t es función del valor tomado en el período t-1. Puesto que en el comportamiento de una variable influyen más aspectos, debemos incluir en la relación anterior un término de error, at, que es una variable aleatoria a la que suponemos ciertas características estadísticas apropiadas. Es decir: Ahora se debe elegir una forma funcional concreta para esta expresión. Por ejemplo, una forma lineal como 4
donde es un término independiente y es un parámetro que multiplica al valor de la variable y en el período t-1. Utilizando métodos estadísticos adecuados podemos estimar los parámetros de forma que estos cumplan propiedades estadísticas razonables y sean una buena (la mejor posible) estimación. Con ello obtendríamos una expresión como: Esta es la esencia de los modelos autorregresivos (o modelos AR). Se realiza una regresión de la variable sobre sí misma (auto-regresión) o, mejor dicho, sobre los valores que la variable tomó en el período/s anterior/es. que utilizaríamos a efectos de predicción. Un aspecto importante es el orden del modelo AR. Por ejemplo, el modelo Dependencia de los datos Cada observación se modela en función de datos anteriores. Modelo explicito, conocidos como ARIMA (Autoregresive Integrated Moving Average) Permite describir un valor como una función lineal de datos anteriores y errores debidos al azar. Modelos que explican el comportamiento de la variable endógena, a través del propio pasado, antes de incorporar el efecto de la variable explicativa (ARIMA). El principio básico de los modelos ARIMA, es que el efecto de un conjunto de variables explicativas x sobre y, debe ser estimado después que se haya controlado por los efectos pasados de la variable endógena. Se intenta explicar, en que medida las variables independientes explican la variación de la variable endógena, que no viene explicado por la variación de los valores pasados de dicha variable. 5
La metodología Box-Jenkins, intenta explicar el proceso que autogenera (explica) la variación de la variable endógena a través del tiempo. Requisito, es que todas las variables sean estacionarias, es decir no existe cambio sistemático en la media y varianza de los valores de dicha variable a lo largo del tiempo. 1. Recogida de datos (Recomiendan un mínimo de 50 observaciones), si es mensual, trabajar con 6 ó 10 años completos. 2. Representación gráfica de la serie, se recomienda utilizar medias y desviaciones típicas por subperíodos, para juzgar la estacionalidad. 3. Transformación previa de la serie para la estacionalidad, las transformaciones logarítmicas son necesarias en caso que la varianza no sea constante. 4. Eliminación de la Tendencia, la observación grafica indicará la existencia o no de tendencia. 5. Identificación del modelo, Consiste en determinar el tipo de modelo más adecuado para la serie objeto de estudio. 6. Estimación de los coeficientes del modelo, decidido el modelo, se procede a la estimación de sus parametros. 7. Contraste de validez conjunta del modelo, se utilizaran diversos procedimientos para valorar el modelo propuesto. 8. Análisis detallado de los errores, diferencias históricas entre valores reales y estimados por el modelo constituyen una fuente especial de interés para una valorización final del modelo. 9. Selección del modelo, en base a los resultados de las etapas anteriores, se elige el modelo. 10. Predicción, el modelo seleccionado servirá como fórmula inicial de predicción. 6
7
8