Departamento de Estadística e Investigación Operativa Aplicadas y Calidad. Licenciado en Administración y Dirección de Empresas A.D.E. - U.P.V.

Departamento de Estadística e Investigación Operativa Aplicadas y Calidad Licenciado en Administración y Dirección de Empresas A.D.E. - U.P.V. ECONOMETRÍA CONVOCATORIA ORDINARIA - 20/01/2005 NOMBRE Y APELLIDOS NORMAS PARA EL EXAMEN ' Sobre la mesa sólo puede estar el examen, el formulario, la calculadora y los útiles de escritura. ' Cada ejercicio se responderá en el espacio libre que hay antes de la próxima pregunta y en las caras de detrás, debiendo quedar claro el desarrollo realizado y resaltada convenientemente la respuesta. ' No se puede desgrapar el examen ni utilizar hojas sueltas como borrador. ' La puntuación de cada ejercicio esta situada al final del correspondiente enunciado.

20/01/2005-3 C1 Si se plantean los dos siguientes modelos para explicar el Consumo de un producto a partir de la Renta de los consumidores: Consumo'β 0 %β 1 Renta%U Consumo'γ 0 %γ 1 (Renta&R min )%U Los significados de los parámetros β 0 y β 1 serán iguales a los significados de los parámetros γ 0 y γ 1 respectivamente?. De no ser así, qué relación existirá entre ellos?. (R min es la Renta que marca el umbral de pobreza del país analizado). (1'0p) Lo primero sería definir el significado de los parámetros de los modelos: β 0 β 1 γ 0 γ 1 Es el promedio del consumo del producto cuando la renta de los consumidores es cero Es el incremento del promedio del consumo del producto por aumento unitario de la renta de los consumidores Es el promedio del consumo del producto cuando la renta de los consumidores es la del umbral de pobreza Es el incremento del promedio del consumo del producto por aumento unitario de la renta de los consumidores De las definiciones anteriores resulta obvio que los parámetros β 1 y γ 1 tienen el mismo significado. No ocurre lo mismo con los otros parámetros, β 0 y γ 0, que difieren en el valor de la renta usado como referencia, cero en el primer caso y la renta umbral de pobreza (R min ) en el segundo. La relación existente entre ellos se obtiene a partir de las ecuaciones originales, desarrollando y agrupando convenientemente: Consumo'β 0 %β 1 Renta%U'γ 0 %γ 1 (Renta&R min )%U' (γ 0 &γ 1 R min ) %γ 1 Renta%U Ahora es sólo cuestión de identificar los parámetros de la primera y la última ecuación (lo que acompaña a Consumo y lo que no lo hace): β 0 'γ 0 &γ 1 R min β 1 'γ 1

20/01/2005-4 C2 Enumera las fases de la elaboración de un modelo ARIMA y haz un breve comentario de lo más esencial de cada una de ellas. (2'0p) 1 Estacionariedad Se aplican las transformaciones adecuadas a la serie en estudio de forma que se consiga que sea estacionaria, caso de no serlo, lo cual es lo más habitual. Si la serie tiene tendencia o cambios de nivel se toman diferencias regulares, tantas como sean necesarias para que desaparezca. Lo mismo ocurre con la estacionalidad, se toman diferencias estacionales hasta que ésta desaparezca. Por último puede ocurrir que la varianza no sea constante, y para conseguir que lo sea se toman logaritmos en la serie original. 2 Identificación La identificación consiste en determinar los órdenes que tienen las partes autorregresiva y de medias móviles, tanto para la parte regular como para la estacional. El objetivo es conocer el modelo ARIMA (p,d,q)x(p,d,q) s. Para proponer el modelo ARIMA de la serie estudiada es necesario proponer modelos simples para la parte regular y estacional (caso de serlo). El modelo para la parte regular se propone a partir de los primeros coeficientes de autocorrelación de la FAS (o la FAP) y se valida observando la FAP (o FAS) y la interacción entre la parte regular y estacional (si es el caso). El modelo para la parte estacional se propone a partir de los coeficientes de autocorrelación estacionales de la FAS (o la FAP) y se valida observando la FAP (o FAS). 3 Estimación Se estiman de los valores de los parámetros de las partes autorregresivas y de medias móviles para el modelo ARIMA (p,d,q)x(p,d,q) s identificado. 4 Validación Mediante las pruebas adecuadas se comprueban tanto las hipótesis relativas al error (ruido blanco) como la significatividad de las estimaciones de los parámetros y al modelo en sí. En este punto aparece la disyuntiva de aceptar o rechazar el modelo estimado y se actúa en consecuencia. Si el resultado es rechazar, se debe REFORMULAR el modelo, y repetir las estimaciones y pruebas hasta encontrar un modelo adecuado. Cuando se disponga de ese modelo adecuado, se estará en condiciones de realizar PREDICCIONES con el mismo, que es, al fin y al cabo, para lo que se quiere. 5 Reformulación En el caso de que el modelo no sea adecuado porque el error está autocorrelacionado, hay que plantearse qué es lo que ha ocurrido en la fase de identificación para que esto sea así. Se debe entonces buscar un modelo complementario, (reformulación) que sea capaz de explicar lo que el primero no puede, y comprobar posteriormente si el nuevo modelo es adecuado. Si este complemento resulta adecuado, se incluye definitivamente en el modelo estimado y si no lo es, entonces se vuelve al paso de IDENTIFICAR hasta conseguir un modelo válido. 6 Explotación El modelo que ha superado todas las pruebas se considera que es un modelo válido para poder efectuar predicciones, y tales predicciones pueden realizarse de forma puntual y/o por intervalos de confianza.

20/01/2005-5 P1 Hace unos meses podía leerse en un suplemento económico de un diario de la ciudad de Valencia: Los clientes aplican una máxima: ya que los precios no bajan, prescindamos de metros cuadrados en nuestra vivienda. Así, las compañías, para hacer más asequibles sus productos a los valencianos, han optado por construir casas más pequeñas, y desde 2001 hasta la fecha, la superficie media de una vivienda ha disminuido siete metros cuadrados. Para comprobar estos hechos se dispone del incremento del precio por metro cuadrado (PRECIOM2, en euros) y del incremento promedio de la superficie de viviendas de nueva construcción (SUP, en metros cuadrados) del año 2003 en los distritos de la ciudad de Valencia. Además se han identificado los distritos que no tienen una limitación natural de espacio para crecer, creado la variable ficticia EXPANSION que toma el valor 1 en el caso de que no existan limitaciones físicas para el crecimiento y 0 en otro caso. a) Expresión general del modelo ajustado en la TABLA P.1_I. Separar del modelo las expresiones de los modelos correspondientes a cada situación física (EXPANSION), y representarlos gráficamente (de forma aproximada, sin realizar cálculos). (0'5p) b) Determina el significado de los parámetros que acompañan a las variables del modelo. (0'9p) c) Explica el significado de las estimaciones de los parámetros que acompañan a las variables (supón que tienes que comunicar las conclusiones en una rueda de prensa a periodistas no especializados en economía). Es cierto que se construyen viviendas más pequeñas?. Justifica la respuesta. (0'9p) d) Determina si el modelo planteado y ajustado podría resultar adecuado. Justificar la respuesta mediante una prueba de hipótesis, indicado las hipótesis realizadas (nula y alternativa), y la hipótesis que se acepta. (0'5p) e) Calcula el coeficiente de determinación, explica su significado y realiza un breve comentario sobre su valor. (0'3p) f) Si entre el año 2001 y el 2003 el incremento promedio del precio por metro cuadrado de la vivienda fue de 240i y nos referimos a la zona donde existen limitaciones físicas, resulta razonable aceptar que la vivienda nueva ha disminuido en 7 metros cuadrados en ese tiempo, tal y como afirmaba el diario?. (0'4p) Multiple Regression Analysis Dependent variable: SUP Standard T Parameter Estimate Error Statistic P-Value CONSTANT 8,72615 2,92056 2,98783 0,0062 PRECIOM2-0,0653729 0,0133444-4,89888 0,0000 EXPANSION*PRECIOM2 0,0734926 0,0182377 4,02972 0,0005 Analysis of Variance Source Sum of Squares Df Mean Square F-Ratio P-Value Model 2354,27 X 1177,13 X X Residual 1778,78 25 X Total (Corr.) X X R-squared = X percent R-squared (adjusted for d.f.) = X percent TABLA P.1_I TABLA P.1_II

20/01/2005-6 Regression Results for SUP (PRECIOM2=240i EXPANSION=0) ----------------------------------------------------------------------- Fitted Stnd. Error Lower 95,0% CL Upper 95,0% CL Row Value for Forecast for Forecast for Forecast ----------------------------------------------------------------------- 29-6,96334 8,89982-25,2929 11,3662 ---------------------------------------------------------------------- TABLA P.1_III a) Expresión general del modelo ajustado en la TABLA P.1_I. Separar del modelo las expresiones de los modelos correspondientes a cada situación física (EXPANSION), y representarlos gráficamente El modelo ajustado en la TABLA P.1_I es el siguiente: SUPERFICIE'β 0 %β 1 PRECIOM2%β 2 EXPANSION(PRECIOM2%U que corresponde a los modelos EXPANSION=0 Hay limitaciones físicas para la construcción SUPERFICIE'β 0 %β 1 PRECIOM2%U EXPANSION=1 No hay limitaciones físicas para la construcción SUPERFICIE'β 0 %(β 1 %β 2 )PRECIOM2%U Según el enunciado, la pendiente de la ecuación correspondiente a EXPANSION=0 debería ser negativa, comenzando en algún valor que supuestamente podría ser positivo. No está clara la pendiente en el caso de que EXPANSION=1, por lo que se dibuja positiva esperando a la estimación de los parámetros para conocer realmente su signo. El valor inicial en este caso es el mismo que en el caso anterior. b) Determina el significado de los parámetros que acompañan a las variables del modelo. β 0 promedio del incremento de superficie de la vivienda cuando el precio por metro cuadrado no cambia, con independencia de su situación. β 1 incremento promedio del aumento de superficie de la vivienda por cada euro que incrementa el aumento de precio por metro cuadrado para las viviendas situadas en una zona con limitaciones físicas. β 2 diferencia en el incremento promedio del aumento de superficie de la vivienda por cada euro que incrementa el aumento precio por metro cuadrado para las viviendas situadas en una zona sin limitaciones físicas respecto de las que tienen limitaciones.

20/01/2005-7 c) Explica el significado de las estimaciones de los parámetros que acompañan a las variables. Es cierto que se construyen viviendas más pequeñas?. Justifica la respuesta. En la Tabla P.1_I se tiene que todos los P.value son menores que el 5% y por lo tanto todas las estimaciones son significativas. Veamos cada caso con detalle. β 0 : Como el P.value = 0'0065 < 0'05 se acepta que b 0 = 8'72615 m 2. Cuando precio del metro cuadrado de vivienda mantiene su valor, el promedio de superficie construida aumenta en 8'72615 m 2. β 1 : Como el P.value = 0'0000 < 0'05 se acepta que b 1 = -0'0653 m 2 /i. Por cada euro que se incrementa el aumento del precio por metro cuadrado, la superficie de la vivienda situada en la zona con limitaciones disminuye en 0'0653 m 2. β 2 : Como el P.value = 0'0005 < 0'05 se acepta que b 2 = 0'07349 m 2 /i. Por cada euro que se incrementa el aumento del precio por metro cuadrado, la superficie de la vivienda situada en la zona sin limitaciones aumenta en -0'0653+0'07349= 0'0082m 2, y la diferencia entre ambas situaciones es de 0'07349 m 2 por cada euro de aumento. Dado que la superficie de la vivienda disminuye en 0'0653 m 2 por cada euro que incrementa el aumento de precio, puede admitirse la afirmación del periódico. La afirmación no es válida en general dado que en la zona sin limitaciones físicas la superficie de las viviendas aumenta con el precio del metro cuadrado. d) Determina si el modelo planteado y ajustado podría resultar adecuado. Justificar la respuesta mediante una prueba de hipótesis, indicado las hipótesis realizadas (nula y alternativa), y la hipótesis que se acepta. Formalmente, la prueba de hipótesis es la siguiente: H 0 El modelo no resulta adecuado, β 1 =β 2 =0 H 1 El modelo podría resultar adecuado, al menos uno de los parámetros es distinto de cero F calc ' CME / F k, n&k&1 CMR Si F calc #F α k,n&k&1 entonces se acepta H 0 (β =0, œ i$1). i Los valores necesarios para realizar la prueba los encontramos en la TABLA P.1_II. CME = 1177'13 CMR = 1778'78/25 = 71'1513 gdlm = k = 2 gdlr = n-k-1 = 25 13 Como F calc ' 1177) '16 ) 05 54ÛF 0) ' 2,25 38 se debe rechazar H 0 y por lo tanto el modelo podría resultar 3) 71 ) 1513 adecuado.

20/01/2005-8 e) Calcula el coeficiente de determinación, explica su significado y realiza un breve comentario sobre su valor. El coeficiente de determinación se calcula de la siguiente forma, a partir de la TABLA P.1_II. R 2 ' SCE SCT ' 2354 ) 27 ' 0 ) 56962 2354 ) 27%1778 ) 78 con lo que el aumento de precio por metro cuadrado y la existencia de suelo, en la forma del modelo propuesto, explica el 56'962% de la variabilidad del aumento de la superficie de la vivienda. Es evidente que el porcentaje de variabilidad explicado es muy pequeño, aunque ha sido posible determinar la influencia del aumento del precio por metro cuadrado sobre el aumento de la superficie de las viviendas. Un porcentaje tan pequeño nos llevará a predicciones con mucho error. f) Si entre el año 2001 y el 2003 el incremento promedio del precio por metro cuadrado de la vivienda fue de 240i y nos referimos a la zona donde existen limitaciones físicas, resulta razonable aceptar que la vivienda nueva ha disminuido en 7 metros cuadrados en ese tiempo, tal y como afirmaba el diario?. De la TABLA P.1_III se tiene que cuando el incremento del precio es de 240i y se está en la situación de limitaciones físicas la superficie de la vivienda disminuye en 6'96334 m 2. Este valor es, desde luego, muy parecido a los 7 m 2 que propone el diario, pero es necesario acudir al intervalo de confianza de la predicción para poder aceptar que este valor es adecuado. En la propia tabla disponemos del intervalo: [-25'29,11'37] m 2. Como -7 m 2 está dentro del intervalo de la predicción, [-25'29,11'37] m 2, se puede admitir la disminución de los 7 m 2 que propone el diario. El intervalo es muy amplio debido a que el modelo no es muy bueno (explicación del 57%), por lo que también podría ser admisible que el incremento de la superficie es cero, o incluso que ese aumento es positivo.

20/01/2005-9 P.2 Se han estudiado los gastos mensuales de construcción de residencias privadas (en millones de dólares) en una ciudad pequeña de EEUU, desde enero de 1988 hasta diciembre de 1993. a) Indica a partir de su representación gráfica, y de forma justificada, las componentes que pueden observarse. (0'4p) FIGURA P.2_I b) Después de tomar dos diferencias regulares y una estacional para convertir la serie en estacionaria, obtenemos la FAS y FAP siguientes. Proponer a partir de ellas todos los modelos posibles, de forma razonada. (1'2p) FIGURA P.2_II FIGURA P.2_III c) Para validar (en parte) el modelo ARIMA(0,2,1)(0,1,1) 12 : c1) contrasta si el error es un ruido blanco. (1'4p) c2) realiza la reformulación del modelo y el sobre ajuste de la parte regular del mismo. (0'5p) A continuación se proporciona toda la información necesaria. Forecast model selected: ARIMA(0,2,1)x(0,1,1)12 Estimation Validation Statistic Period Period TABLA P.2_I -------------------------------------------- ME -0,0020099

20/01/2005-10 ARIMA Model Summary Parameter Estimate Stnd. Error t P-value ---------------------------------------------------------------------------- MA(1) 0,618389 0,105521 5,86035 0,000000 SMA(1) 0,735882 0,0611499 12,0341 0,000000 ---------------------------------------------------------------------------- Backforecasting: yes Estimated white noise variance = 0,000250635 with 56 degrees of freedom Estimated white noise standard deviation = 0,0158315 TABLA P.2_II a) Indica a partir de su representación gráfica, y de forma justificada, las componentes que pueden observarse. Observando el gráfico de la serie (FIGURA P.2_I ) es posible apreciar tanto tendencia como estacionalidad. En primer lugar puede verse que los valores del primer año representado (1988) son en promedio inferiores a los del resto de los años, con lo que podría hablarse de un cambio de nivel. También podría interpretarse que los gastos de construcción de residencia privadas aumentan con el tiempo hasta 1991 y disminuyen a partir de dicho año, con lo que se tendría una tendencia cuadrática. Lo interpretemos como lo interpretemos, debemos admitir la existencia de esta componente tendencia. En segundo lugar es posible apreciar que existe cierta pauta regular repetida durante todos los años, con un máximo en el mes de Agosto y un mínimo en Febrero, existiendo cierta simetría en la oscilación de cada uno de los años. Esto, naturalmente, es señal de que la serie es estacional, y dado la presencia de los picos máximos (o mínimos) equiespaciados 12 meses, este valor debe ser el periodo estacional. Por último habría que hacer algún comentario sobre la componente cíclica. Como es sabido, puede resultar imposible separar lo que es la componente tendencia y lo que es la cíclica. El movimiento de subida y bajada (tendencia cuadrática) podría ser interpretado como parte de un ciclo. No podemos afirmarlo porque no tenemos suficientes datos (años) para ello. La conclusión definitiva sobre tendencia y ciclo debería esperar a disponer de mas datos. b) Después de tomar dos diferencias regulares y una estacional para convertir la serie en estacionaria, obtenemos la FAS y FAP siguientes. Proponer a partir de ellas todos los modelos posibles, de forma razonada. Para proponer los modelos de la serie, debemos proponer modelos para cada una de sus partes, regular y estacional. Analizaremos la FAS y FAP de la serie diferenciada y propondremos modelos. PARTE REGULAR Como en la FAS (FIGURA P.2_II) se tiene que el primer coeficiente de autocorrelación simple es distinto de cero (ρ 1 0) se puede proponer un modelo MA(1). A continuación se verificará que resulta adecuado: Como se trata de un MA(1) con coeficiente de autocorrelación simple negativo (ρ 1 <0), en la FAP deberían observarse coeficientes de autocorrelación parcial negativos con crecimiento exponencial a cero, como así se observa en los primeros coeficientes de la FIGURA P.2_III. Puesto que la serie es estacional, analizaremos ahora la interacción de la parte regular y la estacional:

20/01/2005-11 Multiple Regression Analysis Dependent variable: RESIDUALS^2 Standard T Parameter Estimate Error Statistic P-Value CONSTANT 0,00112653 0,000460713 2,44519 0,0176 Gastos -0,000055746 0,0000281623-1,97945 0,0527 Multiple Regression Analysis Dependent variable: RESIDUALS^2 Standard T Parameter Estimate Error Statistic P-Value CONSTANT 0,0000643785 0,000179206 0,359243 0,7208 tiempo 0,00000364784 0,00000384478 0,948777 0,3468 TABLA P.2_III TABLA P.2_VI FIGURA P.2_IV FIGURA P.2_V FIGURA P.2_VI En la FAS (FIGURA P.2_II), y alrededor del retardo estacional (ρ 12 ) debería observarse la FAS del modelo elegido, un MA(1). Por lo tanto debemos observar dos coeficientes de autocorrelación simple, retardos 11 y 13, que deben ser mayores que los adyacentes, como así es. Puede verse que ρ 13 lo cumple mejor que ρ 11, pero se puede admitir. En la FAP (FIGURA P.2_III), y a la izquierda del retardo estacional (α 12 ) debería observarse la FAS del modelo elegido (un MA(1)), esto es el coeficiente de autocorrelación parcial de retado 11 que es mayor que los anteriores. En la figura puede verse que esto no es así. Por otra parte, a la derecha del retardo estacional (13 y siguientes) debería observarse la FAP del modelo propuesto, es decir, coeficientes de autocorrelación parcial negativos con crecimiento exponencial a cero. Son negativos, crecen a cero, pero apenas puede apreciarse nada mas en el gráfico. Podríamos decir que se cumple. En resumen, se puede decir que un MA(1) para la parte regular podría considerarse adecuado. Este modelo no es el único que puede proponerse para la parte regular. Observando la FAP (FIGURA P.2_III), puede verse que l primer coeficiente de autocorrelación parcial es distinto de cero (α 1 0). Por lo tanto se puede proponer un AR(1) para la parte regular. Como se trata de un AR(1) con coeficiente de autocorrelación parcial negativo (α 1 <0), en la FAS deberían observarse coeficientes de simple que alternan el signo con convergencia exponencial a cero. En la FAS FIGURA P.2_II puede verse que los primeros coeficiente de autocorrelación simple alternan el signo y decrecen (en valor absoluto) a cero. Puesto que la serie es estacional, analizaremos la interacción de la parte regular y la estacional:

20/01/2005-12 En la FAS (FIGURA P.2_II), y alrededor del retardo estacional (ρ 12 ) debería observarse la FAS del modelo elegido, un AR(1). Por lo tanto debemos observar que los coeficientes de autocorrelación simple alternan el signo y decrecen a cero (retardos 11 y anteriores, y retardo 13 y posteriores). Puede verse que ρ 11 y anteriores lo cumplen claramente, mientras que no puede decirse lo mismo de ρ 13 y siguientes. En la FAP (FIGURA P.2_III), y a la izquierda del retardo estacional (α 12 ) debería observarse la FAS del modelo elegido, esto es que los coeficientes de autocorrelación parcial de retado 11 y anteriores alternan el signo y decrecen a cero. En la figura puede verse que existe alternancia de signo, pero que el decrecimiento de los coeficientes no concuerda con la teoría. Por otra parte, a la derecha del retardo estacional debería observarse la FAP del modelo propuesto, es decir, el coeficiente de autocorrelación parcial de retardo 13 debe ser mayor que los siguientes. Es obvio que esta condición no se cumple. En resumen, se puede decir que un AR(1) para la parte regular no podría considerarse demasiado adecuado, pero está propuesto. PARTE ESTACIONAL No se observa ningún coeficiente de autocorrelación estacional significativo (ni simple ni parcial), por lo que no es posible proponer modelos para la parte estacional. Dado que esta parte existe, es necesario proponer algún modelo, y dado que no es posible hacerlo de forma justificada, lo que se hace es proponer modelos simples, un MA(1) y/o un AR(1) con la esperanza de que alguno de ellos resulte adecuado. Demos esperar a la estimación de los parámetros del modelo para conocer si este suposición resulta razonable o no. Los modelos que se proponen para la serie se obtienen combinando los modelos de la parte regular y estacional: (0,2,1)(0,1,1) 12 (1,2,0)(0,1,1) 12 (0,2,1)(1,1,1) 12 (1,2,0)(1,1,0) 12 c) Para validar (en parte) el modelo ARIMA(0,2,1)(0,1,1) 12 : c1) contrasta si el error es un ruido blanco. Para que el error sea un ruido blanco debe cumplir las siguientes condiciones: a) E(ε t )=0 b) Var(ε t )=cte c) Cov(ε t,ε t-k )=0 d) Distribución normal A continuación realizamos las pruebas para comprobar cada una de las condiciones: a) E(ε t )=0 H 0 E(ε t )=0 H 1 E(ε t ) 0 ˆσ Si ε 0 [&z α/2 ε ˆσ, z α/2 ε entonces se acepta H 0. T T] Los valores para realizar la prueba los encontramos en distintas tablas

20/01/2005-13 ARIMA Model Summary ARIMA(1,2,1)x(0,1,1)12 Parameter Estimate Stnd. Error t P-value ---------------------------------------------------------------------------- AR(1) 0,419798 0,139162 3,01661 0,004328 MA(1) 1,04188 0,0105285 98,9579 0,000000 SMA(1) 0,775349 0,0617075 12,5649 0,000000 Mean 0,000175998 0,000067759 2,5974 0,012896 Constant 0,000102114 ---------------------------------------------------------------------------- ARIMA Model Summary ARIMA(0,2,2)x(0,1,1)12 Parameter Estimate Stnd. Error t P-value ---------------------------------------------------------------------------- MA(1) 0,569217 0,131008 4,3449 0,000061 MA(2) 0,188241 0,132284 1,423 0,160383 SMA(1) 0,747242 0,058859 12,6954 0,000000 ---------------------------------------------------------------------------- TABLA P.2_V TABLA P.2_VI ε = ME = -0,0020099 (TABLA P.2_I) ˆσ ε = 0,0158315 (TABLA P.2_II) T = 56+2=58 (TABLA P.2_II) Z 0'025 =1'96 Tabla de la Normal tipificada z "/2 $F, / T = 1'96 0'0158315/ o58 = 0'00407 como el valor medio del residuo -0'0020099 pertenece a la región de aceptación de la prueba, [-0'00407,0'004075], se debe aceptar que el valor medio del error es cero ( H 0 ) b) Var(ε t )=cte Para determinar si la varianza del error es constante se deben realizar los ajustes por regresión del residuo al cuadrado frente al tiempo y frente a la propia variable estudiada. Si la varianza (cuadrado del residuo) no depende ni del tiempo ni de la construcción de residencias privadas se podrá admitir que la varianza del error es constante. En la TABLA P.2_III se presentan los resultados del ajuste del cuadrado de los residuos frente a la construcción de viviendas privadas. El P.value del parámetro que acompaña a la construcción es de 0'0527 > 0'05 y por lo tanto debería admitirse que la varianza del error no depende de la variable estudiada. NOTA: Es evidente que el P.value es muy próximo al 5%, por lo que si se quisiera mejorar el modelo tal vez debiera admitirse la heterocedasticidad. En la TABLA P.2_IV se presentan los resultados del ajuste del cuadrado de los residuos frente al tiempo. El P.value del parámetro que acompaña al tiempo es de 0'3468 > 0'05 y por lo tanto debería admitirse que la varianza del error no depende del tiempo. Dado que la varianza del error no depende ni del tiempo ni de la propia variable estudiada, se puede admitir que la varianza del error es constante y que no existe heterocedasticidad. c) Cov(ε t,ε t-k )=0 El error no debe estar correlacionado consigo mismo. Para comprobar esto debemos observar la FAS de los residuos (FIGURA P.2_V) y también la FAP (FIGURA P.2_VI). En ambos gráficos se observa que ningún coeficiente de autocorrelación sobrepasa la línea de la prueba de hipótesis para saber si son significativos, por lo que ningún coeficiente de autocorrelación simple o parcial es distinto de cero y se debe aceptar la incorrelación del error.

20/01/2005-14 d) Distribución normal En la FIGURA P.2_IV se presenta el papel probabilístico normal de los residuos. Dado que los residuos aparecen alineados, es posible admitir que el error tiene distribución normal. En la figura puede verse la existencia de dos valores anómalos que no nos impiden aceptar la normalidad, pero que podría ser interesante averiguar lo ocurrido en esas fechas. Finalmente, y dado que se cumplen todas las hipótesis, valor medio cero, varianza constante, incorrelación y distribución normal, es posible aceptar que el error es un ruido blanco. c2) realiza la reformulación del modelo y el sobre ajuste de la parte regular del mismo. En primer lugar realizaremos la reformulación. La reformulación debe realizarse si en la FAS o FAP aparece algún coeficiente de autocorrelación simple o parcial significativo. Como este no es nuestro caso, no tiene sentido reformular el modelo. Lo segundo es el sobreajuste. El sobreajuste consiste en aumentar en uno el orden de la parte AR y de la parte MA (aunque no a la vez) para determinar si de esa forma conseguimos un modelo mejor. En este caso se pide realizar el sobreajuste de la parte regular, por lo que los modelos que debieran ensayarse son: (1,2,1)(0,1,1) 12 se aumenta en uno la parte AR de la parte regular (0,2,2)(0,1,1) 12 se aumenta en uno la parte MA de la parte regular Los modelos ajustados aparecen el las tablas TABLA P.2_V y TABLA P.2_VI respectivamente. En el primer caso, modelo (1,2,1)(0,1,1) 12, se puede aprecia que todos los P.value, y en especial el del coeficiente AR nuevo, son todos menores que un 5%. Esto nos indica que tenemos un nuevo modelo que tal vez sea mejor que el estudiado. Naturalmente, es necesario realizar todos las pruebas para determinar si el nuevo modelo es mejor, pero no disponemos de ellas. De todas formas si se observa la estimación del parámetro MA se tiene que su valor es 1'04188. El polinomio característico es (1-1,04188B) que igualado a cero nos da una raíz próxima a 1, lo cual podría interpretarse que la serie se ha sobrediferenciado y que el modelo no es adecuado. (Este polinomio se cancelaría con una de las diferencias al otro lado de la igualdad). Por otra parte, el segundo modelo (0,2,2)(0,1,1) 12 no resulta mejor que el original debido a que el P.value del nuevo parámetro introducido (MA(2)) es de 0'1603, mayor que un 5%, y por lo tanto no significativo. La conclusión es que este nuevo modelo no es mejor que el propuesto en este apartado. La conclusión final del sobreajuste es que no se ha encontrado un modelo ARIMA mejor que el original, y aún mas, el modelo original no resulta adecuado pese a que todas las pruebas sobre el han salido correctas.