Departamento de Estadística e Investigación Operativa Aplicadas y Calidad. Licenciado en Administración y Dirección de Empresas A.D.E. - U.P.V.

Documentos relacionados
Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

Se permite un folio escrito por las dos caras. Cada problema se realiza en hojas diferentes y se entregan por separado.

Tercera práctica de REGRESIÓN.

TEMA 4 Modelo de regresión múltiple

Estadística Industrial. Universidad Carlos III de Madrid Series temporales Práctica 5

REGRESIÓN LINEAL SIMPLE

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)

ANALISIS DE LA ESTATURA

ESTADISTICA II. INGENIERIA INFORMATICA, 3 ER Curso Septiembre Primera Parte

ENUNCIADOS DE PROBLEMAS

CUESTIONES Y PROBLEMAS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES PROPUESTOS EN EXÁMENES

Método de cuadrados mínimos

TODO ECONOMETRIA. Bondad del ajuste Contraste de hipótesis

Multiple Linear Regression

Regresión múltiple. Demostraciones. Elisa Mª Molanes López

Ejercicio Heterocedasticidad_2

Econometría II Grado en finanzas y contabilidad

Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple

ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL

Gráfico 1: Evolución del exceso de rentabilidad de la empresa y de la cartera de mercado

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia

Estadísticas Pueden ser

Econometría dinámica y financiera

T2. El modelo lineal simple

Econometría II Grado en finanzas y contabilidad

Guía breve de análisis de series temporales unidimensionales con Gretl

Regresión lineal. Marcelo Rodríguez Ingeniero Estadístico - Magíster en Estadística

Ejercicio 1 (20 puntos)

MODELO DE RESPUESTAS Objetivos 2, 3, 4, 5, 6, 7, Y 8.

4.1 Análisis bivariado de asociaciones

Tema 3: Análisis de datos bivariantes

Universidad Rafael Belloso Chacín (URBE) Cátedra: Fundamentos de Estadística y Simulación Básica Semestre Profesor: Jaime Soto

ESTADISTICA II. INGENIERIA INFORMATICA, 3 ER Curso

Ejemplo 6.2. Pilar González y Susan Orbe. Dpto. Economía Aplicada III (Econometría y Estadística)

Elaboró: Luis Casas Vilchis

Regresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A

TEMA 3: Contrastes de Hipótesis en el MRL

Pronósticos Automáticos

= 134, 5 Tercer cuartil: Q 3 = Pueden considerarse normales. =2 P 10 = 118 horas. f(x) =

Motivación. Motivación PRONOSTICOS DE DEMANDA

Máster en comunicaciones. Clase 2. Modelos predictores.

Séptima Entrega. New Workfile Daily (5 days week) 1:1:1991 a 2:16:1998. File Import Read Text Lotus Excel

El Modelo de Regresión Lineal

SPSS Aplicación práctica: Base de datos del HATCO

Prueba de hipótesis para la diferencia de medias

Ejercicio 1(10 puntos)

ESTADÍSTICA. Tema 4 Regresión lineal simple

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

Hoja de Ejercicios 3 El modelo de regresión lineal múltiple

MODELO ECONOMÉTRICO. José María Cara Carmona. Adrián López Ibáñez. Explicación del desempleo

Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR

Curso de Predicción Económica y Empresarial Edición 2004

Tribunal de la Oposición al Cuerpo Superior de Estadísticos del Estado

PRÁCTICA 3. REGRESIÓN LINEAL SIMPLE CON SPSS Ajuste de un modelo de regresión lineal simple Porcentaje de variabilidad explicado

SOLUCIÓN EXAMEN IV Nombres: Apellidos: C.I.: Firma: Fecha: 19/11/2004

Hipótesis en el modelo de regresión lineal por Mínimos Cuadrados Ordinarios

Tema 8: Regresión y Correlación

ESTIMACIÓN Y PRUEBA DE HIPÓTESIS INTERVALOS DE CONFIANZA

Estadística. Convocatoria ordinaria

PRUEBA DE HIPÓTESIS BENJAMIN MAMANI CONDORI

Cálculo de la tasa predeterminada de los costos indirectos de fabricación aplicados utilizando un modelo de regresión lineal.

Análisis de la varianza ANOVA

ANÁLISIS DE LA VARIANZA CON UN FACTOR (ANOVA)

UNIVERSIDAD TECNICA PARTICULAR DE LOJA ESTADISTICA Y PROBABILIDAD ENSAYO N 8

Examen de Grado Sección de Econometría Agosto y se obtienen los siguientes resultados. Observe que parte de la información ha sido omitida.

Tema 10: Introducción a los problemas de Asociación y Correlación

Tema 5: Planteamiento de los modelos de series temporales. Coro Chasco Yrigoyen Universidad Autónoma de Madrid (UAM) Asignatura: Econometría II

EXAMEN ECONOMETRÍA I GRUPO 53 - DADE 8 de septiembre de 2005 Prof. Rafael de Arce

Qué hacemos cuando la distribución no es normal? Qué significa ser normal? Qué significa ser normal? 1er. Simposio Metodología Seis Sigma

Métodos Estadísticos Multivariados

2. EL DISEÑO UNIFACTORIAL (COMPARACION DE TRATAMIENTOS)

Estadística para la Economía y la Gestión IN 3401

Contraste de hipótesis Tema Pasos del contraste de hipótesis. 1.1 Hipótesis estadísticas: nula y alternativa. 1.3 Estadístico de contraste

INFERENCIA ESTADISTICA

Análisis Probit. StatFolio de Ejemplo: probit.sgp

SOLUCIÓN A LOS EJERCICIOS DEL SPSS Bivariante

INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016

Técnicas de Predicción Solución Examen Final

LAB 13 - Análisis de Covarianza - CLAVE

ÍNDICE INTRODUCCIÓN... 21

TRABAJO 3: Números Índices. Series Cronológicas (Temas 3 y 4).

Diplomatura en Ciencias Empresariales X Y

Errores de especificación


Repaso de estadística básica. Juan D. Barón Santiago de Chile, 8 de abril de 2013

EJERCICIOS DE PRUEBA DE HIPOTESIS

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

Econometría de series de tiempo aplicada a macroeconomía y finanzas

DISEÑO Y ANÁLISIS DE DATOS EN PSICOLOGÍA II

Determinación del tamaño de muestra (para una sola muestra)

Objetivo: Comprender cómo se calculan los intervalos de confianza y determinar el tamaño ideal de una muetra

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

Prueba de Hipótesis. Bondad de Ajuste. Tuesday, August 5, 14

1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M.

Análisis matemático de la función de Nelson y Siegel

Contrastes de hipótesis paramétricos

GUÍA 5 : EFECTO DEL ESTRÉS EN EL PESO DE RECIÉN NACIDOS

Departamento de Matemática Aplicada a las T.I.C. SOLUCIONES

Guía docente 2007/2008

Segunda práctica de REGRESIÓN.

Transcripción:

Departamento de Estadística e Investigación Operativa Aplicadas y Calidad Licenciado en Administración y Dirección de Empresas A.D.E. - U.P.V. ECONOMETRÍA CONVOCATORIA ORDINARIA - 18/01/2007 NOMBRE Y APELLIDOS NORMAS PARA EL EXAMEN ' Sobre la mesa sólo puede estar el examen, el formulario, la calculadora y los útiles de escritura. ' Cada ejercicio se responderá en el espacio libre que hay antes de la próxima pregunta y en las caras de detrás, debiendo quedar claro el desarrollo realizado y resaltada convenientemente la respuesta. ' No se puede desgrapar el examen ni utilizar hojas sueltas como borrador. ' La puntuación de cada ejercicio esta situada al final del correspondiente enunciado.

18/01/2007-2 P1 Se dispone del número de muertos y del número de accidentes de automóvil ocurridos en España, observados trimestralmente desde el primer trimestre de 1999 y teniendo en cuenta si el accidente se producía en carretera o en un desplazamiento urbano. Los ajustes que aparecen en las siguientes tablas se han realizado utilizado la variable LUGAR, que es una variable ficticia que indica si el accidente se produjo en carretera, VICTIMASM que es el número de personas muertas y ACC10000 que es el número de accidentes producidos menos 10000. De acuerdo a los modelos propuestos responder justificadamente a las siguientes preguntas (α=0'05): a) El lugar donde se produce el accidente, casco urbano o carretera, no tiene importancia en la relación entre el número de muertos y el número de accidentes. (0'7p) b) El número de muertos por accidente en el caso urbano es menor que el número de muertos por accidente en carretera.(0'4p) c) La diferencia del numero medio de muertos en accidente de carretera respecto a los urbanos es de 1000 personas cuando hay 10000 accidentes en un trimestre.(0'4p) Multiple Regression Analysis TABLA P.1_I VICTIMASM=β 0 +β 1 LUGAR+β 2 ACC10000+β 3 LUGAR*ACC10000+U Dependent variable: VICTIMASM Standard T Parameter Estimate Error Statistic P-Value CONSTANT 155,921 17,2791 9,02369 0,0000 LUGAR 933,576 46,0449 20,2754 0,0000 ACC10000 0,013403 0,00286935 4,67109 0,0000 LUGAR*ACC10000 0,100496 0,00732113 13,7269 0,0000 Analysis of Variance TABLA P.1_II VICTIMASM=β 0 +β 1 LUGAR+β 2 ACC10000+β 3 LUGAR*ACC10000+U Source Sum of Squares Df Mean Square F-Ratio P-Value Model 2,75057E6 3 916858,0 1633,45 0,0000 Residual 65111,1 116 561,303 Total (Corr.) 2,81569E6 119 Analysis of Variance TABLA P.1_III VICTIMASM=γ 0 +γ 1 ACC10000 Source Sum of Squares Df Mean Square F-Ratio P-Value Model 423377,0 1 423377,0 40,05 0,0000 Residual 1,24729E6 118 10570,3 Total (Corr.) 1,67067E6 119 a) El lugar donde se produce el accidente, casco urbano o carretera, no tiene importancia en la relación entre el número de muertos y el número de accidentes. Para comprobar si el lugar del accidente tiene importancia en la relación entre el número de muertos y el número de accidentes debemos realizar una prueba de hipótesis para un conjunto de parámetros en el modelo de la TABLA P.1_I. VICTIMASM'β 0 %β 1 LUGAR%β 2 ACC10000%β 3 LUGAR(ACC10000%U En este modelo, los parámetros β 1 y β 3 miden las diferencias entre los promedios de accidentes urbanos y de carretera. El primero mide la diferencia de número promedio de muertos cuando hay 10000 accidentes, del caso de carretera respecto al urbano. El segundo mide la diferencia de número

18/01/2007-3 promedio de muertos por accidente del caso de carretera respecto al urbano. Si ambos fueran cero eso querría decir que no hay diferencias entre las dos situaciones. Para responder se realizará la prueba para un conjunto de parámetros, con los datos disponibles en la TABLA P.1_II y TABLA P.1_III. H 0 β 1 = β 3 =0; el lugar de accidente no influye en la relación entre el número de muertos y el de accidentes. H 1 al menos un parámetro es distinto de cero; el lugar de accidente influye en la relación entre el número de muertos y el de accidentes. La prueba es F calc ' SCR/s SCR c /(n&k&1) /F s,n&k&1 F calc ' (1) 24726 10 6 &65111 ) 1)/2 '1053 ) 06 561 ) 303 F s,n&k&1 'F 2,116 ; F 0) 05 2,116 '3) 07 Como F calc '1053 ) 06>F 0) 05 2116 '3) 07se rechaza la hipótesis nula y se acepta que el lugar de accidente influye en la relación entre el número de muertos y el de accidentes. b) El número de muertos por accidente en el caso urbano es menor que el número de muertos por accidente en carretera. El parámetro β 3 permite responder a la pregunta, ya que cuantifica la diferencia del número de muertos por cada accidente en el caso de accidente de carretera respecto al de casco urbano. Para ello realizaremos la prueba t para determinar si es cero, y si es el caso, su signo. Lo más cómodo es utilizar el P-value para realizar la prueba t en la TABLA P.1_II. H 0 β 3 = 0 H 0 β 3 0 Como P-value = 0'0000 < 0'05 se debe rechazar la hipótesis nula y aceptar que el parámetro es significativo, b 3 =0,100496 muertos/accidente, y el número de muertos por accidente es diferente en ambos casos. Dado que b 3 es positivo, el número de muertos por accidente en carretera es mayor que en el caso urbano. Habría que añadir que considerablemente superior, ya que la diferencia es muy grande si la comparamos con el promedio del número de muertos por cada accidente en el caso urbano, 0'013403. El promedio del número de muertos por accidente en carretera es de 0'013403+0'100496=0'113899, casi 9 veces mayor. c) La diferencia del numero medio de muertos en accidente de carretera respecto a los urbanos es de 1000 personas cuando hay 10000 accidentes en un trimestre. El parámetro β 1 permite responder a la pregunta, ya que cuantifica la diferencia del número de muertos cuando se producen 10000 accidentes en el caso de accidente de carretera respecto al de casco urbano. Realizaremos la prueba t para determinar si puede valer 1000 muertos. H 0 β 1 = 1000 H 0 β 1 1000 t calc ' b 1 &1000 /t s gdlr b1 Utilizamos los resultados de la TABLA P.1_II. si *t calc *#t α/2 gdlr se acepta H 0, t calc ' 933) 576&1000 '1 ) 44 con t con gdlr=116, y 46 ) calc /t gdlr t 0) 025 116 '1 ) 9806 04 Como # t calc # =1'44 < t 0) 025 116 '1 ) 9806 se acepta H 0, y por lo tanto es admisible que cuando se producen 10000 accidentes, la diferencia del número de muertos en carretera respecto a los urbanos sea de 1000 personas.

18/01/2007-4 P2 Describe las principales características de la serie temporal trimestral CONSUMO FINAL EN LOS HOGARES y determina las transformaciones que son necesarias para conseguir que la serie sea estacionaria. (1'5p) (X 10000) 10 CONSUMOFH 1 0,6 FAS de CONSUMOFH 9 0,2 8-0,2 7-0,6 6 Q1/95 Q1/96 Q1/97 Q1/98 Q1/99 Q1/00 Q1/01 Q1/02 Figura P.2_I -1 0 1 2 3 4 5 6 7 8 9 10 Retardo Figura P.2_II Características principales: Tendencia. En el gráfico de la serie (Figura P.2_I) puede observarse que el consumo final en los hogares aumenta, en promedio, con el tiempo, por lo que la variable tiene tendencia positiva. En la FAS de la serie (Figura P.2_II) se observa un decrecimiento lineal de los coeficientes de autocorrelación simple, señal de que la variable tiene tendencia. Estacionalidad En el gráfico de la serie (Figura P.2_I) puede observarse una oscilación que se repite cada año en todos los años, con un mínimo en el primer trimestre y un máximo en el cuarto (cuesta de Enero y Navidad, respectivamente), por lo que puede admitirse la existencia de estacionalidad de periodo 4. La estacionalidad no se observa en la FAS, ya que se esperaría ver que el cuarto coeficiente de autocorrelación simple fuera significativo, y no lo es. Tal vez la tendencia sea muchos más importante que la estacionalidad y por ello no aparece. Ciclos No se aprecia una oscilación de duración superior a un año, por lo que se admitirá que no existen ciclos. Varianza La variabilidad es aproximadamente la misma en todos los años, por lo que puede considerarse constante. Esto puede verse en que la diferencia entre el consumo mayor y menor en cada año es bastante similar. O bien es posible englobar a la serie en una franja de ancho constante. Transformaciones para la estacionariedad En el punto anterior se ha admitido la existencia de tendencia y estacionalidad, lo que lleva a que la media de la variable no es constante y que por lo tanto no es estacionaria. Las transformaciones que deben aplicarse para conseguir la estacionariedad de la variable son diferencias regulares y estacionales. Dado que el consumo final en los hogares tiene tendencia, y que parece ser lineal, con una diferencia regular será suficiente. Dado que la variable es estacional, en principio con una diferencia estacional de periodo 4 será suficiente para eliminar la estacionalidad. Una vez realizadas las dos transformaciones, se espera que la nueva serie sea estacionaria.

18/01/2007-5 P3 Se desea explicar el precio de los áticos en la ciudad de Valencia a partir de su superficie útil y del número de dormitorios y de baños de la vivienda. Para ello se dispone de datos relacionados con un cierto número de áticos en venta, lo cual permite crear las siguientes variables: 1. PRECIO, precio del ático en euros 2. SUPERFICIE, superficie útil de la vivienda menos 25, medida en metros cuadrados 3. HABITACIONES, número de dormitorios menos uno, medidos en unidades 4. BAÑOS, número de baños menos uno, medidos en unidades a) Proponer el modelo lineal más simple posible con las variables propuestas y explicar el significado de sus parámetros. (0'7p) b) Estimado el modelo, el resultado se encuentra en la Tabla P3.1. Comentar el significado de la estimación de los parámetros del modelo ajustado finalmente, tras eliminar aquellos que no eran significativos. (0'6p) c) Calcular el coeficiente de determinación, explicar su significado y comentar su valor (0'2p) d) Determinar que el modelo ajustado tiene problemas de heterocedasticidad. Justificar la respuesta mediante una prueba de hipótesis, indicado las hipótesis realizadas (nula y alternativa), el proceso seguido en la prueba, la hipótesis que se acepta y la variable explicativa causante de la heterocedasticidad. (1'0p) e) Determinar el tipo de relación existente entre la desviación típica del error y la variable explicativa causante de la heterocedasticidad. Proponer el modelo transformado libre de la heterocedasticidad. (1'0p) a) Proponer el modelo lineal más simple posible con las variables propuestas y explicar el significado de sus parámetros. El modelo más simple con las variables propuestas sería el siguiente: PRECIO'β 0 %β 1 SUPERFICIE%β 2 HABITACIONES%β 3 BAÑOS%U El significado de los parámetros sería el siguiente: β 0 β 1 β 2 β 3 Promedio del precio de un ático de 25 m 2 con un dormitorio y un baño Incremento del promedio del precio de un ático por cada metro cuadrado de superficie, dado un número de dormitorios y baños. Incremento del promedio del precio de un ático por cada dormitorio, dada una superficie habitable y número de baños. Incremento del promedio del precio de un ático por cada baño, dada una superficie habitable y número de dormitorios. b) Estimado el modelo, el resultado se encuentra en la Tabla P.3_1. Comentar el significado de la estimación de los parámetros del modelo ajustado finalmente, tras eliminar aquellos que no eran significativos. Dado que todos los P-Valor de la Tabla P.3_1 son inferiores a 0'05, pueden admitirse las estimaciones realizadas de los diferentes parámetros.

18/01/2007-6 Análisis de Regresión Múltiple TABLA P.3_I Variable dependiente: PRECIO Error Estadístico Parámetro Estimación estándar T P-Valor CONSTANTE 150479,0 59239,8 2,54017 0,0174 BAÑOS 132699,0 56724,2 2,33936 0,0273 SUPERFICIE 2474,16 922,164 2,683 0,0125 Análisis de Varianza Fuente Suma de cuadrados GL Cuadrado medio Cociente-F P-Valor Modelo X X 3,61993E11 17,83 0,0000 Residuo X 26 2,02988E10 Total (Corr.) 1,25175E12 28 R-cuadrado = X R-cuadrado (ajustado para g.l.) = X Análisis de Regresión Múltiple TABLA P.3_II Variable dependiente: RESIDUOS^2 Error Estadístico Parámetro Estimación estándar T P-Valor CONSTANTE -5,47113E10 3,27492E10-1,67061 0,1073 SUPERFICIE 8,8913E8 3,52538E8 2,52208 0,0184 HABITACIONES 7,66104E9 1,29718E10 0,590592 0,5601 BAÑOS -2,1827E10 2,18101E10-1,00078 0,3265 Análisis de Varianza Fuente Suma de cuadrados GL Cuadrado medio Cociente-F P-Valor Modelo 2,66428E22 3 8,88092E21 3,26 0,0383 Residuo 6,81687E22 25 2,72675E21 Total (Corr.) 9,48114E22 28 El promedio del precio de un ático de 25 m 2 con un baño es de 150479'0 euros (sea cual sea el número de dormitorios). El incremento promedio del precio de un ático por cada metro cuadrado de superficie es de 2474'16 euros, dado un número de baños. El incremento promedio del precio de un ático por cada baño es de 132699'0 euros, dada una superficie habitable. c) Calcular el coeficiente de determinación, explicar su significado y comentar su valor. Según la Tabla P.3_I, SCT=1'25175E12, y SCE=3'61993E11*2=7'23986E11, ya que el modelo tiene 2 variables explicativas. Por lo tanto R 2 =7'23986E11/1'25175E12=0'578379. El 57'84% de la variabilidad del precio de los áticos se explica por el modelo propuesto. Esta valor es bastante pequeño, y sería necesario más variables para aumentar el valor y conseguir un modelo mejor.

18/01/2007-7 Análisis de Regresión Múltiple TABLA P.3_III Variable dependiente: RESIDUOS^2 Error Estadístico Parámetro Estimación estándar T P-Valor CONSTANTE -5,71969E10 2,69056E10-2,12584 0,0428 SUPERFICIE 7,59986E8 2,53615E8 2,99661 0,0058 R-cuadrado (ajustado para g.l.) = 22,1783 porcentaje CONSTANTE -1,87587E10 1,48452E10-1,26362 0,2172 SUPERFICIE^2 3,28375E6 1,02357E6 3,20812 0,0034 R-cuadrado (ajustado para g.l.) = 24,9169 porcentaje CONSTANTE -4,45576E9 1,18451E10-0,376169 0,7097 SUPERFICIE^3 15593,4 4951,45 3,14926 0,0040 R-cuadrado (ajustado para g.l.) = 24,1559 porcentaje d) Determinar que el modelo ajustado tiene problemas de heterocedasticidad. Justificar la respuesta mediante una prueba de hipótesis, indicado las hipótesis realizadas (nula y alternativa), el proceso seguido en la prueba, la hipótesis que se acepta y la variable explicativa causante de la heterocedasticidad. Para determinar si existe heterocedasticidad, se propondrá un modelo y se realizará el ajuste de la varianza del error (cuadrado del residuo) frente a todas las variables explicativas disponibles. e 2 'γ 0 %γ 1 SUPERFICIE%γ 2 HABITACIONES%γ 3 BAÑOS%U Los resultados del ajuste se encuentran el la Tabla P.3_II, y la prueba sería la siguiente: H 0 γ i =0 œi$1 º La varianza del error no depende de ninguna variable explicativa. No existe heterocedasticidad H 1 al menos un γ i es distinto de cero º La varianza del error si depende de al menos una variable explicativa. Si existe heterocedasticidad Utilizando el P-Valor de la tabla P.3_II se tiene que P-Valor=0'0383<0'05 y por lo tanto debe rechazarse H 0 y aceptarse que existe heterocedasticidad. La variable explicativa causante de la heterocedasticidad se encuentra examinando los P-Valores de la estimación de los parámetros en la propia Tabla P.3_II. En ella se tiene que únicamente el P-valor del parámetro que acompaña a superficie es menor que 0'05, P-Valor=0'0184<0'05, por lo que la heterocedasticidad puede ser atribuida a la superficie del ático. e) Determinar el tipo de relación existente entre la desviación típica del error y la variable explicativa causante de la heterocedasticidad. Proponer el modelo transformado libre de la heterocedasticidad. Para determinar la relación entre la desviación típica del error y la superficie del ático, se utiliza el siguiente modelo, probando diferentes valores de h (1, 2,..., -1, -2,..., ½, 1/3,...): e 2 'δ 0 %δ 1 SUPERFICIE h %U

18/01/2007-8 Los cálculos se encuentran en la Tabla P.3_III, de la se debe señalar que todos los P-Valor de los parámetros que acompañan a la potencia de superficie son menores que 0'05, señalando a dicha potencia como explicativa de la varianza del error. Para determinar el mejor modelo hay que observar el valor del coeficiente de determinación corregido, que tiene un valor inicial de 22'1783% cuando h=1, aumenta a 24'9169% cuando h=2, y disminuye a 24'1559% cuando h=3. De los resultados se deduce que el mayor coeficiente de determinación corregido se produce cuando h=2, y por lo tanto la varianza del error depende del cuadrado de la superficie del ático, o bien que la desviación típica depende de la superficie del ático. Para obtener un modelo libre de heterocedasticidad se debe dividir el mismo por la desviación típica del error, que en este caso es proporcional a la superficie. Se divide el modelo por la superficie del ático. PRECIO SUPERFICIE 'β 0 1 SUPERFICIE %β 1 %β 3 BAÑOS SUPERFICIE % U SUPERFICIE

18/01/2007-9 P4 Se desea proponer un modelo ARIMA para predecir el número de accidentes de automóvil en España. Para ello se dispone del número accidentes producidos desde Enero de 1999 hasta Noviembre de 2003. Observado el gráfico de la serie, se ha decidido tomar dos diferencias regulares y una estacional para poder convertirla en estacionaria. Atendiendo a la FAS y FAP resultantes, un modelo (0,2,2)(0,1,1) 12 parece ser el más indicado. a) Expresión del modelo ajustado en notación de retardos. (0'2p) b) Verificar si son significativos los parámetros del modelo. (0'8p) c) Determinar si el residuo es un ruido blanco, detallando todas las pruebas de hipótesis realizadas para la comprobación. (2'5p) Periodo Periodo TABLA P.4_I Estadístico Estimación Validación -------------------------------------------- ME -48,3683 MPE -1,10493 Resumen del Modelo ARIMA TABLA P.4_II Parámetro Estimación Error Estd. t P-Valor ---------------------------------------------------------------------------- MA(1) 1,86014 0,0224813 82,7418 X MA(2) -0,876484 0,0209015-41,934 X SMA(1) 0,442917 0,136125 3,25374 X ---------------------------------------------------------------------------- Predicción hacia atrás: si Varianza de ruido blanco estimada = 179013,0con X grados de libertad Desviación típica del ruido blanco estimado = 423,099 a) Expresión del modelo ajustado en notación de retardos. El modelo ajustado, a falta de determinar si los parámetros son significativos, sería: (1&B) 2 (1&B 12 )Accidentes t ' (1&1 ) 86014B%0 ) 87648B 2 ) (1&0 ) 4429B 12 )ε t b) Verificar si son significativos los parámetros del modelo. Para determinar si los parámetros son significativos realizaremos la siguiente prueba de hipótesis H 0 ψ i = 0 H 1 ψ i 0 t calc ' ˆψ i s fi /t gdlr si t calc #t α/2 gdlr se acepta H 0, o bien si P-Value $α se acepta H 0 Los valores necesarios para realizar la prueba se encuentran en la TABLA P.4_II. En este caso se debe realizar la prueba basándose en el estadístico t. Para poder realizar la prueba es necesario conocer los grados de libertad del error, gdlr=[(4*12+11)-2-1*12]-3=45-3=42, ya que en todos los casos se trata de una t 42. Si se miran las tablas de la t, t 42 0'025 = 2'018 Parámetro θ 1 : H 0 θ 1 =0 H 1 θ 1 0 El estadístico calculado tiene como valor 82'7418. Como # t clac # =82'7418 > t 42 0'025 = 2'018 se rechaza H 0 y se acepta que θ 1 es significativo, con valor θ 1 = 1'86014.

18/01/2007-10 1 0,6 0,2-0,2-0,6 FAS de residuos ARIMA(0,2,2)x(0,1,1)12-1 0 4 8 12 16 Retardo 1 0,6 0,2-0,2-0,6 FAP de residuos ARIMA(0,2,2)x(0,1,1)12-1 0 4 8 12 16 Retardo PAPEL NORMAL de residuos ARIMA(0,2,2)x(0,1,1)12 99,9 99 95 80 50 20 5 1 0,1-1100 -700-300 100 500 900 Residuos Figura P4.I Figura P4.II Figura P4.III Análisis de Regresión Múltiple TABLA P.4_III Variable dependiente: RESID_022011^2 Error Estadístico Parámetro Estimación estándar T P-Valor CONSTANTE 483470,0 223304,0 2,16508 0,0360 ACCIDENTES -49,7077 34,0475-1,45995 0,1516 Análisis de Regresión Múltiple TABLA P.4_IV Variable dependiente: RESID_022011^2 Error Estadístico Parámetro Estimación estándar T P-Valor CONSTANTE -755,822 100712,0-0,00750479 0,9940 Tiempo 4376,58 2568,32 1,70406 0,0956 Parámetro θ 2 : H 0 θ 2 =0 H 1 θ 2 0 El estadístico calculado tiene como valor -41'934. Como # t clac # =41'934 > t 42 0'025 = 2'018 se rechaza H 0 y se acepta que θ 2 es significativo, con valor θ 2 = -0'876484. Parámetro Θ 1 : H 0 Θ 1 =0 H 1 Θ 1 0 El estadístico calculado tiene como valor 3,25374. Como # t clac # =3,25374 > t 42 0'025 = 2'018 se rechaza H 0 y se acepta que Θ 1 es significativo, con valor Θ 1 = 0'442917. a) Determinar si el residuo es un ruido blanco, detallando todas las pruebas de hipótesis realizadas para la comprobación. Para que el error sea un ruido blanco se deben cumplir las siguientes cuatro condiciones: 1) E(ε t )=0 2) Var(ε t )=cte 3) Cov(ε t,ε t-k )=0 4) Distribución normal de ε t A continuación realizamos las pruebas para comprobar cada una de las condiciones:

18/01/2007-11 1) E(ε t )=0 se utiliza la prueba ya conocida: H 0 E(ε t )=0 H 1 E(ε t ) 0 Si ε 0 [&z ˆσ α/2 ε, z ˆσ α/2 ε ] entonces se acepta H 0. T T Los valores para realizar la prueba los encontramos en distintas tablas ε = ME = -48'368 (TABLA P.4_I) ˆσ ε = 423'099 (TABLA P.4_II) T = 4*12+11-2-1x12= 45 Z 0'025 =1'96 Tabla de la Normal tipificada z "/2 $F, / T = 1'96 423'099/ o45 =123'684 como el valor medio del residuo -48'368 pertenece a la región de aceptación de la prueba, [-123'684,123'684], se debe aceptar que el valor medio del error es cero ( H 0 ) 2) Var(ε t )=cte Si la varianza (cuadrado del residuo) no depende ni del tiempo ni del número de accidentes se podrá admitir que la varianza del error es constante. Para determinar si la varianza del error es constante se deben realizar los ajustes por regresión del residuo al cuadrado frente al tiempo y frente a la propia variable estudiada En la TABLA P.4_III se presentan los resultados del ajuste del cuadrado de los residuos frente al número de accidentes. El P-Valor del parámetro que acompaña a accidentes es de 0'1516, y como P- Valor=0'1516>0'05 debería admitirse que la varianza del error no depende de la variable estudiada. En la P.4_IV se presentan los resultados del ajuste del cuadrado de los residuos frente al tiempo. El P-Valor del parámetro que acompaña al tiempo es de 0'0956. Como P-Valor=0'0956>0'05 debería admitirse que la varianza del error no depende del tiempo. Dado que la varianza del error no depende ni del tiempo ni de la propia variable estudiada, se puede admitir que la varianza del error es constante y que no existe heterocedasticidad. 3) Cov(ε t,ε t-k )=0 El error no debe estar correlacionado consigo mismo. Para comprobar esto debemos observar la FAS de los residuos (Fig.P.4_I) y también la FAP (Fig.P.4_II). En ambos gráficos se observa que ningún coeficiente de autocorrelación sobrepasa la línea de la prueba de hipótesis para saber si son significativos, por lo que ningún coeficiente de autocorrelación simple o parcial es distinto de cero y se debe aceptar la incorrelación del error. 4) Distribución normal En la Fig.P.4_III se presenta el papel probabilístico normal de los residuos. Dado que los residuos aparecen más o menos alineados, es posible admitir que el error tiene distribución normal. Como se cumplen las cuatro condiciones, valor medio cero, varianza constante, incorrelación y distribución normal del error, se debe admitir que el error es un ruido blanco.