Hoja de Ejercicios 3 El modelo de regresión lineal múltiple

Documentos relacionados
Hoja de Ejercicios 4 Análisis de regresión con información cualitativa

TEMA 3: Contrastes de Hipótesis en el MRL

ESTADÍSTICA. Tema 4 Regresión lineal simple

ENUNCIADOS DE PROBLEMAS

Método de cuadrados mínimos

VARIABLES ESTADÍSTICAS BIDIMENSIONALES

EJERCICIOS. Curso: Estadística. Profesores: Mauro Gutierrez Martinez Christiam Miguel Gonzales Chávez. Cecilia Milagros Rosas Meneses

Contrastes de hipótesis paramétricos

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

Tercera práctica de REGRESIÓN.

Estadística y sus aplicaciones en Ciencias Sociales 7. El modelo de regresión simple. Facultad de Ciencias Sociales - UdelaR

Percepción de los Precios por Parte de los Hogares: El caso de la Electricidad en el Perú

INFERENCIA ESTADISTICA

Tema 5. Contraste de hipótesis (I)

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

Bloque 1: Modelo de Solow básico. k t+1 = γf(k t ) + (1 δ)k t.

Contraste de hipótesis Tema Pasos del contraste de hipótesis. 1.1 Hipótesis estadísticas: nula y alternativa. 1.3 Estadístico de contraste

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)

El Modelo de Regresión Simple

Análisis de Regresión Múltiple: Estimación

Econometría II Grado en finanzas y contabilidad

Teorema Central del Límite (1)

Universidad Carlos III de Madrid Econometría Funciones de regresión no lineales Hoja de Ejercicios 8

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Funciones de Regresión No Lineales (SW Cap. 6)

Tema 2. Descripción Conjunta de Varias Variables

Métodos Estadísticos Multivariados

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

Examen de Grado Sección de Econometría Agosto y se obtienen los siguientes resultados. Observe que parte de la información ha sido omitida.

Economía Aplicada. ¾Es importante el tamaño de la clase? Un experimento controlado

Tema 3: El modelo de regresión lineal múltiple

Conceptos Básicos de Inferencia

Determinación del tamaño de muestra (para una sola muestra)

Hoja de Ejercicios 4 Variables Instrumentales y MC2E. Modelos de ecuaciones simultáneas

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

Regresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A

Econometria de Datos en Paneles

Tema 5: Introducción a la inferencia estadística

Exactitud y Linearidad del Calibrador

Econometría de series de tiempo aplicada a macroeconomía y finanzas

= P (Z ) - P (Z ) = P (Z 1 25) P (Z -1 25)= P (Z 1 25) [P (Z 1 25)] = P (Z 1 25) [1- P (Z 1 25)] =

EJERCICIOS DE SELECTIVIDAD

Puntuación Z ESTADÍSTICA APLICADA A LA EDUCACIÓN I. L.A. y M.C.E. Emma Linda Diez Knoth

Unidad IV: Distribuciones muestrales

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

Otra característica poblacional de interés es la varianza de la población, 2, y su raíz cuadrada, la desviación estándar de la población,. La varianza

DEPARTAMENTO DE MATEMÁTICAS. IES GALLICUM

Capítulo 8. Análisis Discriminante

T4. Modelos con variables cualitativas

Multicolinealidad. Universidad de Granada. RSG Incumplimiento de las hipótesis básicas en el modelo lineal uniecuacional múltiple 1 / 17

ESTADÍSTICA I PRESENTACIÓN DE LA ASIGNATURA

TEMA 5 Variables ficticias

Ejemplos y ejercicios de. Estadística Descriptiva. yanálisis de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios.

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

Tema 3. Relación entre dos variables cuantitativas

ESTADÍSTICA DESCRIPTIVA PARA EL TURISMO

Tabla de Test de Hipótesis ( Caso: Una muestra ) A. Test para µ con σ 2 conocida: Suponga que X 1, X 2,, X n, es una m.a.(n) desde N( µ, σ 2 )

La representación gráfica de una función cuadrática es una parábola.

MEDIDAS DE TENDENCIA CENTRAL

TAMAÑO DE MUESTRA EN LA ESTIMACIÓN DE LA MEDIA DE UNA POBLACIÓN

Tema 5. Muestreo y distribuciones muestrales

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo

INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M.

Análisis de datos Categóricos

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24

Estimación de un modelo de ecuaciones simultáneas usando el software econométrico Gretl

INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016

Repaso Estadística Descriptiva

Espacios Vectoriales. AMD Grado en Ingeniería Informática. AMD Grado en Ingeniería Informática (UM) Espacios Vectoriales 1 / 21

1. Caso no lineal: ajuste de una función potencial

Límites de funciones de varias variables.

Cómo se hace la Prueba t a mano?

MODELO ECONOMÉTRICO. José María Cara Carmona. Adrián López Ibáñez. Explicación del desempleo

Regresión con variables independientes cualitativas

Tema 2.- Formas Cuadráticas.

CAPITULO II ANÁLISIS DEL CRECIMIENTO POBLACIONAL Y CALCULO DE CAUDALES DE DISEÑO

Estadística Descriptiva. SESIÓN 7 Medidas de centralización

Estadística Descriptiva. SESIÓN 11 Medidas de dispersión

REGRESIÓN LINEAL SIMPLE, COEFICIENTE DE DETERMINACIÓN Y CORRELACIONES (EJERCICIOS RESUELTOS)

Tema 8. Análisis de dos variables Ejercicios resueltos 1

Pruebas de Hipótesis H0 : μ = 6 H1 : μ 6 α = 0.05 zα/2 = 1.96 (6-1,96 0,4 ; 6+1,96 0,4) = (5,22 ; 6,78) 5,6 Aceptamos la hipótesis nula H 0 2.

Evolución y determinantes de la desigualdad salarial en Uruguay

Máster en comunicaciones. Clase 2. Modelos predictores.

ESTADÍSTICA DESCRIPTIVA

Tema 1. El Modelo de Regresión Lineal con Regresores Aleatorios.

GUÍA 5 : EFECTO DEL ESTRÉS EN EL PESO DE RECIÉN NACIDOS

EJERCICIO 1 La tabla siguiente muestra las posibilidades de producción en una economía:

Análisis de Componentes de la Varianza

DERIVADAS. TVM (a, b) = = h. La tasa de variación media se puede interpretar como la pendiente de la recta AB de la figura siguiente:

Variables aleatorias

Estadística Espacial en Ecología del Paisaje

Colección Gerencia de Proyectos Formulación y Evaluación de Proyectos Unidad de Aprendizaje Evaluación Financiera de Proyectos Autoevaluación

EJERCICIOS RESUELTOS DE ESTADÍSTICA II

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón

EJERCICIOS DE DETERMINANTES

Z i

El Modelo Ricardiano Introducción

OPTIMIZACIÓN VECTORIAL

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

Transcripción:

Hoja de Ejercicios 3 El modelo de regresión lineal múltiple Nota: En aquellos ejercicios en los que se incluyen estimaciones y referencia al archivo de datos utilizado, el estudiante debería comprobar los resultados obtenidos en Gretl. 1. Sea el modelo Y = β 0 + β 1 X 1 + β 2 X 2 + ε, donde E(ε X 1, X 2 ) = 0, y suponga que disponemos de una muestra de tamaño n. (a) Derive las condiciones de primer orden de los estimadores MCO β 0, β 1, β 2 de los coeficientes β. (b) Muestre que β 0 = Y β 1 X 1 β 2 X 2 β 1 = 1 D (s 22s 1y s 12 s 2y ) β 2 = 1 D (s 11s 2y s 12 s 1y ) donde s 11 = 1 n i x2 1i, s 22 = 1 n i x2 2i, D = s 11 s 22 s 2 12. s 12 = 1 n i x 1ix 2i = s 21, s 1y = 1 n i x 1iy i s 2y = 1 n i x 2iy i siendo y i = Y i Y, x 1i = X 1i X 1, x 2i = X 2i X 2. (c) Qué ocurre cuando D = 0? Interprete el resultado. (d) Muestre que, cuando s 12 = 0, el estimador β 1 coincide con el estimador γ 1 en la regresión simple Ŷ = γ 0 + γ 1 X 1, e interprete el resultado. 2. Cuál de las siguientes situaciones, si alguna, incumpliría los supuestos del modelo de regresión clásico? (a) La variable X 2 es el recíproco de la variable X 1. (b) La variable X 2 es el cuadrado de la variable X 1. (c) La variable X 1 es una variable artificial que toma el valor 1 para mujeres y 0 para hombres, y la variable X 2 es una variable artificial que toma el valor 1 para hombres, y 0 para mujeres. 3. Aunque el vino es un bien de consumo, dadas las características de los grandes vinos de reserva puede tener sentido considerarlos como una inversión. En particular, disponemos de datos de los precios de subasta de miles de vinos tintos de reserva de Burdeos de añadas entre 1952 y 1980. Estos vinos se almacenan durante bastante tiempo antes de ser consumidos, lo que César Alonso (UC3M) 1

incrementa su precio dado el coste de almacenaje, que supone un coste de oportunidad dada la posibilidad de inversiones alternativas. Nuestro fichero de datos BORDEAUX.GDT proporciona, para distintas añadas, información sobre LP R (logaritmo neperiano del precio del vino), lluvinv (Cantidad de lluvia caída en el invierno anterior a la cosecha), tempmed (Temperatura media durante el período de maduración de la uva), lluvcos (Cantidad de lluvia caída durante el período de maduración de la uva), edad (Número de años transcurridos desde la cosecha). (a) Estime la proyección lineal de lpr sobre edad. Dados los resultados, cuál sería la tasa de rentabilidad anual derivada de conservar el vino? (b) Efectúe la regresión múltiple de lpr sobre edad, lluvinv, lluvcos, tempmed. Cómo cambia la estimación de la tasa de rentabilidad de conservar el vino? Cómo explica las diferencias? Explique qué (Pista: Qué factores pueden afectar a la calidad del vino?). 4. Sean Y = logaritmo de la cantidad real de dinero, X 1 = logaritmo del PIB real, X 2 = logaritmo del tipo de interés de las Letras del Tesoro. Considere las siguientes regresiones: Ŷ = 2.3296 +0.5573X 1 0.2032X 2 (0.2054) (0.0264) (0.0210) R 2 = 0.927 s = 0.048 Y = 6.63 Ỹ = 2.9967 +0.4356X 1 (0.3657) (0.0438) R 2 = 0.733 s = 0.091 Y = 6.63 X 2 = 3.2839 +0.5988X 1 Utilizando los resultados de estas regresiones, derive la pendiente de la otra regresión corta, es decir, de la regresión de Y sobre X 2. Pista: desarrolle la regla de la variable omitida con los papeles de X 1 y X 2 cambiados. La pendiente y el R 2 de la regresión auxiliar pueden utilizarse para determinar la pendiente de la otra regresión auxiliar. 5. Dado el modelo Y = β 0 + β 1 X 1 + β 2 X 2 1 + ε, donde E (ε X 1 ) = 0, se ha obtenido la siguiente ecuación por MCO: Ŷ = 2.613 + 0.30X 1 0.090X 2 1 (0.429) (0.14) (0.037) n = 32, R 2 = 0.1484 (a) Dados los resultados de la estimación, a partir de qué valor de X 1 el efecto causal de X 1 sobre Y comienza a ser negativo? Justifique la respuesta. César Alonso (UC3M) 2

(b) Queremos contrastar si conviene mantener el término cuadrático en el modelo. Establezca la hipótesis nula y la hipótesis alternativa en términos de los parámetros del modelo, y escriba el correspondiente estadístico de contraste y su distribución aproximada. En caso de disponer de información, realice dicho contraste e indique cuál es su conclusión. 6. Consideramos una ecuación para explicar los salarios de los directores generales de las empresas en función de las ventas anuales de las empresas, el rendimiento de pagarés (roe, en porcentaje) y el rendimiento de las acciones de la empresa (ros, en porcentaje): log(salary) = β 0 + β 1 log(sales) + β 2 roe + β 3 ros + u (a) En términos de los parámetros del modelo, especificar la hipótesis nula de que, una vez tomada en cuenta la influencia de sales y roe, ros no influye en el salario de los directores generales. Especifique como alternativa que la mejora en el rendimiento del mercado de valores incrementa el salario del director general. (b) Considere los siguientes resultados de la estimación de la ecuación anterior por MCO: log(salary) = 4.32 + 0.280log(sales) + 0.0174roe + 0.00024ros (0.32) (0.035) (0.0041) (0.00054) n = 209 R 2 = 0.283 En qué porcentaje se predice que aumentaría la variable salary, si ros aumentase en 50 puntos? (c) Contraste, al 10%, la hipótesis nula de que ros no tiene efecto sobre salary, contra la alternativa de que ros tiene un efecto positivo. (d) Incluiría ros en el modelo final que explica la remuneración del director general en función del rendimiento empresarial? Justifique la respuesta. 7. Considere la siguiente estimación por MCO: ŝleep = 3840.83 0.163totwrk 11.71educ 8.70age + 0.128age2 + 87.75male (235.22) (0.018) (5.86) (11.21) (0.134) (34.33) n = 706 R 2 = 0.117 La variable sleep son los minutos dedicados a dormir a la semana, totwrk son los minutos dedicados a trabajar, educ y age están medidos en años, y male es una variable binaria que toma el valor 1 si el individuo es hombre y 0 en caso contrario. (a) Manteniendo el resto de los factores constantes, hay evidencia de que los hombres duermen más que las mujeres? Se trata de una evidencia fuerte? (b) Es estadísticamente significativa la disyuntiva entre trabajar y dormir? Cuál es la estimación de esta disyuntiva? (c) Qué otra regresión se necesita para contrastar la hipótesis nula de que la edad no afecta al tiempo dedicado a dormir (manteniendo el resto constante)? César Alonso (UC3M) 3

8. El archivo RELOJES.GDT incluye datos de una subasta anual de relojes antiguos organizada por la compañía alemana Triberg Clock. Se ha considerado el siguiente modelo: P = β 0 + β 1 A + β 2 C + β 3 A 2 + β 4 C 2 + β 5 (A C) + ε, (R1) donde P es el precio, en cientos de euros, de la subasta ganadora, A es la antigüedad del reloj (en años) y C es el número de postores o pujadores. Además, el término de error verifica, para cualquier edad y para cualquier número de postores, E (ε A, C) = 0 y V (ε A, C) = σ 2. Supondremos que las correspondientes características poblacionales de dichas variables coinciden con sus análogos muestrales, y que podemos aplicar resultados asintóticos para hacer inferencia aproximada. Tenga en cuenta que para algunas preguntas puede ser necesario conocer dichas características poblacionales, particularmente el rango de valores que toma cada una de las variables de interés. (a) Calcule los estadísticos descriptivos de las variables P, A y C. (b) Estime el modelo (R1) por MCO. Proponga y calcule estimaciones consistentes de V (P ) y V (P A, C). (c) Dados los resultados de (R1), calcule el efecto ceteris paribus de la antigüedad sobre el precio del reloj. Es dicho efecto constante? Justifique la respuesta. (d) Considere la siguiente afirmación: El precio no depende de la antigüedad ni del número de postores. Escriba la hipótesis nula (H 0 ) y la hipótesis alternativa (H 1 ) en términos de los parámetros del modelo (R1). Escriba el estadístico de contraste e indique su distribución aproximada bajo H 0. Si es posible, realice el contraste e indique cuál es su conclusión. En caso de que falte información para realizar el contraste, indique qué necesitaría. (e) Considere la siguiente especificación: P = δ 0 + δ 1 (4A + C) + δ 2 A 2 + δ 3 C 2 + δ 4 (A C) + ε. (R2) Estime (R2) por MCO. (f) Considere la hipótesis nula H 0 : β 1 = 4β 2 frente a la alternativa H 1 : β 1 4β 2. Escriba el modelo restringido (bajo H 0 ), y relaciónelo con el modelo (R2). 9. Considere el modelo de regresión lineal Y i = β 0 + β 1 X 1i + β 2 X 2i + β 3 X 3i + β 4 X 4i + β 5 X 5i + ε i. Explique exactamente cómo contrastaría las siguientes hipótesis: (a) β 1 = 0. (b) β 1 = 0 y β 4 = β 5 (c) β 1 = 0, β 3 = 2, y β 4 = β 5. 10. Para contrastar una única restricción asociada a una relación lineal entre parámetros del modelo, siempre es posible reparametrizar el modelo no restringido, mediante una representación equivalente, pero que permita contrastar la hipótesis nula mediante un contraste de que un determinado coeficiente es igual a cero. Este ejercicio ilustra una posible reparametrización César Alonso (UC3M) 4

para una restricción lineal que afecta a varios parámetros del modelo no restringido. Considere el modelo de regresión múltiple Y = β 0 + β 1 X 1 + β 2 X 2 + β 3 X 3 + ε, (1) que verifica los supuestos 1 a 4. Se quiere contrastar la hipótesis nula H 0 : β 1 3β 2 = 1. (a) Sean β 1 y β ) 2 los estimadores MCO respectivos de β 1 y β 2. Exprese V ( β1 3 β 2 en ) ) términos de V ( β1, V ( β2 y C ( β1, β ) 2. (b) Escriba el estadístico t para contrastar H 0 : β 1 3β 2 = 1. (c) Definiendo θ = β 1 3β 2 y su estimador correspondiente (basado en los estimadores MCO de β 1 y β 2 ), θ = β 1 3 β 2, escriba una especificación equivalente a (1) en la que aparezcan β 0, θ, β 2 y β 3 que permita obtener directamente a partir de una muestra de datos, θ y su error estándar. (d) Explique una estrategia, alternativa al apartado (b), de contrastar H 0 : β 1 3β 2 = 1. 11. Considere la siguiente especificación para una función de producción: y i = β 0 + β 1 l i + β 2 k i + ε i (i = 1,..., n), (2) donde y = logaritmo del output, l = logaritmo del factor trabajo, k = logaritmo del capital. Suponga además que E (ε i l i, k i ) = 0 para todo l i, k i. Se quiere contrastar la hipótesis de rendimientos constantes a escala, es decir, β 1 + β 2 = 1. Explique cómo se haría el contraste: (a) Si se tienen las estimaciones MCO de la regresión (2) y de su correspondiente matriz de varianzas y covarianzas de los parámetros estimados. (b) Si se tienen las estimaciones MCO de la regresión de (y i k i ) sobre una constante, (l i k i ) y k i. (c) Si se tienen la suma de los cuadrados de los residuos de la estimación MCO de (2) y de la estimación MCO de la regresión de (y i k i ) sobre una constante y (l i k i ). César Alonso (UC3M) 5