Estadística e Introducción a la Econometría Curso Ejercicios del Tema 9. Soluciones

Documentos relacionados
Hoja de Ejercicios 4 Análisis de regresión con información cualitativa

GUIÓN TEMA 4. VARIABLES BINARIAS 4.1. Variables binarias

TEMA 3: Contrastes de Hipótesis en el MRL

Hoja de Ejercicios 4 Variables Instrumentales y MC2E. Modelos de ecuaciones simultáneas

ENUNCIADOS DE PROBLEMAS

TEMA 4: Variables binarias

ESTADÍSTICA. Tema 4 Regresión lineal simple

Universidad Carlos III de Madrid Econometría Funciones de regresión no lineales Hoja de Ejercicios 8

Economía Aplicada. ¾Es importante el tamaño de la clase? Un experimento controlado

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón

INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016

Análisis de Regresión Múltiple con Información Cualitativa: Variables Binarias o Ficticias

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS

MODELO ECONOMÉTRICO. José María Cara Carmona. Adrián López Ibáñez. Explicación del desempleo

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

Tercera práctica de REGRESIÓN.

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

Tema 2. Descripción Conjunta de Varias Variables

Medidas de dispersión

UNIVERSIDAD AUTÓNOMA DE MADRID DEPARTAMENTO DE ECONOMÍA CUANTITATIVA CURSO 2010/2011 ECONOMETRIA I. Hoja de Problemas 3 Problemas

Regresión con variables independientes cualitativas

Tema 1.- Correlación Lineal

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo

Calculamos la covarianza. (La covarianza indica el sentido de la correlación entre las variables):

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

TEMA 5 Variables ficticias

Multicolinealidad. Universidad de Granada. RSG Incumplimiento de las hipótesis básicas en el modelo lineal uniecuacional múltiple 1 / 17

ESTADÍSTICA DESCRIPTIVA

Estadística y sus aplicaciones en Ciencias Sociales 7. El modelo de regresión simple. Facultad de Ciencias Sociales - UdelaR

CAPITULO V CONCLUSIONES. a) El índice de Gini, Theil y el Coeficiente de Variación la Distribución Salarial se

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Funciones de Regresión No Lineales (SW Cap. 6)

Análisis de datos Categóricos

RELACIÓN EJERCICIOS DEL CAPÍTULO 2 1. Consideremos cuatro compañías (A, B, C y D) cuyas acciones cotizan en bolsa y seleccionamos aleatoriamente las

Reporte de Pobreza por Ingresos JUNIO 2015

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

REGRESIÓN LINEAL SIMPLE, COEFICIENTE DE DETERMINACIÓN Y CORRELACIONES (EJERCICIOS RESUELTOS)

Diplomatura en Ciencias Empresariales X Y

UNIDAD 12.- Estadística. Tablas y gráficos (tema12 del libro)

Teorema Central del Límite (1)

Reporte de Pobreza y Desigualdad DICIEMBRE 2015

Fase 2. Estudio de mercado: ESTADÍSTICA

CAPITULO V ANALISIS E INTERPRETACION DE RESULTADOS RESULTADOS GENERALES DEL TEST MATRICES PROGRESIVAS DE RAVEN ESCALA GENERAL Cuadro No.

Tema 8. Análisis de dos variables Ejercicios resueltos 1

MÓDULO 1: GESTIÓN DE CARTERAS

EL INEGI DA A CONOCER LOS RESULTADOS DE LA ENCUESTA NACIONAL DE INGRESOS Y GASTOS DE LOS HOGARES (ENIGH) 2008

Tema: ESTADÍSTICA DESCRIPTIVA BÁSICA CON SPSS 8.0

2.- Tablas de frecuencias

1. Los pesos (en Kgs.) de los niños recién nacidos en una clínica maternal durante el último año han sido:

Tema 5. Muestreo y distribuciones muestrales

Contrastes de hipótesis paramétricos

Práctica 9: Anova (2).

Prácticas de Ecología Curso 3 Práctica 1: Muestreo

Facultad de Ciencias Sociales - Universidad de la República

Pruebas de Hipótesis-ANOVA. Curso de Seminario de Tesis Profesor QF Jose Avila Parco Año 2016

Medidas de centralización

1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M.

1. Caso no lineal: ajuste de una función potencial

UNIDAD 6. Estadística

Tema 4: Probabilidad y Teoría de Muestras

Relación 2: CARACTERÍSTICAS DE UNA DISTRIBUCIÓN DE FRECUENCIAS

Desigualdad de ingresos en Costa Rica a la luz de las ENIGH 2004 y 2013

c). Conceptos. Son los grupos o conceptos que se enlistan en las filas de la izquierda de la tabla

no paramétrica comparar más de dos grupos de rangos (medianas)

Estadística para la toma de decisiones

PROBLEMAS TEMA 3: ANÁLISIS DE COMPONENTES PRINCIPALES. LICENCIADO EN ECONOMÍA

TALLER ESTADISTICAS EN EXCEL MSP 21 VERANO 2014

Tema 5: Introducción a la inferencia estadística

TEMA 4: Sistemas de ecuaciones lineales II

Problemas resueltos. Temas 10 y 11 11, 9, 12, 17, 8, 11, 9, 4, 5, 9, 14, 9, 17, 24, 19, 10, 17, 17, 8, 23, 8, 6, 14, 16, 6, 7, 15, 20, 14, 15.

Estadística para investigadores: todo lo que siempre quiso saber y nunca se atrevió a preguntar

Tema 5. Contraste de hipótesis (I)

El Análisis de Correspondencias tiene dos objetivos básicos:

CAPÍTULO IV TRABAJO DE CAMPO Y PROCESO DE CONTRASTE DE LAS HIPÓTESIS

OPCIÓN A. La empresa A (x) tiene 30 trabajadores, la B (y) 20 trabajadores y la C (z) 13 trabajadores.

Evolución y determinantes de la desigualdad salarial en Uruguay

A. Menéndez Taller CES 15_ Confiabilidad. 15. Confiabilidad


Problemas resueltos. Tema 12. 2º La hipótesis alternativa será que la distribución no es uniforme.

Módulo de Estadística

TEMA 1. MATRICES, DETERMINANTES Y APLICACIÓN DE LOS DETERMINANTES. CONCEPTO DE MATRIZ. LA MATRIZ COMO EXPRESIÓN DE TABLAS Y GRAFOS.

Precio de la gasolina regular (colones por litro, promedio anual)

RELACIÓN DE EJERCICIOS TEMA 2

UNIDAD 10: ECUACIONES DE SEGUNDO GRADO.

Universidad de Sonora Departamento de Matemáticas Área Económico Administrativa

INECUACIONES Y SISTEMAS DE INECUACIONES LINEALES.

15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

El Modelo de Regresión Simple

EJERCICIOS RESUELTOS DE ESTADÍSTICA II

INFERENCIA ESTADISTICA

ÍNDICE INTRODUCCIÓN... 21

Hoja 6: Estadística descriptiva

Ejemplos y ejercicios de. Estadística Descriptiva. yanálisis de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios.

1.- Introducción. Ciclos Mayo 2010 Noviembre 2010 Mayo Servicios/Unidades Becas Acceso Primer y Segundo Ciclo Títulos

MATEMÁTICAS APLICADAS A LAS CC. SOCIALES I. Examen de la tercera evaluación. Nombre y apellidos Fecha: 10 de junio de 2010

Otra característica poblacional de interés es la varianza de la población, 2, y su raíz cuadrada, la desviación estándar de la población,. La varianza

Cómo llevar a cabo un trabajo empírico

Transcripción:

1 Estadística e Introducción a la Econometría Curso 2012-13 Ejercicios del Tema 9 Soluciones 1.- Considere el siguiente modelo para el peso de un bebé al nacer log(bwght) = 0 + 1 cigs + 2 log(faminc) + 3 parity + 4 male + 5 white + u donde bwght es el peso del bebé al nacer en onzas, cigs es el número de cigarrillos diarios que consumió la madre durante el embarazo, faminc es la renta de la familia en miles de dólares, parity es el orden de nacimiento del niño, male es una variable cticia que vale 1 si el bebé es un varón, white es otra variable cticia que vale 1 si el bebé es de raza blanca. Utilizando los datos sobre 1388 nacimientos del chero BWGHT del libro de Wooldridge se ha estimado el modelo obteniéndose los siguientes resultados: log(bwght) \ = 4:66 (0:022) +0:027 (0:010) 0:0044 (0:00085) male + 0:055 n = 1388; R 2 = 0:047 cigs + 0:0093 (0:0059) white (0:013) log(faminc) + 0:016 (0:0056) parity a) Manteniendo todos los demás factores constantes Cuál es el efecto de fumar 10 cigarrillos más al día sobre el peso del bebé al nacer? b) Manteniendo todos los demás factores constantes Pesan más en promedio los bebés de raza blanca que los de raza no blanca? Cuánto más? Es esa diferencia estadísticamente signi cativa? c) Manteniendo todos los demás factores constantes Pesan más en promedio los niños que las niñas? Cuánto más? Es esa diferencia estadísticamente signi cativa? d) Manteniendo todos los demás factores constantes Qué diferencia hay en promedio entre el peso de los varones de raza blanca y de las hembras de raza no blanca? a) Puesto que la variable dependiente está en logaritmos, fumar 10 cigarrillos más al día, manteniendo todos los demás factores constantes, supone en promedio una disminución del peso del bebé al nacer del 4:4% (100 0:0044 10 = 4:4). b) Puesto que el coe ciente de la variable white es positivo, manteniendo constantes el resto de los factores, los bebés de raza blanca pesan más en promedio que los de raza no blanca, en concreto pesan en promedio un 5:5% más. Para ver si esa diferencia es signi cativa tenemos que contrastar H 0 : 5 = 0 H 1 : 5 6= 0 t = b 5 se( b 5 ) t 1382 Bajo H 0 Para esta muestra t = 0:055=0:013 = 4:23 y el p-valor es prácticamente cero. Por tanto, la diferencia es estadísticamente signi cativa a cualquier nivel de signi cación razonable.

2 c) Puesto que el coe ciente de la variable male es positivo, manteniendo constantes el resto de los factores, los niños pesan más en promedio al nacer que las niñas, en concreto pesan en promedio un 2:7% más. Para ver si esa diferencia es signi cativa tenemos que contrastar H 0 : 4 = 0 H 1 : 4 6= 0 t = b 4 se( b 4 ) t 1382 Bajo H 0 Para esta muestra t = 0:027=0:010 = 2:7 y el p-valor es 0:0082. Por tanto, la diferencia es estadísticamente signi cativa al 1%. d) Como 100 (0:027 + 0:055) = 8:2, tenemos que según estos resultados los varones de raza blanca pesan en promedio al nacer un 8:2% más que las hembras de raza no blanca. 2.- Para analizar el salario de los profesores universitarios se utiliza el modelo: salario = 0 + 1 Homb + 2 Blanco + 3 Homb Blanco + 4 exper + u donde salario es el salario anual del profesor en miles de dólares, exper son los años de experiencia docente, Homb es una variable binaria que vale 1 si el profesor es hombre y Blanco es otra variable binaria que vale 1 si el profesor es de raza blanca. a) Determine el salario medio para: a1) Hombres de raza blanca. a2) Mujeres de raza blanca. a3) Hombres de raza no blanca. a4) Mujeres de raza no blanca. b) Cuál es la diferencia en el salario medio entre b1) hombres blancos y mujeres blancas con la misma experiencia laboral? b2) hombres blancos y hombres no blancos con la misma experiencia laboral? b3) mujeres blancas y mujeres no blancas con la misma experiencia laboral? b4) hombres no blancos y mujeres no blancas con la misma experiencia laboral? c) Cómo contrastaría la hipótesis La diferencia en el salario medio entre blancos y no blancos con la misma experiencia laboral es la misma para hombres y mujeres?. a1) E(salario j Homb = 1; Blanco = 1; exper) = 0 + 1 + 2 + 3 + 4 exper a2) a3) E(salario j Homb = 0; Blanco = 1; exper) = 0 + 2 + 4 exper E(salario j Homb = 1; Blanco = 0; exper) = 0 + 1 + 4 exper a4) E(salario j Homb = 0; Blanco = 0; exper) = 0 + 4 exper

3 b1) E(salario j Homb = 1; Blanco = 1; exper) E(salario j Homb = 0; Blanco = 1; exper) b2) = 1 + 3 E(salario j Homb = 1; Blanco = 1; exper) E(salario j Homb = 1; Blanco = 0; exper) b3) = 2 + 3 E(salario j Homb = 0; Blanco = 1; exper) E(salario j Homb = 0; Blanco = 0; exper) b4) = 2 E(salario j Homb = 1; Blanco = 0; exper) E(salario j Homb = 0; Blanco = 0; exper) = 1 c) Acabamos de ver que la diferencia en el salario medio entre blancos y no blancos con la misma experiencia laboral es 2 + 3 para los hombres y 2 para las mujeres, y por tanto, la diferencia será idéntica para hombres y mujeres si 3 = 0; y tendríamos que contrastar H 0 : 3 = 0 H 1 : 3 6= 0 El estadístico de contraste es t = b 3 t n 5 Bajo H 0 se b3 Rechazaremos H 0 a nivel si jtj > t n 5;=2 : 3.- Supongamos que se reúne información sobre salarios, educación, experiencia y sexo a partir de una encuesta. Además, se pregunta sobre el consumo de marihuana. La pregunta se formula así: En cuántas ocasiones fumaste marihuana el mes pasado? a) Escriba un modelo que permita estimar los efectos del consumo de marihuana en el salario, teniendo en cuenta los efectos de otros factores. El objetivo es poder realizar a rmaciones del tipo "si se consume una vez más marihuana al mes, el salario variará en promedio un x%". b) Especi que un modelo que permita contrastar si el consumo de esta droga tiene distintos efectos en los salarios de hombres y mujeres. Cómo contrastaría que el efecto de esta droga es el mismo para hombres y mujeres? c) Supongamos que se considera preferible medir el consumo de marihuana clasi cando a la gente en cuatro categorías: no consumidor, consumidor ocasional (de una a cinco veces al mes), consumidor moderado (de seis a diez) y consumidor habitual (más de diez veces al mes). Utilizando esta clasi cación, escriba un modelo que permita estimar los efectos de esta droga sobre el salario. d) Usando el modelo del apartado c), explique cómo contrastar la hipótesis nula de que el consumo de marihuana no afecta al salario. La respuesta debe indicar la hipótesis nula y alternativa, y el estadístico de contraste, la distribución del estadístico bajo la nula y cuál sería la región crítica.

4 a) El modelo que tenemos que considerar es log(salario) = 0 + 1 educ + 2 exper + 3 Muj + 4 Cons_mar + u donde Cons_mar es el número de veces al mes que el individuo consume marihuana. En este modelo 100 4 es la variación porcentual media en el salario cuando el consumo de marihuana aumenta en una vez más al mes, manteniendo constante los años de educación, la experiencia laboral y el sexo. En este modelo el efecto del consumo de marihuana sobre el salario es idéntico para hombres y para mujeres. b) Para permitir que el consumo de marihuana tenga distinto efecto sobre el salario dependiendo del sexo del individuo tendríamos que considerar el modelo: log(salario) = 0 + 1 educ + 2 exper + 3 Muj + 4 Cons_mar + 5 Muj Cons_mar + u En este modelo 100 4 es la variación porcentual media en el salario de los hombres cuando el consumo de marihuana aumenta en una vez más al mes, manteniendo constante los años de educación, la experiencia laboral y 100 ( 4 + 5 ) es la variación porcentual media en el salario de las mujeres cuando el consumo de marihuana aumenta en una vez más al mes, manteniendo constante los años de educación, la experiencia laboral. Para contrastar si existen diferencias entre hombres y mujeres en el efecto del consumo de marihuana sobre los salarios, tenemos que contrastar H 0 : 5 = 0 frente a H 1 : 5 6= 0: c) De nimos el modelo log(salario) = 0 + 1 educ + 2 exper + 3 Muj + 4 Ocas + 5 Mod (1) + 6 Hab + u donde la categoría omitida es no consumir marihuana y 1 si consume marihuana de 1 a 5 veces al mes Ocas = 0 en caso contrario 1 si consume marihuana de 6 a 10 veces al mes Mod = 0 en caso contrario 1 si consume marihuana más de 10 veces al mes Hab = 0 en caso contrario d) En el modelo del apartado c) la hipótesis nula de que el consumo de marihuana no afecta al salario es H 0 : 4 = 5 = 6 = 0. Para contrastar esta hipótesis tendríamos que estimar el modelo restringido log(salario) = 0 + 1 educ + 2 exper + 3 Muj + u (2) y comparar la suma cuadrática residual de este modelo restringido (2), SCR r ;con la suma cuadrática residual del modelo no restringido (1), SCR nr ; mediante el estadístico F F = (SCR r SCR nr ) =3 SCR nr =(n 7) F 3;n 7 bajo H 0 Una vez calculado el estadístico F, rechazaríamos H 0 a nivel si F > F 3;n 7; : 4.- Para contrastar la efectividad de un programa de formación laboral sobre los salarios posteriores de los trabajadores, especi camos el modelo log(wage) = 0 + 1 train + 2 educ + 3 exper + u

5 donde train es una variable binaria con valor 1 si el trabajador participó en el programa. Pensemos que el término de error contiene características no observables del trabajador. Si los trabajadores menos hábiles tienen mayores posibilidades de ser seleccionados para el programa, y se usa un análisis MCO, qué se puede decir sobre el sesgo probable en el estimador MCO de 1? En el tema 2 vimos cómo determinar el signo del sesgo cuando omitimos una variable relevante, en este caso la "habilidad" de los trabajadores. Si los trabajadores menos hábiles tienen mayores posibilidades de ser seleccionados para el programa, u y train estarán negativamente correlacionadas, y cómo la habilidad tiene un efecto positivo sobre el salario, el estimador MCO de 1 tendrá un sesgo negativo. Además, puesto que cabe esperar que 1 > 0; es probable que concluyamos que el programa es menos efectivo de lo que realmente es. 5.- Supongamos que estamos interesados en analizar las posibles diferencias en el consumo de cerveza según el sexo. Para ello especi camos el modelo cerv = 0 + 1 Renta + 2 Muj + 3 MujRenta + u donde cerv es el gasto anual en cerveza en euros, Renta es la renta anual en miles de euros, Muj es una dummy que vale 1 para las mujeres y MujRenta = Muj Renta. En base a una muestra de 34 individuos se ha obtenido el siguiente modelo estimado: cerv d = 186:47 + 2:3 Renta 126:0Muj 1:3 MujRenta (45:67) (0:9) (57:01) (1:0) n = 34; R 2 = 0:5055 Además, utilizando la misma muestra se ha estimado el modelo cerv = 0 + 1 Renta + 3 MujRenta + u obteniéndose que el R-cuadrado es 0:3445; se ha estimado el modelo cerv = 0 + 1 Renta + 2 Muj + u obteniéndose que el R-cuadrado es 0:2903; y se ha estimado el modelo cerv = 0 + 1 Renta + u obteniéndose que el R-cuadrado es 0:1355: a) Cuál es la diferencia estimada en el gasto medio anual en cerveza entre hombres y mujeres con renta 25000 euros al año?. b) Suponiendo que los errores son normales, contraste las siguientes a rmaciones b1) Controlando por renta, no existen diferencias en el consumo de cerveza según el sexo. b2) Controlando por renta, la propensión marginal al consumo de cerveza es mayor para los hombres que para las mujeres. a) El consumo medio de cerveza es: para los hombres con renta 25000 euros, y E(cerv j Muj = 0; Renta = 25) = 0 + 1 25 E(cerv j Muj = 1; Renta = 25) = 0 + 2 + ( 1 + 3 )25

6 para las mujeres con renta 25000 euros. Por tanto, puesto que 126 + 1:3 25 = 158:5; se estima que los hombres con con renta 25000 euros gastan en media 158:5 euros más al año en cerveza que las mujeres con la misma renta. b1) Tenemos que contrastar H 0 : 2 = 3 = 0 H 1 : 2 6= 0 y/o 3 6= 0 Para hacer el contraste hay que considerar el modelo restringido cerv = 0 + 1 Renta + u y comparar el R-cuadrado de este modelo restringido, Rr;con 2 el R-cuadrado del modelo no restringido, Rnr; 2 mediante el estadístico F = R2 nr Rr 2 =2 (1 Rnr) 2 =30 F 2;30 Bajo H 0 El valor del estadístico en la muestra es F = (0:5055 0:1355) =2 (1 0:5055) =30 = 11:22 y el p-valor es P rob(f 2;30 > 11:2) = 0:00023. Por tanto, podemos rechazar la hipótesis nula a cualquier nivel de signi cación razonable y concluir que existen diferencias en el consumo de cerveza entre hombres y mujeres. b2) La propensión marginal al consumo de cerveza para los hombres es: mientras que para las mujeres es: Por tanto, tenemos que contrastar @cerv @renta = 1 @cerv @renta = 1 + 3 t = H 0 : 3 = 0 H 1 : 3 < 0 ^ 3 t 30 se ^3 Bajo H 0 Para esta muestra t = 1:3=1:0 = 1:3 y el p-valor es 0:1018: Por tanto, no podemos rechazar H 0 al 10%; es decir, no existe su ciente evidencia para a rmar que la propensión marginal al consumo de cerveza es mayor para los hombres que para las mujeres. 6.- Considere el siguiente modelo sat = 0 + 1 hsize + 2 hsize 2 + 3 female + 4 black + 5 female black + u donde sat es la puntuación en el test SAT de aptitud escolar, hsize es el número de alumnos en la promoción de bachillerato (en centenares), f emale es una variable cticia que vale 1 si el individuo es mujer, black es otra variable cticia que vale 1 si el individuo es de raza negra.

7 Utilizando los datos del chero GPA2 del libro de Wooldridge se ha estimado este modelo obteniéndose los siguientes resultados: csat = 1028:1 (6:29) 169:8 (12:71) + 19:3hsize 2:19 (3:83) black + 62:30 (18:15) n = 4137; R 2 = 0:0858 (0:527) hsize2 45:09 female black (4:29) female a) Hay evidencia fuerte de que hsize 2 debería incluirse en el modelo? De acuerdo con esta ecuación, cuál sería el tamaño óptimo de la promoción? b) Manteniendo jo hsize, cuál es la diferencia estimada en sat entre las mujeres no negras y los hombres no negros? Hasta qué punto es estadísticamente signi cativa esta diferencia? c) Manteniendo jo hsize, cuál es la diferencia estimada de puntuación SAT entre hombres negros y hombres que no lo son? Es esa diferencia estadísticamente signi cativa? d) Manteniendo jo hsize, cuál es la diferencia estimada de puntuación SAT entre mujeres negras y mujeres que no lo son? Qué se necesitaría hacer para contrastar la hipótesis de que la diferencia es estadísticamente signi cativa? a) Para ver si hay evidencia de que hsize 2 debería incluirse en el modelo tenemos que contrastar H 0 : 2 = 0 H 1 : 2 6= 0 t = b 2 se( b 2 ) t 4131 Bajo H 0 Para esta muestra t = 2:19=0:527 = 4:16 y el p-valor es 0:000032. Por tanto, hsize 2 es estadísticamente signi cativa a cualquier nivel de signi cación razonable y hay una fuerte evidencia de que debemos incluir hsize 2 en el modelo. El efecto marginal de hsize sobre sat es @sat @hsize = 1 + 2 2 hsize El tamaño óptimo se alcanza cuando 1 + 2 2 hsize = 0; es decir cuando hsize = 1 2 : Se estima 2 19:3 que el tamaño óptimo es 22:19 = 4:41; y como la variable hsize esta medida en cientos de alumnos, el tamaño óptimo estimado es 441 alumnos. Este resultado es similar al que obtuvimos en el ejercicio 8 del tema 3 sin controlar por el sexo y la raza. b) Manteniendo jo hsize, las mujeres no negras obtienen en media 45:1 puntos menos en sat que los hombres no negros. Para ver si esa diferencia es signi cativa tenemos que contrastar H 0 : 3 = 0 H 1 : 3 6= 0 t = b 3 se( b 3 ) t 4131 Bajo H 0 Para esta muestra t = 45:09=4:29 = 10:51 y el p-valor es cero. Por tanto, la diferencia es estadísticamente signi cativa a cualquier nivel de signi cación razonable.

8 c) Manteniendo jo hsize, los hombres negros obtienen en media 169:8 puntos menos en sat que los hombres no negros. Para ver si esa diferencia es signi cativa tenemos que contrastar H 0 : 4 = 0 H 1 : 4 6= 0 t = b 4 se( b 4 ) t 4131 Bajo H 0 Para esta muestra t = 169:8=12:71 = 13:36 y el p-valor es cero. Por tanto, la diferencia es estadísticamente signi cativa a cualquier nivel de signi cación razonable. d) Manteniendo jo hsize, las mujeres negras obtienen en media 107:5 ( 169:8 + 62:3 = 107:5) puntos menos en sat que las mujeres no negras. Para ver si esa diferencia es signi cativa tenemos que contrastar H 0 : 4 + 5 = 0 H 1 : 4 + 5 6= 0 Para hacer el contraste podemos utilizar la dummy de ser hombre en lugar de la de ser mujer, así especi caríamos el modelo sat = 0 + 1 hsize + 2 hsize 2 + 3 male + 4 black + 5 male black + u En este modelo 4 mide la diferencia en sat entre mujeres negras y mujeres no negras, de forma que en este modelo tendríamos que contrastar 7.- Considere el siguiente modelo H 0 : 4 = 0 H 1 : 4 6= 0 log(salary) = 0 + 1 log(sales) + 2 finance + 3 consprod + 4 utility + u donde salary es el salario anual del director general de la empresa en miles de dólares, sales son las ventas anuales de la empresa en millones de dólares, y finance, consprod y utility son variables binarias que indican el sector en el que opera la empresa (sector nanciero, sector de bienes consumo y sector servicios). El sector omitido es el sector industrial. a) Estime el modelo utilizando los datos del chero CEOSAL1 del libro de Wooldridge y presente los resultados en forma de ecuación. b) Contraste si el salario de los directores generales depende del sector en el que opera la empresa. c) Manteniendo jas las ventas, calcule la diferencia porcentual promedio en el salario estimado entre los sectores servicios e industrial Es esta diferencia estadísticamente signi cativa al 1 por ciento? d) Manteniendo jas las ventas, cuál es en promedio la diferencia porcentual en el salario estimado entre el sector de bienes de consumo y el sector nanciero? Contraste si la diferencia es estadísticamente signi cativa. a) Los resultados de la estimación son \ log(salary) = 4:89 + 0:244 (0:275) (0:032) 0:353 utility (0:097) log(sales) + 0:124finance + 0:239 consprod (0:089) (0:083) n = 209; R 2 = 0:336; SCR = 44:33320

9 b) Tenemos que contrastar si los coe cientes de las dummies sectoriales son signi cativos conjuntamente. Es decir tenemos que contrastar: H 0 : 2 = 3 = 4 = 0 H 0 : 2 6= 0 y/o 3 6= 0 y/o 4 6= 0 Para contrastar esta hipótesis tenemos que estimar el modelo restringido log(salary) = 0 + 1 log(sales) + u y calcular la suma cuadrática residual, SCR r = 52:65600: El estadístico de contraste es F = (SCR r SCR nr ) =3 SCR nr =(209 4 1) F 3;204 bajo H 0 y puesto que SCR nr = 44:33320 y SCR r = 52:65600; tenemos que F = (52:65600 44:33320) =3 44:33320=204 = 12:77 Como el p-valor del contraste es prácticamente cero, podemos rechazar H 0 a cualquier nivel de signi cación razonable y concluir que el salario de los directores generales depende del sector en el que opera la empresa. c) El salario es en promedio un 35:3% menor en el sector servicios que en el sector industrial. Para ver si esa diferencia es estadísticamente signi cativa tenemos que contrastar H 0 : 4 = 0 H 1 : 4 6= 0 t = b 4 se( b 4 ) t 204 Bajo H 0 Para esta muestra t = 3:648 y el p-valor es 0.003. La diferencia es estadísticamente signi cativa al 1%. d) Como 100 (0:239 0:124) = 11:5; el salario es en promedio un 11:5% mayor en el sector de bienes de consumo que en el sector nanciero. Para contrastar si esta diferencia es estadísticamente signi cativa tenemos que incluir en el modelo la dummy del sector industrial y excluir la del sector nanciero. Los resultados de la estimación son \ log(salary) = 5:01 + 0:244 (0:277) (0:032) 0:477 utility (0:104) log(sales) 0:124industry + 0:114 consprod (0:089) (0:089) n = 209; R 2 = 0:336; SCR = 44:33320 La diferencia no es estadísticamente signi cativa ya que el p-valor del contraste de signi catividad individual de la variable consprod es 0:2121: 8.- Considere el modelo colgpa = 0 + 1 hsize + 2 hsize 2 + 3 hsperc + 4 sat + 5 female + 6 athlete + u donde colgpa es la cali cación media acumulada en la universidad, hsize es el número de alumnos en la promoción de bachillerato (en centenares), hsperc es el percentil que ocupa en la distribución de

10 cali caciones de los alumnos del instituto que se graduaron el mismo año (de nido de forma que, por ejemplo, hsperc = 5 se re ere al cinco por ciento de los mejores alumnos que se gradúan), sat es la puntuación en el test SAT de aptitud escolar, female es una variable cticia que vale 1 si el estudiante es mujer, athlete es otra variable cticia que vale 1 si el estudiante es atleta. a) Estime el modelo utilizando los datos del chero GPA2 del libro de Wooldridge y presente los resultados en forma de ecuación. Cuál es la diferencia estimada en la nota media de la universidad entre los atletas y los que no lo son? Es esta diferencia estadísticamente signi cativa? b) Suprima sat del modelo y vuelva a estimar la ecuación. Cuál es ahora la diferencia estimada por ser atleta? Explique por qué la estimación es diferente de la obtenida en el apartado a. c) Considere ahora un modelo que permita que el efecto de ser atleta sobre la nota media di era en función del sexo del alumno y contraste la hipótesis nula de que, manteniendo constantes los restantes factores, la diferencia en la nota media entre atletas y no atletas es la misma para hombres y mujeres (incluya también sat en la ecuación). d) Considere ahora un modelo que permita que el efecto de sat sobre la nota de la universidad pueda ser distinto para hombres y mujeres hay evidencia su ciente para a rmar que el efecto de sat sobre la nota de la universidad di ere por sexos?. a) Los resultados de la estimación son colgpa \ = 1:24 (0:079) +0:155 (0:018) 0:0569hsize + 0:0047 (0:0164) (0:0022) hsize2 0:0132 female + 0:169 n = 4137; R 2 = 0:293 (0:042) athlete (0:00057) hsperc + 0:0016 (0:000069) sat Manteniendo los otros factores jos, los atletas obtienen, en media, 0:169 puntos más de nota que los no atletas. Para ver si esa diferencia es estadísticamente signi cativa tenemos que contrastar H 0 : 6 = 0 H 1 : 6 6= 0 t = b 6 se( b 6 ) t 4130 Bajo H 0 Para esta muestra t = 3:998 y el p-valor es prácticamente cero. La diferencia es estadísticamente signi cativa a cualquier nivel de signi cación razonable. b) Cuando suprimimos sat de la ecuación, el coe ciente estimado de athlete pasa a ser 0:0054 y el error estándar es 0:045. Al suprimir sat; athlete no es signi cativa y además su efecto es muy pequeño desde el punto de vista económico. La estimación es diferente ya que la media de sat es menor para atletas que para no atletas (la correlación entre athlete y sat es negativa) y el efecto de sat sobre colgpa es positivo, por tanto cuando no controlamos por sat el coe ciente estimado de athlete tiene sesgo negativo. c) Para permitir que el efecto de ser atleta di era en función del sexo del alumno tenemos que introducir en el modelo la interacción entre athlete y female. Es decir tenemos que considerar el modelo colgpa = 0 + 1 hsize + 2 hsize 2 + 3 hsperc + 4 sat + 5 female + 6 athlete + 7 female athlete + u

11 Los resultados de la estimación de este modelo son colgpa \ = 1:24 (0:080) +0:155 (0:018) 0:0568hsize + 0:0047 (0:0164) (0:0023) hsize2 0:0132 female + 0:167athlete + 0:0077 (0:048) n = 4137; R 2 = 0:293 (0:096) (0:00057) hsperc + 0:0016 female athlete (0:000067) sat La hipótesis que tenemos que contrastar para ver si la diferencia en la nota media entre atletas y no atletas es la misma para hombres y mujeres es H 0 : 7 = 0 H 1 : 7 6= 0 t = b 7 se(b 7 ) t 4129 Bajo H 0 Para esta muestra t = 0:08 y el p-valor es 0:94, no podemos rechazar la hipótesis nula a ningún nivel de signi cación razonable, y por tanto concluimos que la diferencia en la nota media entre atletas y no atletas es la misma para hombres y mujeres. d) Para permitir que el efecto de sat sobre la nota de la universidad pueda ser distinto para hombres y mujeres tenemos que interaccionar la variable cticia de ser mujer con sat, es decir tenemos que considerar el modelo colgpa = 0 + 1 hsize + 2 hsize 2 + 3 hsperc + 4 sat Los resultados de la estimación de este modelo son colgpa \ = 1:26 (0:097) +0:102 (0:134) + 5 female + 6 athlete + 7 female sat + u 0:0569hsize + 0:0047 (0:0164) (0:0022) hsize2 0:0132 female + 0:167athlete + 0:000051 (0:043) n = 4137; R 2 = 0:293 (0:00013) (0:00057) hsperc + 0:0016 female sat (0:000085) sat La hipótesis que tenemos que contrastar para ver si el efecto de sat sobre la nota de la universidad di ere por sexos es H 0 : 7 = 0 H 1 : 7 6= 0 t = b 7 se( b 7 ) t 4129 Bajo H 0 Para esta muestra t = 0:40 y el p-valor es 0:69, no podemos rechazar la hipótesis nula a ningún nivel de signi cación razonable, y por tanto concluimos que el efecto de sat sobre la nota de la universidad es el mismo para hombres y mujeres. 9.- Considere el siguiente modelo que relaciona el tiempo dedicado a dormir y el dedicado a trabajar, junto a otros factores que afectan el sueño: sleeph = 0 + 1 totwrkh + 2 educ + 3 age + 4 age 2 + 5 yngkid + u

12 donde el tiempo dedicado a dormir (sleeph) y el tiempo total de trabajo (totwrkh) se miden en horas por semana (tenga en cuenta que las variables que aparecen en el chero son sleep y totwrk; ambas medidas en minutos por semana, y por tanto tiene que generar sleeph y totwrkh antes de estimar el modelo). El nivel de educación (educ) y la edad (age) se miden en años y yngkid es una variable binaria que toma el valor 1 si el individuo tiene hijos menores de 3 años. a) Estime esta ecuación por separado para hombres y mujeres utilizando los datos del chero SLEEP75 del libro de Wooldridge y presente los resultados en forma de ecuación. Existen grandes diferencias entre las dos ecuaciones estimadas? b) Calcule el test de Chow para la igualdad de los parámetros de la ecuación de las mujeres y la de los hombres. Cuáles son los grados de libertad relevantes para este test? Se debería rechazar H 0 al 5%? c) Estime el modelo que incluye todas las variables, la dummy de ser hombre (o la de ser mujer), y las interacciones entre todas las variables y la dummy de ser hombre (o la de ser mujer) y compruebe que la SCR de este modelo coincide con la suma de las SCR de las ecuaciones estimadas para hombres y mujeres por separado que obtuvo en el apartado a. d) Permitiendo que los términos constantes sean distintos para hombres y mujeres, contraste ahora si hay diferencias en las pendientes. a) La ecuación estimada para hombres es: \sleeph = 60:8 (5:17) 0:182 (0:024) totwrkh 0:218educ + 0:119age 00075 (0:124) (0:239) (0:0028) age2 + 1:006 n = 400; R 2 = 0:156; SCR = 17712:22 y para mujeres es: \sleeph = 70:65 (384:89) 0:140 (0:027) totwrkh 0:170educ 0:506age + 0:0061 (0:160) (0:309) (0:0037) age2 1:97 n = 306; R 2 = 0:098; SCR = 15913:49 (0:984) yngkid (1:55) yngkid Las ecuaciones estimadas son muy distintas. Tener hijos pequeños disminuye el tiempo dedicado a dormir para las mujeres (en unas 2 horas a la semana) y aumenta el tiempo dedicado a dormir para los hombres (en aproximadamente 1 hora a la semana). El efecto de la edad sobre el tiempo dedicado a dormir también es muy distinto, la relación para hombres tiene forma de U invertida mientras que para mujeres tiene forma de U. b) El estadístico de Chow es F = (SCR r (SCR 1 + SCR 2 )) =6 (SCR 1 + SCR 2 ) =(706 2 6) F 6;694 bajo H 0 donde SCR 1 y SCR 2 son las SCR que hemos obtenido en el apartado a estimando el modelo por separado para hombres y mujeres, y SCR r es la SCR obtenida estimando el modelo con todas las observaciones. El valor del estadístico en la muestra es F = (34240:96 (17712:22 + 15913:49)) =6 (17712:22 + 15913:49) =(706 2 6) y el p-valor es 0:049 por lo que podemos rechazar H 0 al 5%: c) Tenemos que estimar ahora el modelo = 2:12 sleeph = 0 + 0 male + 1 totwrkh + 1 male totwrkh + 2 educ + 2 male educ + 3 age + 3 male age + 4 age 2 + 4 male age2 + 5 yngkid + 5 male yngkid + u Los resultados de la estimación aparecen en la siguiente tabla

13 MCO, usando las observaciones 1 706 Variable dependiente: sleeph Coeficiente Desv. Típica Estadístico t Valor p const 70.6455 6.13087 11.52 3.11e 028 *** male 9.84202 8.14653 1.208 0.2274 totwrkh 0.139950 0.0264349 5.294 1.61e 07 *** maletotwrkh 0.0421737 0.0366740 1.150 0.2506 educ 0.170086 0.152739 1.114 0.2658 maleeduc 0.0474541 0.199466 0.2379 0.8120 age 0.505943 0.295175 1.714 0.0870 * maleage 0.625219 0.385389 1.622 0.1052 agesq 0.00613234 0.00355753 1.724 0.0852 * maleagesq 0.00687847 0.00459856 1.496 0.1352 yngkid 1.97138 1.48436 1.328 0.1846 maleyngkid 2.97771 1.80175 1.653 0.0988 * Media de la vble. dep. 54.43926 D.T. de la vble. dep. 7.406891 Suma de cuad. residuos 33625.71 D.T. de la regresión 6.960749 R cuadrado 0.130618 R cuadrado corregido 0.116839 F(11, 694) 9.478958 Valor p (de F) 4.95e 16 y tenemos que la SRC de este modelo es SCR = 33625:71 que coincide con SCR 1 + SCR 2 = 17712:22 + 15913:49: d) El modelo restringido es ahora sleeph = 0 + 0 male + 1 totwrkh + 2 educ + 3 age + 4 age 2 + 5 yngkid + u y estimando este modelo con toda la muestra obtenemos SRC = 33929:94: El estadístico de contraste es El valor del estadístico en la muestra es F = (SCR r SCR nr ) =5 SCR nr =(706 2 6) F 5;694 bajo H 0 F = (33929:94 33625:71) =5 33625:71=(706 2 6) = 1:26 y el p-valor es 0:28 por lo que no podemos rechazar H 0 a ningún nivel de signi cación razonable y concluimos que no hay evidencia para a rmar que, una vez que permitimos distintos términos constantes para hombres y mujeres, las pendientes sean distintas para estos dos grupos. Este es un ejemplo en el que hay diferencias muy importantes entre los coe cientes pero dichas diferencias no son estadísticamente signi cativas, seguramente porque el tamaño muestral no es muy grande.