Introducción a la Econometría Curso 2009/2010 Seriedeproblemas1 1.- Considere la siguiente distribución de probabilidad: Llueve (X=0) No llueve (X=1) Total Tiempo de viaje largo (Y=0) 0.15 0.07 0.22 Tiempo de viaje corto (Y=1) 0.15 0.63 0.78 Total 0.30 0.70 1.00 Calcular: a) E(Y) y E(X) b) σ 2 X y σ2 Y c) σ XY y corr(x,y) Considere ahora dos nuevas variables aleatorias: W=3+6X y V=20-7Y. Calcular: d) E(W) y E(V) e) σ 2 W y σ2 V f) σ WV ycorr(w,v) 2.- La siguiente tabla proporciona la distribución de probabilidad conjunta entre situación laboral y la graduación académica de las personas en edad de trabajar en EE.UU. en 1990: Desempleado (Y=0) Empleado (Y=1) Total Sin graduado escolar (X=0) 0.045 0.709 0.754 Con graduado escolar (X=1) 0.005 0.241 0.246 Total 0.050 0.950 1.000 a) Calcular E(Y) b) La tasa de desempleo es la parte de la población activa que se encuentra desempleada. Demuestre que la tasa de desempleo viene dada por 1-E(Y) c) Calcular E(Y/X=1) y E(Y/X=0) 1
d) Calcular la tasa de desempleo para (i) las personas con graduado escolar y (ii) las personas sin graduado escolar e) Un miembro seleccionado aleatoriamente de esta población dice estar desempleado. Cuál es la probabilidad de que este trabajador tenga el graduado escolar? y de que no lo tenga?. 3) Calcule las siguientes probabilidades: a) Si Y se distribuye N(1,4), encuentre Pr(Y 3) b) Si Y se distribuye N((3,9), encuentre Pr(Y>0) c) Si Y se distribuye N(50,25), encuentre Pr(40 Y 52) d) Si Y se distribuye N(5,2), encuentre Pr(6 Y 8) 4) Calcule las siguientes probabilidades: a) Si Y se distribuye χ 2 1, encuentre Pr(Y 6.63) b) Si Y se distribuye χ 2 4, encuentre Pr(Y 7.78) c) Si Y se distribuye F 10,, encuentre Pr(Y>2.32) 5) En una población μ Y = 100 y σ 2 Y =43. Utilice el Teorema Central del Límite para responder a las siguientes cuestiones: a) En una muestra aleatoria de tamaño n =100, halle Pr[Y 101] b) En una muestra aleatoria de tamaño n =165,hallePr[Y >98] c) En una muestra aleatoria de tamaño n =64,hallePr[101 Y 103] 6) Considere dos variables aleatorias X e Y. Suponga que Y toma k valores y 1,y 2,..., y k,yquex toma l valores x 1,x 2,..., x l. a) Demuestre que Pr[Y = y j ]= P Pr[Y = y j /X = x i ]Pr[X = x i ]. (Sugerencia: utilice la definición de Pr[Y = y j /X = x i ]). b) Utilice su respuesta en a) para verificar que E(Y )= P E(Y/X = x i )Pr[X = x i ] c) Suponga que X e Y son independientes. Demuestre que σ XY =0 yquecorr(x, Y )=0. 7) Este ejercicio muestra un ejemplo de un par de variables aleatorias X e Y para las cuales la media condicionada de Y dado X depende de X pero corr(x, Y )=0. Sean X y Z dos variables aleatorias nornales estándar independientemente distribuidas y sea Y = X 2 + Z. a) Demuestre que E(Y/X)=X 2 b) Demuestre que μ Y =1. c) Demuestre que E(XY )=0. (Sugerencia: use el hecho de que los momentos de orden impar de una variable aleatoria normal estándar son todos 0). 2
0. d) Demuestre que la cov(x, Y )=0y en consecuencia corr(x, Y )= 8) En una encuesta de 400 votantes potenciales, 215 respondieron que votaríanalacandidaturaoficial y 185 respondieron que votarían a una candidatura alternativa. Sea p la fracción de todos los votantes potenciales que prefieren la candidatura oficial en el momento de la encuesta, y sea bp la fracción de los que respondieron a la encuesta que prefieren la candidatura oficial. a) Utilice los resultados de la encuesta para estimar p b) Utilice el estimador de la varianza de bp, bp(1 bp)/n, para calcular el error estándar de su estimador. c) Cuál es el p-valor para el contraste de la H 0 : p =0.5 vs H 1 : p 6= 0.5? d) Cuál es el p-valor para el contraste de la H 0 : p =0.5 vs H 1 : p>0.5? e) Porqué los resultados en c) y d) difieren? f) Contiene la encuesta evidencia estadísticamente significativa de que la candidatura oficial va ganando a las otras candidaturas en el momento de la encuesta? Razone la respuesta. 9) Con los datos del ejercicio anterior, a) Contruya un intervalo de confianza al 95% para p. b) Contruya un intervalo de confianza al 99% para p. c) Porquéelintervaloenb)esmásamplioqueena)? d) Sin realizar ningún cálculo adicional, contraste la H 0 : p =0.5 vs H 1 : p 6= 0.5 al nivel de significación del 5%. 10) Para investigar la posible discriminación sexual en una empresa, se seleccionan aleatoriamente una muestra de 100 hombres y 64 mujeres con trabajos similares. En la siguiente tabla se muestra un resumen de los salarios mensuales: Salario medio (Y ) Desviación Estándar (σ Y ) n Hombres $3100 $200 100 Mujeres $2900 $320 64 a) Qué sugieren estos datos sobre la diferencia de salario en la empresa? Representan estos datos evidencia estadísticamente significativa de quelossalariosdeloshombresydelasmujeressondiferentes? (Paracontestar a esta pregunta, primero escriba la H 0 ylah 1 ; calcule después el 3
estadístico t relevante; después calcule el p-valor asociado con el estadístico t y finalmente use el p-valor para responder a esta pregunta). b) Sugieren estos datos que la empresa es culpable de discriminación sexual en sus políticas de compensación?. Razone su respuesta. 11) Los valores de las alturas en pulgadas (X) y del peso en libras (Y )se recogen a partir de una muestra de 300 alumnos masculinos. Los estadísticos resumen son los siguientes: X =70.5 pulgadas, Y =150libras; S X =1.8 pulgadas; S Y =14.2 libras; S XY =21.73 pulgadas x libras y r XY =0.85. Covierta estos datos al sistema métrico decimal (metros y kilogramos). 12) Este ejercicio demuestra que la varianza muestral es un estimador insesgado de la varianza poblacional cuando Y 1,Y 2,..., Y n son i.i.d. con media μ Y yvarianzaσ 2 Y. a) Utilice la ecuación var(x +Y )=σ 2 X +σ 2 Y +2σ XY para demostrar que E[(Y i Y ) 2 ]=var(y i ) 2cov(Y i, Y )+var(y ) b) Utilice la ecuación cov(a + bx + cv, Y ) = bσ XY + cσ VY para demostrar que cov(y,y i )=σ 2 Y /n c) Utilice los resultados de las partes a) y b) para demostrar que E(s 2 Y )=σ 2 Y. Preguntas de examen Lassiguientespreguntasestánextraídasdeexámenesdeañosanteriores. En cada una de ellas, sólo una respuesta es correcta. 1. La correlación entre X e Y (a) No puede ser negativa ya que la varianza es siempre positiva (b) Es el cuadrado de la covarianza (c) Puede calcularse dividiendo la covarianza entre X e Y por el producto de las dos desviaciones estándar (d) Puede calcularse dividiendo la covarianza entre X e Y por el producto de las dos varianzas 2. La probabilidad de que el suceso A oelb ocurra es (a) P(A) P(B) (b) P(A)+P(B) si ambos sucesos son excluyentes (c) P(A)/P(B) 4
(d) P(A)+P(B) incluso si ambos sucesos no son excluyentes 3. Cuando decimos quey es consistente no nos referimos a que (a) Y sea consistente de μ Y (b) Y tenga la menor varianza de todos los estimadores de μ Y (c) Y P μ Y (d) La probabilidad de que Y pertenezca al intervalo μ Y ± c esté cercana a la unidad cuando n es arbitrariamente grande para cualquier constante c >0. 4. Un estimador bμ Y de μ Y es insesgado si (a) bμ Y = μ Y (b) Y tiene la menor varianza de todos los estimadores de μ Y (c) Y P μ Y (d) E (bμ Y )= μ Y 5. El Teorema Central del Límite (a) Nos da condiciones bajo las cuales la suma de variables i.i.d. se distribuye asintóticamente Normal (b) Postula que Y es un estimador consistente de μ Y (c) Sólo se cumple cuando lo hace la Ley de los Grandes Números (d) Nos da condiciones bajo las cuales la suma de variables i.i.d. se distribuye asintóticamente t de Student 6. Una hipótesis alternativa de dos colas puede escribirse como (a) E (Y ) >μ Y,0 (b) E (Y )=μ Y,0 (c) Y 6=μ Y,0 (d) E (Y ) 6=μ Y,0 7. El error estándar de Y viene dado por (a) 1 n nx Yi Y 2 5
(b) 1 n 1 (c) (d) s s nx Yi Y 2 1 n 1 nx Yi Y 2 1 n(n 1) nx Yi Y 2 8. El valor-p se define como (a) p =0.05 (b) P H0 ³ Y μ Y,0 > (c) P (z >1.96) (d) P H0 ³ Y μ Y,0 < Y obs μ Y,0 Y obs μ Y,0 9. Si x es una variable aleatoria N(μ x,σ 2 x) ylavariablez=3+0,5x, la varianza de z es (a) 0,5σ 2 x (b) 3 2 +0,5σ 2 x (c) 0,25σ 2 x (d) σ 2 x 10. Para proporcionar respuestas cuantitativas a cuestiones de política económica (a) típicamente, basta con usar el sentido común (b) hay que entrevistar a los que toman decisiones de política económica (c) hay que examinar la evidencia empírica (d) es imposible dado que las cuestiones de política económica no son cuantificables. 11. Un ejemplo de un experimento aleatorio controlado se produce cuando (a) los hogares reciben una rebaja en los impuestos un año y al otro siguiente no. 6
(b) un estado de EEUU aumenta el salario mínimo y el estado adyacente no lo hace, de tal forma que se pueden observar diferencias en el empleo. (c) las variables aleatorias se controlan manteniendo constantes otros factores (d) algunos alumnos de 5 o curso de primaria en una escuela específica pueden utilizar los ordenadores y otros no y, manteniendo constantes otros factores, son evaluados a final de curso. 12. Una función de distribución ó función de probabilidad acumulada muestra la probabilidad de (a) que una variable aleatoria sea menor o igual que cierto valor (b) que dos o más sucesos ocurran simultáneamente (c) que una variable aleatoria tome un valor determinado. dado que otro suceso ha tenido lugar. (d) todos los sucesos que tienen lugar. 13. La probabilidad condicionada dey dado X = x, Pr[Y = y X = x] es (a) (b) (c) (d) Pr[Y =x] Pr[X=x] lx Pr[X = x i,y = y] Pr[X=x,Y =x] Pr[Y =y] Pr[X=x,Y =x] Pr[X=x] 14. En todos los casos siguientes dos variables están incorreladas, exceptuando el caso en el que (a) sean independientes (b) tengan covarianza cero (c) σ XY p σ 2 X σ2 Y (d) E[Y X] =0 15. LavarianzadelamediamuestralY, denotada por σ 2, viene dada por Y la siguiente expresión 7
(a) σ 2 Y (b) σ Y n (c) σ2 Y n (d) σ2 Y n 16. En un muestreo de variables i.i.d., lo siguiente es cierto, excepto (a) E[Y ]=μ Y (b) var(y )= σ2 Y n (c) E[Y ] <E[Y ] (d) Y es una variable aleatoria 8