Poblaciones y parámetros Econometría I Ejercicios de repaso de estadística 1. Considera una variable aleatoria Z que solo puede tomar cinco valores, todos ellos con la misma probabilidad: Z = {Z 1,, Z 3, Z 4, Z 5 }. La variable Z es una variable medida en miles de euros. (a) Proporciona la expresión que define el valor esperado de Z, E(Z), la varianza, var(z), y la desviación estandar, sd(z). Presenta las expresiones utilizando sumatorios. (b) Qué información sobre el comportamiento de Z proporciona cada uno de estos parámetros? (c) Considera que tenemos los cinco valores que la variable Z puede tomar son: Z = {1, 2, 3, 4, 5}. Con la ayuda de una hoja de cálculo (Excel o similar) calcula E(Z), var(z) y sd(z), definiendo las formulas correspondientes. (Es decir, no utilitces las funciones predefinidas en la hoja de cálculo). (d) Considera ahora que redefinimos Z en euros. Es decir, queremos cambiar las unidades de medida de Z. Etiqueta esta variable Z definida en euros com Z. Así, los cinco valores que puede tomar Z son: Z = {1000, 2000, 3000, 4000, 5000}. Modifica la hoja de cálculo que antes has creado y calcula E(Z ), var(z ) i sd(z ). (e) Entra las observaciones de Z a Gretl. Crea un guión de instrucciones y utilizando las instrucciones correspondientes, calcula E(Z), var(z), sd(z) y E(Z ), var(z ), sd(z ). Verifica que los valores coincidencon tus cálculos anteriores. (f) Dados los resultados anteriores, Dirias que el valor esperado de una variable depende de las unidades medida de las variables o independiente a estos cambios? Y la varianza? Y la desviación estandard? Justifica. 1
2. Considera dos variables Z y W, ambas medidas en miles de euros, que solo pueden tomar cinco pares de valores, todos ellos con la misma probabilidad: Z W Z 1 W 1 W 2 Z 3 W 3 Z 4 W 4 Z 5 W 5 (a) Proporciona la expresión que define la covariància entre Z y W, cov(z, W ), y tambén la expressión que define el coeficiente de correlación entre Z y W, corr(z, W ). Presenta las expresiones utilizando sumatorios. (b) Qué información sobre el comportamiento de Z y W proporciona cada uno de estos parámetros? (c) Considera que tenemos los cinco pares de valores que pueden tomar (Z, W ): Z W 1 2 2 4 3 6 4 8 5 10 Con la ayuda de una hoja de cálculo (Excel o similar) calcula cov(z, W ) i corr(z, W ), definiendo las formulas correspondientes. (Es decir, no utilitces las funciones predefinidas en la hoja de cálculo). (d) Considera que cambiamos las unidades de medida de estas dos variables de miles de euros a euros: Z W 1000 2000 2000 4000 3000 6000 4000 8000 5000 10000 Modifica la hoja de cálculo que antes has creado y calcula cov(z, W ) y corr(z, W ). (e) Entra los pares de observaciones de (Z, W ) a Gretl. Crea un guión de instrucciones y utilizando las instrucciones correspondientes, calcula cov(z, W ), corr(z, W ) y cov(z, W ), corr(z, W ). Verifica que los valores coincidencon tus cálculos anteriores. (f) Dados los resultados anteriores, Dirias que la covariància depende de las unidades de medida o es independente a estos cambios? Y el coeficiente de correlación simple? Justifica. 3. Demuestra que si entre doss variables, X y Y, existe una relación lineal exacta, Y = a + bx con b 0, el coeficiente de correlación entre X y Y es igual a 1 si b > 0 y igual a -1 si b < 0. 2
Distribuciones 4. Considera la variable aleatória Z= resultado de tirar el dado. (a) Es Z una variable aleatoria continua o discreta? (b) Encuentra la función de probabilidad de Z. Cómo etiquetarias este tipo de función? 5. Considera que Z es una variable aleatoria continua con función de densidad N(0, 1). Con la ayuda de la tabla de la distribución normal que proporciona Gretl, encuentra el valor de c en los siguientes casos: (a) Prob {Z > c} = 0.025 (b) Prob { Z > c} = 0.10 6. Utilitzando las tablas de la distribución correspondiente que proporciona Gretl, encuentra cada una de las probabilidades siguientes sabiendo que Z N(0, 1). En cada caso, incluye un gráfico de la función de densidad, marcado la probabilidad corresponiente. (a) Prob {Z > 1.96} (b) Prob { Z > 1.96} (c) Prob { 1.96 < Z < 1.96} 7. Si sabemos que Z 1 N(0, 1) y N(0, 1) són dos variables independentes. Qué podrias decir sobre la distribución (tipo, esperanza y varianza) de las siguientes variables: (a) Z 3 = Z 1 + (b) Z 4 = Z 1 4 (c) Z 5 = 2 + 4Z 1 (d) Z 6 = Z 1 (e) Z 7 = 1 (f) Z 8 = 1 + 2 Población y parámetros versus Muestra y estadísticos 8. Considera que conocemos todas las observaciones de la población de una variable Z viene dada por: Z = {6, 7, 6, 8, 5, 7, 6, 9, 10, 6}. (a) Calcula E(z) y var(z). (b) Considera que en lugar de toda la población, sólo tenemos la siguiente muestra, extraída aleatoriamente, de esta población: {6, 8, 10}. Calcula la mediana muestral, Z, y la varianza muestral de Z, var(z). (c) Considera ahora que la muestra disponible sacada de esta población es: {6, 5, 9}. Calcula de nuevo la mediana mostral, Z, y la varianza muestral de Z asociada a esta segunda muestra. (d) Crees que la mediana muestral, Z, es una variable aleatoria? Y la varianza muestral? Razona la respuesta. 3
Simulación de la conducta de una variable aleatoria 9. Crea un fichero de instrucciones de Gretl que genere 100 observaciones de una variable aleatoria Z 1 N(0, 1). Antes del comando que genera la variable, incluye el comando set seed 1234. Ejecuta el guión. Una vez generadas estas observaciones, utilizando los menús de la ventana principal, encuentra: (a) Los estadísticos básicos para esta variable (media muestral, varianza y desviación estándar). Han salido como esperabas? Comenta. (b) El histograma de frecuencias de las observaciones de Z 1 de la muestra. Han salido como esperabas? Comenta. 10. Repite el ejercicio anterior pero generando ahora 10.000 observaciones de Z 1 en lugar de 100. Comenta los resultados: fijate en la mediana muestral, la varianza muestral y el histograma obtenidos en este ejercicio en comparación a lo obtenido en el ejercicio anterior. Han variado en la dirección que esperabas? Relaciones lineales entre variables 11. Considera la variable aleatoria Z 1 N(0, 4) y definimos = Z 1 + 3. (a) Qué puedes decir de la correlación entre Z 1 y? (b) Escribe un guión de instrucciones de Gretl que genere 1000 observacioes de estas dos variables. Ejecuta el guión. Incluye la instrucción set seed 10101 antes de generar las observaciones. Haz un gráfico con las observaciones generadas, en el plano (Z 1, ). Utiliza el menu de Gretl para encontrar el coeficiente de correlación simple de observaciones de Z 1 y incluidas en la muestra. Comenta. 12. Sabemos que Z 1 N(3, 4) y = Z 1 + v donde v N(0, 1). (a) Qué podemos decir de la correlación entre Z 1 i? (b) Con la ayuda de un guión de instrucciones de Gretl genera 1000 observaciones de Z 1 y. Incluye la instrucción set seed 10101 antes de generar las observacions. Haz un gráfico con las observaciones generadas, en el plano (Z 1, ). Encuentra el coeficiente de correlación simple muestral entre Z 1 y. (c) Si quisieramos disminuir la correlación entre las dos variables, qué elemento en la generación de podriamos cambiar? 13. Considera Z 1 N(0, 4). Define otra variable aleatoria de forma independente. Con la ayuda de Gretl, genera 1000 observaciones de Z 1 y 1000 observaciones de. Incluye la instrucción set seed 10101 antes de generar las observaciones. (a) Calcula el coeficiente de correlación simple muestral entre las dos. Te han salido como esperabas? (b) Haz un gráfico de las 1000 observaciones en el plano (Z 1, ). Te sorprende? Comenta. 4
Aplicaciones 14. El fichero Spain2013.gdt contiene información sobre la renta anual (hy022), en euros, de 12.053 hogares españoles para 2013. (a) Con la ayuda de Gretl estima la distribución de la renta en España utilizando un histograma. Comenta. (b) Calcula los estadísticos de estadística descriptiva básica. Comenta. (c) Crees que seria razonable suponer que la renta se distribuye normalmente? Justifica la respuesta. 15. El artículo de Sachs & Wagner (2001) publicado en la European Economic Review tenía como objetivo encontrar evidencia empírica para la llamada maldición de los recursos naturales, que sostiene que los países con abundancia de recursos naturales tienden a tener un crecimiento económico bajo. El fichero nr97m.gdt contiene los datos utilizados para estos autores de 71 países. Los autores utilizan el peso de las exportaciones de recursos naturales sobre el PNB para 1980 (sxp80) como medida de la abundancia de los recursos naturales. Como indicador del crecimiento económico los autores utilizan los promedios de las tasas de crecimiento económico anuales entre 1970 y 1990 (gea7090). (a) Con la ayuda de Gretl, calcula el coeficiente de correlación simple entre sxp80 y gea7090. Crees que el valor encontrado apoya la hipótesis de la maldición de los recursos naturales? Comenta. (b) Haz un gráfico (scatter plot) de las observaciones de los 71 países poniendo gea7090 en el eje vertical y sxp80 en el eje horizontal. Crees que el gráfico apoya la hipótesis de los autores? Comenta. Estadística para vectores de variables aleatorias [ ] 16. Sea z = un vector aleatorio. Sabiendo que E(Z 1 ) = 4, E( ) = 8, V ar(z 1 ) = 100, V ar( ) = 49 y Cov(Z 1, ) = 2, encuentra E(z) y V ar(z). 17. Si definimos z = [ ] N ([ ] 3, 5 [ ]) 4 0 0 9 (a) Qué podemos decir de E(z), V ar(z), E(Z 1 ), V ar(z 1 ), E( ), V ar( ), Cov(Z 1, ), Cov(, Z 1 ) y Corr(Z 1, )? (b) Qué podemos decir de la distribución de Z 1? Y de? 18. Definimos: z = [ como un vector que incluye las variables aleatorias Z 1 y. Para cada uno de los seguientes casos, calcula el coeficiente de correlación simple entre Z 1 y. ] 5
[ ] 9 0 (a) V ar(z) = 0 100 [ ] 9 30 (b) V ar(z) = 30 100 (c) V ar(z) = [ 9 ] 18 18 100 19. Considera que: (a) E(Z 1 ) = 8, E( ) = 3 y E(Z 3 ) = 5, (b) V ar(z 1 ) = 8, V ar( ) = 4 y V ar(z 3 ) = 16, (c) Cov(Z 1, ) = 16, Cov(Z 1, Z 3 ) = 0.2 y Cov(, Z 3 ) = 9, Z 1 Detalla E(z) y V ar(z) si z =. Z 3 20. Considera que tenemos un vector columna z que contiene dos variables aleatorias: Z 1 y. [ ] z = El vector z esta conjuntamente distribuida con una Normal con vector de esperanzas µ y matriz de varianzas y covarianzas, Σ: Considera que: z N(µ, Σ) E(Z 1 ) = 4 E( ) = 10 V ar(z 1 ) = 2 V ar( ) = 4 Cov(Z 1, ) = 0. (a) Considera que definimos la variable W 1. Aplica las propiedades de la esperanza y la varianza para encontrar E(W 1 ) y var(w 1 ). Qué puedes decir sobre la distribución que seguirá W 1? (b) Considera la siguiente propiedad: Si z N(µ, Σ) Az N(Aµ, AΣA ) donde A es una matriz de constantes. Queremos utilizar esta propiedad para encontrar E(W 1 ) y var(w 1 ). Detalla los elementos de µ, Σ. Detalla los elementos de la matriz A para que Az = W 1. (c) Aplica la propiedad dada en el apartado (b) para encontrar la distribución, la esperanza y la varianza de W 1. (d) Considera que definimos las variables: W 1 = Z 1 + 2 W 2 = Z 1 W 3 = +. Utilizando la propiedad incluída en la pregunta 20b, hallar la esperanza y varianza de cada una de estas variables y también sus covarianzas. 6