UNIVERSIDAD NACIONAL DE TRUJILLO ESCUELA PROFESIONAL DE ECONOMÍA APUNTES DE CLASE CAPÍTULO 8: ANÁLISIS DE REGRESIÓN MÚLTIPLE: EL PROBLEMA DE LA INFERENCIA ECONOMETRÍA 2 WILHEM ROOSVELT GUARDIA VÁSQUEZ Econometría.weebly.com Wilhem.weebly.com
EJERCICIO APLICATIVO La siguiente tabla ofrece datos sobre la mortalidad infantil (MI), la tasa de analfabetismo femenina (TANF), el PBI percápita (PBIPC) y la tasa de la población con acceso sostenible a mejores fuentes de abastecimiento de agua potable y saneamiento para 32 países de América Latina y el Caribe. Mortalidad infantil, tasa de analfabetismo y datos relacionados de 32 países Obs Países MI TANF PBIPC PAS 1 Antillas Neerlandesas 15.0 3.0 11964.5 89 2 Argentina 15.0 2.7 5497.9 91 3 Bahamas 15.3 3.3 18974.4 100 4 Barbados 12.3 0.2 11096.7 100 5 Belice 18.5 5.2 4268.9 47 6 Bolivia 55.6 17.0 1159.5 46 7 Brasil 27.3 11.0 5616.2 75 8 Chile 8.0 3.6 8873.3 91 9 Colombia 20.5 6.9 3219.7 86 10 Costa Rica 10.5 3.7 5053.2 92 11 Cuba 6.1 2.8 2884.7 98 12 Ecuador 24.9 8.3 3088.8 89 13 El Salvador 26.4 21.2 2668.2 62 14 Granada 37.7 4 5315.9 96 15 Guatemala 38.6 35.4 2353.4 86 16 Guyana 49.4 1.3 1218.5 70 17 Haití 56.1 46.8 525.2 30 18 Honduras 31.2 21.7 1542.9 69 19 Jamaica 14.6 7.7 3796.1 80 20 México 20.5 9.1 7975.7 79 21 Nicaragua 26.4 31.6 958.6 47 22 Panamá 20.6 7.6 5218.9 73 23 Paraguay 35.5 6.4 1500.9 80 24 Perú 30.3 12.3 3351.5 63 25 Puerto Rico 8.1 5.1 20741 94 26 República Dominicana 34.9 14.4 3711.5 78 27 San Vicente y las Granadinas 26.7 7.5 4186.2 78 28 Santa Lucía 14.6 12.3 4624 89 29 Suriname 31.8 15.9 3812.5 94 30 Trinidad y Tabago 15.1 1.7 13660.8 100 31 Uruguay 14.4 1.6 5808.6 100 32 Venezuela 18.9 6.2 6733.9 68 Fuente: CEPAL MI: Tasa de mortalidad infantil por quinquenios 2000-2005; número de defunciones de niños menores de 1 año de edad por cada mil nacidos vivos TANF: Tasa de analfabetismo femenino de 15 y más años de edad, 2005 PBIPC: PBI percápita en millones de dólares a 2006 PAS: Población con acceso sostenible a mejores fuentes de abastecimiento de agua potable y a mejores servicios de saneamiento, en % a 2006.
PREGUNTAS a) A priori, Cuál es la relación esperada entre la mortalidad infantil y cada una de las demás variables? Sustente su respuesta utilizando la matriz de correlación. 4 b) Haga la regresión de la mortalidad infantil sobre la tasa de analfabetismo femenina y el PBI percápita MI = b 1 + b 2 TANF + b 3 PBIPC + e y obtenga los resultados habituales de una regresión. Interprete los resultados. 6 c) Del apartado b) analice si los coeficientes parciales son estadísticamente significativos, individualmente, al 1%, 5% y 10% de significancia. Calcule el intervalo de confianza para los mismos al 99 % de confianza. 7 d) Del apartado b) establezca un intervalo de confianza para σ u 2 al 99 por ciento de confianza. Contraste H 0 : σ u 2 = 100 frente a H a : σ u 2 < 100 al 5 por ciento significancia. 8 e) Del apartado b) calcule la matriz de varianzas-covarianzas de los estimadores. Interprete los resultados. 9 f) Interprete el coeficiente de determinación ajustado. Construya la tabla ANOVA y a partir de ésta contrastar la significatividad conjunta del modelo H 0 : R 2 = 0 frente a H a : R 2 > 0 al 1%, 5% y 10 % de significancia. Interprete los resultados. 9 g) Realizar los siguientes contrastes de hipótesis: H 0 : β 2 = 1; H 0 : β 3 = 0.005 H 0 : β 2 + β 3 = 0.60 al 1% de significancia (análisis: dos colas). Para cada caso muestre el F estadístico con su respectiva probabilidad. Pista: Utilice el contraste de Wald. 11 h) Haga la regresión de la mortalidad infantil sobre la tasa de analfabetización femenina, el PBI percápita y población con acceso sostenible a mejores fuentes de abastecimiento de agua, es decir, MI = b 1 + b 2 TANF + b 3 PBIPC + b 4 PAS + e y obtenga los resultados habituales. Construya la tabla ANOVA incremental y a partir de ésta decidir si merece la pena añadir la variable PAS al 1%, 5% y 10% de significancia. Cuáles son las consecuencias de añadir la variable PAS?. 23 Página 3
Mortalidad Infantil (defunciones de niños menores de 1 año por cada mil nacidos) ECONOMETRÍA 2 RESPUESTAS a) A priori, Cuál es la relación esperada entre la mortalidad infantil y cada una de las demás variables? Sustente su respuesta utilizando la matriz de correlación. La relación entre la Mortalidad Infantil y la tasa de analfabetismo es positiva. Ceteris Paribus, si la tasa de analfabetismo (TANF) se reduce, la mortalidad infantil (MI) también se reduce. El coeficiente de correlación entre MI y TANF es 0.597910. Matriz de correlación entre la variable endógena (MI) y las variables exógenas MI TANF PBIPC PAS MI 1.000000 0.597910-0.571548-0.615720 TANF 0.597910 1.000000-0.469010-0.643984 PBIPC -0.571548-0.469010 1.000000 0.537318 PAS -0.615720-0.643984 0.537318 1.000000 Fuente: elaboración propia en base a los datos de la CEPAL MortaIidad Infantil vs. Tasa de analfabetismo femenino en América Latina y el Caribe. 60 Bolivia Haití 50 Guyana 40 30 Perú 20 10 0 Chile 0 10 20 30 40 50 Elaboración propia Fuente: CEPAL Coeficiente de correlación = 0.5979 Tasa de analfabetismo femenino de 15 y más años de edad Página 4
MI (defunciones de niños menores de 1 añopor cada mil nacidos vivos) ECONOMETRÍA 2 La relación entre la MI y el PBI percápita es negativa. Ceteris Paribus, si el ingreso por habitante aumenta, la mortalidad infantil se reduce. El coeficiente de correlación de entre MI y PBIPC es -0.571548. 60 Mortalidad Infantil vs PBI percápita en América Latina y el Caribe 2005-2006 Haití Bolivia Coeficiente de correlación = -0.5715 50 40 30 Perú 20 10 Chile Puerto Rico 0 0 5000 10000 15000 20000 25000 Elaboración propia Fuente: CEPAL PBI percápita (millones de US$) La relación entre la Mortalidad Infantil y la población con acceso sostenible a mejores fuentes de abastecimiento de agua potable (PAS) es negativa. Ceteris Paribus, si la población tiene mejor acceso a los servicios básicos como el agua dentro de la vivienda, tenderá a contraer menos enfermedades y por ende la mortalidad infantil se reducirá. El coeficiente de correlación entre MI y PAS en -0.615720. Página 5
Mortalidad infantil (defunciones de niños menores de 1 año por cada 1000 nacidos vivos) ECONOMETRÍA 2 Mortalidad Infantil versus población con m ejores fuentes de abastecim iento de agua en Am érica Latina y el Caribe 2005-2006 60 50 Haití Bolivia 40 30 Perú 20 10 0 Coeficiente de correlación=-0.6157 Chile Cuba 20 30 40 50 60 70 80 90 100 % de Población con acceso a mejores fuentes de abastecimiento de agua Elaboración propia Fuente: CEPAL b) Haga la regresión de la mortalidad infantil sobre la tasa de analfabetismo femenina y el PBI percápita MI = b 1 + b 2 TANF + b 3 PBIPC + e y obtenga los resultados habituales de una regresión. Interprete los resultados. Dependent Variable: MI Method: Least Squares Sample: 1 32 Included observations: 32 Variable Coefficient Std. Error t-statistic Prob. C 24.62648 4.098870 6.008114 0.0000 TANF 0.517040 0.187835 2.752625 0.0101 PBIPC -0.001002 0.000412-2.429457 0.0215 R-squared 0.466149 Mean dependent var 24.40000 Adjusted R-squared 0.429331 S.D. dependent var 13.11274 S.E. of regression 9.905703 Akaike info criterion 7.513158 Sum squared resid 2845.566 Schwarz criterion 7.650571 Log likelihood -117.2105 F-statistic 12.66113 Durbin-Watson stat 1.840228 Prob(F-statistic) 0.000112 Página 6
MI = 24.62647915 + 0.5170397354*TANF - 0.001001908156*PBIPC+RESID Interpretación Si la tasa de analfabetismo femenino de 15 y más años de edad se incrementa en 1 por ciento (Ceteris paribus), la tasa de mortalidad infantil aumenta en 0.52 por ciento. Si el PBI percápita aumenta en 1 dólar (ceteris paribus), la tasa de mortalidad infantil disminuye en 0.001 por ciento. c) Del apartado b) analice si los coeficientes parciales son estadísticamente significativos, individualmente, al 1%, 5% y 10% de significancia. Calcule el intervalo de confianza para los mismos al 99 % de confianza. El punto de corte es significativo al 1%, 5% y 10% de significancia. La pendiente de la tasa de analfabetismo es significativo al 5% y 10% pero no al 1% de significancia. La pendiente del PBI percápita es significativo al 5% y 10% pero no al 1% de significancia. Intervalo de confianza 1 (α = 1%) 99% Región de no rechazo t 29 RA 0.005-2.76 2.76 0.005 RA Como el valor de la t student t 0.005 para n-k=32-3=29 grados de libertad, tenemos que los intervalos de confianza al 99% para los parámetros estimados serán: 1 Análisis de dos colas. Scalar z1=@qtdist(0.995,29)=2.75638590367. Scalar z2=@qtdist(0.005,29)=-2.75638590367 Página 7
24.62648 2.76(4.098870) 0.517040 2.76(0.187835) -0.001002 2.76(0.000412) 2 d) Del apartado b) establezca un intervalo de confianza para σ u al 99 por ciento de confianza. Contraste H 0 : σ u 2 = 100 frente a H a : σ u 2 < 100 al 5 por ciento significancia. σ u 2 = SRC n k = 2845.566 32 3 = 98.12296552 2 u Prob ( n k) b 2 u 2 u ( n k) 1 a El valor de a y b lo obtendremos de la tabla estadística Se sabe que 2 2 Prob( a b) 1 n k 2 Pr ob (13.121148888 29 52.3356177859) 99% Por lo tanto 98.1229 2 Prob (32 3) u 52.3356 98.1229 (32 3) 99% 13.1211 Prob 54.3714992 σ u 2 216.8686619 = 99% Es decir, en aplicaciones prácticas, 95 de cada 100 intervalos incluirán el auténtico σ u 2. 2 Análisis de dos colas. Scalar z3=@qchisq(0.995,29)=52.3356177859. Scalar z4=@qchisq(0.005,29)=13.121148888 Página 8
e) Del apartado b) calcule la matriz de varianzas-covarianzas de los estimadores. Interprete los resultados. b 1 b 2 b 3 b 1 b 2 b 3 16.80074-0.578069-0.001347-0.578069 0.035282 3.63E-05-0.001347 3.63E-05 1.70E-07 La diagonal principal del Var-cov(β j ) es la varianza de los estimadores. Por ejemplo Var(b1)=16.80074, var(b2) 0.035285, var(b3)=0.000000170. Por encima o por debajo de la diagonal principal son las covarianzas de los estimadores. Por ejemplo Cov(b1,b2)=-0.578069. f) Interprete el coeficiente de determinación ajustado. Construya la tabla ANOVA y a partir de ésta contrastar la significatividad conjunta del modelo H 0 : R 2 = 0 frente a H a : R 2 > 0 al 1%, 5% y 10 % de significancia. Interprete los resultados. El valor de R 2 ajustado es 0.429361, es decir, el42.94% de la variación de la mortalidad infantil está explicada por las variables independientes (Tasa de analfabetismo femenina, PBI percápita). TABLA ANOVA Análisis de la varianza para contrastar la significatividad del conjunto de regresores del modelo (Excluido el término independiente) Fuente de variación Suma al cuadrado Grados de libertad Suma de cuadrados medios F * Explicado por la regresión, 0.466149 2 Q 1 = 0.466149 TANF, PBIPC 2 = 0.2330745 F = Q 1 Q No explicada por la 2 0.533851 29 regresión Q 2 = 0.533851 = 0.01841 = 12.66 29 Total 1 31 - Página 9
H 0 : R 2 = 0 H a : R 2 > 0 F(2,29) 10% 5% 1% 2.50 3.33 5.43 Dado que F es mayor que los puntos críticos para cada nivel de significancia, se rechaza la hipótesis nula. TABLA ANOVA EN EVIEWS Página 10
Wald Test: Equation: EQ01 Test Statistic Value df Probability F-statistic 12.66113 (2, 29) 0.0001 Chi-square 25.32225 2 0.0000 Null Hypothesis Summary: Normalized Restriction (= 0) Value Std. Err. C(2) 0.517040 0.187835 C(3) -0.001002 0.000412 Restrictions are linear in coefficients. g) Realizar los siguientes contrastes de hipótesis: H 0 : β 2 = 1; H 0 : β 3 = 0. 005 H 0 : β 2 + β 3 = 0. 60 al 1% de significancia (análisis: dos colas). Para cada caso muestre el F estadístico con su respectiva probabilidad. Pista: Utilice el contraste de Wald. ********************************************************************** Método de la prueba t 3 t = b 2 β 2 se(b 2 ) = 0.517040 1 = 2.571192802 0.187835 99% Región de no rechazo t 29 RA 0.005-2.76 2.76 0.005 RA El valor del estadístico t pertenece a la región de no rechazo. Por lo tanto, no se debe rechazar la hipótesis nula al 1% de significancia. 3 Para una descripción más detallada de esta prueba véase Damodar Gujarati. Econometría. Cuarta Edición. Págs. 255-257. Página 11
Observe: t 2 29 = F 1,29 = ( 2.571192802) 2 = 6.611032426 Método de la prueba F : Mínimos cuadrados restringidos 4 Mínimos cuadrados sin restringir Dependent Variable: MI Method: Least Squares Sample: 1 32 Included observations: 32 MI = b 1 + b 2 TANF + b 3 PBIPC + e Variable Coefficient Std. Error t-statistic Prob. C 24.62648 4.098870 6.008114 0.0000 TANF 0.517040 0.187835 2.752625 0.0101 PBIPC -0.001002 0.000412-2.429457 0.0215 R-squared 0.466149 Mean dependent var 24.40000 Adjusted R-squared 0.429331 S.D. dependent var 13.11274 S.E. of regression 9.905703 Akaike info criterion 7.513158 Sum squared resid 2845.566 Schwarz criterion 7.650571 Log likelihood -117.2105 F-statistic 12.66113 Durbin-Watson stat 1.840228 Prob(F-statistic) 0.000112 Mínimos cuadrados restringidos H 0 : β 2 = 1 H a : β 2 1 MI = b 1 + 1TANF + b 3 PBIPC + e MI TANF = b 1 + b 3 PBIPC + e 4 Véase Damodar Gujarati. Econometría. Cuarta Edición. Págs. 258-261. Página 12
Dependent Variable: MI-TANF Method: Least Squares Date: 09/12/08 Time: 17:40 Sample: 1 32 Included observations: 32 Variable Coefficient Std. Error t-statistic Prob. C 16.71355 2.949642 5.666297 0.0000 PBIPC -0.000505 0.000397-1.271545 0.2133 R-squared 0.051138 Mean dependent var 13.85313 Adjusted R-squared 0.019509 S.D. dependent var 10.89922 S.E. of regression 10.79237 Akaike info criterion 7.656018 Sum squared resid 3494.259 Schwarz criterion 7.747626 Log likelihood -120.4963 F-statistic 1.616827 Durbin-Watson stat 2.499406 Prob(F-statistic) 0.213305 Bajo el supuesto de normalidad y la hipótesis nula y alternativa planteado líneas arriba, F = SRC r SRC c SRC n k = F c, n k Constituirá el estadístico prueba particularizado bajo la hipótesis nula, a comparar con el valor crítico de una distribución F-Snedecor con c y n-k grados de libertad, respectivamente. Nota: SRC r : Suma de residuos al cuadrado restringido SRC: Suma de residuos al cuadrado sin restringir c: denota el número de restricciones (1 en nuestro ejemplo) n: número de observaciones k: número de variables explicativas incluyendo el punto de corte en la regresión no restringida Para nuestro ejemplo, F = 3494.259 2845.566 1 2845.566 32 3 = 6.611021147 F 1,29 En Eviews elegir la opción View/Coefficient Tests/Wald-Coefficient Restrictions... y escribir c(2)=1. El resultado se presenta en la siguiente ventana. Observe el resultado coincide con los Página 13
cálculos anteriores. La hipótesis nula no se debe rechazar al 1% de significancia 5 aunque sí al 5% y 10% de significancia. Wald Test: Equation: EQ01 Test Statistic Value df Probability F-statistic 6.611028 (1, 29) 0.0155 Chi-square 6.611028 1 0.0101 Null Hypothesis Summary: Normalized Restriction (= 0) Value Std. Err. -1 + C(2) -0.482960 0.187835 Restrictions are linear in coefficients. Método estadístico del Multiplicador de Lagrange (LM) 6 para q restricciones de exclusión. PASOS 1. Haga la regresión de Y sobre el conjunto restringido de variables independientes y conserve los residuos. 2. Haga la regresión de Residuos sobre todas las variables independientes y obtenga la R cuadrada (R 2 u ). 5 Obsérvese el p-value es apenas 1.55%. Dado que este último es menor que 5% y 10% de significancia se debe rechazar la hipótesis nula. 6 Para una descripción más detallada de esta prueba véase Jeffrey M. Wooldridge. Introducción a la Econometría. Págs. 171-172. 255-258. Página 14
2 3. Calcule el ML=nR u (el tamaño de la muestra multiplicado por la R cuadrada obtenida en el paso 2. 4. Compare el ML con el valor crítico apropiado, c, de una distribución χ 2 q. Si ML>c, se rechaza la hipótesis nula. Mejor aun obtenga el valor p como probabilidad de 2 que una variable aleatoria χ q exceda el valor estadístico de la prueba. Si el valor p (p-value) es menor que el nivel de significancia deseado, entonces se rechaza la hipótesis nula. En caso contrario no rechazamos la hipótesis nula. La regla de rechazo es esencialmente la misma que la de la prueba F. En nuestro ejemplo, el modelo original está dada por: MI = b 1 + b 2 TANF + b 3 PBIPC + e (Sin restringir) Bajo la hipótesis nula y alternativa H 0 : β 2 = 1 H a : β 2 1 El modelo restringido estará dada por Ordenando: MI = b 1 + 1TANF + b 3 PBIPC + e MI TANF = b 1 + b 3 PBIPC + e (Modelo restringido 7 ) Y corriendo el modelo, obtenemos: MI-TANF = 16.714-0.000505*PBIPC 7 El número de restricciones es q=1. Página 15
Haciendo la regresión de los residuos sobre todas las variables independientes, obtenemos el R cuadrado que se presenta en la siguiente tabla. Dependent Variable: RESID RESTRINGO Method: Least Squares Date: 09/19/08 Time: 12:48 Sample: 1 32 Included observations: 32 Variable Coefficient Std. Error t-statistic Prob. PBIPC -0.000497 0.000412-1.205915 0.2376 TANF -0.482960 0.187835-2.571192 0.0155 C 7.912933 4.098870 1.930516 0.0634 R-squared 0.185646 Mean dependent var 5.07E-16 Adjusted R-squared 0.129483 S.D. dependent var 10.61688 S.E. of regression 9.905703 Akaike info criterion 7.513158 Sum squared resid 2845.566 Schwarz criterion 7.650571 Log likelihood -117.2105 F-statistic 3.305514 Durbin-Watson stat 1.840228 Prob(F-statistic) 0.050909 A continuación calculamos el estadístico LM ML=nR u 2 ML=32(0.185646)=5.940672 ~ χ 1 2 Prob χ 1 2 5.940672 = 0.0295907530358 (NOTA 8 ) Dado que el p-value es menor que 5% y 10% de significancia, se rechaza la hipótesis nula. No obstante no se debe rechazar al 1% de significancia. 8 Para calcular la probabilidad, en la zona de comandos, escribir scalar z1=2*@chisq(5.940672,1) Página 16
************************************************************************** Método de la prueba t H 0 : β 3 = 0.005 H a : β 3 0.005 t = b 3 β 3 se(b 3 ) = 0.001002 ( 0.005) 0.000412 = 9.703883495 α = 2 prob t 29 9.703883495 = 0000000000129 99% Región de no rechazo t 29 RA 0.005-2.76 2.76 0.005 RA El valor del estadístico t pertenece a la región de rechazo. Por lo tanto, se debe rechazar la hipótesis nula al 1% de significancia. El p-value es casi cero, por lo tanto se rechaza la hipótesis nula al 1%, 5% y 10% de significancia. Método de la prueba F : Mínimos cuadrados restringidos H 0 : β 3 = 0.005 H a : β 3 0.005 Mínimos cuadrados sin restringir MI = b 1 + b 2 TANF + b 3 PBIPC + e Página 17
Dependent Variable: MI Method: Least Squares Sample: 1 32 Included observations: 32 Variable Coefficient Std. Error t-statistic Prob. C 24.62648 4.098870 6.008114 0.0000 TANF 0.517040 0.187835 2.752625 0.0101 PBIPC -0.001002 0.000412-2.429457 0.0215 R-squared 0.466149 Mean dependent var 24.40000 Adjusted R-squared 0.429331 S.D. dependent var 13.11274 S.E. of regression 9.905703 Akaike info criterion 7.513158 Sum squared resid 2845.566 Schwarz criterion 7.650571 Log likelihood -117.2105 F-statistic 12.66113 Durbin-Watson stat 1.840228 Prob(F-statistic) 0.000112 Mínimos cuadrados restringidos MI = b 1 + b 2 TANF 0.005PBIPC + e MI + 0.005PBIPC = b 1 + b 2 TANF + e Dependent Variable: MI+0.005*PBIPC Method: Least Squares Date: 09/12/08 Time: 18:13 Sample: 1 32 Included observations: 32 Variable Coefficient Std. Error t-statistic Prob. C 56.29869 5.012074 11.23261 0.0000 TANF -0.337030 0.335893-1.003383 0.3237 R-squared 0.032470 Mean dependent var 52.74408 Adjusted R-squared 0.000219 S.D. dependent var 20.05866 S.E. of regression 20.05647 Akaike info criterion 8.895442 Sum squared resid 12067.86 Schwarz criterion 8.987050 Log likelihood -140.3271 F-statistic 1.006777 Durbin-Watson stat 1.876953 Prob(F-statistic) 0.323701 Bajo el supuesto de normalidad y la hipótesis nula y alternativa planteado líneas arriba, F = SRC r SRC c SRC n k = F c, n k Página 18
Constituirá el estadístico prueba particularizado bajo la hipótesis nula, a comparar con el valor crítico de una distribución F-Snedecor con c y n-k grados de libertad, respectivamente. Nota: SRC r : Suma de residuos al cuadrado restringido SRC: Suma de residuos al cuadrado sin restringir c: denota el número de restricciones (1 en nuestro ejemplo) n: número de observaciones k: número de variables explicativas incluyendo el punto de corte en la regresión no restringida Para nuestro ejemplo, F = 12067.86 2845.566 1 2845.566 32 3 = 93.98711047 F 1,29 En Eviews, elegir la opción View/Coefficient Tests/Wald-Coefficient Restrictions... y escribir c(3)=-0.005. El resultado se presenta en la siguiente ventana. Observe el resultado coincide con los cálculos anteriores. La hipótesis nula se debe rechazar al 1%, 5% y 10% de significancia Wald Test: Equation: EQ01 Test Statistic Value df Probability F-statistic 93.98708 (1, 29) 0.0000 Chi-square 93.98708 1 0.0000 Null Hypothesis Summary: Normalized Restriction (= 0) Value Std. Err. 0.005 + C(3) 0.003998 0.000412 Restrictions are linear in coefficients. ************************************************************************ Método de la prueba t H 0 : β 2 + β 3 = 0.60 H a : β 2 + β 3 0.60 Página 19
t = b 2 + b 3 β 2 + β 3 se b 2 + b 3 t = b 2 + b 3 0.60 var(b 2 ) + var(b 3 ) + 2cov(b 2 b 3 ) Matriz de varianzas-covarianzas b 1 b 2 b 3 b 1 b 2 b 3 16.80074-0.578069-0.001347-0.578069 0.035282 3.63E-05-0.001347 3.63E-05 1.70E-07 t = 0.517040 0.001002 0.60 0.035282 + 0.00000017 + 2 0.0000363 = 0.4465383537~t 29 Obsérvese t 2 29 = ( 0.4465383537) 2 = 0.1993965013~F(1,29) 99% Región de no rechazo t 29 RA 0.005-2.76 2.76 0.005 RA Dado que el estadístico t pertenece a la región de no rechazo, se acepta la hipótesis nula. Método de la prueba F : Mínimos cuadrados restringidos H 0 : β 2 + β 3 = 0.60 β 2 = 0.60 β 3 MI = β 1 + β 2 TANF + β 3 PBIPC + e MI = β 1 + (0.60 β 3) TANF + β 3 PBIPC + e MI = β 1 + 0.60 TANF β 3 TANF + β 3 PBIPC + e MI = β 1 + 0.60 TANF + β 3 (PBIPC TANF) + e Página 20
Mínimos cuadrados restringidos MI 0.60TANF = β 1 + β 3 (PBIPC TANF) + e Dependent Variable: MI-0.60*TANF Method: Least Squares Date: 09/12/08 Time: 19:14 Sample: 1 32 Included observations: 32 Variable Coefficient Std. Error t-statistic Prob. C 23.25046 2.666453 8.719619 0.0000 PBIPC-TANF -0.000915 0.000359-2.549615 0.0161 R-squared 0.178094 Mean dependent var 18.07187 Adjusted R-squared 0.150697 S.D. dependent var 10.60426 S.E. of regression 9.772634 Akaike info criterion 7.457511 Sum squared resid 2865.131 Schwarz criterion 7.549119 Log likelihood -117.3202 F-statistic 6.500537 Durbin-Watson stat 1.960459 Prob(F-statistic) 0.016134 Dependent Variable: MI Method: Least Squares Sample: 1 32 Included observations: 32 Mínimos cuadrados sin restringir MI = b 1 + b 2 TANF + b 3 PBIPC + e Variable Coefficient Std. Error t-statistic Prob. C 24.62648 4.098870 6.008114 0.0000 TANF 0.517040 0.187835 2.752625 0.0101 PBIPC -0.001002 0.000412-2.429457 0.0215 R-squared 0.466149 Mean dependent var 24.40000 Adjusted R-squared 0.429331 S.D. dependent var 13.11274 S.E. of regression 9.905703 Akaike info criterion 7.513158 Sum squared resid 2845.566 Schwarz criterion 7.650571 Log likelihood -117.2105 F-statistic 12.66113 Durbin-Watson stat 1.840228 Prob(F-statistic) 0.000112 Bajo el supuesto de normalidad y la hipótesis nula y alternativa planteado líneas arriba, F = SRC r SRC c SRC n k = F c, n k Página 21
Constituirá el estadístico prueba particularizado bajo la hipótesis nula, a comparar con el valor crítico de una distribución F-Snedecor con c y n-k grados de libertad, respectivamente. Nota: SRC r : Suma de residuos al cuadrado restringido SRC: Suma de residuos al cuadrado sin restringir c: denota el número de restricciones (1 en nuestro ejemplo) n: número de observaciones k: número de variables explicativas incluyendo el punto de corte en la regresión no restringida Para nuestro ejemplo, F = 2865.131 2845.566 1 2845.566 32 3 = 0.1993926692 F 1,29 En Eviews elegir la opción View/Coefficient Tests/Wald-Coefficient Restrictions... y escribir c(2)+c(3)=0.60. El resultado se presenta en la siguiente ventana. Observe el resultado coincide con los cálculos anteriores. La hipótesis nula no se debe rechazar dado que el p-value es mayor que el 1% de significancia. Página 22
Wald Test: Equation: EQ01 Test Statistic Value df Probability F-statistic 0.199397 (1, 29) 0.6585 Chi-square 0.199397 1 0.6552 Null Hypothesis Summary: Normalized Restriction (= 0) Value Std. Err. -0.6 + C(2) + C(3) -0.083962 0.188029 Restrictions are linear in coefficients. h) Haga la regresión de la mortalidad infantil sobre la tasa de analfabetización femenina, el PBI percápita y población con acceso sostenible a mejores fuentes de abastecimiento de agua, es decir, MI = b 1 + b 2 TANF + b 3 PBIPC + b 4 PAS + e y obtenga los resultados habituales. Construya la tabla ANOVA incremental y a partir de ésta decidir si merece la pena añadir la variable PAS al 1%, 5% y 10% de significancia. Cuáles son las consecuencias de añadir la variable PAS?. Dependent Variable: MI Method: Least Squares Sample: 1 32 Included observations: 32 MODELO SIN LA VARIABLE PAS Variable Coefficient Std. Error t-statistic Prob. C 24.62648 4.098870 6.008114 0.0000 TANF 0.517040 0.187835 2.752625 0.0101 PBIPC -0.001002 0.000412-2.429457 0.0215 R-squared 0.466149 Mean dependent var 24.40000 Adjusted R-squared 0.429331 S.D. dependent var 13.11274 S.E. of regression 9.905703 Akaike info criterion 7.513158 Sum squared resid 2845.566 Schwarz criterion 7.650571 Log likelihood -117.2105 F-statistic 12.66113 Durbin-Watson stat 1.840228 Prob(F-statistic) 0.000112 MI = 24.62647915 + 0.5170397354*TANF - 0.001001908156*PBIPC+RESID Página 23
MODELO CON LA VARIABLE PAS Dependent Variable: MI Method: Least Squares Sample: 1 32 Included observations: 32 Variable Coefficient Std. Error t-statistic Prob. C 41.12488 11.71173 3.511427 0.0015 TANF 0.346369 0.216288 1.601423 0.1205 PBIPC -0.000777 0.000431-1.803759 0.0820 PAS -0.201240 0.134204-1.499500 0.1449 R-squared 0.505832 Mean dependent var 24.40000 Adjusted R-squared 0.452886 S.D. dependent var 13.11274 S.E. of regression 9.699121 Akaike info criterion 7.498416 Sum squared resid 2634.043 Schwarz criterion 7.681633 Log likelihood -115.9747 F-statistic 9.553640 Durbin-Watson stat 1.883524 Prob(F-statistic) 0.000165 MI = 41.12487696 + 0.346368544*TANF - 0.0007769858234*PBIPC - 0.2012396009*PAS ANÁLISIS MARGINAL DE UNA VARIABLES: PAS H 0 : β 4 = 0 H a : β 4 0 TABLA ANOVA INCREMENTAL Fuente de variación Explicada por la regresión TANF & PBIPC Explicada por la regresión TANF & PBIPC & PAS Suma al cuadrado Grados de libertad 2 R m 1 = 0.466149 2-2 R k 1 = 0.505832 3-2 2 Incremento debido a PAS R k 1 R m 1 = 0.039683 1 Q 3 = 0.039683 = 0.039683 1 2 No explicada por la regresión 1 R k 1 = 0.494168 28 Q 4 = 0.494168 = 0.01764885714 28 TOTAL 1 31 - SCM F* 0.039683 F = 0.01764885714 = 2.248474203 Prob(F*)=0.144936 Dado que el p-value es mayor que α = 1%, 5%y10%, no se rechaza la Hipótesis nula. Por lo tanto la variable PAS es irrelevante en el modelo. Obsérvese además t 2 25 = ( 1.499500) 2 = 2.24850025 = F(1,28) Es decir, se demuestra estadísticamente que el cuadrado del valor crítico de una distribución t-student con n-k grados de libertad equivale al valor crítico de una Página 24
distribución F-Snedecor con 1 y n-k grados de libertad, en el numerador y denominador, respectivamente. Ojo, n es el número de observaciones y k el número de variables explicativas incluyendo el punto de corte. Para realizar el análisis incremental en Eviews seleccionar la opción View/Coefficient Tests/Omitted Variables-Likelihood Ratio y escribir PAS. Omitted Variables: PAS F-statistic 2.248499 Probability 0.144936 Log likelihood ratio 2.471746 Probability 0.115909 Test Equation: Dependent Variable: MI Method: Least Squares Date: 09/12/08 Time: 19:43 Sample: 1 32 Included observations: 32 Variable Coefficient Std. Error t-statistic Prob. C 41.12488 11.71173 3.511427 0.0015 TANF 0.346369 0.216288 1.601423 0.1205 PBIPC -0.000777 0.000431-1.803759 0.0820 PAS -0.201240 0.134204-1.499500 0.1449 R-squared 0.505832 Mean dependent var 24.40000 Adjusted R-squared 0.452886 S.D. dependent var 13.11274 S.E. of regression 9.699121 Akaike info criterion 7.498416 Sum squared resid 2634.043 Schwarz criterion 7.681633 Log likelihood -115.9747 F-statistic 9.553640 Durbin-Watson stat 1.883524 Prob(F-statistic) 0.000165 Página 25
Alternativamente, podemos utilizar el contraste de Wald eligiendo la opción View/Coefficient Tests/Wald-Coefficient Restrictions y escribir la hipótesis nula c(4)=0. Wald Test: Equation: EQ05 Test Statistic Value df Probability F-statistic 2.248499 (1, 28) 0.1449 Chi-square 2.248499 1 0.1337 Null Hypothesis Summary: Normalized Restriction (= 0) Value Std. Err. C(4) -0.201240 0.134204 Restrictions are linear in coefficients. Las dos tablas anteriores nos muestran el mismo resultado calculado en la tabla Anova incremental. Página 26
REFERENCIAS BIBLIOGRÁFICAS - Gujarati Damodar. Econometría. Cuarta Edición. Capítulo 8. Págs. 239-284. - Jeffrey M. Wooldrige. Introducción a la Econometría. Capítulo 5. Págs. 171-173. Capítulo 8. Págs. 255-258. Página 27