Econometría Tutorial 6 Ejercicios de Multicolinealidad En los siguientes ejercicios vamos a retomar la Curva de Kuznets Ambiental analizada en los primeros dos trabajos prácticos. La relación entre contaminación y desarrollo era resumida por la ecuación (3): Recuerde que la base de datos polucion2006.dta contiene datos para 157 países en el año 2006 sobre las siguientes variables: - diox: nivel de contaminación, medido como la intensidad en las emisiones de dióxido de carbono (CO2) en Kg, por cada Kg de petróleo utilizado. - gdp: PBI per cápita en miles de dólares corrientes. - edu: años promedio de educación. 1
Modelo Benchmark a) Estime el modelo en Stata. gen lndiox=ln(diox). gen gdp2=gdp*gdp. reg lndiox gdp gdp2 edu F( 3, 153) = 7.44 Model 6.69137517 3 2.23045839 Prob > F = 0.0001 Residual 45.8749838 153.299836496 R-squared = 0.1273 Adj R-squared = 0.1102 Total 52.566359 156.33696384 Root MSE =.54757 gdp.0401394.0127979 3.14 0.002.014856.0654228 gdp2 -.0009817.0003233-3.04 0.003 -.0016205 -.0003429 edu.0424088.0245052 1.73 0.086 -.0060035.0908211 _cons -.0111252.2732859-0.04 0.968 -.5510261.5287757 b) Interprete los coeficientes obtenidos y su significatividad estadística 2
I. Multicolinealidad perfecta a) Suponga que modificamos ligeramente el modelo descripto arriba: Donde edu2=2*edu b) Cuál es el nivel de correlación entre edu y edu2. gen edu2=2*edu. corr gdp gdp2 edu edu2 (obs=157) gdp gdp2 edu edu2 gdp 1.0000 gdp2 0.9450 1.0000 edu 0.5312 0.4352 1.0000 edu2 0.5312 0.4352 1.0000 1.0000 c) Es posible aplicar el teorema de Gauss-Markov en este caso? 3
d) Intente estimar empíricamente β 3 y β 4. Qué sucede? Justifique.. reg lndiox gdp gdp2 edu edu2 note: edu omitted because of collinearity F( 3, 153) = 7.44 Model 6.69137517 3 2.23045839 Prob > F = 0.0001 Residual 45.8749838 153.299836496 R-squared = 0.1273 Adj R-squared = 0.1102 Total 52.566359 156.33696384 Root MSE =.54757 gdp.0401394.0127979 3.14 0.002.014856.0654228 gdp2 -.0009817.0003233-3.04 0.003 -.0016205 -.0003429 edu (omitted) edu2.0212044.0122526 1.73 0.086 -.0030018.0454105 _cons -.0111252.2732859-0.04 0.968 -.5510261.5287757 e) Intente estimar empíricamente β 3 y β 4 por separado. Qué sucede? Justifique.. reg lndiox gdp gdp2 edu F( 3, 153) = 7.44 Model 6.69137517 3 2.23045839 Prob > F = 0.0001 Residual 45.8749838 153.299836496 R-squared = 0.1273 Adj R-squared = 0.1102 Total 52.566359 156.33696384 Root MSE =.54757. reg lndiox gdp gdp2 edu2 F( 3, 153) = 7.44 Model 6.69137517 3 2.23045839 Prob > F = 0.0001 Residual 45.8749838 153.299836496 R-squared = 0.1273 Adj R-squared = 0.1102 Total 52.566359 156.33696384 Root MSE =.54757 gdp.0401394.0127979 3.14 0.002.014856.0654228 gdp2 -.0009817.0003233-3.04 0.003 -.0016205 -.0003429 edu.0424088.0245052 1.73 0.086 -.0060035.0908211 _cons -.0111252.2732859-0.04 0.968 -.5510261.5287757 gdp.0401394.0127979 3.14 0.002.014856.0654228 gdp2 -.0009817.0003233-3.04 0.003 -.0016205 -.0003429 edu2.0212044.0122526 1.73 0.086 -.0030018.0454105 _cons -.0111252.2732859-0.04 0.968 -.5510261.5287757 4
f) Transforme el modelo reemplazando en el modelo original edu2=2*edu. Qué combinación de los parámetros sí puede ser estimada por MC? Estime y comente. 5
II. Multicolinealidad alta pero no perfecta a) Suponga que modificamos ligeramente el modelo descripto arriba: Donde EDU3=0.9*EDU-e Y e es una variable aleatoria con distribución N(0,1). Cuál es ahora el nivel de correlación entre las variables explicativas?. gen e=invnormal(uniform()). gen edu3=0.9*edu+e. corr lndiox gdp gdp2 edu edu3 (obs=157) lndiox gdp gdp2 edu edu3 lndiox 1.0000 gdp 0.1948 1.0000 gdp2 0.0962 0.9450 1.0000 edu 0.2659 0.5312 0.4352 1.0000 edu3 0.1885 0.4877 0.3816 0.8988 1.0000 6
b) Intente estimar empíricamente β 3 y β 5. Compare su respuesta con el ejercicio 1.c. Analice la significatividad estadística de los estimadores, tanto global como individual. Usted cree que las estimaciones de ambos parámetros son confiables? Justifique. reg lndiox gdp gdp2 edu edu3 F( 4, 152) = 6.71 Model 7.88946647 4 1.97236662 Prob > F = 0.0001 Residual 44.6768925 152.293926925 R-squared = 0.1501 Adj R-squared = 0.1277 Total 52.566359 156.33696384 Root MSE =.54215 gdp.043815.0128013 3.42 0.001.0185237.0691064 gdp2 -.0010742.0003234-3.32 0.001 -.0017131 -.0004352 edu.1234485.0469026 2.63 0.009.0307833.2161137 edu3 -.0903168.0447346-2.02 0.045 -.1786986 -.001935 _cons -.0295908.2707339-0.11 0.913 -.564478.5052965. gen e2=invnormal(uniform()). gen edu4=0.9*edu+e2. reg lndiox gdp gdp2 edu edu4 F( 4, 152) = 5.56 Model 6.70493016 4 1.67623254 Prob > F = 0.0003 Residual 45.8614288 152.301719927 R-squared = 0.1276 Adj R-squared = 0.1046 Total 52.566359 156.33696384 Root MSE =.54929 gdp.0397117.0129956 3.06 0.003.0140363.0653871 gdp2 -.00097.0003291-2.95 0.004 -.0016201 -.0003198 edu.051407.0490565 1.05 0.296 -.0455136.1483276 edu4 -.0098051.0462601-0.21 0.832 -.1012009.0815906 _cons -.0112994.2741441-0.04 0.967 -.5529242.5303254 c) El estimador de mínimos cuadrados sigue siendo el de menor varianza entre la familia de estimadores lineales e insesgados? 7
3. Baja multicolinealidad a) Replique el ejercicio 2.c pero en esta oportunidad asuma un c=0.01. Cuál es ahora el nivel de correlación entre las variables independientes?. gen edu5=0.01*edu+e2. corr lndiox gdp gdp2 edu edu5 (obs=157) lndiox gdp gdp2 edu edu5 lndiox 1.0000 gdp 0.1948 1.0000 gdp2 0.0962 0.9450 1.0000 edu 0.2659 0.5312 0.4352 1.0000 edu5-0.0492 0.0164 0.0681 0.0181 1.0000 b) Estime el nuevo modelo. reg lndiox gdp gdp2 edu edu5 F( 4, 152) = 6.71 Model 7.88946636 4 1.97236659 Prob > F = 0.0001 Residual 44.6768926 152.293926925 R-squared = 0.1501 Adj R-squared = 0.1277 Total 52.566359 156.33696384 Root MSE =.54215 gdp.043815.0128013 3.42 0.001.0185237.0691064 gdp2 -.0010742.0003234-3.32 0.001 -.0017131 -.0004352 edu.0430666.0242647 1.77 0.078 -.0048731.0910063 edu5 -.0903168.0447346-2.02 0.045 -.1786986 -.001935 _cons -.0295908.2707339-0.11 0.913 -.564478.5052965 8
IV. Multicolinealidad perfecta a raíz de correlación global de una variable Considere el siguiente modelo lineal, Donde DESARROLLO = 0.3*GDP+0.7*EDU a) Es posible aplicar el teorema de Gauss-Markov en este caso? 9
b) Intente estimar empíricamente el modelo. Qué sucede? Justifique.. gen desarrollo=0.3*gdp+0.7*edu. reg lndiox gdp gdp2 edu desarrollo note: desarrollo omitted because of collinearity F( 3, 153) = 7.44 Model 6.69137517 3 2.23045839 Prob > F = 0.0001 Residual 45.8749838 153.299836496 R-squared = 0.1273 Adj R-squared = 0.1102 Total 52.566359 156.33696384 Root MSE =.54757 gdp.0401394.0127979 3.14 0.002.014856.0654228 gdp2 -.0009817.0003233-3.04 0.003 -.0016205 -.0003429 edu.0424088.0245052 1.73 0.086 -.0060035.0908211 desarrollo (omitted) _cons -.0111252.2732859-0.04 0.968 -.5510261.5287757 10
V. Correlación no perfecta entre más de dos variables Considere el siguiente modelo lineal, Donde DESARROLLO2 = 0.5*GDP+0.5*EDU+e a) Se cumple el teorema de Gauss Markov? 11
b) Estime la correlación parcial de Q con el resto de las variables. Para esto, estime una regresión donde la variable a explicar sea Q y las explicativas X y P. Qué conclusión puede sacar de los resultados de este inciso en comparación con los resultados del inciso anterior?. gen desarrollo2=0.5*gdp+0.5*edu+e. reg desarrollo2 gdp gdp2 edu F( 3, 153) = 2244.26 Model 6463.33227 3 2154.44409 Prob > F = 0.0000 Residual 146.876786 153.959978992 R-squared = 0.9778 Adj R-squared = 0.9773 Total 6610.20906 156 42.373135 Root MSE =.97979 desarrollo2 Coef. Std. Err. t P> t [95% Conf. Interval] gdp.5406968.0228995 23.61 0.000.4954567.5859369 gdp2 -.0010237.0005786-1.77 0.079 -.0021667.0001193 edu.4972831.0438478 11.34 0.000.4106579.5839084 _cons -.2044535.4889966-0.42 0.676-1.17051.7616034 12
c) Intente estimar empíricamente β, γ y δ en forma conjunta. Qué sucede? Justifique. Compare su respuesta con el ejercicio 4.d. Analice la significatividad estadística de los estimadores, tanto global como individual. Usted cree que las estimaciones de ambos parámetros son confiables? Justifique.. reg lndiox gdp gdp2 edu desarrollo2 F( 4, 152) = 6.71 Model 7.88946668 4 1.97236667 Prob > F = 0.0001 Residual 44.6768923 152.293926923 R-squared = 0.1501 Adj R-squared = 0.1277 Total 52.566359 156.33696384 Root MSE =.54215 gdp.0889734.0273058 3.26 0.001.0350254.1429214 gdp2 -.0010742.0003234-3.32 0.001 -.0017131 -.0004352 edu.0873218.0329172 2.65 0.009.0222874.1523562 desarrollo2 -.0903168.0447346-2.02 0.045 -.1786986 -.001935 _cons -.0295908.2707339-0.11 0.913 -.564478.5052965. gen desarrollo3=0.5*gdp+0.5*edu+e2. reg lndiox gdp gdp2 edu desarrollo3 F( 4, 152) = 5.56 Model 6.70493018 4 1.67623255 Prob > F = 0.0003 Residual 45.8614288 152.301719926 R-squared = 0.1276 Adj R-squared = 0.1046 Total 52.566359 156.33696384 Root MSE =.54929 gdp.0446143.0247091 1.81 0.073 -.0042032.0934318 gdp2 -.00097.0003291-2.95 0.004 -.0016201 -.0003198 edu.0474849.0343196 1.38 0.169 -.0203201.1152899 desarrollo3 -.0098051.0462601-0.21 0.832 -.1012009.0815906 _cons -.0112994.2741441-0.04 0.967 -.5529242.5303255 d) El estimador de mínimos cuadrados sigue siendo el de menor varianza entre la familia de estimadores lineales e insesgados? 13