Universidad Nacional de Cordoba Econometría de Datos en Paneles Walter Sosa Escudero (wsosa@udesa.edu.ar) Universidad de San Andres y UNLP 19 de Mayo de 2004
Econometria de Datos en Paneles Walter Sosa Escudero Introduccion
,948035,30 08 Una base de datos en panel contiene informacion para varios individuos (empresas, paises, etc.) en el tiempo. El aspecto fundamental es esta bidimensionalidad de los datos. PSID: 6500 familias desde 1968. EPH: tiene una estructura de panel rotativo.
'039,,8/0:8,7/,948035,30 Con N individuos y T periodos podriamos estimar N modelos de series de tiempo y T modelos de corte transversal. Las ventajas de disponer de un panel tiene que ver con la posibilidad de agregar esta información de alguna manera. Ejemplo: y it =x it +u it Supone que el modelo lineal subyacente es el mismo para todos los individuos y periodos. 43974 /0 09074 030 /,/08344-807;,- 08
743 0 %7:2-:.7 203 ;,7,- 080.4342.,8 ;,7,- 08/0 :89.,.7 2 3, 3,089 2,. 43/0.479097,38;078, 708: 9,807 2: 25479,390 7 9., 089,2:.4770,. 43,/,.431,.94708 70 43, 086:0 31 : 0384-700.7 203 574-02,/0 42 8 43/0;,7,- 08 &35,30 /0/,9485072 90.43974,754708948010.948 42 9 /48
'039,,8 5 47,7010.948/ 3 2.48 03!47,9,9,8,/0/08025 04/0 48 : 9 248/48, 48743/,0 $438 02570 48 2 8248 3/ ; /:484;,3749,3/4!072 900 2 3,7808 48547, 70,. 43 ',7,82 8, 9,
2 9,. 4308 48 0257008548-0, 70,7 31472,. 43902547, /0.479097,38;078, 5:0/038072 84-807;,. 4308 5074/054-,. 4308 09074 030,8 485,30 08843.4894848/0 25 02039,7,/2 3 897,7!74-02,8/080 0.9 ; /,/,:9480 0.. 43 34 7085:089,,997 9 43 2038 43902547,.479,
Econometria de Datos en Paneles Walter Sosa Escudero El Modelo Básico de Componente de Errores
850. 1.,. 43 24/0 4-,8.408 x it vector de K variables explicativas (incluye una constante). es un vector de coeficientes El termino de error incluye dos componentes, uno especifico del individuo y otro de la observacion.
Caso más simple: i = $:543,248,/. 43, 20390 6:0 9 8,9 81,.094/48 48 8:5:08948.,8.48 30890.,84 0 089 2,/47/0 08,0897:.9:7,/05,30 34, 70, 31472,. 43
El estimador MCO de es: en donde X es una matriz NT x K con las observaciones de todas las variables explicativas para todos los individuos, Y se define en forma similar
4/0 4/0010.9481 48 47708543/0, 03/43/0 08:33:2074 1 4 5,7,.,/, 3/ ; /:4 6: ;, 0, 24/0 48/0 70 708 43 :345,7,.,/, 3; / /:4 2 82, 503/ 0390 :3 3907.05940850. 1.4 5,7,.,/, 3/ ; /:4 Г Г Г
89 2,. 43/0 24/0 4/0 Si satisface todos los supuestos clasicos, el estimador MELI de y i es el estimador MCO incorporando N-1 variables binarias. (una por individuo menos una. Porque?). En terminos matriciales: en donde Z es una matriz NT x (K+(N-1)) con todas las K variables explicativas (X) y las N-1 dummies
!74-02, 08:3,2,97 2: 7,3/05,7, 3;079 7 %7:.4 97,381472,70 24/0 45,7,0 2 3,7 48 4203.0248.43 942,3/457420/ 48547 3/ ; /:4 7089,3/4 81,. 24897,76:00 089 2,/47 /0 03 08 0,.9,20390 :,, 089 2,/47 /0 030 24/0 4.43;,7,- 08-3,7,8 08,2,/424/0 4 9 3
89 2,. 43/0,2,97 /0;,7,3,8 310703.,, 40 8:5:0894/03472, /,//0 480 9,9047, 089,3/,7-8.,/0 310703.,5,7, 1:3. 43, 908989 09. 3 0307, 485,6:0908089,3/,7,/48 $9,9, 09..,.:,3.4770.9,20390,8;,7,3,8, 6:090307.: /,/4.43 48 7,/48/0-079,/8 :34 4,.0, 2,34,9047,,8 3949.,/0 9,2-031:3. 43,03 1472,089,3/,7 90898-,8,/4803708: 9,/48/0 3472, /,/,8 3949.,
!745 0/,/08/0 089 2,/47/0 089 2,/47/0 08.438 890390.:,3/44% 9 03/03, 31 3 94 089 2,/47/0 3408.438 890390 0 3:2074/0 5,7,209748,:2039,.43!74-02,/0 5,7,209748 3. /039, 08
4/0 4/0010.948, 0,947 48 47708543/0, 03/43/0 08:3,;,7,- 0, 0,947, 5,7,.,/, 3/ ; /:4 1472,5,790/0 9072 34/007747 6:0, 47,9 030/48.4254303908:340850. 1.4/0 3/ ; /:4 4974/0, 4-807;,. 3
#0.47/,947 4 Consideremos: Y=X +u Valen todos los supuestos clasicos, salvo que: V(u) =, simetrica y positiva definida (permite autocorrelacion y heterocedasticidad). %04702, 9 03 /0 08 9073,9 ;,20390.43!! 8,9 81,.0!!
,.9-08 706: 070.434.07 032:. 48.,84808943408 1,.9-0 Ωˆ $ 08:3089 2,/47.438 890390/0 :3,;078 43 1,.9-0 /0 089 2,/4708 408 08,8 3949.,2039006: ;, 0390,,0897,90,08089 2,7 :0 4.425:9,70
850. 1.,. 43/0 24/0 4/0
39072 3482,97., 08 Г:.43 : ' : 08:3,2,97 % %.430 020394.,7,.907 89.4 80,6:0 3408:308.,,7547, /039 /,/!47.43897:.. 43 0 24/0 4/09 030,:94.4770,. 43 /0 080 089 2,/47
89 2,. 43/0 24/0 4/0 $05:0/024897,76:00 089 2,/47 /0 08 /039.4, 089 2,/47/0 03 43 089 2,/47/0 70025,,,8;,7,3,8547 089 2,. 4308.438 8903908/0,82 82,8
#0,. 43080397024/0 48 48089 2,/4708, 9073,9 ;48 89 2,. 43 $ 0 ;07/,/07424/0 408 08 301. 0390 5476:0 $ 0 ;07/,/07424/0 408 08 54903., 20390808,/40 3.438 890390 5476:0 89 2,. 4309 003 57420/ 48547 3/ ; /:4 $ 0 ;07/,/07424/0 408 08 301. 0390 5476:0 $ 0 ;07/,/07424/0 408 08 54903., 20390808,/40 3.438 890390
',7,- 086:0;,7,384 4547 3/ ; /:48 438 /0702480 24/0 4 ;0.9474-807;,- 0/0;,7,- 086:0;,7,384 4547 3/ ; /:48 0 9,2, 4/0:3,574; 3., 4.4770,. 43,/,.43 3 089 2,/47/0345:0/0 /039 1.,7 Q!476:0 089 2,/47/08 5:0/0 /039 1.,7 Q!476:0 Q":05,8,.4309 003
.4770,. 43,/,.43 #08: 9,/42: 25479,390 089 2,/47/008 3.438 890390 5476:0 089 2,/47/08 :08 03/4.438 890390 09 003 843 3.438 8903908
10.9481 484, 0,947 48!70 :39,2:.425.,/, 4.431:3/ 724/0 48! 8.43089 2,/4708 :348.70036:008:3,.:089 43/097,9,2 0394 9748 /080 0.. 43/024/0 48 8,4 08;, /4 3430.08,7,20390459 24,:3.:,3/4 089,.4770,. 43,/4.43 9 03/0,8072,801. 0390.:,3/4 089,.4770,. 43,/4.43 89,870,80 2 3,3089 2,/4708 507434 30.08,7,203908: 0703.:, :8,7
025 4025 7.4 85,7 /,/0870 43, 08030 /08,25 04 :0390,,3!4794,2,7. 0 $48,8.:/074 #0 43, $. 03.0,3/&7-,3.4342.8 :089 43 1:07908/ 85,7 /,/0870 43, 08.43 /08025 04.,2-,390 31472,. 43 5,30 /0574; 3.,8,7 039 3,8, 48 ',7,- 00 5.,/, 9,8,/0/08025 0470 43, 5,7,.,/,507 4/4 ',7,- 080 5.,9 ;,8 5-2 574/:.9470 43, 8 4. 5 /08; 48/0,903/03.,030 574/:.94 :5742 /08025 0457420/ 4 751,203 3/.,/47/0,203 9 08
89 2,. 43/0010.9481 48. xtreg iu pbgm shockp uprom rpf amen, fe i(indice) Fixed-effects (within) regression Number of obs = 242 Group variable (i) : indice Number of groups = 22 R-sq: within = 0.5810 Obs per group: min = 11 between = 0.1198 avg = 11.0 overall = 0.1781 max = 11 F(4,216) = 74.88 corr(u_i, Xb) = -0.8359 Prob > F = 0.0000 ------------------------------------------------------------------------------ iu Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- pbgm.0045631.0012047 3.788 0.000.0021886.0069377 shockp -3.756665 2.9543-1.272 0.205-9.579612 2.066283 uprom.8426046.0596304 14.130 0.000.7250727.9601365 rpf.0128717.0070708 1.820 0.070 -.001065.0268084 amen (dropped) _cons -2.038174.8060633-2.529 0.012-3.626931 -.4494178 ------------------------------------------------------------------------------ sigma_u 4.9293803 sigma_e 1.8148176 rho.88063494 (fraction of variance due to u_i) ------------------------------------------------------------------------------ F test that all u_i=0: F(21,216) = 15.99 Prob > F = 0.0000 Test F de significatividad conjunta Stata NO muestra las estimaciones de los efectos fijos! EF no puede estimar el coeficiente de amenities Test de Efectos Fijos
89 2,. 43/0010.948, 0,947 48. xtreg iu pbgm shockp uprom rpf amen, re i(indice) Random-effects GLS regression Number of obs = 242 Group variable (i) : indice Number of groups = 22 R-sq: within = 0.5658 Obs per group: min = 11 between = 0.1243 avg = 11.0 overall = 0.3646 max = 11 Random effects u_i ~ Gaussian Wald chi2(5) = 284.74 corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000 Test de Efectos Aleatorios ------------------------------------------------------------------------------ iu Coef. Std. Err. z P> z [95% Conf. Interval] ---------+-------------------------------------------------------------------- pbgm.001187.0004271 2.779 0.005.00035.0020241 shockp -1.932403 2.932216-0.659 0.510-7.679442 3.814635 uprom.8982061.0574937 15.623 0.000.7855206 1.010892 rpf.0085048.0070188 1.212 0.226 -.0052518.0222615 amen -.0355677.0751639-0.473 0.636 -.1828862.1117509 _cons.2122568 1.196021 0.177 0.859-2.131901 2.556415 ---------+-------------------------------------------------------------------- sigma_u 2.2612849 sigma_e 1.8148176 rho.60823435 (fraction of variance due to u_i) ------------------------------------------------------------------------------ RE puede estimar el coeficiente de amenities Componentes de varianzas
Econometria de Datos en Paneles Walter Sosa Escudero Inferencia en el Modelo de Componente de Errores "The three golden rules of econometrics are test, test, test." (D. Hendry, 1980, pp. 403)
Tests de agrupamiento ("To pool or not to pool") Modelo restringido (pooled): Modelo sin restringir: Hipotesis (poolability): Bajo H o estimamos un solo modelo agregado. Bajo H A estimariamos T modelos de series temporales. Es una discusion clásica de "sesgo-varianza" (ver Baltagi, Griffin y Xiong (2000) para una aplicacion interesante).
Tests de agrupamiento Si ε it satisface todos los supuestos clasicos y bajo normalidad, el test es un Test de Chow simple!: e son residuos de estimar el modelo agregado por OLS, e * son residuos de estimar los modelos por separado. Es identico a estimar un solo modelo agregado con dummies por intercepto y pendiente, y evaluar la significatividad de todas las dummies con un test F. Se puede testear igualdad solo de pendientes Si V(ε)=Ω : usar test de Chow luego de la estimacion FGLS (Test de Roy-Zellner).
Test de efectos fijos Consideremos el modelo de efectos fijos en forma matricial: en donde Z es una matriz de N-1 variables binarias por intercepto. Bajo el supuesto de normalidad de e, la hipotesis: H o : µ 1 = µ 2 =...=µ N-1 =0 (ausencia de efectos fijos) puede evaluarse con un test F estandar de significatividad conjunta de las N-1 variables binarias.
Test de efectos aleatorios En el modelo de efectos aleatorios, corresponde a la hipotesis de ausencia de efectos aleatorios. Test de Breusch-Pagan: bajo normalidad, el estadistico tiene distribucion asintotica chi-cuadrado con 1 grado de libertad bajo H 0. Rechazar si LM es muy grande. Honda (1985): el supuesto de normalidad se puede relajar. Test unidireccional.
Tests de autocorrelación Baltagi-Li (1991) H o : ρ=0 en: (suponen implicitamente no efectos aleatorios) Test: con tiene distribucion asintotica Chi 2 (1) bajo H o. Es muy similar a un test LM estandar de autocorrelacion.
Tests modificados de efectos aleatorios y autocorrelacion Bera-Yoon-Sosa Escudero (2001): Test de BP de efectos aleatorios supone implicitamente no autocorrelacion. La presencia de efectos aleatorios "confunde" al test de BP, induciendo a rechazar H o, aun cuando es cierta. Misma cosa sucede con el test de autocorrelacion. BYS: tests modificados. Test conjunto Baltagi-Li (1991) Test de la hipotesis nula conjunta de no autocorrelacion y no efectos aleatorios (baja potencia, poco informativo) Sosa Escudero (2001): Test conjunto de efectos aleatorios y correlacion serial positiva (one-sided, one-directional)
Ejemplo empirico BSY (2001). Dos bases de datos (Grunfeld y Greene) " * " tests modificados No rechaza! No rechaza! En ambos ejemplos los tests originales rechazan H 0 (autocorrelacion, efectos aleatorios, ambos?) Los test modificados sugieren que en el caso de Grunfeld el problema es EA y en el de Greene autocorrelacion!!
En el modelo: Heterocedasticidad cual es la nocion relevante de heterocedasticidad? En µ o en ε? O en ambos? Lejeune (1998): Test de heterocedasticidad en el efecto especifico. Distribution-free. Holly and Lucien (2000). Test de heterocedasticidad en el efecto individual. Supone normalidad Sosa Escudero (2003). Test de heterocedasticidad en el efecto individual y/o en el especifico. Distribution-free.
Test de Hausman Si µ esta correlacionado con X: β EA es inconsistente β EF es consistente. Si µ NO esta correlacionado con X: β EA es consistente y eficiente. β EF es consistente. Hausman (1978) propone evaluar la hipotesis de ausencia de correlación entre µ y X en base a: que tiene distribucion asintotica Chi 2 (K) bajo H o
Test de Hausman Intuitivamente, bajo H o ambas estimaciones deberian coincidir. El estimador de EF es consistente independientemente de H o. Rechazar H o sugiere que el estimador de EA es inconsistente. No necesariamente se sigue que hay que usar EF. Hay otras estrategias consistentes además de EF. No es un test de EA vs. EF., solo explora la consistencia de los estimadores.
Test de Hausman. Ejemplo empirico.. xthaus Hausman specification test ---- Coefficients ---- Fixed Random iu Effects Effects Difference ---------+----------------------------------------- pbgm.0045631.001187.0033761 shockp -3.756665-1.932403-1.824262 uprom.8426046.8982061 -.0556016 rpf.0128717.0085048.0043669 Test: Ho: difference in coefficients not systematic chi2( 4) = (b-b)'[s^(-1)](b-b), S = (S_fe - S_re) = 25.60 Prob>chi2 = 0.0000 Las diferencias entre EF y RE son significativas
Econometria de Datos en Paneles Walter Sosa Escudero Topicos adicionales y comentarios finales
Paneles dinamicos
Los estimadores estandar son sesgados e inconsistentes
Estrategias de estimacion Variables instrumentales: Anderson-Hsiao (1981) GMM: Arellano-Bond (1981) Modificaciones al estimador de efectos fijos: Kiviet
Otras áreas Modelos dinamicos. Raices unitarias y cointegracion. Casi todos los resultados estandar en econometría estan siendo rescritor para paneles (modelos de eleccion, semi y no parametricos, etc.).
Textos recientes Wooldridge, J., 2001, The Econometrics of Cross Section and Panel Data, MIT Press. Arellano, M., 2003, Panel Data, Oxford University Press. Hsiao, C., 2002, Analisis of Panel Data, Cambridge University Press, Cambridge. Baltagi, B., 2001, The Econometrics of Panel Data, Wiley, New York. Baltagi, B., 2002, Recent Developments in the Econometrics of Panel Data, Edward Elgar Publishing.
Software Stata 8 tiene muy buenas rutinas para paneles (www.stata.com). La version 5 de Eviews tiene una modulo para paneles fácil de usar (www.eviews.com) Limdep 8 sigue teniendo una buena coleccion de metodos sofisticados, sobre todo para modelos de eleccion (www.limdep.com) Ox o R son buenos entornos programables.
#010703.,8 4254303908/0077470810.9481 48, 0,947 48, 9,,5 9: 48, 473 0,3/%7:2-: 89 2,9 3 9 0.4342.4/0 417 20 9!,30,9, #0; 0 41.4342.8,3/$9,9 89.8 55 8,2 74 9 025 7.8,5,30 /,9,,5574,. ":,7907 4:73, 41.4342.8 850. 1.,. 43/024/0 48 30, 08, 9, 7 11 3,3/ 43 %454474734994544 424 0304:8;078:8 09074 0304:8089 2,9478,55 0/94.,70990/02,3/ #0; 0 41.4342.8,3/$9,9 89.8 55, 9,,3/ 7 11 3 % 00.4342097.8417,9 43,,//.9 43 9 0.,8041.,709908 4:73, 41:8 3088,3/.4342.$9,9 89.8 07,,3/$48,8.:/074 %089 3 147807,.4770,9 43,3/7,3/420110.98 3 3.425 0905,30 8 2 204 &3 ;078 9 41 34 8 07, $48,8.:/074,3/ 443 %08981479 07747425430394/0 :3/07 4., 8850. 1.,9 43 4:73, 41.4342097.8 55 $48,8.:/074,3/07, $50. 1.,9 43%0898147 30,7!,30,9,4/0 8.433 07, $9,9, %0. 3., : 09 3 55
#010703.,8 4/0 48/ 3,2.48 3/07843 %,3/ 8,4 472:,9 43,3/089 2,9 4341/ 3,2.24/0 8:8 3 5,30 /,9, 4:73, 41.4342097.8 70,34,3/43/ $ $4209089841850. 1.,9 43147 5,30 /,9, 4390,7 40; /03.0,3/,3,55.,9 4394 025 4 203906:,9 438 #0; 0 41.4342.8$9:/ 08 70,34,3/4;07 349 07 44,99 0 3897:2039, ;,7,- 08089 2,9 434107747.4254303924/0 8 4:73, 41.4342097.8 :7,:1 $ 2,3 10894147, 74 9 0.4342097.8 4:73, 41.4342097.8 47-08 70,880882039419 070,9 438 5-09 003 306:, 9,3/ 74 9 207.,3.4342.#0; 0 :/843 #,3/ 03 89 2,9 3 / 3,2.5,30 /,9,24/0 8, : /01472,.740.4342 898.4342.8 099078 ; 09 3-,8 3.438 8903.,3011. 03. 41;,7 4:8089 2,9478 3/ 3,2.5,30 /,9,24/0 8 4:73, 41.4342097.8!,30 0834089,. 43,7 48#,.08:3 9,7,8.4 390 7,. 43!4794,,3 $,2,7. 0,3/$48,8.:/074!078 8903.0,3/70 43, / 85,7 9 08 3 :3025 4 20397 039 3, #0 43, $. 03.0,3/&7-,3.4342.8 0357038,,//,, $ : $,3/ :! 45,30 /,9,708.:09 05:7.,8 3 54 075,7 9 9 047 3 7 8 3, :2,7 09, 45. 9 07 4;0 74 9 7,90.43;07 03.0 1,.947,79 1,.93 088, 435,30 /,9,0.4342097.8 3 7 8 3, :2,7 09, 45. 9