Tema 6: Multcolnealdad Máxmo Camacho Máxmo Camacho Econometría I - ADE+D / - Tema 6
Multcolnealdad h Bloque I: El modelo lneal clásco r Tema : Introduccón a la econometría r Tema : El modelo de regresón lneal r Tema 3: El método MCO r Tema 4: Propedades de la estmacón MCO r Tema 5: Inferenca y predccón Bloque II: Extensones al modelo lneal clásco r Tema 6: Multcolnealdad r Tema 7: Varables fctcas r Tema 8: Heteroscedastcdad r Tema 9: Endogenedad Máxmo Camacho Econometría I - ADE+D / - Tema 6
Descrpcón de la clase Introduccón Multcolnealdad exacta Consecuencas sobre la estmacón Cómo detectarla? Cómo corregrla? Multcolnealdad aproxmada Consecuencas sobre la estmacón Cómo detectarla? Cómo corregrla? Conclusones Máxmo Camacho Econometría I - ADE+D / - Tema 6 3
. Introduccón.. Ejemplo de clase En Calforna los responsables de educacón queren estudar notas en 4 colegos. Datos en 998 Notas Y Rato estudantes por profesor X (REP) Porcentaje de alumnos que no hablan ben el doma X (PNI) Porcentaje de alumnos que pueden pedr ayuda para comedor X 3 (PAC) Porcentaje de alumnos que pueden pedr ayuda por renta baja X 4 (PAR) nuevas Cómo estmamos esta relacón? Modelo lneal clásco Máxmo Camacho Econometría I - ADE+D / - Tema 6 4
. Introduccón.. Supuestos del modelo lneal clásco Suponemos relacón lneal entre las varables Y β + β X +... + β X + ε k k Y Xβ + ε Y χ ' β + ε Supuestos Exogenedad débl E ( ε χ ) E( ε ) Muestras aleatoras E ( ε χ ) E( ε ) E( ε ε ) E( ε ) E( ε ) j j j Momentos cuartos fntos 4 4 4 ( ) <, < E( X ) <,..., < E( X ) < < E ε k No multcolnealdad exacta X,..., X n no son lnealmente dependentes Normaldad ε X ~ N Homoscedastcdad var ( ε X ) σ Máxmo Camacho Econometría I - ADE+D / - Tema 6 5
Máxmo Camacho Econometría I - ADE+D / - Tema 6 6 Defncón Una o varas varables explcatvas son una combnacón lneal de otra(s) Ejemplos económcos.. La matrz de explcatvas X tene columnas lnealmente dependentes. Multcolnealdad exacta.. Concepto ε β β + + nterés regonal Renta ε β β β β + + + + 3 benefco gastos ngresos Cotzacón + n k kn n k k n X X X X X X Y Y Y ε ε ε β β β
. Multcolnealdad exacta.. Implcacón para el modelo No podemos encontrar de forma únca ( X ' X ) X ' Y ˆ MCO β rango ( X ) < K X ' X Teoría: Hemos excludo este caso por supuesto Pero podría aparecer en aplcacones práctcas Cómo detectarlo? Los programas se quejarán de que no podemos nvertr matrz (X X) En Evews aparece el mensaje near sngular matrx Cómo corregrlo? Se deben a errores del nvestgador al ntroducr las explcatvas Al aparecer mensaje de error, corregremos las explcatvas Máxmo Camacho Econometría I - ADE+D / - Tema 6 7
. Multcolnealdad exacta.. Implcacón para el modelo Correccón En el ejemplo de la renta regonal, supongamos nterés 4 Renta regonal + β β nterés + ε Renta regonal β + β4 + ε Renta regonal α β + 4 α + ε β En el ejemplo de la cotzacón sabemos benefcos ngresos - gastos Cotzacón + βngresos + βgastos + β3benefco β + ε Cotzacón + αngresos + α α gastos + ε α β α + α β β3 β β3 Máxmo Camacho Econometría I - ADE+D / - Tema 6 8
3. Multcolnealdad aproxmada 3.. Concepto Defncón Una o varas varables explcatvas son una combnacón lneal aproxmada de otra(s) Supongamos que X es buena explcatva pero comb. lneal aproxmada de las demás X α + αx +... + αk X k + u Ejemplos económcos Porcentaje de alumnos que pueden pedr ayuda por renta baja Porcentaje de alumnos que pueden pedr ayuda para comedor Ayudas que recbe una colego para lbros Ayudas que recbe el colego para nstalacones Gasto públco en carreteras Gasto públco en mejorar otras comuncacones Máxmo Camacho Econometría I - ADE+D / - Tema 6 9
3. Multcolnealdad aproxmada 3.. Implcacón para el modelo Podemos encontrar de forma únca ( X ' X ) X ' Y ˆ MCO β rango ( X ) K X ' X Nota: Hemos excludo la multcolnealdad exacta por el supuesto Estmadores cumplen buenas propedades y contrastes e ntervalos como sempre Qué problemas genera en la estmacón? Para entenderlo, supongamos que hacemos la regresón X α + αx +... + αk X k + u Y defnmos R uˆ ( X X) SCR STC Máxmo Camacho Econometría I - ADE+D / - Tema 6
3. Multcolnealdad aproxmada 3.. Implcacón para el modelo Qué problemas genera en la estmacón? Podemos demostrar (ejerccos de clase y Wooldrdge, pág. ) que + ˆ uˆ ε β β ( ˆ σ σ var β ) X uˆ uˆ ( R ) ( X X ) Cuanta mayor relacón lneal entre X y el resto mayor varanza de ˆβ Estmacón mprecsa e ntervalos de confanza muy grandes ˆ β ± ( ) t ˆ n K, α / vâr β Ejemplos: S X no se relaconara ( R ) S R.5 esa varanza se duplca var ( ˆ β X ) σ ( X X) S R.9 esa varanza se multplca por Máxmo Camacho Econometría I - ADE+D / - Tema 6
3. Multcolnealdad aproxmada 3.. Implcacón para el modelo Ejemplo smulado (Novales, pág 346) Se generan 5 trpletas de vectores ( x ) ( ε ) j, j X j X, (j,, 5) Bajo 3 supuestos de R (,.9 y.99). Sempre se cumplen los supuestos cláscos Se generan Y j conocendo la recta poblaconal Y j j j 8 + 5X 3X + ε j Se estma MCO 5 veces y los resultados medos Medas R. R.9 R.99 βˆ ( ˆ ) ( ˆ ) var β var β ( 8., 5., -3. ) ( 7.9, 5.,-3. ) ( 7.9, 5., -3.3 ).3.9..3.6.3 cas esperanzas (nsesgados) aumentan mucho Máxmo Camacho Econometría I - ADE+D / - Tema 6
3. Multcolnealdad aproxmada 3.. Implcacón para el modelo Puede ndcar artfcalmente varables no son sgnfcatvas ndvdualmente Supongamos que hacemos el contraste Y β... + + βx + + βk X k ε : H β H : β a El estadístco tene varanza muy grande y tende a caer en zona de no RH r Con ndependenca de que X se relacone con Y r Aunque el R c sea alto y no caga al qutar X t ˆ β ( ˆ β ) ~ vâr t n K - t n-k,α/ t n-k,α/ Máxmo Camacho Econometría I - ADE+D / - Tema 6 3
3. Multcolnealdad aproxmada 3.3. Métodos de deteccón de multcolnealdad Método : gráfcos de las explcatvas En nuestro ejemplo Notas + βrep + βpni + β3pac + β4 β PAR + ε Esperamos que PAR y PAC se relaconen (negatvamente) con la dependente Esperamos que PAR y PAC se relaconen lnealmente (y postvamente) Crítca: los gráfcos sempre nos pueden engañar 7 7 8 7 68 7 68 7 6 5 NOTAS 66 64 NOTAS 66 64 PAR 4 3 6 6 6 3 4 5 6 7 8 6 4 6 8 4 6 8 PAR PAC PAC Máxmo Camacho Econometría I - ADE+D / - Tema 6 4
3. Multcolnealdad aproxmada 3.3. Métodos de deteccón de multcolnealdad Método : regresar explcatvas entre ellas y ver R j Sabemos que var ( ˆ β j X ) ( R ) ( X X ) j σ j j El problema vene dado por R j altos que ndcan alta relacón lneal Veamos como son los R j REP PNI PAR PAC α R + αpni + αpac + α3par3 + ε α R + αrep + αpac + α3par3 + ε α R + αrep + αpni + α3pac3 + ε 3 α R + αrep + αpni + α3par3 + ε 4.4.49.6.74 Parece que el problema puede estar con PAR o con PAC Máxmo Camacho Econometría I - ADE+D / - Tema 6 5
3. Multcolnealdad aproxmada 3.3. Métodos de deteccón de multcolnealdad Crítca cómo de grande debe ser R j para preocuparnos por multcolnealdad? r En la lteratura ha habdo algunos ntentos de acotarlo r Ej: Klen (96). Sólo nos preocupa s R j > R Notas PAR PAC β R + βrep + βpni + β3pac + β4par + ε α R + αrep + αpni + α3pac3 + ε 3 α R + αrep + αpni + α3par3 + ε 4.74.77.6 r Debemos preocuparnos por multcolnealdad? No hay nnguna razón objetva para usar esta cota Máxmo Camacho Econometría I - ADE+D / - Tema 6 6
3. Multcolnealdad aproxmada 3.3. Métodos de deteccón de multcolnealdad Método 3: regresar explcatvas entre ellas y contrastes sgnfcatvdad conjunta Sabemos que REP + αpni + αpac + α3 α PAR + ε CSC: H : α, α, α3 ( R ) j 3 Fj R ( n 4 ) j REP α F + αpni + αpac + α3par3 + ε 5.77 PNI PAR PAC α F + αrep + αpac + α3par3 + ε α F + αrep + αpni + α3pac3 + ε 3 α F + αrep + αpni + α3par3 + ε 4 33 8 394 3.6 RH Crítca. Con n grande RH con demasada frecuenca: recuerda que R.4!!! Máxmo Camacho Econometría I - ADE+D / - Tema 6 7
3. Multcolnealdad aproxmada 3.3. Métodos de deteccón de multcolnealdad Método 4: contradccón contraste sgnfcatvdad global e ndvduales Supongamos que en el modelo Y + βx + βx + β3x 3 + β4x 4 β + ε Las explcatvas X, X 3 y X 4 se relaconan cas lnealmente S las varables se relaconan con la dependente r El contraste de sgnfcatvdad global, menos afectado por la multcolnealdad, puede ndcar sgnfcatvdad (ncluso al %) r Y el R puede ser alto ndcando un buen ajuste Sus contrastes de sgnfcatvdad ndvduales r Pueden ndcar no sgnfcatvdad r Sólo una varable (X ) sgnfcatva Máxmo Camacho Econometría I - ADE+D / - Tema 6 8
3. Multcolnealdad aproxmada 3.3. Métodos de deteccón de multcolnealdad Crítca: casos tan claros no los tendremos en la realdad No tas ˆ 7.39.REP.3 PNI.5 PAC.4 PAR R (4.69) (.3) (.3) (.6) (.3).77 t ˆ β vâr ( ˆ β ) t 4.3 t 3.8 t3 6.4 t4.78 F R 4 ( R ) ( n 5) 357 t 3 t t t 4 F -.96.96.37 Máxmo Camacho Econometría I - ADE+D / - Tema 6 9
3. Multcolnealdad aproxmada 3.3. Métodos de deteccón de multcolnealdad r Globalmente sgnfcatvas r PAR es la únca no sgnfcatva r Se debe a multcolnealdad o a que no es una buena explcatva? q S se debe a multcolnealdad: vamos a ver solucones q S no se relacona con la dependente: deberíamos qutarla del modelo q Pero cómo lo sabremos? q Lo mejor es acudr al sentdo común r Cuáles son las solucones a la multcolnealdad? Máxmo Camacho Econometría I - ADE+D / - Tema 6
3. Multcolnealdad aproxmada 3.4. Solucones a la multcolnealdad Solucón : añadr nformacón extra-muestral Amplar la muestra: usando otros colegos de Calforna r Crítca: debemos usar toda la nformacón dsponble en la prmera estmacón Usar la estmacón de otra muestra r Supongamos que usando datos de Texas hemos estmado Notas ˆ. PAR r Para los datos de Calforna estmamos Notas β + β REP + β PNI + β PAC. PAR + ε 3 r Crítca: por qué ˆ β ˆ β Texas 4 Calforna 4? Restrccones falsas sesgan la estmacón Máxmo Camacho Econometría I - ADE+D / - Tema 6
3. Multcolnealdad aproxmada 3.4. Solucones a la multcolnealdad Solucón : Usar estmadores alternatvos a MCO Estmador de Cresta r Buscamos un c y un estmador de menor varanza ( X ' X + ci ) X ' Y ˆ C var ˆ β ' + ' ' c X σ X X ci X X X X + ci β ( ) ( ) ( ) r crítcas: el estmador propuesto es sesgado y cómo elegr c Estmador de componentes prncpales r Buscamos combnacón lneal de las columnas de X: Z XB r B se busaca de forma que las Z sean ortogonales (elmna multcolnealdad) r Regresamos usando Z Y Zα + ε r crítcas: αˆ dfícles de nterpretar sesgados da gual s objetvo es predecr Máxmo Camacho Econometría I - ADE+D / - Tema 6
3. Multcolnealdad aproxmada 3.4. Solucones a la multcolnealdad Solucón 3: Elmnar la varable no sgnfcatva (PAR ) (Ver tema 5: consecuencas de mponer restrccones certas y falsas) Supongamos que elmnamos la varable: mponemos β 4 r S no se relacona con las notas Imponemos una restrccón certa (No sesgo y reducmos la varanza) r S se relacona con las notas Imponemos una restrccón falsa (Introducmos sesgo y reducmos la varanza) Cuándo merece la pena asumr el resgo de elmnarla? r Analzaremos el error cuadrátco medo Máxmo Camacho Econometría I - ADE+D / - Tema 6 3
3. Multcolnealdad aproxmada 3.4. Solucones a la multcolnealdad r Supongamos un modelo más sencllo Y β X + βx + ε ˆβ r Pensamos que X presenta problemas de multcolnealdad con X 3 : s Y X β + ε ~ β β r ECM? (Ejerccos de clase y Novales, pág 36) ~ ( β ) var( ˆ β ) ECM + sesgo ECM ECM ( ~ β ) ( ˆ β ) ( ) + R t t β var ( β ) r Sólo merece la pena s t < algunos autores pden t << r crítcas: q Cuánto podemos consderar t <<? q Queremos estmadores sesgados? Máxmo Camacho Econometría I - ADE+D / - Tema 6 4
3. Multcolnealdad aproxmada 3.4. Solucones a la multcolnealdad r En nuestro ejemplo Notas ˆ 7.39.REP (4.69) (.3).3 PNI (.3).5 PAC (.3).4 PAR (.6) t ˆ β vâr 4 ( ˆ β4 ) 4.78 r Qué hacemos? q M consejo es acudr al sentdo común (teoría económca) q Parece que tanto PAC como PAR contenen la msma nformacón sobre los colegos: nos dcen cuáles tenen más alumnos pobres q Podemos elmnar PAR porque PAC ya contene la nformacón necesara para estmar el modelo de notas Notas ˆ 7.5.99 REP (4.69) (.4). PNI (.3).55 PAC (.) Máxmo Camacho Econometría I - ADE+D / - Tema 6 5
4. Conclusón X 4 puede tener dstntas relacones con las demás ( X -4 ) y la dependente X 4 no explcatva y multco, : X 4 la elmnamos con contrastes X 4 explcatva y no multco, X 4 explcatva: X 4 será explcatva fnal X 4 explcatva y multco no severa: X 4 será explcatva tras los contrastes X 4 explcatva y multco severa: acudr al sentdo común más contrastes X -4 X 4 X -4 X 4 caso X -4 caso 3 X -4 X4 X 4 caso caso 4 Máxmo Camacho Econometría I - ADE+D / - Tema 6 6
5. Qué hemos aprenddo? Multcolnealdad Relacón lneal entre las varables explcatvas del modelo Exacta Teoría: nunca hay porque suponemos Práctca: fácl de detectar y resolver Aproxmada Da lugar a estmacones mprecsos, varanzas e ntervalos de confanza grandes Dfícl de detectar y de corregr Qué hacer? Asegurarnos de que tenemos multcolnealdad: todas pruebas y teoría económca No sgnfcatva y la nformacón sobre Y ya está en las que quedan: elmnarla No sgnfcatva pero la nformacón sobre Y ya está en las que quedan: la dejamos Máxmo Camacho Econometría I - ADE+D / - Tema 6 7