Tema 6: Multicolinealidad



Documentos relacionados
Tema 8: Heteroscedasticidad

Tema 7: Variables Ficticias

Regresión y correlación Tema Contraste sobre β 1.2 Regresión en formato ANOVA. 2. Correlación. Contraste sobre ρ xy

Análisis estadístico de incertidumbres aleatorias

Tema 21: Distribución muestral de un estadístico

CURSO INTERNACIONAL: CONSTRUCCIÓN DE ESCENARIOS ECONÓMICOS Y ECONOMETRÍA AVANZADA. Instructor: Horacio Catalán Alonso

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 17 de Mayo de :00 horas

FE DE ERRATAS Y AÑADIDOS AL LIBRO FUNDAMENTOS DE LAS TÉCNICAS MULTIVARIANTES (Ximénez & San Martín, 2004)

PUBLICACIONES DE 4º CURSO

DISTRIBUCION DE RENDIMIENTOS: APLICACIONES

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 20 DE JUNIO DE horas

Examen Final de Econometría Grado

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 19 de Septiembre de :30 horas. Pregunta 19 A B C En Blanco

Bloque 5. Probabilidad y Estadística Tema 2. Estadística descriptiva Ejercicios resueltos

6 Heteroscedasticidad

EJERCICIO 1 1. VERDADERO 2. VERDADERO (Esta afirmación no es cierta en el caso del modelo general). 3. En el modelo lineal general

CAPÍTULO 3 DIAGNÓSTICOS DE REGRESIÓN

EJERCICIOS DE ESTADÍSTICA BIDIMENSIONAL.

Estadísticos muéstrales

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 6 de Junio de :00 horas. Pregunta 19 A B C En Blanco. Pregunta 18 A B C En Blanco

Colección de problemas de. Teoría Microeconómica IV

Solución Taller No. 10 Econometría II Prof. Bernal

Análisis de Regresión y Correlación

Pregunta Hoy está nublado, cuál es la probabilidad de que mañana continúe nublado? cuál es la probabilidad de que está nublado pasado mañana?

EJERCICIOS: Tema 3. Los ejercicios señalados con.r se consideran de conocimientos previos necesarios para la comprensión del tema 3.

( ) MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO ( mas ) y Y. N n. S y. MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO ( mas )

Modelo de Variables Instrumentales

Organización y resumen de datos cuantitativos

Ejercicios resueltos y exámenes

Facultad de Ingeniería División de Ciencias Básicas Coordinación de Ciencias Aplicadas Departamento de Probabilidad y Estadística

( ) = 0 entonces ˆ i i. xy x Y Y xy Y x ˆ. β = = β =.(1) Propiedades Estadísticas de los estimadores MICO. Linealidad.

MUESTREO EN POBLACIONES FINITAS

Especialista en Estadística y Docencia Universitaria REGRESION LINEAL MULTIPLE

El Método de Mínimos Cuadrados

Investigación y Técnicas de Mercado. Previsión de Ventas TÉCNICAS CUANTITATIVAS ELEMENTALES DE PREVISIÓN UNIVARIANTE. (IV): Ajustes de Tendencia

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

315 M de R Versión 1 Segunda Parcial 1/8 Lapso 2008/2

Licenciatura en Administración y Dirección de Empresas INTRODUCCIÓN A LA ESTADÍSTICA EMPRESARIAL

Una matriz es un conjunto de elementos de cualquier naturaleza aunque, en general, son números ordenados en filas y columnas.

CAPITULO III VARIABLE DEPENDIENTE CUALITATIVA Y LIMITADA

Inferencia en Regresión Lineal Simple

Problemas donde intervienen dos o más variables numéricas

Bloque 2 Análisis de circuitos alimentados en corriente continua. Teoría de Circuitos

UNIDAD 12: Distribuciones bidimensionales. Correlación y regresión

I EJERCICIOS RESUELTOS II EXÁMENES DE ECONOMETRÍA III EXÁMENES DE ECONOMETRÍA EMPRESARIAL IV EXÁMENES DE PRINCIPIOS DE ECONOMETRÍA

Tema 1.3_A La media y la desviación estándar

Solución de los Ejercicios de Práctica # 1. Econometría 1 Prof. R. Bernal

Tema 5: Incumplimiento de las Hipótesis sobre el Término de Perturbación

HOMOGENEIDAD DE POBLACIONES ESTADISTICAS. EL PROBLEMA DE LA MIXTURA DE COMPONENTES

Econometría de corte transversal. Pablo Lavado Centro de Investigación de la Universidad del Pacífico

MODELOS DE SECUENCIACIÓN EN MÁQUINAS 1

Análisis de la Varianza de dos factores con replicaciones: Caso Balanceado (Scheffé, 1959)

a) Qué población (la de hombres o la de mujeres) presenta un salario medio mayor? b) Qué porcentaje de varones gana más de 900?

Modelos de elección simple y múltiple. Regresión logit y probit. Modelos multilogit y multiprobit.

MÉTODOS LINEALES DE ESTIMACIÓN CON DATOS DE PANEL: UNA APLICACIÓN AL ESTUDIO DE LOS EFECTOS DE LA INVERSIÓN PÚBLICA FEDERAL EN MÉXICO RESUMEN

Estadística con R. Modelo Probabilístico Lineal

Efectos fijos o aleatorios: test de especificación

ANEXO A: Método de Interpolación de Cokriging Colocado

CAPITULO CUATRO MEDIDAS DE DISPERSION, ASIMETRIA Y CURTOSIS

COLEGIO INGLÉS MEDIDAS DE DISPERSIÓN

ECONOMETRÍA II: ECONOMETRÍA DE SERIES TEMPORALES. Regresión con autocorrelación

315 M/R Versión 1 Integral 1/ /1 UNIVERSIDAD NACIONAL ABIERTA VICERRECTORADO ACADÉMICO ÁREA INGENIERÍA

EJERCICIOS DE INECUACIONES

5 Análisis de regresión múltiple con información cualitativa

4. REPRESENTACIONES GRÁFICAS PARA DATOS CATEGÓRICOS.

ICI3140 Métodos Numéricos. Profesor : Dr. Héctor Allende-Cid

10. VIBRACIONES EN SISTEMAS CON N GRADOS DE LIBERTAD

T. 5 Estadísticos de forma de la distribución

Transcripción:

Tema 6: Multcolnealdad Máxmo Camacho Máxmo Camacho Econometría I - ADE+D / - Tema 6

Multcolnealdad h Bloque I: El modelo lneal clásco r Tema : Introduccón a la econometría r Tema : El modelo de regresón lneal r Tema 3: El método MCO r Tema 4: Propedades de la estmacón MCO r Tema 5: Inferenca y predccón Bloque II: Extensones al modelo lneal clásco r Tema 6: Multcolnealdad r Tema 7: Varables fctcas r Tema 8: Heteroscedastcdad r Tema 9: Endogenedad Máxmo Camacho Econometría I - ADE+D / - Tema 6

Descrpcón de la clase Introduccón Multcolnealdad exacta Consecuencas sobre la estmacón Cómo detectarla? Cómo corregrla? Multcolnealdad aproxmada Consecuencas sobre la estmacón Cómo detectarla? Cómo corregrla? Conclusones Máxmo Camacho Econometría I - ADE+D / - Tema 6 3

. Introduccón.. Ejemplo de clase En Calforna los responsables de educacón queren estudar notas en 4 colegos. Datos en 998 Notas Y Rato estudantes por profesor X (REP) Porcentaje de alumnos que no hablan ben el doma X (PNI) Porcentaje de alumnos que pueden pedr ayuda para comedor X 3 (PAC) Porcentaje de alumnos que pueden pedr ayuda por renta baja X 4 (PAR) nuevas Cómo estmamos esta relacón? Modelo lneal clásco Máxmo Camacho Econometría I - ADE+D / - Tema 6 4

. Introduccón.. Supuestos del modelo lneal clásco Suponemos relacón lneal entre las varables Y β + β X +... + β X + ε k k Y Xβ + ε Y χ ' β + ε Supuestos Exogenedad débl E ( ε χ ) E( ε ) Muestras aleatoras E ( ε χ ) E( ε ) E( ε ε ) E( ε ) E( ε ) j j j Momentos cuartos fntos 4 4 4 ( ) <, < E( X ) <,..., < E( X ) < < E ε k No multcolnealdad exacta X,..., X n no son lnealmente dependentes Normaldad ε X ~ N Homoscedastcdad var ( ε X ) σ Máxmo Camacho Econometría I - ADE+D / - Tema 6 5

Máxmo Camacho Econometría I - ADE+D / - Tema 6 6 Defncón Una o varas varables explcatvas son una combnacón lneal de otra(s) Ejemplos económcos.. La matrz de explcatvas X tene columnas lnealmente dependentes. Multcolnealdad exacta.. Concepto ε β β + + nterés regonal Renta ε β β β β + + + + 3 benefco gastos ngresos Cotzacón + n k kn n k k n X X X X X X Y Y Y ε ε ε β β β

. Multcolnealdad exacta.. Implcacón para el modelo No podemos encontrar de forma únca ( X ' X ) X ' Y ˆ MCO β rango ( X ) < K X ' X Teoría: Hemos excludo este caso por supuesto Pero podría aparecer en aplcacones práctcas Cómo detectarlo? Los programas se quejarán de que no podemos nvertr matrz (X X) En Evews aparece el mensaje near sngular matrx Cómo corregrlo? Se deben a errores del nvestgador al ntroducr las explcatvas Al aparecer mensaje de error, corregremos las explcatvas Máxmo Camacho Econometría I - ADE+D / - Tema 6 7

. Multcolnealdad exacta.. Implcacón para el modelo Correccón En el ejemplo de la renta regonal, supongamos nterés 4 Renta regonal + β β nterés + ε Renta regonal β + β4 + ε Renta regonal α β + 4 α + ε β En el ejemplo de la cotzacón sabemos benefcos ngresos - gastos Cotzacón + βngresos + βgastos + β3benefco β + ε Cotzacón + αngresos + α α gastos + ε α β α + α β β3 β β3 Máxmo Camacho Econometría I - ADE+D / - Tema 6 8

3. Multcolnealdad aproxmada 3.. Concepto Defncón Una o varas varables explcatvas son una combnacón lneal aproxmada de otra(s) Supongamos que X es buena explcatva pero comb. lneal aproxmada de las demás X α + αx +... + αk X k + u Ejemplos económcos Porcentaje de alumnos que pueden pedr ayuda por renta baja Porcentaje de alumnos que pueden pedr ayuda para comedor Ayudas que recbe una colego para lbros Ayudas que recbe el colego para nstalacones Gasto públco en carreteras Gasto públco en mejorar otras comuncacones Máxmo Camacho Econometría I - ADE+D / - Tema 6 9

3. Multcolnealdad aproxmada 3.. Implcacón para el modelo Podemos encontrar de forma únca ( X ' X ) X ' Y ˆ MCO β rango ( X ) K X ' X Nota: Hemos excludo la multcolnealdad exacta por el supuesto Estmadores cumplen buenas propedades y contrastes e ntervalos como sempre Qué problemas genera en la estmacón? Para entenderlo, supongamos que hacemos la regresón X α + αx +... + αk X k + u Y defnmos R uˆ ( X X) SCR STC Máxmo Camacho Econometría I - ADE+D / - Tema 6

3. Multcolnealdad aproxmada 3.. Implcacón para el modelo Qué problemas genera en la estmacón? Podemos demostrar (ejerccos de clase y Wooldrdge, pág. ) que + ˆ uˆ ε β β ( ˆ σ σ var β ) X uˆ uˆ ( R ) ( X X ) Cuanta mayor relacón lneal entre X y el resto mayor varanza de ˆβ Estmacón mprecsa e ntervalos de confanza muy grandes ˆ β ± ( ) t ˆ n K, α / vâr β Ejemplos: S X no se relaconara ( R ) S R.5 esa varanza se duplca var ( ˆ β X ) σ ( X X) S R.9 esa varanza se multplca por Máxmo Camacho Econometría I - ADE+D / - Tema 6

3. Multcolnealdad aproxmada 3.. Implcacón para el modelo Ejemplo smulado (Novales, pág 346) Se generan 5 trpletas de vectores ( x ) ( ε ) j, j X j X, (j,, 5) Bajo 3 supuestos de R (,.9 y.99). Sempre se cumplen los supuestos cláscos Se generan Y j conocendo la recta poblaconal Y j j j 8 + 5X 3X + ε j Se estma MCO 5 veces y los resultados medos Medas R. R.9 R.99 βˆ ( ˆ ) ( ˆ ) var β var β ( 8., 5., -3. ) ( 7.9, 5.,-3. ) ( 7.9, 5., -3.3 ).3.9..3.6.3 cas esperanzas (nsesgados) aumentan mucho Máxmo Camacho Econometría I - ADE+D / - Tema 6

3. Multcolnealdad aproxmada 3.. Implcacón para el modelo Puede ndcar artfcalmente varables no son sgnfcatvas ndvdualmente Supongamos que hacemos el contraste Y β... + + βx + + βk X k ε : H β H : β a El estadístco tene varanza muy grande y tende a caer en zona de no RH r Con ndependenca de que X se relacone con Y r Aunque el R c sea alto y no caga al qutar X t ˆ β ( ˆ β ) ~ vâr t n K - t n-k,α/ t n-k,α/ Máxmo Camacho Econometría I - ADE+D / - Tema 6 3

3. Multcolnealdad aproxmada 3.3. Métodos de deteccón de multcolnealdad Método : gráfcos de las explcatvas En nuestro ejemplo Notas + βrep + βpni + β3pac + β4 β PAR + ε Esperamos que PAR y PAC se relaconen (negatvamente) con la dependente Esperamos que PAR y PAC se relaconen lnealmente (y postvamente) Crítca: los gráfcos sempre nos pueden engañar 7 7 8 7 68 7 68 7 6 5 NOTAS 66 64 NOTAS 66 64 PAR 4 3 6 6 6 3 4 5 6 7 8 6 4 6 8 4 6 8 PAR PAC PAC Máxmo Camacho Econometría I - ADE+D / - Tema 6 4

3. Multcolnealdad aproxmada 3.3. Métodos de deteccón de multcolnealdad Método : regresar explcatvas entre ellas y ver R j Sabemos que var ( ˆ β j X ) ( R ) ( X X ) j σ j j El problema vene dado por R j altos que ndcan alta relacón lneal Veamos como son los R j REP PNI PAR PAC α R + αpni + αpac + α3par3 + ε α R + αrep + αpac + α3par3 + ε α R + αrep + αpni + α3pac3 + ε 3 α R + αrep + αpni + α3par3 + ε 4.4.49.6.74 Parece que el problema puede estar con PAR o con PAC Máxmo Camacho Econometría I - ADE+D / - Tema 6 5

3. Multcolnealdad aproxmada 3.3. Métodos de deteccón de multcolnealdad Crítca cómo de grande debe ser R j para preocuparnos por multcolnealdad? r En la lteratura ha habdo algunos ntentos de acotarlo r Ej: Klen (96). Sólo nos preocupa s R j > R Notas PAR PAC β R + βrep + βpni + β3pac + β4par + ε α R + αrep + αpni + α3pac3 + ε 3 α R + αrep + αpni + α3par3 + ε 4.74.77.6 r Debemos preocuparnos por multcolnealdad? No hay nnguna razón objetva para usar esta cota Máxmo Camacho Econometría I - ADE+D / - Tema 6 6

3. Multcolnealdad aproxmada 3.3. Métodos de deteccón de multcolnealdad Método 3: regresar explcatvas entre ellas y contrastes sgnfcatvdad conjunta Sabemos que REP + αpni + αpac + α3 α PAR + ε CSC: H : α, α, α3 ( R ) j 3 Fj R ( n 4 ) j REP α F + αpni + αpac + α3par3 + ε 5.77 PNI PAR PAC α F + αrep + αpac + α3par3 + ε α F + αrep + αpni + α3pac3 + ε 3 α F + αrep + αpni + α3par3 + ε 4 33 8 394 3.6 RH Crítca. Con n grande RH con demasada frecuenca: recuerda que R.4!!! Máxmo Camacho Econometría I - ADE+D / - Tema 6 7

3. Multcolnealdad aproxmada 3.3. Métodos de deteccón de multcolnealdad Método 4: contradccón contraste sgnfcatvdad global e ndvduales Supongamos que en el modelo Y + βx + βx + β3x 3 + β4x 4 β + ε Las explcatvas X, X 3 y X 4 se relaconan cas lnealmente S las varables se relaconan con la dependente r El contraste de sgnfcatvdad global, menos afectado por la multcolnealdad, puede ndcar sgnfcatvdad (ncluso al %) r Y el R puede ser alto ndcando un buen ajuste Sus contrastes de sgnfcatvdad ndvduales r Pueden ndcar no sgnfcatvdad r Sólo una varable (X ) sgnfcatva Máxmo Camacho Econometría I - ADE+D / - Tema 6 8

3. Multcolnealdad aproxmada 3.3. Métodos de deteccón de multcolnealdad Crítca: casos tan claros no los tendremos en la realdad No tas ˆ 7.39.REP.3 PNI.5 PAC.4 PAR R (4.69) (.3) (.3) (.6) (.3).77 t ˆ β vâr ( ˆ β ) t 4.3 t 3.8 t3 6.4 t4.78 F R 4 ( R ) ( n 5) 357 t 3 t t t 4 F -.96.96.37 Máxmo Camacho Econometría I - ADE+D / - Tema 6 9

3. Multcolnealdad aproxmada 3.3. Métodos de deteccón de multcolnealdad r Globalmente sgnfcatvas r PAR es la únca no sgnfcatva r Se debe a multcolnealdad o a que no es una buena explcatva? q S se debe a multcolnealdad: vamos a ver solucones q S no se relacona con la dependente: deberíamos qutarla del modelo q Pero cómo lo sabremos? q Lo mejor es acudr al sentdo común r Cuáles son las solucones a la multcolnealdad? Máxmo Camacho Econometría I - ADE+D / - Tema 6

3. Multcolnealdad aproxmada 3.4. Solucones a la multcolnealdad Solucón : añadr nformacón extra-muestral Amplar la muestra: usando otros colegos de Calforna r Crítca: debemos usar toda la nformacón dsponble en la prmera estmacón Usar la estmacón de otra muestra r Supongamos que usando datos de Texas hemos estmado Notas ˆ. PAR r Para los datos de Calforna estmamos Notas β + β REP + β PNI + β PAC. PAR + ε 3 r Crítca: por qué ˆ β ˆ β Texas 4 Calforna 4? Restrccones falsas sesgan la estmacón Máxmo Camacho Econometría I - ADE+D / - Tema 6

3. Multcolnealdad aproxmada 3.4. Solucones a la multcolnealdad Solucón : Usar estmadores alternatvos a MCO Estmador de Cresta r Buscamos un c y un estmador de menor varanza ( X ' X + ci ) X ' Y ˆ C var ˆ β ' + ' ' c X σ X X ci X X X X + ci β ( ) ( ) ( ) r crítcas: el estmador propuesto es sesgado y cómo elegr c Estmador de componentes prncpales r Buscamos combnacón lneal de las columnas de X: Z XB r B se busaca de forma que las Z sean ortogonales (elmna multcolnealdad) r Regresamos usando Z Y Zα + ε r crítcas: αˆ dfícles de nterpretar sesgados da gual s objetvo es predecr Máxmo Camacho Econometría I - ADE+D / - Tema 6

3. Multcolnealdad aproxmada 3.4. Solucones a la multcolnealdad Solucón 3: Elmnar la varable no sgnfcatva (PAR ) (Ver tema 5: consecuencas de mponer restrccones certas y falsas) Supongamos que elmnamos la varable: mponemos β 4 r S no se relacona con las notas Imponemos una restrccón certa (No sesgo y reducmos la varanza) r S se relacona con las notas Imponemos una restrccón falsa (Introducmos sesgo y reducmos la varanza) Cuándo merece la pena asumr el resgo de elmnarla? r Analzaremos el error cuadrátco medo Máxmo Camacho Econometría I - ADE+D / - Tema 6 3

3. Multcolnealdad aproxmada 3.4. Solucones a la multcolnealdad r Supongamos un modelo más sencllo Y β X + βx + ε ˆβ r Pensamos que X presenta problemas de multcolnealdad con X 3 : s Y X β + ε ~ β β r ECM? (Ejerccos de clase y Novales, pág 36) ~ ( β ) var( ˆ β ) ECM + sesgo ECM ECM ( ~ β ) ( ˆ β ) ( ) + R t t β var ( β ) r Sólo merece la pena s t < algunos autores pden t << r crítcas: q Cuánto podemos consderar t <<? q Queremos estmadores sesgados? Máxmo Camacho Econometría I - ADE+D / - Tema 6 4

3. Multcolnealdad aproxmada 3.4. Solucones a la multcolnealdad r En nuestro ejemplo Notas ˆ 7.39.REP (4.69) (.3).3 PNI (.3).5 PAC (.3).4 PAR (.6) t ˆ β vâr 4 ( ˆ β4 ) 4.78 r Qué hacemos? q M consejo es acudr al sentdo común (teoría económca) q Parece que tanto PAC como PAR contenen la msma nformacón sobre los colegos: nos dcen cuáles tenen más alumnos pobres q Podemos elmnar PAR porque PAC ya contene la nformacón necesara para estmar el modelo de notas Notas ˆ 7.5.99 REP (4.69) (.4). PNI (.3).55 PAC (.) Máxmo Camacho Econometría I - ADE+D / - Tema 6 5

4. Conclusón X 4 puede tener dstntas relacones con las demás ( X -4 ) y la dependente X 4 no explcatva y multco, : X 4 la elmnamos con contrastes X 4 explcatva y no multco, X 4 explcatva: X 4 será explcatva fnal X 4 explcatva y multco no severa: X 4 será explcatva tras los contrastes X 4 explcatva y multco severa: acudr al sentdo común más contrastes X -4 X 4 X -4 X 4 caso X -4 caso 3 X -4 X4 X 4 caso caso 4 Máxmo Camacho Econometría I - ADE+D / - Tema 6 6

5. Qué hemos aprenddo? Multcolnealdad Relacón lneal entre las varables explcatvas del modelo Exacta Teoría: nunca hay porque suponemos Práctca: fácl de detectar y resolver Aproxmada Da lugar a estmacones mprecsos, varanzas e ntervalos de confanza grandes Dfícl de detectar y de corregr Qué hacer? Asegurarnos de que tenemos multcolnealdad: todas pruebas y teoría económca No sgnfcatva y la nformacón sobre Y ya está en las que quedan: elmnarla No sgnfcatva pero la nformacón sobre Y ya está en las que quedan: la dejamos Máxmo Camacho Econometría I - ADE+D / - Tema 6 7