TM 4. PROBLEMAS FRECUENTES PROVOCADOS POR LOS DATOS ECONOMICOS. 1. MULTICOLINEALIDAD: CONCEPTO Y TIPOS.

Documentos relacionados
Contenido. vii. Prólogo... i Presentación... iii Grupo de trabajo...v. 1. Introducción y conceptos preliminares...1

Tema 4. Regresión lineal simple

ANÁLISIS DE REGRESIÓN

Multicolinealidad Introducción. Uno de los supuestos básicos del modelo lineal general. y = Xβ + u

Fundamentos del Análisis Econométrico. Dante A. Urbina

Tema 5. Diagnosis y validación del modelo de regresión lineal múltiple

Estadística para la Economía y la Gestión IN 3401 Clase 5

con los supuestos clásicos, uno de ellos es que ninguna de las variables X 1, X 2,, X K es

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

Programa Oficial de Asignatura. Ficha Técnica. Presentación. Competencias y/o resultados del aprendizaje. Econometría

T2. El modelo lineal simple

Tema 5: Regresión con datos de sección cruzada. Universidad Complutense de Madrid Marzo de 2012

El Modelo de Regresión Lineal

TEMA 10 Correlación y regresión. El modelo de regresión simple

Curso: 2º Créditos ECTS: 6 Tipo de asignatura: Obligatoria Tipo de formación: Teórico-Práctica

Regresión múltiple. Demostraciones. Elisa Mª Molanes López

TEMA 4 Modelo de regresión múltiple

Errores de especificación

TODO ECONOMETRIA TEMA 1: MODELO BASICO DE REGRESIÓN LINEAL MULTIPLE (MBRL)

CALIFICACION: 287,33 218, sí 1 sí 1. Se especifica el siguiente modelo de regresión para el precio de las viviendas: G i =

MÓDULO X. LA DINÁMICA DE LA ECONOMÍA MUNDIAL PROGRAMA OPERATIVO MATEMÁTICAS ECONOMETRÍA I. Profesor: Noé Becerra Rodríguez.

Métodos Estadísticos para Economía y Gestión IN 540 Clase 7

Econometría. Examen 02/02/2015. La respuesta que no sea claramente interpretable se considerará incorrecta.

El modelo de regresión múltiple

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

TODO ECONOMETRIA. Bondad del ajuste Contraste de hipótesis

Estadística III (P33) Exam, Tipo: A

ECONOMETRÍA I. Tema 6: Heterocedasticidad. Patricia Moreno Juan Manuel Rodriguez Poo Alexandra Soberon Departamento de Economía

Taller I Econometría I

Tema 6. Multicolinealidad. Contenido Multicolinealidad perfecta Multicolinealidad de grado alto

Regresión Simple. Leticia Gracia Medrano. 2 de agosto del 2012

Introducción a la Econometría

(3620) ECONOMETRÍA (3620)

Grado en Finanzas y Contabilidad

Soluciones Examen Final de Econometría Universidad Carlos III de Madrid 26 de Mayo de 2015

= 15 CALIFICACION:

ÍNDICE PRESENTACIÓN 1 I. INTRODUCCIÓN A LA ECONOMETRÍA... 4 CURRICULUM I.1. 4 Definición... I.2

GEOESTADÍSTICA APLICADA

Diplomado en Estadística Aplicada

Capítulo 6 Multicolinealidad Luis Quintana Romero. Econometría Aplicada Utilizando R

Estructura de este tema. Tema 4 Regresión lineal simple. Ejemplo: consumo de vino y dolencias cardíacas. Frecuencias

Econometría. Multicolinealidad

Tema 5: Calibración de modelos. Modelado y simulación en Ingeniería Química. Manuel Rodríguez

Regresión Lineal. Rodrigo A. Alfaro. Rodrigo A. Alfaro (BCCh) Regresión Lineal / 16

Modelo de Regresión Lineal Simple

PROPIEDADES DEL ESTIMADOR MCO

ESTADÍSTICA. Tema 4 Regresión lineal simple

ECONOMETRÍA II Prof.: Begoña Álvarez TEMA 1 INTRODUCCIÓN. Estimación por máxima verosimilitud y conceptos de teoría asintótica

EJERCICIO T2 NOMBRE: Correctas Incorrectas En Blanco Puntos

TEMA 3: PROPIEDADES DEL ESTIMADOR MCO

Modelado y simulación en Ingeniería Química. Manuel Rodríguez

Generalmente, el objetivo de cualquier estudio de econometría es la. búsqueda de relaciones matemáticas que permitan explicar el comportamiento

Anomalías en regresión y medidas remediales

Estadística II Ejercicios Tema 5

Tercera práctica de REGRESIÓN.

T3. El modelo lineal básico

Prácticas Tema 5. Ampliaciones del Modelo lineal básico

Tema 8: Regresión y Correlación

Curso de nivelación Estadística y Matemática

REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE

Econometría. Examen 24/06/2015. La respuesta que no sea claramente interpretable se considerará incorrecta.

TEMA N 1.- ANÁLISIS DE REGRESIÓN Y MÉTODO DE MÍNIMOS CUADRADOS

TEMA 3 Modelo de regresión simple

ESTADISTICA AVANZADA MODULO I

Regresión Lineal Simple y Múltiple Regresión Logística

Nota de los autores... vi

EXAMEN FINAL DE ECONOMETRÍA SOLUCIONES Conteste cada pregunta en un cuadernillo diferente en dos horas y media

Econometría de Económicas Ejercicios para el tema 2 y 3

TEMA 4 Regresión logística

peso edad grasas Regresión lineal simple Los datos

TEMA 5: Especificación y Predicción en el MRL

Econometría 1. Karoll GOMEZ Segundo semestre 2017

Guía docente 2007/2008

Modelo de Regresión Lineal Múltiple. Normalidad. Dr. Víctor Aguirre Torres ITAM

Examen de Introducción a la Econometría 8 de septiembre de 2008

EJERCICIO T1 NOMBRE: Correctas Incorrectas En Blanco Puntos

Información sobre Gastos de Consumo Personal y Producto Interno Bruto ( ) en miles de millones de dólares de 1992.

Estadística I Tema 2: Análisis de datos univariantes Descripción numérica de datos

ECONOMETRÍA I. Tema 2: El Modelo de Regresión Lineal Simple. Patricia Moreno Juan Manuel Rodriguez Poo Alexandra Soberon Departamento de Economía

La econometría : una mirada de pájaro

UNIVERSIDAD DE VALLADOLID FACULTAD DE CIENCIAS ECONÓMICAS Y EMPRESARIALES DEPARTAMENTO DE ECONOMÍA APLICADA PROYECTO DOCENTE DE ECONOMETRÍA

Métodos Estadísticos Multivariados

Econometría 1. Karoll GOMEZ Segundo semestre 2017

Estadística aplicada al medio ambiente

Escuela de Economía Universidad de Carabobo Profesor: Exaú Navarro Pérez.

5.5 Modelo de regresión. se especificó en los términos siguientes: (6.3.1) 1,2,3,..N. Donde:

TEMA 2: Propiedades de los estimadores MCO

ESTADÍSTICA APLICADA. Tema 4: Regresión lineal simple

Econometría Aplicada

ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN

Profesor: Hugo S. Salinas. Primer Semestre Tabla 1: Inteligencia y Rendimiento. X Y Figura 1: Inteligencia y Rendimiento.

PARTE I: FUNDAMENTOS DEL ANÁLISIS DE REGRESIÓN CON DATOS DE. 1. Qué es la econometría y para qué sirve? La naturaleza del enfoque

Econometría II. Hoja de Problemas 1

Los estimadores mínimo cuadráticos bajo los supuestos clásicos

Estadística y sus aplicaciones en Ciencias Sociales 7. El modelo de regresión simple. Facultad de Ciencias Sociales - UdelaR

UNIVERSIDAD CARLOS III DE MADRID ECONOMETRÍA EXAMEN FINAL (Modelo A)

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)

Transcripción:

TM 4. PROBLEMAS FRECUENTES PROVOCADOS POR LOS DATOS ECONOMICOS. 1. MULTICOLINEALIDAD: CONCEPTO Y TIPOS.. CÓMO DETECTAR Y MEDIR EL GRADO DE MULTICOLINEALIDAD. 3. SOLUCIONES: CÓMO AFRONTAR EL PROBLEMA EN LA PRÁCTICA. 4. INFLUENCIA REAL Y POTENCIAL DE LAS OBSERVACIONES 5. DETECCION DE OUTLIERS. 6. NO NORMALIDAD EN LAS PERTURBACIONES. CONSECUENCIAS. 7. EL CONTRASTE DE NORMALIDAD DE JARQUE-BERA

1. MULTICOLINEALIDAD: CONCEPTO Y TIPOS: A. MULTICOLINEALIDAD EXACTA: Cuando una de las variables explicativas es combinación lineal determinista de todas las demás. Consec: ρ(x)<k => X ' X = 0 => (X X) -1 no puede calcularse => ˆβ no pueden mco obtenerse. B. MULTICOLINEALIDAD APROXIMADA: Cuando una de las variables es aproximadamente igual a una combinación lineal de las restantes. Consec: X ' X 0 => (X X) -1 toma valores muy elevados => V( ˆβ mco ) = σ u(x X) -1 => los estimadores ˆβ mco tendrán varianzas elevadas => serán estimadores imprecisos.

. COMO DETECTAR LA MULTICOLINEALIDAD..1. EN LOS RESULTADOS DE LOS MODELOS: - R, R, contraste de la F global,, altos mientras que los contrastes de significación individual son no significativos. - Grandes alteraciones en los ˆβ al cambiar mco ligeramente el modelo ( por eemplo, al eliminar un regresor no significativo). - Signos incorrectos según la Teoría económica... ANALIZANDO LAS CORRELACIONES. a) Matriz de correlaciones de las X (si r i >0,8 => correlación fuerte entre x i y x ) b) Calcular el determinante de la matriz de correlaciones de las x: R Si R 1, no multicolinealidad. c) Estimando regresiones auxiliares. X = X 1 a 1 + X a + + X k a k + V

d) Analizando el factor de inflación de la varianza. Partiendo de: Y= β 1 + β X + + β K X K + U Dada una regresión auxiliar: X = X 1 a 1 + X a + + X k a k + V (1) Se puede demostrar que la varianza del estimador ˆβ puede expresarse como: Var ( ˆβ ) = σ u u vˆ i = N i= 1 x σ i u u (1 R ) Donde: vˆ son los residuos de estimar (1) por MCO. i R es el coeficiente de determinación de (1) por MCO. σ u Var ( ˆβ )= N x i= 1 u i 1 * 1 R Siendo: 1 el factor de inflación de la varianza para X 1 R

σ u u x i la var( ˆβ ) en la regresión de Y contra X R 0 0,5 0,8 0,9 0,95 0,99 0,999 Factor de inflación de la varianza 1 5 10 multicolinealidad 0 preocupante 100 1000

CONSECUENCIAS DE βˆ CON VARIANZAS ALTAS: 1. Intervalos de confianza amplios: [ βˆ T σˆ (ˆ β ) β βˆ + T σˆ (ˆ β )] i n k i i i n k i. Contrastes de significación individual indican coeficientes no significativos: βˆ β0 σˆ (ˆ) β 3. Las medidas y contrastes de bondad global del auste pueden ser satisfactorias. (R, F, SCERR, R ) 4. Estimaciones muy poco robustas. Modelo muy sensible a la adición de algunas observaciones o a la eliminación de una variable explicativa inicialmente no significativa. 5. El modelo sirve para predecir, pero no para realizar análisis estructural.

3. SOLUCIONES A LA MULTICOLINEALIDAD. 3.1 Más información muestral. ( ampliar la muestra). Pero puede que esto no sea posible, o puede que las nuevas observaciones también presenten multicolinealidad. 3.. Usar información extra-muestral y usar MCR, basándose en restricciones sugeridas por la teoría económica o por otros trabaos empíricos. 3.3. Aplicar componentes principales a la matriz X y hacer regresión de Y sobre los componentes. 3.4. Eliminar una variable explicativa si la teoría económica te lo permite. 3.5. Convivir con el problema.

4. ANALISIS DE LOS RESIDUOS Y DETECCION DE OUTLIERS. Estudio de la existencia de unidades muestrales atípicas: (individuos, años, ) 4.1. Hay individuos cuyas variables X están muy aleadas de la media muestral? 4.. Hay individuos raros que distorsionan los resultados del modelo de regresión? 4.3. Hay individuos atípicos cuyos errores son anormalmente altos? Para cada unidad muestral analizaremos: 1. influencia potencial. influencia real 3. detección y tratamiento de observaciones atípicas outliers.

4.1 INFLUENCIA POTENCIAL. Mide la capacidad específica que tiene una observación para contribuir al auste. La influencia potencial de la observación i depende de los valores que toman sus variables explicativas: x i,,x k i. En general, aquellas observaciones con valores de las variables exógenas extremos, aleados de los valores medios de las explicativas, influirán más en los resultados de la regresión que aquellas observaciones próximas al comportamiento de los regresores. Una medida descriptiva que detecta la influencia potencial es el LEVERAGE : 1 Ŷ = Xβ ˆ = X(X' X) X' Y = HY H = h 11 h h 1...... h h 1n nn donde : h ii es el LEVERAGE ó INFLUENCIA POTENCIAL. H ii será mayor cuanto más se diferencie una observación de las restantes en términos de los regresores.

En regresión lineal simple: 1 (X X) i h ii = + n (X X) i h ii sólo depende de valores de X, no de Y. NOTA: en el SPSS nos proporcionan otra medida : la distancia de mahalanobis. Su relación con el LEVERAGE es : 1 h ii = ( 1 + mahalanobis) n Cuanto mayor sea la influencia potencial para i, menor será la precisión de la predicción ŷ. i 0<h ii <1 Decisión: si h ii >k/n => la obervación i es potencialmente influyente. La detección de observaciones potencialmente influyentes no convierte en inservible la estimación. El hecho de que una observación tenga mayor capacidad informativa no tiene por qué ser en principio algo negativo.

4.. INFLUENCIA REAL. Trata de detectar aquellas observaciones cuya supresión de la base de datos muestrales llevaría a modificaciones importantes en las estimaciones, errores estandar, intervalos de confianza. Contraste: H 0 : la observación i no es realmente influyente. D : distancia de Cook. D J (Ŷ Ŷ ) ii I = D ~ F K, N-K kσˆ Ŷ es la estimación de y i i obtenida con la muestra n-1, que excluye al individuo. Una única observación puede ser responsable de: -qué variables son significativas -signo de los coeficientes -no linealidad de la relación -Incumplimiento de la hipòtesis de normalidad El deterioro de la capacidad predictiva del modelo. * Qué hacer para solucionar la influencia real. 1. Revisar posibles errores en los datos. Probar formas funcionales alternativas 3. Eliminar la observación problemática 4. Introducir variables ficticias para i.

4.3 OBSERVACIONES ATIPICAS. 1. Residuos estandarizados: e S e (Y Ŷ) = e N ~N(0,1). Residuos estudentizados: e S e = (Y Ŷ) σˆ ( 1 h ) ~ T n-k 3. Residuos estudentizados con omisión: e S () e = (Y Ŷ σˆ () () ) ( 1 h ) ~ T n-k-1 (): Para el cálculo se ha omitido al individuo.

6. NO NORMALIDAD EN LAS PERTURBACIONES. CONSECUENCIAS. En el modelo de regresión suponemos que u i ~N. Pero este supuesto a veces no se cumple. Causas: - La propia especificación del modelo - Porque los residuos parezcan no normales (colas amplias, asimétricos) Consecuencias de la no normalidad en las perturbaciones: a) Si u i tiene varianzas finitas: - los ˆβ i son lineales, insesgados y consistentes. - no son eficientes. - los contrastes t y F no son válidos en muestras pequeñas aunque se ustifiquen asintóticamente. b) Si u i tiene varianzas no finitas: - Los ˆβ i no son asintóticamente normales. - Los contrastes t y F no son válidos ni siquiera asintóticamente. - Las estimaciones son muy sensibles a pequeñas variaciones en la muestra.

7. EL CONTRASTE DE NORMALIDAD DE JARQUE-BERA. H 0 : Perturbaciones normales H 1 : Perturbaciones no normales Estadístico de contraste: basado en los coeficientes de asimetría y curtosis C.Asimetría J.B. = (N K) 6 + Curtosis 4 ~ χ donde: _ Xi X fi m3 C. Asimetría= = 3 3/ Sx _ Xi X f i _ Xi X fi m4 C.Curtosis= 3 = 3 4 4/ S _ x Xi X f i 3 4