TEMA 6. Modelos para Datos de Panel

Documentos relacionados
TEMA 5. Modelos para Datos de Conteo

Econometria de Datos en Paneles

Econometría II Grado en finanzas y contabilidad

Econometría de Económicas Ejercicios para el tema 2 y 3

ANÁLISIS DE REGRESIÓN

Econometría II. Hoja de Problemas 1

Tema 10: Introducción a los problemas de Asociación y Correlación

Gráfico 1: Evolución del exceso de rentabilidad de la empresa y de la cartera de mercado

Econometría II Grado en finanzas y contabilidad

Curso de nivelación Estadística y Matemática

El Modelo de Regresión Lineal

T2. El modelo lineal simple

Más Allá del Modelo de Regresión Lineal. Dante A. Urbina

Tema 8: Regresión y Correlación

Tema 4. El Modelo de Regresión Lineal con Series Temporales.

Estadística para la Economía y la Gestión IN 3401 Clase 5

Tema 2. Heterocedasticidad. 1 El modelo de regresión lineal con errores heterocedásticos

Modelos con Datos de Panel

T6. Modelos multiecuacionales

Econometría dinámica y financiera

Mínimos Cuadrados Generalizados

Tema 4. Regresión lineal simple

Econometría III Examen. 29 de Marzo de 2012

Modelos Dinámicos. Tema Introducción

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

ECONOMETRÍA I. Tema 2: El Modelo de Regresión Lineal Simple. Patricia Moreno Juan Manuel Rodriguez Poo Alexandra Soberon Departamento de Economía

Nombre y Apellidos:... EXAMEN ECONOMETRÍA II (Enero 2010)

Regresión Lineal. Rodrigo A. Alfaro. Rodrigo A. Alfaro (BCCh) Regresión Lineal / 16

Econometría de series de tiempo aplicada a macroeconomía y finanzas

ECONOMETRÍA II Prof.: Begoña Álvarez TEMA 1 INTRODUCCIÓN. Estimación por máxima verosimilitud y conceptos de teoría asintótica

Conceptos básicos de inferencia estadística (IV): Inferencia no paramétrica: Contrastes de aleatoriedad.

Se permite un folio escrito por las dos caras. Cada problema se realiza en hojas diferentes y se entregan por separado.

Economía Aplicada. Variables Instrumentales. Basado en Stock y Watson (cap.12), Wooldridge (cap. 15) y Angrist y Pischke (cap. 4)

Grado en Finanzas y Contabilidad

REGRESIÓN LINEAL SIMPLE

ECONOMETRÍA II: ECONOMETRÍA DE SERIES TEMPORALES. Modelos econométricos dinámicos uniecuacionales

Prueba de Hipótesis. Para dos muestras

Inferencia y Especificación en Modelos de Ecuaciones Simultáneas

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Ejemplo 7.1. Heterocedasticidad. Pilar González y Susan Orbe. Dpto. Economía Aplicada III (Econometría y Estadística)

Tema 1. Introducción: el modelo econométrico

Regresión múltiple. Demostraciones. Elisa Mª Molanes López

TEMA 3. Modelos de Elección Discreta

TEMA 5: Especificación y Predicción en el MRL

ECONOMETRIA. Tema 6: MODELOS CON VARIABLES EXPLICATIVAS ENDÓGENAS. César Alonso. Universidad Carlos III de Madrid

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia

TODO ECONOMETRIA. Bondad del ajuste Contraste de hipótesis

ECONOMETRÍA I. Tema 3: El Modelo de Regresión Lineal Múltiple: estimación

ENUNCIADOS DE PROBLEMAS

CURSO ECONOMETRÍA BÁSICA MULTISOFTWARE

Tema 2: Análisis de datos bivariantes

Prácticas Tema 5. Ampliaciones del Modelo lineal básico

Procesos autorregresivos

4.1. El concepto de autocorrelación y su modelización

TEMA 3: Contrastes de Hipótesis en el MRL

Errores de especificación

Modelos Lineales para Datos en Paneles. Walter Sosa Escudero. Banco Central de Chile

Econometria I. Tema 6: Modelos de Ecuaciones Simultáneas. Universidad Carlos III. Getafe, Madrid. November 2008

Obligatoria Optativa Extracurricular Curso Seminario Taller. Clave seriación 45 Laboratorio. Horas prácticas de campo

TEMA 3: PROPIEDADES DEL ESTIMADOR MCO

Diplomado en Estadística Aplicada

El problema de la endogeneidad Variables proxy Variables instrumentales STATA. Endogeneidad. Gabriel Montes-Rojas

Julio Deride Silva. 4 de junio de 2010

Tema 3: Análisis de datos bivariantes

TODO ECONOMETRIA TEMA 1: MODELO BASICO DE REGRESIÓN LINEAL MULTIPLE (MBRL)

Estadística y sus aplicaciones en Ciencias Sociales 7. El modelo de regresión simple. Facultad de Ciencias Sociales - UdelaR

TEMA 2: Propiedades de los estimadores MCO

Estructura de este tema. Tema 4 Regresión lineal simple. Ejemplo: consumo de vino y dolencias cardíacas. Frecuencias

Definición de Correlación

ESTADÍSTICA. Tema 4 Regresión lineal simple

ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN

Tema 1: Estadística descriptiva. Probabilidad y Estadística (Ing. Informática). Tema 1: Estadística descriptiva 1

Econometría de series de tiempo aplicada a macroeconomía y finanzas

Tema 1. El Modelo de Regresión Lineal con Regresores Aleatorios.

peso edad grasas Regresión lineal simple Los datos

EXAMEN DE ESTADÍSTICA II Junio de 2002 SOLUCIÓN (tiempo:100 minutos)

Mínimos Cuadrados Generalizados

Econometría II. Hoja de Problemas 4

Estimación MCO, MCI en Modelos de Ecuaciones Simultáneas

Econometría Universidad Carlos III de Madrid Soluciones Examen Final 27 de Mayo de 2013

Estadística para la Economía y la Gestión IN 3401

ECONOMETRÍA II: ECONOMETRÍA DE SERIES TEMPORALES. Modelos VAR

MÍNIMOS CUADRADOS GENERALIZADOS

Qué es una regresión lineal?

Sesión IV: Variables Instrumentales Variables Instrumentales

Econometría de la desigualdad: de la persona promedio a la persona cuantil. Manuel Arellano CEMFI. Universidad de Málaga 20 de mayo 2016

Estadística para el análisis de los Mercados S3_A1.1_LECV1. Estadística Descriptiva Bivariada

GUIÓN TEMA 2. PROPIEDADES DE LOS ESTIMADORES MCO 2.1 PROPIEDADES ESTADÍSTICAS DEL ES- TIMADOR MCO DE.

Estadística para la Economía y la Gestión IN 3401 Clase 5

CALIFICACION: - P C: precio medio de los productos sustitutivos existentes en el mercado en euros.

ESTADÍSTICA APLICADA. Tema 4: Regresión lineal simple

Ejercicio 1. Ejercicio 2

UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS NATURALES Y MUSEO CÁTEDRA DE ESTADÍSTICA CLASE ESPECIAL. Tema:

Regresión con errores autocorrelacionados

Estadística Diplomado

INDICE. Prólogo a la Segunda Edición

PROPIEDADES DEL ESTIMADOR MCO

Estimación de una tendencia determinista y un componente estacional

Hoja de Ejercicios 3 El modelo de regresión lineal múltiple

Transcripción:

TEMA 6. Modelos para Datos de Panel Profesor: Pedro Albarrán Pérez Universidad de Alicante. Curso 2010/2011.

Contenido 1 Introducción 2 Modelos estáticos Modelo con Efectos Individuales: Fijos y Aleatorios Extensiones del Modelo Básico 3 Estimación de Modelos estáticos. Predicción Estimadores Agrupados ( Pooled ) Estimador Between Estimador de Efectos Aleatorios Estimadores de Efectos Fijos Test de Hausman Predicción. 4 Paneles largos 5 Variables instrumentales 6 Modelos Dinámicos para datos de panel Introducción Estimador de Arellano y Bond

Consideraciones básicas Datos de Panel Los datos de panel (o datos longitudinales) consiste en observaciones de un corte transversal de unidades individuales (hogares, empresas, países, etc.) repetidas sobre el tiempo Algunos ejemplos: {Y it, X it } i = 1,..., N; t = 1,..., T PSID (Panel Study of Income Dynamics) ECHP (European Community Household Panel) SHIW (Survey on Household Income and Wealth) EPA (Encuesta de Población Activa) ESEE (Encuesta sobre Estrategías Empresariales) FES (Family Expenditure Survey) CEX (Consumers Expenditure Survey) ECPF (Encuesta Continua de Presupuestos Familiares) paneles de estados americanos, de países, etc.

Consideraciones básicas Consideraciones básicas En general, los datos se observan a intervalos regulares de tiempo Los datos de panel pueden ser balanceados (T i = T para todo i) o no balanceados (T i T para algún i) la selección muestral debe ser aleatoria (no correlacionada con los regresores) para que los estimadores sean consistentes Se pueden tener paneles: de muchos individuos y pocos periodos temporales ( short panels) de pocos individuos y muchos periodos temporales ( long panels ) de muchos individuos y muchos periodos temporales Se puede hacer inferencia asintótica NT N, T N, T fijo T, N fijo

Consideraciones básicas Consideraciones básicas (cont.) Los errores estarán probablemente correlacionados (en el tiempo para un individuo y/o entre individuos) Se pueden tener regresores invariantes en el tiempo (x it = x i ), que no varían con los individuos (x it = x t ) o que varían tanto con el tiempo como con los individuos (x it ) Algunos coeficientes del modelo pueden variar entre individuos o en el tiempo Los datos de panel permiten la estimación de modelos dinámicos

Estadística descriptiva para datos de panel Descripción de los datos Para cada observación debe conocerse el individuo i y el periodo temporal t al que se refiere. p.e., un panel balanceado p.e., un panel NO balanceado individuo año renta edad individuo año renta edad sexo 1 2000 1800 29 1 2000 800 19 2 1 2001 1950 30 1 2001 950 20 2 2 2000 800 20 2 2000 1900 29 1 2 2001 850 21 2 2001 1950 30 1.... 2 2002 2100 31 1..... 500 2000 2200 54 1000 2000 2100 49 1 500 2001 2400 55 1000 2001 2200 50 1 Obviamente preferiremos una descripción resumida de la estructura del panel en nuestros datos

Estadística descriptiva para datos de panel Descripción de los datos (cont.) Para paneles balanceados, describir el número de observaciones implica: número de individuos distintos N total de periodos cubiertos por el panel T el número total de observaciones es simplemente NT Para paneles NO balanceados, además debemos considerar: periodos concretos en que se observa cada individuo T i (o su media) número total de observaciones N i=1 T i También se puede presentar el patrón de observaciones; p.e., t = 1 t = 2 t = 3 t = 4 n 1, T i = 4. n 2, T i = 3.. n 3, T i = 2. n 4, T i = 3 Notad que no tiene porque haber individuos observados todos los periodos y que individuos con el mismo T i pueden ser observados en periodos diferentes.

Estadística descriptiva para datos de panel Descomposición within - between Las variables pueden tener variación tanto en el tiempo como entre individuos Variabilidad within, s 2 W : variación en el tiempo para un individuo dado Variabilidad between, s 2 B: variación entre individuos La variabilidad total ( overall ), s 2 O, se puede descomponer en within y between s 2 O s2 W + s2 B

Estadística descriptiva para datos de panel Descomposición within - between (cont.) Variabilidad overall (en torno a la media total x = 1 /NT i t x it) s 2 O = 1 NT 1 (x it x) 2 Variabilidad within (en torno a la media individual x i = 1 /T s 2 W = 1 NT 1 (x it x i ) 2 = i t i t 1 NT 1 Variabilidad between (variación de x i en torno a x) s 2 B = 1 N 1 (x i x) 2 (x it x i + x) 2 Nota: NT debe entenderse como total de observaciones es decir, para paneles no balanceados debe ser N i=1 T i i i t t x it)

Estadística descriptiva para datos de panel Estadísticas Descriptivas Las estadísticas pueden describir los datos totales ( overall ): within : between : x it x it x i + x x i Existe una distribución de cada uno de ellos que caracterizar: su máximo, mínimo, percentiles, varianza, etc. Para variables discretas, una tabulación de valores (histograma) puede ofrecer overall : observaciones que toman ese valor between : individuos para los que alguna vez toma ese valor porcentaje de individuos que nunca cambia de valor ( within ) Para variables binarias, se puede calcular una matriz de transiciones (ofrecen idea de persistencia, dinámica) X it+1 = 0 X it+1 = 1 X it = 0 Pr (X it+1 = 0 X it = 0) Pr (X it+1 = 1 X it = 0) X it = 1 Pr (X it+1 = 0 X it = 1) Pr (X it+1 = 1 X it = 1)

Estadística descriptiva para datos de panel Gráficos Se puede representar la evolución de algunas o de todos los individuos i Se pueden representar gráficos de dispersión para dos variables overall o within (cada variable en desviaciones respecto a la media de cada individuo)

Modelo con Efectos Individuales: Fijos y Aleatorios Modelo con efectos individuales donde y it = β 1 x 1it + + β k x kit + u it = β 1 x 1it + + β k x kit + α i + ε it x 1it,..., x kit : variables explicativas (observables) u it = α i + ε it : término de error compuesto (inobservado) α i : efectos individuales (heterogeneidad inobservada permanente en el tiempo) ε it : error idiosincrásico Existen dos modelos sustancialmente diferentes según el tratamiento de α i 1 Modelo de efectos fijos 2 Modelo de efectos aleatorios

Modelo con Efectos Individuales: Fijos y Aleatorios Efectos Individuales Fijos Permite que los regresores x 1it,..., x kit estén correlacionados con α i sin especificar la forma concreta todo el análisis será condicional en α i El supuesto fundamental es E [ε it α i, x 1it,..., x kit ] = 0 los regresores deben seguir siendo incorrelados con ε it Esto implica E [y it α i, x 1it,..., x kit ] = β 1 x 1it + + β k x kit + α i y δe [y it α i, x 1it,..., x kit ] δx j,it = β j Se puede identificar el efecto marginal β j aunque el regresor es endógeno, respecto al término de error compuesto u it los regresores pueden estar correlacionados u it, pero sólo con su parte constante en el tiempo ej.: y it =renta, α i =habilidad inobservada permanente

Modelo con Efectos Individuales: Fijos y Aleatorios Efectos Individuales Fijos : problemas En principio, se necesitan estimar α 1,..., α N junto con los parámetros β j en paneles cortos, estimar los parámetros β j necesita N Problema de parámetros incidentales: la estimación de los β j puede estar sesgada por estimar infinitos parámetros auxiliares α i Alternativamente, se puede estimar el modelo transformado para eliminar α i sólo se identifica β j para regresores que varían en el tiempo Estimar consistentemente β puede NO ser suficiente: Para predecir y it : E [y it x 1it,..., x kit ] = β 1 x 1it + + β k x kit + E [α i x 1it,..., x kit ] en paneles cortos, E [α i x 1it,..., x kit ] no se estima consistentemente En modelos no lineales, el efecto marginal no está estimado consistentemente (depende de α i ) δe [y it α i, x 1it,..., x kit ] δx j,it

Modelo con Efectos Individuales: Fijos y Aleatorios Efectos Individuales Aleatorios El efecto individual α i se trata como puramente aleatorio debe especificarse su distribución, condicional en los regresores Supuesto habitual: α i no está correlacionado con los regresores α i X it N ( 0, σ 2 ) α Se puede estimar el modelo por Mínimos Cuadrado Generalizados Factibles: todos los coeficientes y efectos marginales, incluyendo de las variables que no varían en el tiempo la predicción E [y it x 1it,..., x kit ] PERO la estimación es inconsistente si el supuesto sobre la distribución de α i es incorrecto p.e., α i sí está correlacionado con los regresores α i X it N ( ) π X it, σ 2 α

Extensiones del Modelo Básico Extensiones Modelo con dos efectos y it = β 1 x 1it + + β k x kit + α i + γ t + ε it la constante varía tanto entre individuos, α i, como en el tiempo, γ t en paneles cortos, γ t se modeliza como fijo (con una dummy para cada t) Modelo agrupado ( pooled ) o de promedio poblacional y it = α + β 1 x 1it + + β k x kit + u it supone que los regresores están incorrelados con u it pero no una estructura en u it (a diferencia de efectos aleatorios) se puede estimar consistentemente por MCO la inferencia debe usar errores estándar robustos por la probable correlación entre individuos y en el tiempo para un individuo

Extensiones del Modelo Básico Modelos Lineales mixtos Se puede generalizar el modelo para permitir pendientes diferentes para cada individuo y it = β 1i x 1it + + β ki x kit + α i + ε it = α i + X it i + ε it En paneles largos, se pueden estimar fácilmente los parámetros ( αi, β i ) mediante regresiones separadas para cada individuo En ( paneles ) cortos, se necesita suponer una distribución para αi, β i, condicionales en los regresores como en el modelo de efectos aleatorios, se suele suponer que son independientes de los regresores por ejemplo, (α i, β i ) X it N (β, Σ) También se puede considerar que los parámetros varíen con el tiempo o variables observables

Estimadores Agrupados ( Pooled ) Estimador Pooled por MCO Un modelo lineal estático para datos de panel y it = α + β 1 x 1it + + β k x kit + u it Se puede estimar consistentemente por MCO si se supone que los regresores son exógenos: Pero los errores u it no serán i.i.d.: E [u it x 1it,..., x kit ] = 0 las observaciones están agrupadas de forma natural por individuos i ( clusters ) probablemente existirá heterocedasticidad entre clusters Deben usarse errores estándar robustos, al menos por la presencia de clusters Este estimador es simple y aprovecha tanto la variabilidad temporal como entre individuos de los datos

Estimadores Agrupados ( Pooled ) Estimador Pooled por MCGF Bajo el mismo supuesto de exogeneidad E [u it x 1it,..., x kit ] = 0 (garantiza que el estimador es consistente) Se puede obtener un estimador de MCGF, asintóticamente más eficiente que el de MCO supone una estructura concreta para la matriz de correlaciones de u it es más eficiente solo si el supuesto es correcto Se puede suponer: independencia ρ ts = 0 equicorrelación ρ ts = ρ proceso estacionario AR(p) o MA(q) sin estructura (salvo porque deben ser iguales entre individuos) En general, se siguen utilizando errores estándar robustos (no se considera que el supuesto sea realmente correcto)

Estimador Between Estimador Between El estimador between explota sólo la variación de corte transversal es decir, utiliza los datos between y i, x 1i,..., x ki Resulta de estimar por MCO el modelo y i = α + β 1 x 1i + + β k x ki + u i (deberían usarse errores estándar robustos) Será consistente bajo el mismo supuesto anterior de exogeneidad de los regresores respecto al término de error compuesto En la práctica apenas se utiliza porque el estimador pooled y el de efectos aleatorios son superiores son consistentes bajo las mismas condiciones son más eficientes (asintóticamente)

Estimador de Efectos Aleatorios Estimador de Efectos Aleatorios Sea un modelo de efectos individuales y it = β 1 x 1it + + β k x kit + α i + ε it donde E [α i X it ] = 0; E [ε it X it ] = 0; Var [α i X it ] = σ 2 α Var [ε it X it ] = σ 2 ε Esto implica que los regresores son exógenos respecto al término de error compuesto u it = α i + ε it E [u it X it ] = 0 Además, se tiene una estructura de correlación particular σ 2 α Corr (u it, u is ) = σ 2 α + σ 2, t s ε Por tanto, se puede estimar eficientemente mediante MCGF

Estimador de Efectos Aleatorios El estimador de efectos aleatorios (MCGF) se obtiene estimando por MCO el modelo transformado (y it θ ) i y i = α (1 θ ) i + (X it θ ) i X i β+αi (1 θ ) i + (ε it θ ) i ε i θ i es un estimador consistente de θ i = 1 σ 2 ε/(t i σ 2 α+σ 2 ε) El estimador de Efectos Aleatorios usa tanto variación within como between Otros estimadores se pueden obtener como casos especiales del estimador de efectos aleatorios cuando θ i 0, se tiene el estimador agrupado por MCO cuando θ i 1 (porque T i o σ2 α/σ 2 ε son grandes), se tiene el estimador within

Estimadores de Efectos Fijos Estimadores de Efectos Fijos Sea un modelo de efectos individuales y it = β 1 x 1it + + β k x kit + α i + ε it Suponemos E [ε it α i, x 1it,..., x kit ] = 0 La estimación de los parámetros β requiere la eliminación de α i Estos estimadores sólo utilizan variación within de los datos la estimación de los datos con poca variación within será bastante imprecisa no se puede estimar el coeficiente de variables que no varíen en el tiempo Son consistentes tanto si los regresores están correlacionados con la heterogeneidad permanente como si no si no existe correlación, otros estimadores son más eficiente en cualquier caso, los errores estándar serán mayores que los de otros estimadores

Estimadores de Efectos Fijos Estimadores within : Desviaciones respecto a la media Se puede transformar el modelo restando a cada variable su media individual ( ) (y it y i ) = X it X i β + (εit ε i ) donde X i = 1 /T i t X it Este modelo se puede estimar consistentemente por MCO porque los regresores X it eran endógenos por su correlación con α i pero están incorrelados con ε it (en cualquier periodo temporal) Cuando se disponga de estimaciones de β, se pueden obtener estimaciones de los efectos individuales α i = y i X i β sólo serán consistentes si T i Se deben utilizar errores estándar robustos si se piensa que ε it no son i.i.d.

Estimadores de Efectos Fijos Estimadores within con dummies de individuo También se pueden estimar conjuntamente α 1,..., α N y el vector β Mediante MCO en el modelo original con N dummies para los efectos individuales N y it = X it β + α i d j,it + ε it j=1 donde d j,it = 1 para el individuo i y d j,it = 0 en caso contrario Este estimador de β es numéricamente igual al obtenido en desviaciones respecto a la media Asimismo, también los efectos individuales estimados son α i = y i X i β

Estimadores de Efectos Fijos Estimador en primeras diferencias Existen muchas formas de eliminar los efectos individuales α i Se puede estimar por MCO el modelo en primeras diferencias (y it y it 1 ) = (X it X it 1 ) β + (ε it ε it 1 ) Este estimador en primeras diferencias (por MCO) es consistente El estimador en desviaciones respecto a la media y el estimador en primeras diferencias son, en general, similares pero diferentes ambos utilizan el mismo número de observaciones para T = 2, son numéricamente iguales En modelos estáticos, se suele preferir el estimador en desviaciones respecto a la media porque es más eficiente cuando ε it es i.i.d. el error en primeras diferencias está autocorrelacionado por tanto, MCO no es eficiente (y deben usarse errores estándar robustos)

Estimadores de Efectos Fijos Exogeneidad estricta y Exogeneidad débil El estimador en desviaciones respecto a ) la media requiere que (ε it ε i ) esté incorrelado con (X it X i Esto sucederá cuando se cumpla el supuesto de exogeneidad estricta (o fuerte) E [ε it α i, X i1,..., X it ] = 0 El estimador en desviaciones respecto a la media requiere que (ε it ε it 1 ) esté incorrelado con (X it X it 1 ) Esto sucederá cuando se cumpla el supuesto de exogeneidad débil E [ε it α i, X i1,..., X it ] = 0 a diferencia del anterior, permite que valores futuros de los regresores estén correlacionados con el error ej., un regresores es la variable dependiente retardada Esta distinción no suele ser relevante en modelos estáticos

Test de Hausman Efectos Fijos o Efectos Aleatorios? El estimador de Efectos Fijos permite estimar el modelo bajo supuestos menos restrictivos permite correlación entre los regresores y los efectos individuales permite estimar el modelo incluso si los regresores son endógenos PERO es menos deseable en otras dimensiones es menos eficiente (al explotar solo variación within ) no identifica los coeficientes de regresores que no varíen en el tiempo El estimador de Efectos Aleatorios es más eficiente si se cumplen supuestos adicionales a los de Efectos Fijos PERO puede ser inconsistente

Test de Hausman y it MCO/MCGF Estim. within α 1 + + + + + + + + + + + + ++ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + α 2 x it α 3 x 1 x 2 x3 x 4 α 4

Test de Hausman Contraste de Hausman Resulta muy importante conocer si el modelo adecuado para analizar nuestros datos es el de efectos fijos o el de efectos aleatorios Bajo la hipótesis nula de que se cumplen los supuestos del modelo de Efectos Aleatorios, ambos estimadores, el de efectos fijos y el de efectos aleatorios, deben ser similares ambos son consistentes El contraste compara los coeficientes estimables de los regresores que varían con el tiempo El estadístico de contraste mide la distancia entre ambas estimaciones: si es grande se rechaza H 0 ( βef β ) [ ) )] 1 EA Var ( βef Var ( βea ( βef β ) a Ho EA χ 2 (k)

Predicción. Predicción Se puede predecir el valor de la variable dependiente, incondicional en los efectos fijos E (y it X it ), como ŷ it = X it β + α donde α = 1 N i α i Se puede predecir el valor de la variable dependiente dado su efecto individual E (y it X it, α i ), como Asimismo, se pueden obtener: ŷ it = X it β + α i los efectos individuales estimados α i = y i X β i el residuo idiosincrásico ε it = y it X it β α i el residuo compuesto û it = ε it + α i = y it X it β Notad que α i (y, por tanto, la predicción de y it que la utiliza) requieren que T para ser predicciones consistentes ( α solo necesita NT )

Predicción. R 2 total, within y between Se pueden obtener obtener un R 2 del modelo para los datos totales, within y between dependiendo del modelo, el R 2 habitual será uno de estos tres Estos R 2 se obtienen como correlaciones entre los datos observados y los datos predichos por el modelo observado [ ( R 2 o = Corr y it, X it β )]2 [ ( )]2 ( ) R 2 w = Corr (y it y i ), X it X i β ( R 2 b [Corr = y i, X β )]2 i

Predicción. No existe una descomposición para los R 2 como en la varianza: cada uno se interpreta independientemente También puede resultar interesante obtener estimaciones separadas de la varianza de los efectos individuales σ 2 α de la varianza del error idiosincrásico σ 2 ε por tanto, automáticamente de la varianza del término de error compuesto de la autocorrelación del término de error compuesto u it ρ = Ĉorr (u itu it 1 )

Introducción En los paneles largos, se tienen muchos periodos temporales para pocos individuos: N pequeño, T por ejemplo, unas pocas industrias, empresas o regiones observadas durante muchos periodos de tiempo. Se puede estimar estimar un modelo de efectos fijos mediante dummies de individuo como regresores En la práctica, se suelen preferir modelos agrupados para estimar por MCGF para incorporar estructuras de covarianza más generales del término de error También se pueden estimar modelos más flexibles con pendientes específicas para cada individuo mediante regresiones separadas y it = X it β i + α i + ε it

Introducción (cont.) La longitud temporal de los datos supone la principal característica a considerar cuando se estima un modelo con un panel largo En todos los casos, debe tenerse en cuenta la probable autocorrelación en ε it o directamente en u it mediante errores estándar robustos a autocorrelación o estimando por MCGF si se considera apropiado un determinado proceso (estacionario) Aunque tampoco puede olvidarse la posibilidad de heterocedasticidad en u it o ε it Se pueden estimar modelos con efectos temporales y it = X it β i + α i + γ t + ε it estimar γ t con dummies puede suponer un problema de parámetros incidentales (T ) PERO se pueden reemplazar por una tendencia (aprovechando que el tiempo está ordenado de forma natural)

Análisis de Series Temporales con datos de panel Cuando se tiene un panel largo con pocos individuos, se podría tratar como un sistema de N series temporales PERO ya hemos visto que debemos considerar aspectos ignorados por la econometría de series temporales puras controlar por heterogeneidad inobservado comportamiento asintótico cuando tanto N como T van a infinito la posibilidad de dependencia de corte transversal En cualquier caso, también hemos visto que los paneles largos permiten analizar la evolución temporal de una variable Los datos de series temporales se pueden modelizar como procesos estacionarios: bien la variable dependiente o bien el término de error siguen procesos ARMA(p,q) o como procesos no estacionarios, aunque éstos sólo se pueden analizar convincentemente cuando la serie temporal es muy larga

Raíces unitarias y cointegración Se pueden estudiar modelos dinámicos como y it = ρ i y it 1 + φ i1 y it 1 + + φ ipi y it pi + Z it γ i + u it donde los cambios retardados garantizan que u it sea i.i.d. El proceso será estacionario para el individuo i si ρ i = 1 Cuando dos procesos son no estacionarios, pueden estar correlacionados (espúreamente) sólo por serlo Por tanto, cuando se estudian varias variables en una serie temporal larga, debe analizarse si están cointegradas es decir, si siguen relacionadas descontando el efecto de la no estacionariedad

Introducción Variables instrumentales con datos de panel Se pueden extender fácilmente los métodos de variables instrumentales al caso de datos de panel Si el modelo agrupado es apropiado y it = α + X it β + u it, un instrumento válido debe cumplir E [u it Z it ] = 0 Se puede estimar por mínimos cuadrados en dos etapas (MC2E) (con errores robustos a clusters de individuos) Si el modelo de efectos fijos es apropiado y it = X it β + α i + ε it, un instrumento válido debe cumplir (exogeneidad estricta) E [ε it α i, Z i1,..., Z it ] = 0 Se puede estimar también por MC2E en el modelo transformado para eliminar los efectos individuales (en desviaciones respecto a la media, etc.)

Estimador de Hausman-Taylor Estimador de Hausman-Taylor Este estimador de V.I. permite estimar los coeficientes de los regresores invariantes en el tiempo El modelo de efectos individuales se puede escribir como Supuestos: y it = X 1it β 1 + X 2it β 2 + W 1i γ 1 + W 2i γ 2 + α i + ε it 1 algunos regresores invariantes en el tiempo W 1i NO están correlacionados con α i 2 algunos regresores que sí varían con el tiempo X 1it NO están correlacionados con α i 3 otros regresores, W 2i y X 2it, sí pueden estar correlacionados con α i 4 todos los regresores están incorrelados con ε it Este estimador es más restrictivo porque se basa en supuestos adicionales a los del estimador de efectos fijos la existencia de regresores no correlacionados con los efectos individuales

Estimador de Hausman-Taylor Usando la transformación de efectos aleatorios del modelo ỹ it = X 1it β 1 + X 2it β 2 + W 1i γ 1 + W 2i γ 2 + α i + ε it Cada variable ha sido transformada X 1it = X 1it θ i X 1i donde θ i es un estimador consistente deθ i = 1 σ 2 ε/(t i σ 2 α+σ 2 ε) Esta transformación no elimina los regresores invariantes en el tiempo se puede estimar γ 1 y γ 2 Tampoco elimina los efectos individuales: por tanto, X 2it y W 2i están correlacionados con α i esta endogeneidad se remedia mediante el uso de variables instrumentales

Estimador de Hausman-Taylor ỹ it = X 1it β 1 + X 2it β 2 + W 1i γ 1 + W 2i γ 2 + α i + ε it Un instrumento para X 2it es X 2it = X 2it X 2i está correlacionado con X 2it se puede comprobar que NO está correlacionado con α i Un instrumento para W 2i es X 1i Supone que el número de regresores exógenos que varían con el tiempo es mayor que el número de regresores endógenos invariantes en el tiempo Se usan datos de otros periodos para formar los instrumentos: X 1i1,..., X 1iT también servirían Un instrumento para X 1it es X 1it = X 1it X 1i se usa X 1i dos veces Un instrumento para W 1i es W 1i

Introducción Modelos dinámicos Por simplicidad, consideremos un modelo AR(1) y it = γ 1 y it 1 + X it β + α i + ε it Se puede generalizar a más retardos fácilmente La correlación en el tiempo de y it tiene distintas fuentes 1 directamente a través de valores pasado de y it (verdadera dependencia temporal) 2 directamente a través de los regresores X it (heterogeneidad observada) 3 indirectamente a través de los efectos individuales α i (heterogeneidad inobservada) 4 (correlación serial en ε it ) Las implicaciones de cada fuente de correlación son muy diferentes

Introducción Problemas de los Estimadores y it = γ 1 y it 1 + X it β + α i + ε it, ε it i.i.d. NO se puede suponer que y it 1 está incorrelado con α i Por tanto, los estimadores de pooled y de efectos aleatorios NO son adecuados para modelos dinámicos El estimador within es inconsistente (y it y i ) = γ 1 ( yit 1 y i, 1 ) + (X it X i ) β + (εit ε i ) porque ( ) y it 1 y i, 1 está correlado con (εit ε i ) ε i incluye los errores de todos los periodos Todos los estimadores de efectos fijos tienen el mismo problema (y it y it 1 ) = γ 1 (y it 1 y it 2 ) + (X it X it 1 ) β + (ε it ε it 1 )

Estimador de Arellano y Bond Estimador de Arellano-Bond Sea el modelo transformado en primeras diferencias y it = γ 1 y it 1 + X itβ + ε it Si ε it es i.i.d., un instrumento válido para y it 1 será y it 2 y it 2 está correlacionado con y it 1 = y it 1 y it 2 y it 2 NO está correlacionado con ε it = ε it ε it 1 De hecho, son instrumentos válidos cualquier valor de y it retardados dos periodos o más E y it 2 y it 3. y i1 ε it = 0 E [y is ε it ] = 0, s t 2 Se pueden obtener estimaciones consistentes de un modelo dinámico de datos de panel utilizando la transformación adecuada del modelo (este argumento NO funciona en desviaciones respecto a la media) y los instrumentos adecuados

Estimador de Arellano y Bond Arellano-Bond (cont.) El estimador asintóticamente más eficiente utiliza todos los retardos posibles para estimar el modelo dinámico se denomina estimador de Arellano-Bond se estima mediante el Método Generalizado de los Momentos (para utilizar todos los instrumentos) Este estimador permite estimar un modelo dinámico sin necesidad de instrumentos externos El modelo puede incluir regresores (estrictamente) exógenos E [ ε it α i, x j,i1,..., x j,it ] = 0 son sus propios instrumentos E [x j,it ε it ] = 0 aunque también se pueden utilizar todos sus retardos y adelantos E [x j,it ε is ] = 0, s t Además, el argumento utilizado para obtener instrumentos de y it 1 se puede generalizar al otros regresores que no sean estrictamente exógenos sin necesidad de buscar un instrumento nuevo

Estimador de Arellano y Bond Arellano-Bond (cont.) Si se tienen regresores que, como y it 1, son predeterminados (débilmente exógenos) E [ ε it α i, x j,i1,..., x j,it ] = 0 están correlacionados con los errores pasados E [x j,it ε is ] 0, pero no con errores futuros E [x j,it ε is ] = 0, s t Algunos regresores pueden ser contemporáneamente endógenos E [x j,it ε is ] 0, s t pero estar incorrelado con los errores futuros E [x j,it ε is ] = 0, s < t s > t

Estimador de Arellano y Bond Arellano-Bond (cont.) Este estimador necesita que ε it sea i.i.d. para ser consistente Este supuesto se puede contrastar, porque: Cov ( ε it, ε it 1 ) 0 Cov ( ε it, ε it k ) = 0 k 2 Si este supuesto no se cumple, se puede seguir estimando el modelo si ε it AR(p), se puede re-escribir el modelo original como un proceso autorregresivo y se tendrá un nuevo error i.i.d. si ε it MA (q), se pueden utilizar valores más retardados como instrumentos También se dispone un test de Sargan para contrastar la coherencia entre los instrumentos