: Metodos Cuantitativos para el Analisis Distributivo (wsosa@udesa.edu.ar) Universidad de San Andres y CEDLAS/UNLP XLII Reunion Anual de la Asociacion Argentina de Economia Politica Bahia Blanca
El analisis distributivo ha crecido notablemente, en todas sus dimensiones. Mayor disponibilidad de microdatos y fuentes alternativas (experimentos artificiales y naturales), mejor estrategia de identificacion. Reduccion notoria en costos computacionales. Avances significativos en metodos y teorias estadisticas y economicas. Requieren un nuevo conjunto de herramientas analiticas. Como construir una caja de herramientas moderna.
El Punto de Partida Que es hacer analisis distributivo? Y es una variable aleatoria continua y positiva con funcion de distribucion acumulada F (y) = P r(y y). Este es nuestro modelo de ingresos (poblacional). Y 1,..., Y n son variables aleatorias independientes e identicamente distribuidas, de modo que Y i F (y). Las realizaciones de estas variables aleatorias son los ingresos. Un estudio de la distribucion del ingreso es en realidad un estudio de F (y) en base a la informacion disponible.
Tres Tipos de Analisis Distributivo 1) Analisis Directo de la Distribucion: Estudiar directamente F (y) o alguna otra representacion mas conveniente: 1) funcion de densidad (f(y)), 2) funcion de cuantiles (Q(τ) = F 1 (τ)), 3) Curva de Lorenz, 4) desfile de los enanos, etc. 2) Analisis de Caracteristicas de la Distribucion: En vez de F (y) podriamos concentrar el analisis en alguna caracteristica de F (y), tal como su posicion central (media, mediana), su dispersion (varianza), el grado de desigualdad (Gini, Theil), la proporcion de pobres (tasa de incidencia de pobreza).
3) Analisis Condicional / Causal de la Distribucion: Notar que F (y) = y 0 f(y x)f(x) dxdy de modo que es relevante estudiar la distribucion del ingreso en relacion a la distribucion de otras variables y como esta impacta a la distribucion del ingreso (analisis condicional).
La Caja de Analisis Directo: estimacion de funciones de distribucion acumulada, Curvas de Lorenz, histogramas, modelos parametricos para la distribucion (log-normal, Pareto, Dagum, Singh-Maddala, etc. Analisis de Caracteristicas: medidas de posicion y dipersion, desigualdad (Gini, Theil, Atkinson, etc.), de pobreza (headcounts, brechas de pobreza, FGT). Analisis Condicional: modelos de regresion lineal y no lineal (probits, tobits, durations, counts, etc.). Ecuaciones de Mincer y sus variantes (Heckman). ANOVA, Descomposicion de Oaxaca-Blinder. Referencias: Cowell(1995), Lambert (1993), Wooldridge(2002), Deaton (1997).
La Nueva Caja de Herramientas Metodos no-parametricos. Inferencia en medidas de desigualdad y pobreza. Econometria de diseños muestrales compleos. Analisis dinamico y cohortes. Analisis multivariado. Polarizacion, alienacion, movilidad y persistencia. Evaluacion de impacto. Descomposiciones microeconometricas. Regresion por cuantiles.
Metodos No-Parametricos Tipo de Analisis: Directo. Problema: el grado de conocimiento distributivo es muy basico como para imponer restricciones parametricas. Es relevante que los propios datos sugieran las formas de la distribucion (colas largas, bimodalidades, etc.) Solucion: estimar las distribuciones de interes (FDA, cuantiles, Lorenz, densidades) directamente, sin hacer supuestos funcionales. Ejemplo: Burkhauser et al. (1999, JAE). Referencia: Pagan y Ullah (2000).
Inferencia y Significatividad Estadistica Tipo de Analisis: caracteristicas. Problema: evaluar si dos medidas (de pobreza, desigualdad), son estadisticamente distintas. Hipotesis de no cambio. Construir intervalos de confianza. Concepto de superpoblacion Solucion: metodos de bootstrap para medidas de pobreza y desigualdad. Teoria asintotica. Ejemplo: Gasparini y Sosa Escudero (2001). Referencia: Davidson y Flachaire (2007, JoE).
Diseños Muestrales Complejos Tipo de Analisis: los tres, en particular el de caracteristicas (desigualdad, pobreza). Problema: las muestras disponibles frecuentemente obedecen a esquemas muestrales sofisticados (estructura de clusters, estratos, etapas, etc.), muy lejos del paradigma clasico de muestra iid. Solucion: tecnicas para analisis de muestreo complejo, estructuras de ponderadores. Referencia: Wooldridge (2003, AER).
Analisis Dinamico y Cohortes Tipo de Analisis: de caracteristicas y condicional Problema: importa tanto el nivel de una caracteristica (pobreza), como su evolucion temporal. Idealmente los paneles pueden proveer una solucion. Tienen graves problemas administrativos (attrition) y son costosos. Solucion: en vez de perseguir en el tiempo a un individuo, perseguir individuos representativos de un grupo o cohorte. Ejemplo: Deaton y Paxson (1994, JPE), Navarro (2007). Referencia: MacKenzie (2004, JoE)
Analisis Multivariado Tipo de Analisis: directo y de caracteristicas, incipiente en lo condicional/causal. Problema: el bienestar tiene multiples dimensiones que no pueden ser apropiadamente resumidas en una sola (ingreso). Solucion: metodos multivariados. Modelos factoriales, Analisis de Clusters, Medidas multidimensionales de bienestar (pobreza, en particular). Ejemplo: CEDLAS (2008), Ferro-Luzzi (2006). Referencia: Kakwani y Silber (2008).
Caracteristicas Adicionales Tipo de Analisis: de caracteristicas. Problema: las caracteristicas basicas no alcanzan para resumir los fenomenos distributivos. Solucion: medidas adicionales. Polarizacion, multimodalidad, alienacion, movilidad, persistencia. Ejemplo: Gasparini, Horenstein, Olivieri (2006), Sosa Escudero, Arias y Marchionni (2006). Referencia: Duclos, Esteban y Rey (2004, Econometrica).
Tratamientos y Evaluacion de Impacto Tipo de Analisis: condicional. Problema: los modelos de regresion simple suponen demasiada estructura de causalidad sobre los datos. Es dificil cuantificar efectos causales. Solucion: modelos y metodos para el analisis causal. Regression discontinuity, average y quantile treatment effects, differences-in-differences, propensity scores, matching, etc. Referencia: Lee (2005).
Descomposiciones Microeconometricas Tipo de Analisis: condicional. Problema: los modelos de regresion simple se concentran en como el efecto de una variable sobre la media de otra. En el analisis distributivo es relevante ver como afecta la distribucion de esa variable Solucion: descomposiciones microeconometricas contrafactuales: cambios en la distribucion de una variable como consecuencia de cambios en la distribucion de otra (condicional) y de cambios en la estructura que las une. Ejemplos: Gasparini, Marchionni y Sosa Escudero (2005). Referencia: Bourguignon, Ferreira y Lustig (2005).
Alternativas Semi y No Parametricas Tipo de Analisis: condicional. Los modelos de regresion estandar exploran efectos en las esperanzas condicinoales, no en toda la distribucion Solucion: regresion por cuantiles, metodos que exploran el efecto de variables sobre toda la distribucion condicional. Ejemplos: Machado y Mata (2004, JAE), Autor, Katz y Kearney (2005, NBER) Referencia: Koenker (2005).
Comentarios Finales La econometria es una parte integral de la economia. Es la parte de la estadistica que la economia integro verticalmente. Desarrollo simultaneo de teorias y metodos cuantitativos. Repaso de metodos y tecnicas relevantes para el analisis distributivo.