Econometría Avanzada FLACSO 2014

Documentos relacionados
ESCUELA SUPERIOR POLITECNICA DEL LITORAL

Microeconometría. Karoll GOMEZ Segundo semestre 2017

Auxiliar 9. MNL y MLE. Daniel Olcay. 21 de octubre de 2014 IN4402. Daniel Olcay (IN4402) Auxiliar 9 21 de octubre de / 13

Modelo de regresión múltiple: estimación, inferencia y predicción Concepto de econometría...

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS. Modelos Probit y Tobit aplicados al estudio de la oferta laboral de los trabajadores secundarios en el Perú

Variables Dependientes Limitadas

Econometría III Examen. 29 de Marzo de 2012

ECONOMETRÍA II Prof.: Begoña Álvarez TEMA 1 INTRODUCCIÓN. Estimación por máxima verosimilitud y conceptos de teoría asintótica

Modelos de Variable Dependiente Limitada. Econometría Aplicada UCEMA Daniel Lema

Diplomado en Econometría Coordinadora académica: M.F. Esperanza Sainz López

EXAMEN DE ECONOMETRÍA

Econometría II. Hoja de Problemas 1

Diplomado en Econometría Coordinadora académica: M.F. Esperanza Sainz López

Estimación Máxima Verosimilitud

Economía Aplicada. Modelos con variables dependiente binarias. Departamento de Economía Universidad Carlos III de Madrid

Unidad V: Estadística aplicada

ANÁLISIS DE REGRESIÓN

Estimación Probit. Microeconomía Cuantitativa. R. Mora. Departmento de Economía Universidad Carlos III de Madrid

INDICE. Capitulo Uno.

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

Modelos elección discreta y variable dependiente limitada

5. Descripción teórica de los modelos econométricos. La naturaleza del estudio que esta tesis pretende realizar nos lleva a enfrentarnos

Modelos para variables categóricas

EXPERIENCIA PILOTO DE CRÉDITOS EUROPEOS UNIVERSIDAD DE CÓRDOBA CURSO FICHA DE ASIGNATURA DATOS BÁSICOS DE LA ASIGNATURA

FORMATO MODALIDAD PRESENCIAL UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ECONOMÍA. Plan de estudios

Pérdida Esperada. Pérdida Esperada (PE): Valor esperado de pérdida por riesgo crediticio en un horizonte de tiempo determinado.

Teórica básica. Incluimos. - Temas

Diplomado en Estadística Aplicada

Introducción a la Econometría

Análisis de datos Categóricos

ECONOMETRÍA I. Tema 4: El Modelo de Regresión Lineal Múltiple: inferencia y validación

PROGRAMA DE CURSO. Código Nombre ESTADÍSTICA PARA LA ECONOMÍA Y GESTIÓN Nombre en Inglés Statistics for Economics and Management Unidades

5 Estudios de simulación

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

Inferencia en tablas de contingencia

Econometría Aplicada

Preparación de los datos de entrada

Análisis de datos Categóricos

Estadística Computacional. M. González

Soluciones Examen Final de Econometría Universidad Carlos III de Madrid 26 de Mayo de 2015

Econometría Aplicada

Estadística para la Economía y la Gestión IN 3401 Clase 5

TEMA 3. Modelos de Elección Discreta

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

Modelo Lineal Generalizado GAMMA. Distribución gamma: Otra parametrización mediante el parámetro de forma y la media:

MÓDULO: MÉTODOS CUANTITATIVOS

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico

Curso de nivelación Estadística y Matemática

Estadística. Para el caso de dos variables aleatorias X e Y, se puede mostrar que. Pero y son desconocidos. Entonces. covarianza muestral

Sesión 7 - Modelos de variable censurada y truncada

Estimación de Parámetros. Jhon Jairo Padilla A., PhD.

Estimación de Parámetros. Jhon Jairo Padilla A., PhD.

CURSO ECONOMETRÍA AVANZADA MULTISOFTWARE

Resumen. Recordemos que una cópula es una función C : I 2 I tal que: C(u 2, v 2 ) C(u 2, v 1 ) C(u 1, v 2 ) + C(u 1, v 1 ) 0. (2)

Estimación del Probit Ordinal y del Logit Multinomial

ESTADISTICA INFERENCIAL DR. JORGE ACUÑA A.

Guía docente 2007/2008

INTRODUCCIÓN A LA TERCERA PARTE: UNA CLASIFICACIÓN DE LOS MÉTODOS DEL ANÁLISIS MULTIVARIADO

Tema 1. Introducción: el modelo econométrico

TEST DE RAZÓN DE VEROSIMILITUD GENERALIZADA

Selección de distribuciones de probabilidad

INDICE Capitulo uno Introducción y estadísticas descriptiva Capitulo dos Conceptos en probabilidad Capitulo tres

ESTIMACIÓN Y PRUEBA DE HIPÓTESIS INTERVALOS DE CONFIANZA

Universidad de la República, Facultad de Ciencias Económicas y Administración.

JUEGO DE BASKETBALL. Repaso de Distribuciones de Probabilidad Discretas y Continuas

Contenido. vii. Prólogo... i Presentación... iii Grupo de trabajo...v. 1. Introducción y conceptos preliminares...1

Regresión Lineal Simple y Múltiple Regresión Logística

Hoja 4 Variables aleatorias multidimensionales

La econometría : una mirada de pájaro

Facultad de Ciencias Sociales - Universidad de la República

Econometría 1. Karoll GOMEZ Segundo semestre 2017

Obligatoria Optativa Extracurricular Curso Seminario Taller. Clave seriación 45 Laboratorio. Horas prácticas de campo

INDICE. Prólogo a la Segunda Edición

Taller 10: Modelos con variable dependiente cualitativa Econometría

Programa Oficial de Asignatura. Ficha Técnica. Presentación. Competencias y/o resultados del aprendizaje. Econometría

matemáticas como herramientas para solución de problemas en ingeniería. PS Probabilidad y Estadística Clave de la materia: Cuatrimestre: 4

con los supuestos clásicos, uno de ellos es que ninguna de las variables X 1, X 2,, X K es

SOLUCION TALLER 1 SOLUCION PUNTO 1. - Función de producción cuadrática. Se espera que: >0 porque x2 es un insumo de producción

Guillermo Ayala Gallego Universidad de Valencia

PROBABILIDAD Y ESTADÍSTICA ECON 2302 Sección 4 HAROLD CORONADO ARANGO

TODO ECONOMETRIA TEMA 1: MODELO BASICO DE REGRESIÓN LINEAL MULTIPLE (MBRL)

Examen de Introducción a la Econometría

GENERACION DE NUMEROS ALEATORIOS Y VARIABLES ALEATORIAS

Más Allá del Modelo de Regresión Lineal. Dante A. Urbina

LICENCIATURA EN ECONOMÍA Y LICENCIATURA EN ADMINISTRACIÓN DE EMPRESAS

PROGRAMA DE CURSO. Código Nombre MA3403 Probabilidades y Estadística Nombre en Inglés Probability and Statistics SCT

Curso: 2º Créditos ECTS: 6 Tipo de asignatura: Obligatoria Tipo de formación: Teórico-Práctica

Regresión Lineal Múltiple

Aplicación de la distribución empírica: Tests de bondad de ajuste

PROGRAMA DE CURSO. Horas de Trabajo Personal Horas de Cátedra. Básica. Resultados de Aprendizaje

UNIVERSIDAD AUTÓNOMA DE CHIHUAHUA Clave: 08MSU0017H. Clave: 08USU4053W FACULTAD DE INGENIERÍA PROGRAMA DEL CURSO: PROBABILIDAD Y ESTADISTICAS

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Econometría 1. Karoll GOMEZ Segundo semestre 2017

Econometría de Económicas Ejercicios para el tema 2 y 3

Curso: Métodos de Monte Carlo Unidad 2, Sesión 5: Cálculo de intervalos de confianza

Tema 2. Heterocedasticidad. 1 El modelo de regresión lineal con errores heterocedásticos

Taller I Econometría I

TEMA 5: Especificación y Predicción en el MRL

Modelos para Variables Censuradas y Truncadas

Transcripción:

Econometría Avanzada FLACSO 2014

Hemos cubierto: Mapa Planteamiento de una pregunta económica de interés Diferencias entre econometría y estadística Métodos: Lineales (MCO) revisión, variables instrumentales No-lineales: ML, MCNL, GMM Basado en supuestos de distribución de y Basado en información/modelo a priori de no-linealidad Metodología generalizada, permite incorporar más información a estimación (+ cierta ganancia de eficiencia), IV no lineales

Mapa Hasta ahora: Hemos hablado únicamente de datos transversales (no existe el tiempo) (A) Quedarían: Series de tiempo (B) Datos de Panel (datos longitudinales) - (A+B)

Que nos queda? 1. Concluir métodos para datos transversales Otros métodos (datos transversales): Modelos de decisión discreta: Probit, Logit, multinomiales Tobit (truncamiento) Inferencia: tests de hipótesis (cobertura incluye modelos lineales, no lineales, series de tiempo, datos de panel) 2. Métodos de panel (introducción)

Inferencia

Distribución asintótica (GMM) En cualquier modelo, inferencia se basa en distribución asintótica de los estimadores. En su forma más general: θ GMM a ~ N θ 0, (G 0 W 0 G 0 ) 1 (G 0 W 0 S 0 W 0 G 0 )(G 0 W 0 G 0 ) 1 G 0 = h (CPO) θ S 0 = h θ h θ W 0 = 1/S 0 1. Matriz de Varianza Covarianza de los Estimadores (k x k) 2. Inferencia (errores estándares) de θ o sus combinaciones tiene que ser función de los elementos de esta matriz

Inferencia: Tests de hipótesis (cap 7 CT) Versión no-lineal, ej.: (restricción) Existe una versión no-lineal del test de Wald, el cual se deriva utilizando el método Delta (ver CT 7.2). Dicho método, calcula la varianza de h θ, v h θ de manera que inferencia pueda ser llevada a cabo a través de: Dicha varianza es una función no-lineal de la restricción y de la varianza de los parámetros

Inferencia: Tests de hipótesis (cap 7 CT) Test de Wald Donde R tiene dimensiones h x k (h=#de hipótesis; k=# de regresores) Ejemplo (modelo lineal): β 0 = 1; β 2 β 3 = 2 ~χ(h)

Inferencia: Tests de hipótesis (cap 7 CT) Alternativa para tests de hipótesis no-lineales : bootstrap. Razones: Test de demasiado complejo calculo para aplicar método delta (Wald). Ej. (Poisson) g x = xexp(xβ) La distribución del estimador en muestras pequeñas puede ser muy distinto a la distribución asintótica. Tarea/taller 4: bootstrap.

Método de Bootstrap Es una variante de métodos de Monte Carlo Estudios de Monte Carlo: simulaciones, basadas en submuestreo, diseñadas para obtener resultados numéricos; es decir cuando no se cuenta con, o no son confiables, resultados analíticos (en nuestro caso, resultados asintóticos) Idea básica de Monte Carlo: existe una relación de interés que se quiere investigar pero para la cual no existe una solución analítica. Se procede a muestrear varias veces utilizando datos de las variables que se conocen para que a través de cada muestreo se vaya mapeando la relación de interés

Método de Bootstrap Idea básica de bootstrap: Existe una muestra de tamaño N sobre la cual se desea investigar alguna propiedad de distribución para propósitos de inferencia Se procede realizar los cálculos pertinentes (ej. Media) para una sub-muestra M<N Se repite el último paso (con reemplazo) muchas veces (ej. 1000) Se obtiene una distribución (empírica) del estadístico de interés y se procede con la inferencia

Ejemplo: Media Muestra de N=10.000 observaciones para variable y Queremos un estimador de la media: E y = y = 1 y N i i=1 Para posteriormente realizar una inferencia: Ho: y=0 Asumiendo y es iid y normalidad, en la situación estándar se puede utilizar el test de t: y ~t(n 1) SE(y) Sin embargo, en caso de no contar con esta última ecuación, se puede recurrir al siguiente ejercicio de bootstrap N

Ejemplo: Media 1. De la muestra de N=10.000 observaciones para variable y, tomar una sub-muestra (1) aleatoria M<N, por ejemplo 40. 2. Calcular la media para la sub-muestra (1): y 1 = 1 y N i,1 i=1 3. Guardar este valor y 1 y repetir ejercicio (con reemplazo) múltiples veces. Por ejemplo 1.000 veces: y 1,, y 1.000 3. Estas 1.000 replicas de la media para cada sub-muestra representan la distribución (empírica) del estimador 4. Por lo tanto, se procede con la inferencia utilizando esta distribución: Cálculo de la media de y 1,, y 1.000 Cálculo del SE de y 1,, y 1.000 Cálculo de los intervalos de confianza M

Método de Bootstrap De manera más general. Consideremos el siguiente modelo estadístico de interés: y i = f(x i, θ, e i ) Posiblemente no lineal en x, θ y el error e. Se procede con la estimación de acuerdo a un método seleccionado por el investigador (ej. MCO, GMM, ML, etc.) y se obtienen θ. Interés está en realizar inferencia con respecto a θ o, de manera más general, a una función de θ: g(θ)

Método de Bootstrap Al igual que en el ejemplo de la media, se procede a tomar una sub-muestra (ej. M=40) de (y,x) Para la primera sub-muestra (1), se procede con la estimación del modelo de acuerdo al método seleccionado por el investigador (ej. MCO, GMM, ML, etc.) y se obtiene θ 1 y posteriormente g(θ 1 ). Se repite el proceso (con reemplazo), múltiples veces (ej. W=1.000) Se genera una distribución de g(θ) utiilzando g θ 1,, g θ W Y se procede con inferencia

Método de Bootstrap Y se procede con inferencia: Media del estimador: g θ i = 1 W W i=1 g θ i Error Estándar: 1 g θ i g θ i 2 W W i=1 Intervalos de confianza (ej. α = 0,95) Se ordena g θ i de menor a mayor: g θ 1 < < g θ W CI low = g θ (1 α)/2w CI high = g θ α/2w

Bootstrap Paramétrico Una variación del Bootstrap se basa en utilizar la distribución de los parámetros calculados, θ, para estimar una distribución del estimador de interés g(θ) Se hace un muestreo aleatorio de θ utilizando la distribución asintótica de θ que arroja la estimación (matriz de varianza-covarianza y vector de estimados θ se utilizan para generar números aleatorios de θ provenientes de una distribución normal multivariada). Para cada θ generada de manera aleatoria con el procedimiento anterior, se estima g(θ) y se procede de manera idéntica al método de bootstrap (no paramétrico) antes descrito.

Bootstrap Paramétrico Esta variación se la utiliza cuando el modelo es de difícil estimación (rutinas que demoran varias semanas o meses, por ejemplo). En el taller 4 ustedes realizarán este ejercicio para los datos generados en el taller 3.

Otros métodos (datos transversales)

Modelos de Decisión Discreta Se dan cuando la variable dependiente corresponde a una y solamente una de varias opciones mutuamente excluyentes. En general el orden de las opciones no es crítica. Versión más sencilla es aquella en la que existen dos opciones: modelos Binarios Opción 1: y es codificada como 0 Opción 2: y codificada como 1

Modelos de Decisión Discreta Como práctica general, estos modelos se los estima con ML puesto que se utiliza la distribución Bernoulli como idónea de la generación de la variable dependiente: f y; λ = p y (1 p) 1 y Adicionalmente, dado que p, por definición, debe estar entre 0 y 1, se realiza un supuesto adicional para su distribución: Función de distribución acumulativa o cdf, la cual es la integral de la función de densidad de probabilidad o pdf (cdf = pdf)

Modelos de Decisión Discreta Las dos opciones más utilizadas en econometría para la cdf son el logit y el probit Logit Probit Cdf de la normal estanarizada p i =

Logit o Probit? Logit tiene algunas ventajas: Su cálculo es más simple pues la cdf es analítica ( solución cerrada ) CPO (necesarias para ML) son sencillas (analíticas) Razón de efectos marginales (odds ratio) es constante: dp/dx i dp/dx j = β i β j (recuerden modelos de índice simple simple index models ):

Logit o Probit? Sin embargo: Probit tiene extensiones importantes como el modelo Tobit (cuando datos están truncados) Algunos lo consideran por esta razón En aplicaciones sencillas (es decir pocas observaciones, pocos regresores), no existen diferencias importantes en tiempo de cómputo entre un modelo u otro. Finalmente, se puede comparar los dos modelos en función del log-likelihood

Qué hacemos cuando estimamos un modelo Logit (o Probit)? Ejemplo (C&T, p. 14.2, 14.3)

Qué hacemos cuando estimamos un modelo Logit (o Probit)? Ejemplo (C&T, p. 14.2, 14.3)

Qué hacemos cuando estimamos un modelo Logit (o Probit)? Ejemplo (C&T, p. 14.2, 14.3)

Logit y Probit como modelos de Variables Latentes En algunos casos, el modelo de interés especifica una variable dependiente, continua, que está explicada por una serie de variables independientes X: Index function model Sin embargo, y no es observable (es latente ). presente o potencial pero no evidente o activo Lo que se observa es una manifestación imperfecta de la misma:

Ejemplos: Logit y Probit como modelos de Variables Latentes y es una variable continua que determina el nivel de riesgo de una corrida bancaria que enfrenta un país. Se observa únicamente y = 1 si se evidencia corrida bancaria y 0 caso contrario y son las horas que una persona está dispuesta a trabajar dependiendo del nivel de salario. Se observa únicamente y = 1 si el individuo está trabajando y 0 caso contrario. y es un indicador de cuánto desea un individuo comprar un artículo. Se observa únicamente y = 1 si el individuo lo compra y 0 caso contrario.

Logit y Probit como modelos de Formalmente: Variables Latentes Porqué?

Logit y Probit como modelos de Formalmente: Variables Latentes Porqué? Volvemos al caso de especificar forma funcional para F (): Probit (normal) o Logit Principal diferencia: aquí se hace un supuesto sobre la distribución del error u en el caso anterior (ej. Taller 3) no existió error (explícito). Esto permite expresar de manera más intuitiva modelos multinomiales

Modelos Multinomiales Extensión directa de modelos binomiales. Intuición es la misma, excepto que al tener más de 2 alternativas, la distribución ya no es binomial sino multinomial. Específicamente, para m alternativas: Adicionalmente, y haciendo uso de la especificación estos modelos como uno de variable latente:

Modelos Multinomiales Por lo tanto, la densidad multinomial (para propósitos de estimación ML) está dada (para un individuo/observación) por: Más específicamente: Con el requerimiento de que: p ij ε 0,1 y que p ij j = 1 Modelo Logit: cumple con estas condiciones; ej:

Modelos Multinomiales Dada la densidad para un individuo i: f i y = p i1 y i1 p im y im = m p ij y ij j=1 Pregunta: Cómo se procedería a la estimación via ML si i = 1, N? Trabajo en grupo: escribir la función likelihood, loglikelihood y la condición de primer orden con respecto a un parámetro β

Modelo Tobit Pueden existir otros problemas de latencia parcial : Censura (Censoring): valores de y superiores a un umbral no son observados (pero si sus variables explicativas). Ej. se tienen datos x (variables explicativas) para todos los individuos, pero datos para la variable y solo para individuos de ingreso bajo y medio (por ej por razones de confidencialidad). Truncamiento (Truncation): caso más severo pues no se observa ni y ni x más allá del umbral. Ej. Solo se observa la muestra de la población de ingresos bajos

Ilustración del problema Simlulación C&T (sección 16.2): Número de horas de trabajo que uno desea trabajar (potencialmente negativo)

Logística Esta semana Clases viernes, Mayo 2 Asignación de taller # 4, entrega 5 de Mayo Siguientes dos semanas: Clases Miércoles y Viernes siguiente semana (5-9 de Mayo), posible laboratorio Mayo 9 Taller 5 (final) entrega Mayo 12 Lunes (12) y Miércoles (14), presentaciones proyecto Viernes (16) examen final (lista de preguntas de preparación será distribuida con 1 semana de anticipación)