Beatriz Sánchez Reyes. 22 de septiembre de 2010

Documentos relacionados
Estimación de una función de gasto en alimentos

Yearly analysis Confidence interval ci ch4

En cada una de las tablas de esta sección se incluyen también los comandos de Stata con los cuales se obtuvo la información.

Solución Taller No. 5 Econometría II Prof. Bernal

Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple

Modelo 1: MCO, usando las observaciones 1994: :03 (T = 218) Variable dependiente: INFLACION

Modelación estadística: La regresión lineal simple

SOLUCION TALLER 1 SOLUCION PUNTO 1. - Función de producción cuadrática. Se espera que: >0 porque x2 es un insumo de producción

Sección Teórica. , cuya información se presenta a continuación. Completar las celdas necesarias para responder a las preguntas 1 a 5.

SOLUCIÓN PROPUESTA. Es de notar que dadao que los datos provienen de un corte transversal, valores de bondad de ajuste resultan ser bajos.

INTERVALOS DE CONFIANZA

INTEREXPORT TELECOMUNICACIONES Y SERVICIOS S.A.

Muestreo e inferencia

... *Elasticidad ingreso del gasto en electricidad (Modelo Restringido). reg lviv ling

Universidad de la República, Facultad de Ciencias Económicas y Administración.

EJERCICIOS CAPITULO 9. GUJARATI-PORTER (2010)

Consecuencias económicas de eventos climáticos en la gestión hídrica de la cuenca del Canal de Panamá

Ejercicio 1 (20 puntos)

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

Regresión por Cuantiles

Multiple Linear Regression

Repaso de estadística básica. Juan D. Barón Santiago de Chile, 8 de abril de 2013

TEORÍAS MODELOS DATOS EMPÍRICOS

Varianza del error no constante: heteroscedasticidad. Fortino Vela Peón Universidad Autónoma Metropolitana

MULTICOLINEALIDAD (Gujarati y Porter, Capítulo 10) Ejemplo de la sección donde

PRUEBA DE FALTA DE AJUSTE (Lack-of-fit Test) Fortino Vela Peón

Impacto de la Crisis del Sector Eléctrico en la Economía Dominicana Parte I: Hogares

Análisis de la evolución y tendencia de las tasas de hepatitis A en Chile desde a 2002

Ejercicio 1(10 puntos)

Análisis de Tendencias de los indicadores en las Encuestas de Verificación Nacional Muestral

EJC 15: DATOS PANEL. PRIMERA DIFERENCIA-EFECTOS FIJOS-EFECTOS ALEATORIOS Wooldridge, pags. 419, 441, 449, 452.

TEMA 2.1: MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

Bienvenidos a EEiPP 2013! Introducción al Taller Internacional de Encuestas y Evaluación de Impacto

Funciones de Regresión No Lineales (SW Cap. 6)

Instrumentos Económicos y Regulación de la Contaminación Industrial: Primera aproximación el caso del Río Bogotá

Guía de interpretaciones y comandos STATA en apoyo a la solución de algunos ejercicios de la tarea para el Examen Final con

Sesión 8 Procesando la Encuesta de Demografía y Salud (ENDS) Colombia 2010

EXAMEN DE ECONOMETRÍA 08/07/99-1

Universitat Pompeu Fabra Licenciatura de ADE y Economía Econometría I / 10143) Profesor: Javier Coronado Examen Final Diciembre 2011

Iker Ustárroz, Juan M. Cabasés, María Errea Universidad Pública de Navarra

Images created with STATA software. Regresión múltiple. Por qué controlar?

Impacto Cuantitativo de INFOCAP en el ingreso y empleo de sus ex - alumnos

Multiple Linear Regression

peso edad grasas Regresión lineal simple Los datos

Econometría Tutorial 6 Ejercicios de Multicolinealidad

Estimación de Efectos Causales Dinámicos (SW Capítulo 13) efecto causal dinámico

INFLUENCIA DE LA TASA DE INTERÉS DE POLÍTICA MONETARIA SOBRE LAS TASAS DE INTERÉS ACTIVA Y PASIVA

ANÁLISIS ESTADÍSTICO DE LAS PUNTUACIONES PARA ASCENSOS DOCENTES

Sesión 8 - Modelos con datos de conteo

Técnicas Cuantitativas para el Management y los Negocios

Proyectando los efectos de estrategias de adaptación en el consumo residencial de agua en Santiago

Ejercicios Wooldridge (2010) 5ª. ed.

Bioestadística. Curso Práctica: La recta de regresión

Considere la tasa de nacimiento (B) como la variable respuesta y la actividad económica de las mujeres (W) como variable regresora.

Práctica 3: Regresión simple con R

Tablas de errores de muestreo

DETERMINANTES DE LOS INGRESOS

ECONOMÍAS DE ESCALA EN LAS UNIVERSIDADES PÚBLICAS ESPAÑOLAS

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

Medidas de Tendencia central Medidas de Dispersión Medidas de Asimetría

Estadística II Ejercicios Tema 5

Endogeneidad y heterogeneidad no observada. 2. Modelo de regresión clásico y endogeneidad

Método de cuadrados mínimos

Demanda de los servicios TIC en hogares de República Dominicana. Fabricio Gómez Mazara, Msc Miembro del Consejo Directivo INDOTEL

Javier Roca Pardiñas Prof. Titular de Universidade Dpto. Estatística e I.O. Universidade de Vigo

COLEGIO CALASANCIO. MADRID. ESTADÍSTICA UNIDIMENSIONAL. 4º E.S.O.

PREGUNTAS TIPO EXAMEN- ESTADÍSTICA DESCRIPTIVA 2

Regresión múltiple. Efecto de varias variables ambientales sobre una especie de ganso migratorio. Luz

ESTADÍSTICA Camerina Laura Ramírez Gallegos

MSc. Víctor Hugo Herrera Ballesteros

REGRESIÓN CUANTÍLICA: ESTIMACIÓN Y CONTRASTES

Tema: Análisis de regresión y análisis de varianza. La tabla ANOVA tiene la siguiente representación: CMR F c CME SCE CME=SCE/GLE

EXTENSIÓN DEL MODELO DE REGRESIÓN LINEAL DE DOS VARIABLES

Práctica 4 EJERCICIOS 1.- REGRESIÓN LINEAL SIMPLE 5.1 Regresión de Peso sobre Altura Datos en Encuesta.sgd a) Estudio descriptivo de ambas variables

L FME al YoMO Se cumplen los cánones de belleza? Pedro Delicado, Lourdes Rodero 1 de marzo de 2017

Impacto de la Crisis del Sector Eléctrico en la Economía Dominicana Parte II: Empresas

ESTIMACIÓN DE LA DEMANDA DE CIGARRILLOS EN PANAMA (Consideraciones para Política Fiscal)

Econometría I (LADE). Curso 2001/2002 PRÁCTICA 08

LA VOLATILIDAD DEL PRECIO DEL PETRÓLEO Y SUS EFECTOS EN LA ECONOMÍA ECUATORIANA EN LA ÚLTIMA DECADA.

Crecimiento y Desarrollo Económicos

GEOESTADÍSTICA APLICADA

Estadística Descriptiva en R: Parámetros y estadísticos. José Enrique Martín García Universidad Politécnica de Gimialcón (Copyright 2016)

GUIA DOCENTE ESTADISTICA

ANÁLISIS DE REGRESIÓN

Los datos siguientes contienen indicadores demográficos y criminales sobre 47

ANEXOS. 1) Modelo Probit.

Regresión Múltiple b=read.table("datoempleado.dat",header=t,sep="\t")

ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL

Regresión con Datos de Panel (SW Ch. 8)

El Crédito Educativo en la Educación Superior en el Ecuador: Análisis de resultados

1. MEDIDAS DE TENDENCIA CENTRAL

ESTADÍSTICA 1.- NOCIONES GENERALES

MEDIDAS DE POSICIÓN CUANTILES CUARTILES DECILES CARLOS DARIO RESTREPO

con los supuestos clásicos, uno de ellos es que ninguna de las variables X 1, X 2,, X K es

18/06/2010 REGRESIÓN LINEAL MULTIVARIADA. Descripción. Objetivos

Regresión Múltiple (SW Capítulo 5) Estimación MCO de la relación entre las notas y el número de estudiantes por profesor:

Transcripción:

Regresión cuantílica Beatriz Sánchez Reyes 22 de septiembre de 2010

Índice Definición de cuantil Regresión cuantílica - Estimación - Inferencia Regresión mediana (Ejemplo) Regresión cuartílica (Ejemplo)

Definición de cuantil Un cuantil es un valor b de la muestra que deja por debajo una proporción de observaciones igual a θ* y una proporción (1-θ) de observaciones por encima. Los cuantiles más utilizados son: - Mediana - Cuartiles - Deciles - Percentiles o centiles Una forma alternativa de expresar los cuantiles es a través del siguiente problema de minimización: *0<θ<1

Regresión cuantílica La regresión cuantílica (Koenker y Basset, 1978) busca modelizar la relación existente entre x e y para distintos cuantiles de la distribución de la variable dependiente y. y i =x i β θ + u i

Estimación (I) La estimación de los parámetros en el caso de la regresión cuantílica se lleva a cabo a través de la minimización de las desviaciones absolutas ponderadas con pesos asimétricos:

Estimación (II) Una forma alternativa a la expresión anterior: Donde tal que: ρ(u) (θ-1) θ u

Estimación (III) Expresado como un problema de programación lineal, se tiene la siguiente expresión:

Inferencia (I) Cálculo de Λ θ mediante bootstrapp (Efron, 1979): donde:

Inferencia (II) Pseudo- R 2 =

Regresión mediana La regresión mediana es un caso particular de la regresión cuantílica en el que: θ=0,5 Por tanto, la expresión para el cálculo de los parámetros de la regresión quedaría de la siguiente manera:

Ejemplo 1: Regresión mediana ante la presencia de atípicos var_pob i =(renta_pc) i β θ + u i var_pob i : Variación de la población en cada uno de los municipios extremeños de más de 5.000 habitantes entre los años 1999 y 2009. (renta_pc) i : Renta per cápita de los municipios extremeños de más de 5.000 habitantes en 2007 (último año disponible). θ=0,5

Paso 1.- Estimar los modelos: var_pob i =(renta_pc) i β MCO + u i var_pob i =(renta_pc) i β Med + u i Paso 2.- Estimar y comparar los modelos anteriores ante la presencia de un dato atípico.

. REGRESIÓN MCO reg var_pob renta_pc Source SS df MS Number of obs = 40 -------------+------------------------------ F( 1, 38) = 16.03 Model 688.84859 1 688.84859 Prob > F = 0.0003 Residual 1632.80496 38 42.9685515 R-squared = 0.2967 -------------+------------------------------ Adj R-squared = 0.2782 Total 2321.65355 39 59.5295781 Root MSE = 6.555 ------------------------------------------------------------------------------ var_pob Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- renta_pc.0039573.0009884 4.00 0.000.0019565.0059582 _cons -39.478 10.9443-3.61 0.001-61.63358-17.32242 ------------------------------------------------------------------------------. REGRESIÓN CUANTÍLICA qreg var_pob renta_pc Iteration 1: WLS sum of weighted deviations = 197.2375 Iteration 1: sum of abs. weighted deviations = 197.00522 Iteration 2: sum of abs. weighted deviations = 195.62679 Median regression Number of obs = 40 Raw sum of deviations 256.7947 (about 3.8062935) Min sum of deviations 195.6268 Pseudo R2 = 0.2382 ------------------------------------------------------------------------------ var_pob Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- renta_pc.0047281.001102 4.29 0.000.0024972.006959 _cons -48.34135 12.20507-3.96 0.000-73.04922-23.63347 ------------------------------------------------------------------------------ -10 0 10 20-10 0 10 20 9000 10000 11000 12000 13000 14000 renta_pc var_pob Fitted values 9000 10000 11000 12000 13000 14000 renta_pc var_pob Fitted values

. REGRESIÓN MCO reg var_pob renta_pc Source SS df MS Number of obs = 40 -------------+------------------------------ F( 1, 38) = 0.01 Model 1.65009625 1 1.65009625 Prob > F = 0.9410 Residual 11280.3495 38 296.851303 R-squared = 0.0001 -------------+------------------------------ Adj R-squared = -0.0262 Total 11281.9996 39 289.282041 Root MSE = 17.229 ------------------------------------------------------------------------------ var_pob Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- renta_pc -.0001937.0025978-0.07 0.941 -.0054527.0050653 _cons 8.570905 28.76618 0.30 0.767-49.66319 66.805. REGRESIÓN CUANTÍLICA qreg var_pob renta_pc Iteration 1: WLS sum of weighted deviations = 313.11749 Iteration 1: sum of abs. weighted deviations = 300.26033 Iteration 2: sum of abs. weighted deviations = 295.65072 Iteration 3: sum of abs. weighted deviations = 288.26053 Iteration 4: sum of abs. weighted deviations = 287.3096 Iteration 5: sum of abs. weighted deviations = 287.24892 Median regression Number of obs = 40 Raw sum of deviations 348.4169 (about 3.8062935) Min sum of deviations 287.2489 Pseudo R2 = 0.1756 ------------------------------------------------------------------------------ var_pob Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- renta_pc.0047281.001102 4.29 0.000.0024972.006959 _cons -48.34135 12.20507-3.96 0.000-73.04922-23.63347 0 50 0 50 100 100 9000 10000 11000 12000 13000 14000 renta_pc 9000 10000 11000 12000 13000 14000 renta_pc var_pob Fitted values var_pob Fitted values

Regresión cuartílica La regresión cuartílica es otro caso particular de la regresión cuantílica en el que: θ=0,25; y i =x i β 0,25 + u i θ=0,5; y i =x i β 0,50 + u i θ=0,75 y i =x i β 0,75 + u i

Ejemplo 2: Regresión cuartílica ante la presencia de heteroscedasticidad Base de datos: Ingreso y gasto medio mensual de 200 individuos. Consumo y gasto medio mensual 6.000 5.000 Gastos ( ) 4.000 3.000 2.000 1.000 0 0 1.000 2.000 3.000 4.000 5.000 6.000 Ingresos ( )

Paso 1.- Estimar los modelos: gasto i =ingreso i β 0,25 + u i gasto i =ingreso i β 0,50 + u i gasto i =ingreso i β 0,75 + u i Paso 2.- Comprobar que hay diferencias significativas entre cuartiles.

Estimación del modelo para θ=0,25; θ=0,50 y θ=0,75.. sqreg gasto ingreso, q(.25.50.75) (fitting base model) (bootstrapping...) Simultaneous quantile regression Number of obs = 200 bootstrap(20) SEs.25 Pseudo R2 = 0.7072.50 Pseudo R2 = 0.7755.75 Pseudo R2 = 0.8243 ------------------------------------------------------------------------------ Bootstrap gasto Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- q25 ingreso.6205204.0227141 27.32 0.000.5757277.665313 _cons 233.2106 23.56546 9.90 0.000 186.7391 279.6821 -------------+---------------------------------------------------------------- q50 ingreso.7431851.0389875 19.06 0.000.6663011.8200691 _cons 179.2339 36.59756 4.90 0.000 107.0628 251.4049 -------------+---------------------------------------------------------------- q75 ingreso.8626156.0298075 28.94 0.000.8038346.9213966 _cons 103.004 29.64797 3.47 0.001 44.53763 161.4703 ------------------------------------------------------------------------------

Comprobación de que existen diferencias entre cuartiles. iqreg gasto ingreso, q(.25.75) (fitting base model) (bootstrapping...).75-.25 Interquantile regression Number of obs = 200 bootstrap(20) SEs.75 Pseudo R2 = 0.8243.25 Pseudo R2 = 0.7072 ------------------------------------------------------------------------------ Bootstrap gasto Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- ingreso.2420952.0268284 9.02 0.000.1891892.2950013 _cons -130.2067 21.62142-6.02 0.000-172.8445-87.56885 ------------------------------------------------------------------------------. test [q25]ingreso=[q75]ingreso ( 1) [q25]ingreso - [q75]ingreso = 0 F( 1, 198) = 66.81 Prob > F = 0.0000

Conclusión La minimización de las desviaciones en valor absoluto en lugar de al cuadrado (MCO), hace que la regresión cuantílica sea especialmente útil ante la presencia de atípicos, heteroscedasticidad o cambio estructural.