5. Descripción teórica de los modelos econométricos. La naturaleza del estudio que esta tesis pretende realizar nos lleva a enfrentarnos

Documentos relacionados
1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

Estimación de un modelo de ecuaciones simultáneas usando el software econométrico Gretl

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 7)

Universidad de la República, Facultad de Ciencias Económicas y Administración.

Multicolinealidad. Universidad de Granada. RSG Incumplimiento de las hipótesis básicas en el modelo lineal uniecuacional múltiple 1 / 17

Análisis de datos Categóricos

c). Conceptos. Son los grupos o conceptos que se enlistan en las filas de la izquierda de la tabla

Sistemas de ecuaciones lineales dependientes de un parámetro

Determinación del tamaño de muestra (para una sola muestra)

Conceptos básicos estadísticos

Facultad de Ciencias Sociales - Universidad de la República

Regresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A

Otra característica poblacional de interés es la varianza de la población, 2, y su raíz cuadrada, la desviación estándar de la población,. La varianza

UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ECONOMICAS

Econometria de Datos en Paneles

LA FUNCIÓN DE DISTRIBUCIÓN DE PROBABILIDAD DE LA LLUVIA ANUAL CUANDO OCURRE UN CAMBIO CLIMÁTICO

INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016

MARCO NORMATICO CONTABLE PARA EMPRESAS QUE NO COTIZAN EN EL MERCADO DE VALORES Y QUE NO CAPTAN NI ADMINISTRAN AHORRO DEL PÚBLICO

2. CONOCIMIENTO Actividad por la cual se adquiere certeza de la realidad, de la existencia del entorno, con características comprobadas.

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

Teorema Central del Límite (1)

Medidas descriptivas I. Medidas de tendencia central A. La moda

Análisis Probit. StatFolio de Ejemplo: probit.sgp

Cómo llevar a cabo un trabajo empírico

2 = 1 0,5 + = 0,5 c) 3 + = = 2

Ejercicios T2 y T3.- DISTRIBUCIONES MUESTRALES Y ESTIMACIÓN PUNTUAL

ENUNCIADOS DE PROBLEMAS

ANÁLISIS DISCRIMINANTE

Tema 5. Contraste de hipótesis (I)

Mercedes Granda Departamento de Electrónica y Computadores. Las propiedades de las redes de Petri nos permiten

Unidad 1: Espacio de Probabilidad

Conceptos Básicos de Inferencia

Lección 12: Sistemas de ecuaciones lineales

MODULO VIII. Semana 1 ASPECTOS DE EVALUACIÓN FINANCIERA, ECONÓMICA, SOCIAL Y AMBIENTAL.

ESTADÍSTICA DESCRIPTIVA

4. NÚMEROS PSEUDOALEATORIOS.

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

ECONOMETRIA II. 4º Curso Licenciatura en Economía. INTRODUCCIÓN Algunos conceptos de estimación y teoría asintótica.

INFERENCIA ESTADISTICA

SECCIÓN AU 420 UNIFORMIDAD EN LA APLICACIÓN DE PRINCIPIOS DE CONTABILIDAD GENERALMENTE ACEPTADOS

Prácticas de Ecología Curso 3 Práctica 1: Muestreo

TEMA 8.- NORMAS DE MATRICES Y

Ecuaciones exponenciales y logaritmicas

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Cálculo de bisección inversa mediante mínimos cuadrados

EVALUACIÓN SUMATIVA. 2.2 Resuelve problemas, utilizando el principio de la multiplicación con seguridad.

A. Menéndez Taller CES 15_ Confiabilidad. 15. Confiabilidad

PROYECTO DE INVESTIGACIÓN

Econometría de series de tiempo aplicada a macroeconomía y finanzas

Tema 4: Probabilidad y Teoría de Muestras

Capítulo IV. Estrategia Econométrica. La metodología utilizada en esta tesis es la idónea para evaluar la hipótesis planteada

UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO

Nivel de Satisfacción en los afiliados. Régimen Estatal de Protección Social en Salud Zacatecas

ESTIMACIÓN PUNTUAL Julián de la Horra Departamento de Matemáticas U.A.M.

Percepción de los Precios por Parte de los Hogares: El caso de la Electricidad en el Perú

Contraste de hipótesis Tema Pasos del contraste de hipótesis. 1.1 Hipótesis estadísticas: nula y alternativa. 1.3 Estadístico de contraste

Economía Aplicada. ¾Es importante el tamaño de la clase? Un experimento controlado

DEPARTAMENTO DE MATEMÁTICAS. IES GALLICUM

Tomamos como imagen de prueba la figura 4.17 en escala de grises. Figura Imagen de prueba.

FINANZAS. introducción a los derivados crediticios y, por último, un caso de cobertura de un porfolio de préstamos utilizando Credit Default Swaps.

EL PAPEL DE LA ESTADISTICA EN O Y M. Objetivo: Identificar índices estadísticos, y métodos más convenientes, para aplicarlos en el estudio de O y M.

CARTA DESCRIPTIVA. Clave: ECO Créditos: 8. Conocimientos: Probabilidad y estadística. Algebra lineal. Econometría I.

DESPLIEGUE DE LA CALIDAD (Quality Function Deployment, QFD)

Tema 1. El Modelo de Regresión Lineal con Regresores Aleatorios.

Método de cuadrados mínimos

METODOLOGIA PARA LA CONSTRUCCION Y APLICACION DE MODELOS DE SIMULACION DINAMICA A PROCESOS DE IMPORTANCIA AGRÍCOLA

4. Complementos sobre Problemas de Contorno para S.D.O. Lineales. 4. Complementos sobre Problemas de Contorno

Departamento de Matemáticas. ÁLGEBRA: Ecuaciones

TEMA 3: Contrastes de Hipótesis en el MRL

ETAPA: FORMACIÓN PROFESIONAL NIVEL: CICLO MEDIO DE COMERCIO MATERIA: RELACIONES EN EL ENTORNO DE TRABAJO OBJETIVOS

Z i

VARIABLES ESTADÍSTICAS BIDIMENSIONALES

Los Métodos de Valoración Indirecta (Costo De Viaje)

ANEXO 1 EJEMPLO DE CALCULO DE RESISTIVIDAD APARENTE. Subestaciones de Media Tensión Curso Fernando Berrutti Staino

ANALISIS Y DISEÑO DE SISTEMAS HERRAMIENTAS PARA DETERMINAR REQUERIMIENTOS DE SISTEMAS

UNIDAD DIDACTICA. Esta unidad es el punto de partida para la correcta asimilación de las posteriores unidades didácticas del módulo.

Métodos Estadísticos Multivariados

Análisis de Componentes de la Varianza

Modelos Estocásticos I Tercer Examen Parcial Respuestas

HOJA DE TRABAJO UNIDAD 3

PROYECTO DE TESIS (INVESTIGACION CUALITATIVA)

GUION TÉCNICO AUDIO. El Conjunto De Los Números Reales. realidad, es una ciencia resultado de más de 4 mil años de

Estadística Básica. Unidad 2. Actividades

EJERCICIOS DE ÁLGEBRA LINEAL TEMA 1 ESPACIOS VECTORIALES

Repaso de conceptos de álgebra lineal

3. ANÁLISIS DE DATOS DE PRECIPITACIÓN.

Algunas Distribuciones Continuas de Probabilidad. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

4º E.S.O. Matemáticas A

Objetivos formativos de Álgebra

Tema 4: Probabilidad y Teoría de Muestras

Modelos de PERT/CPM: Probabilístico

Tema 5. Muestreo y distribuciones muestrales

Apéndice sobre ecuaciones diferenciales lineales

Econometría II Grado en finanzas y contabilidad

Unidad II: Fundamentos de la teoría de probabilidad

Impacto del impuesto al precio de las gasolinas sobre la distribución del presupuesto de consumo en las familias de México

MÓDULO: MÉTODOS CUANTITATIVOS

CAPÍTULO 4 RECOPILACIÓN DE DATOS Y CÁLCULO DEL VPN. En el presente capítulo se presenta lo que es la recopilación de los datos que se tomarán

Unidad 5: MODELO DE COMPORTAMIENTO - ESQUEMA DE DATOS CARACTERÍSTICAS DEL ESQUEMA DE DATOS DIAGRAMA ENTIDAD RELACIÓN (D.E.R.)

Transcripción:

5. Descripción teórica de los modelos econométricos El problema de la auto-selección La naturaleza del estudio que esta tesis pretende realizar nos lleva a enfrentarnos inevitablemente a un problema de selección endógena. Al haber una selección entre dos regímenes, como lo son el empleo formal y el informal, ésta puede ser de dos tipos. En primer lugar, puede haber una selección exógena, es decir que las muestras de los dos regímenes se construyan a partir de un criterio que no esté relacionado con la variable dependiente del modelo. Este caso no presenta problemas econométricos ya que el muestreo, al ser aleatorio no influye en la estimación de los parámetros del modelo. Por otro lado, también puede darse el caso en que la selección de las muestras de los dos regímenes esté basada total o parcialmente en los valores tomados por la variable dependiente. Al darse esto nos estamos enfrentando a una selección endógena de la muestra, la cual lleva a estimaciones de parámetros inconsistentes al menos de que se apliquen medidas para corregir por este problema. La selección endógena se puede deber, a su vez, a dos razones. En primer lugar puede haber una auto-selección de las muestras que se da si los resultados están siendo afectados por la decisión personal de los individuos de estar en un régimen u otro. La otra razón por la que puede haber selección endógena es si los participantes de un régimen están siendo sobre representados en la muestra de una manera deliberada (Cameron y Trivedi, 005). En nuestro estudio vamos a tratar con dos regímenes compuestos por trabajadores formales e informales. Debido a que vamos a estar buscando estimar los salarios de estos grupos de trabajadores, y a que la decisión de una persona de trabajar

en un sector u otro casi seguramente se ve afectada por los salarios de estos sectores, el problema de la auto-selección es un obstáculo que se debe superar para obtener estimaciones adecuadas. El modelo con el que vamos a trabajar nosotros es el de endogenous switching regression, que por su naturaleza de estimación conjunta de las ecuaciones de los salarios con una ecuación de selección corrige por el problema de auto-selección. No obstante, para describir la manera en que se logra hacer dicha corrección utilizando la ecuación de selección, se mostrará primero un modelo de selección endógena más simple que busca estimar una sola ecuación para simplificar la explicación. La presentación que se hace a continuación sigue las explicaciones que ofrecen Wooldridge y Cameron y Trivedi a la solución del problema de autoselección (Wooldridge, 000; Cameron y Trivedi, 005). Al presentarse el problema de la selección endógena, los modelos deben recurrir a la estimación de una segunda ecuación además de su ecuación objetivo, a la que se puede denominar con el nombre de ecuación de selección. Esta ecuación estima el valor de una variable latente x * que determina la participación o no participación de un individuo en la muestra. El valor de dicha variable latente no se observa; lo único que el investigador puede observar es si el individuo se encuentra o no participando en la actividad determinada. De esta manera obtenemos el siguiente modelo de dos ecuaciones: () x* = yβ+ ε () x* = yβ + ε donde y y y son vectores de características específicas de los individuos y β y β son vectores de parámetros. En este caso la primera ecuación determina la participación de una persona en la actividad y la segunda es la de interés para la

investigación. No obstante, en relación a x *, lo que el investigador puede en realidad observar es x, que a su vez toma los valores: (3) x si x* > 0 x = ó 0 si x* 0 Además, dado que x determina la selección de la muestra es importante notar también que existe una x (que determina a la variable de interés) que toma valores de x * si x * > 0 (es decir, si el individuo participa) y que no se observa si x * 0. El ejemplo típico de este caso es el del mercado laboral. Las personas que un investigador puede observar trabajando en un momento dado son una sub-muestra de la población potencialmente activa, que ha tomado ya anteriormente la decisión de trabajar. Así pues, en ese caso, x * sería una variable latente que determina la decisión de participar en el mercado laboral de un individuo y x * sería la variable de interés, como por ejemplo, las horas de trabajo que realiza una persona dado que se encuentra en el mercado laboral. Ahora, observando las ecuaciones y, vemos que si ε y ε están correlacionados surgen problemas de estimación de los parámetros β. Es decir, volviendo al ejemplo anterior, si las características no observadas de un individuo determinan tanto su participación en el mercado laboral como las horas que éste decide trabajar una vez dentro de dicho mercado, las dos ecuaciones no pueden estimarse por separado sin obtener parámetros sesgados. Para ver la prueba econométrica de dicha afirmación, referirse a Wooldridge 000 pg. 560.

Existe un método propuesto por Heckman para resolver el problema anterior (Heckman, 976). Para que este método funcione es necesario que se cumplan las siguientes condiciones: - que el vector de características y sea estrictamente un subconjunto del vector y ; - que existan elementos en y que no se encuentren dentro de y ; y - que el término de error ε sea independiente de y y por lo mismo de y. Bajo estas condiciones, y además si ε se distribuye de manera normal, el problema de la correlación entre ε y ε se puede resolver incluyendo en la estimación el Inverse Mills Ratio (IMR), que representa la razón de la función de densidad de probabilidad entre la función de densidad acumulada de una distribución. Es decir: (4) φ( c) λ( z) = Φ () c Donde λ(z) es el IMR. Heckman argumenta además que esta razón se puede obtener utilizando un probit para estimar la participación de los individuos en función de las variables del vector y y utilizando la muestra completa (tanto a los participantes como a los no participantes) en la estimación. Con todo lo anterior, el método propuesto por Heckman se compone de dos pasos. Primero se debe utilizar todas las observaciones de la población para estimar un modelo probit de la participación en función de la matriz de parámetros y. Con esto se puede obtener el IMR. Una vez teniendo lo anterior, el segundo paso consiste en usar la muestra restringida (solamente a los participantes) para estimar la ecuación de x en función de y y λ estimado. Con esto se resuelve el problema de la auto-selección de la muestra y las estimaciones de β, bajo determinadas condiciones, se vuelven consistentes.

Modelo teórico de las endogenous switching regressions El modelo de endogenous switching regressions puede ser visto como un caso especial de los modelos de selección endógena de la muestra en el cual se estiman, al mismo tiempo, dos ecuaciones objetivo correspondientes a dos regímenes distintos. Así pues, en un modelo de switching regressions lo que nos proponemos es estimar dos ecuaciones de tipo: (5) y = β' x+ ε (6) y0 = β0' x0 + ε 0 donde los errores ε y ε 0 están distribuidos de manera normal con varianzas constantes y Corr[ ε, ε 0 ] = ρ 0. Como se puede observar, las ecuaciones 5 y 6 ambas estiman la misma variable dependiente con la diferencia de que cada una lo hace para un régimen distinto de individuos. Debido a que, además, en este modelo la separación de los individuos entre los dos regímenes se hace de manera endógena, existe la necesidad de una tercera ecuación de selección que, como vimos anteriormente, es indispensable para evitar errores por la auto-selección. Dicha ecuación de selección es muy parecida a la que describimos en el apartado anterior, con la diferencia de que ésta, en lugar de modelar la probabilidad de participación en la muestra, estima la probabilidad de que un individuo se encuentre dentro de un régimen u otro, suponiendo que para cada observación solamente se presenta un régimen en un momento dado (Greene, 995). La ecuación de selección, al igual que en el apartado anterior, se estima mediante una variable latente no observada, y depende de si esta variable latente pasa un cierto umbral, el que un individuo se encuentra en un régimen u otro. Así pues tenemos:

(7) z* = α ' x3 + ε 3 (8) si z* > 0 z = ó 0 si z* 0 Donde la ecuación 7 estima la variable latente, y la ecuación 8 muestra la división entre los regímenes 0 y que se hace dependiendo del valor de la variable latente estimada. En relación a los modelos de respuesta binaria como el probit, se puede decir que una forma de motivarlos es justamente a partir de una variable latente, por lo que este tipo de modelo puede ser usado para estimar la ecuación de selección. El caso típico descrito por las switching regressions es el de la migración donde una persona puede decidir entre dos regímenes: migrar o no migrar. El salario estimado de los individuos depende, a su vez, de la decisión sobre migración anteriormente tomada por ellos, por lo que se incluye una ecuación que determina dicha decisión. A su vez, la decisión se puede decir que se toma en base a una variable latente que sería el costo de moverse del lugar A al lugar B y del premio salarial recibido en caso de migrar. Así pues, el salario observado será el del lugar B si el costo es inferior al beneficio (el umbral) de mudarse. De lo contrario, si el costo excede el umbral marcado por el beneficio, la persona no se moverá y su salario observado será el del lugar A (Greene, 995). En nuestro caso, los dos regímenes serán el del empleo informal o formal. Dado que la definición que hemos asumido de la informalidad está basada solamente en el empleo principal de la persona, en un momento dado un individuo solamente se puede encontrar dentro de uno de estos dos regímenes. No obstante, la que se propone en este estudio es solamente una de varias aplicaciones del modelo de

endogenous switching regressions al mercado laboral. Varios otros estudios se han hecho sobre cuestiones laborales como el trabajo femenino intermitente (Hotchkiss y Pitts, 003) o la oferta de trabajo de hombres casados (Ransom, 985) utilizando este mismo método, por lo que se puede decir que su aplicación al mercado laboral es común. Los modelos de endogenous switching se pueden estimar ecuación por ecuación con un método de mínimos cuadrados en dos pasos, siendo este método, no obstante, ineficiente en este caso (Loshkin y Sajaia, 004). Debido a esto, el procedimiento utilizado por el programa de cómputo de STATA, que fue el que se ocupó para las estimaciones de esta tesis, implementa un método de Máxima Verosimilitud. El programa utilizado fue desarrollado por Loshkin y Sajaia y, tal como ellos lo explican, sirve para estimar simultáneamente la ecuación de selección utilizando un modelo binario y las otras dos ecuaciones continuas del modelo con la finalidad de arrojar estimadores consistentes. Necesidad de una variable de exclusión Como hemos mencionado, el modelo propuesto por Heckman para resolver el problema de la auto-selección está basado en tres condiciones, la segunda de las cuales dice que es necesario que existan elementos en la matriz de variables explicativas de la ecuación de selección que no se encuentren dentro de la matriz de variables explicativas de las ecuaciones objetivo. Es decir, debe incluirse por lo menos una variable que afecte la selección, pero que no tenga un efecto parcial sobre las variables explicativas de la ecuación objetivo. Esto no es absolutamente necesario Para una explicación más profunda del programa desarrollado para el STATA ver Loshkin y Sajaia 004

para aplicar el procedimiento, sin embargo los resultados son menos convincentes si no se cuenta con una variable de exclusión. La razón por la que esto pasa es que al ser el IMR una función aproximadamente linear para muchos de sus argumentos, de no tener un parámetro de exclusión la estimación de λ puede estar altamente correlacionada con las variables explicativas del modelo, lo cual causa multicolinealidad y errores estándar muy altos para la estimación de los β. Debido a esto, si no tenemos una variable de exclusión, se vuelve muy complicado si no imposible, distinguir la auto-selección de una mala especificación de la forma funcional de la ecuación que estamos buscando estimar, con lo cual nos enfrentamos a un fuerte problema de identificación (Wooldridge, 000). Debido a que el modelo de endogenous switching presentado en la tesis utiliza la misma corrección de Heckman basada en el uso del IMR que ha sido descrita anteriormente, éste se enfrenta inevitablemente al mismo problema de identificación. Para resolverlo se debe cuidar de incluir una o más variables en la estimación de la ecuación de selección que no estén dentro de la estimación de las otras dos ecuaciones del modelo. Además, estas variables deberán poder usarse como variables de exclusión, es decir, teóricamente no deberían afectar la variable estimada en las otras dos ecuaciones. No obstante, se debe mencionar que a pesar de que la inclusión de una variable de exclusión es importante para la identificación teórica del modelo, en la práctica esta variable no es absolutamente necesaria para llevar a cabo la estimación. En realidad, Loshkin y Sajaia especifican al hablar sobre las estimaciones hechas por su programa que, de no haber una variable en la ecuación de selección que no se incluya en las otras dos ecuaciones, su programa aún así logra la identificación mediante no-

linealidades (Loshkin, Sajaia, 004). Debido a esto, a pesar de la importancia teórica de la existencia de la variable de exclusión, se debe reconocer que la posibilidad de estimar el modelo no depende críticamente de ella.