El modelo Ordinal y el modelo Multinomial

Documentos relacionados

ANEXOS. 1) Modelo Probit.

Estimación del Probit Ordinal y del Logit Multinomial

TEMA 4: Variables binarias

Módulo 9 Sistema matemático y operaciones binarias

Análisis de Regresión Múltiple con Información Cualitativa: Variables Binarias o Ficticias

Tema 3. Espacios vectoriales

ESTIMACIÓN. puntual y por intervalo

1.1. Introducción y conceptos básicos

ANÁLISIS DE DATOS NO NUMERICOS

A estas alturas de nuestros conocimientos vamos a establecer dos reglas muy prácticas de cómo sumar dos números reales:

Definición Dados dos números naturales m y n, una matriz de orden o dimensión m n es una tabla numérica rectangular con m filas y n columnas.

Tema 10. Estimación Puntual.

Subespacios vectoriales en R n

1. MEDIDAS DE TENDENCIA CENTRAL

Modelos de elección binaria

Clase 4: Probabilidades de un evento

Cap. 24 La Ley de Gauss

1. Dominio, simetría, puntos de corte y periodicidad

Grado en Finanzas y Contabilidad

Aplicación de los modelos de credit scoring para instituciones microfinacieras.

ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Construcción de una Base de Datos

TEMA 5 Variables ficticias

MODELOS DE RECUPERACION

1.4.- D E S I G U A L D A D E S

Apuntes de Matemática Discreta 9. Funciones

1. SOLUCIONES A LOS EJERCICIOS PROPUESTOS

CORRELACIÓN Y PREDICIÓN

35 Facultad de Ciencias Universidad de Los Andes Mérida-Venezuela. Potencial Eléctrico

ANÁLISIS DINÁMICO DEL RIESGO DE UN PROYECTO

RELACIONES DE RECURRENCIA

Profr. Efraín Soto Apolinar. La función lineal. y = a 0 + a 1 x. y = m x + b

Programa para el Mejoramiento de la Enseñanza de la Matemática en ANEP Proyecto: Análisis, Reflexión y Producción. Fracciones

Tema 1: Test de Distribuciones de Probabilidad

Cómo?: Resolviendo el sistema lineal homógeneo que satisfacen las componentes de cualquier vector de S. x4 = x 1 x 3 = x 2 x 1

Análisis de medidas conjuntas (conjoint analysis)

CAPITULO 4 JUSTIFICACION DEL ESTUDIO. En este capítulo se presenta la justificación del estudio, supuestos y limitaciones de

Tema 2. Espacios Vectoriales Introducción

_ Antología de Física I. Unidad II Vectores. Elaboró: Ing. Víctor H. Alcalá-Octaviano

Covarianza y coeficiente de correlación

Funciones, x, y, gráficos

Profr. Efraín Soto Apolinar. Función Inversa

Universidad Diego Portales Facultad de Economía y Empresa. 1. Reputación. Apuntes de Teoría de Juegos Profesor: Carlos R. Pitta

FUNCIONES CUADRÁTICAS Y RACIONALES

Metodología. del ajuste estacional. Tablero de Indicadores Económicos

BASES Y DIMENSIÓN. Propiedades de las bases. Ejemplos de bases.

1. a) Definimos X =número de personas con síntomas si examino sólo una persona, la cual sigue una distribución B(1, p), donde

Selectividad Septiembre 2006 SEPTIEMBRE 2006

1. Producto escalar, métrica y norma asociada

Semana 08 [1/15] Axioma del Supremo. April 18, Axioma del Supremo

Tema 12: Contrastes Paramétricos

Medidas de tendencia central o de posición: situación de los valores alrededor

PROGRAMACIÓN LINEAL Introducción Inecuaciones lineales con 2 variables

ANALIZANDO GRAFICADORES

Precio del alquiler de pisos durante una serie de meses. Evolución del índice del precio del trigo con mediciones anuales.

QUÉ ES LA RENTABILIDAD Y CÓMO MEDIRLA. La rentabilidad mide la eficiencia con la cual una empresa utiliza sus recursos financieros.

El problema del cumpleaños

Variables Parcialmente Continuas. Walter Sosa Escudero. Universidad de San Andr es

Apuntes de Matemática Discreta 1. Conjuntos y Subconjuntos

La práctica del análisis de correspondencias

Macroeconomía II EAE 211B

ANÁLISIS DE BALANCES CON EL NUEVO PGC DE 2008

Teorema de Green Curvas de Jordan

Tema 7. SISTEMAS SECUENCIALES SISTEMAS SECUENCIALES SÍNCRONOS

Tema 3. Medidas de tendencia central Introducción. Contenido

Caracterización de los niveles de consumo de alcohol en Chile. José Sanhueza, Economista, M.Econ.

Validation. Validación Psicométrica. Validation. Central Test. Central Test. Centraltest CENTRAL. L art de l évaluation. El arte de la evaluación

POR QUÉ EL VALOR PRESENTE NETO CONDUCE A MEJORES DECISIONES DE INVERSIÓN QUE OTROS CRITERIOS? ( Brealey & Myers )

GUIÓN TEMA 4. VARIABLES BINARIAS 4.1. Variables binarias

Introducción a la Teoría de Probabilidad

Fundamentos de Biología Aplicada I Estadística Curso Práctica 6: Regresión Logística I

Estas visiones de la información, denominadas vistas, se pueden identificar de varias formas.

BPMN Business Process Modeling Notation

Funciones Condicionales

Selectividad Septiembre 2008 SEPTIEMBRE 2008

Traslaciones, Homotecias, Giros y Simetrías

DESARROLLO DE HABILIDADES DEL PENSAMIENTO LÓGICO

La lección de hoy es sobre Resolver Ecuaciones. El cuál es la expectativa para el aprendizaje del estudiante SEI.2.A1.1

Potencial eléctrico. du = - F dl

ESTADÍSTICA SEMANA 4

8.1. Introducción Dependencia/independencia estadística Representación gráfica: diagrama de dispersión Regresión...

Selectividad Junio 2008 JUNIO 2008 PRUEBA A

a < b y se lee "a es menor que b" (desigualdad estricta) a > b y se lee "a es mayor que b" (desigualdad estricta)

ESTIMACION DE INTERVALOS DE CONFIANZA

Subconjuntos destacados en la

Ejercicios de Modelos de Probabilidad

MATEMÁTICAS APLICADAS A LAS C.C. SOCIALES

DOMINIO Y RANGO página 89. Cuando se grafica una función existen las siguientes posibilidades:

Notas en Eonomía de la Información *

1. CUENTA DE PÉRDIDAS Y GANANCIAS ANALÍTICA

Ingeniería del Software I Clase de Testing Funcional 2do. Cuatrimestre de 2007

Unidad I. 1.1 Sistemas numéricos (Binario, Octal, Decimal, Hexadecimal)

PROYECTO DE LA REAL ACADEMIA DE CIENCIAS Estímulo del talento matemático

MODELOS DE INVENTARIO

Control Estadístico de Procesos

Se llama dominio de una función f(x) a todos los valores de x para los que f(x) existe. El dominio se denota como Dom(f)

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

Transcripción:

El modelo Ordinal y el modelo Multinomial Microeconomía Cuantitativa R. Mora Departmento de Economía Universidad Carlos III de Madrid

Esquema Motivación 1 Motivación 2 3

Motivación

Consideramos las siguientes extensiones de los modelos de variable dependiente binaria: : La variable dependiente toma un número de valores nitos y discretos que contienen información ordinal. Modelos de respuesta multinomial: La variable dependiente toma una serie de valores nitos y discretos que NO contienen información ordinal. Como en los casos probit y logit, la variable dependiente no es estrictamente continua. La estimación se lleva a cabo utilizando el estimador MV.

Ejemplos de modelos ordinales Calicación de crédito, utilizando siete categorías, desde "denitivamente no digno de crédito" a "digno de crédito". Decisión de permanecer inactivo, trabajar a tiempo parcial, o trabajar a tiempo completo En una regresión de ingresos, el nivel de ingresos se codica en intervalos: [0,1000), [1000,1500) [1500,2000), [2000, ) En valoraciones sobre armaciones, varias respuestas con contenido ordinal: "completamente en desacuerdo", "en desacuerdo", "algo de acuerdo", "completamente de acuerdo"

Ejemplos de modelos multinomiales Elección del modo de transporte: tren, autobús, coche. Situación económica: inactivos, desempleados, trabajadores por cuenta propia, empleado. Elección campo Educación: ciencia dura, ciencias de la salud, ciencias sociales, humanidades.

Los dos modelos estándar son el probit ordenado y el logit ordenado. El enfoque es equivalente: simplemente usamos para el probit ordenado la CDF normal Φ y para el logit ordenado la CDF logística Λ. OLS no funciona porque la variable dependiente no tiene sentido cardinal: Solvencia: 0,1,2,3,4,5 : El cambio de 0 a 1 no tiene que ser "equivalente" al cambio de 4 a 5. Actividad: inactivo = 0, a tiempo parcial = 1, a tiempo completo = 2: Mientras inactiva es cero horas de trabajo, el código 1 reeja entre 1 y (generalmente) 30 horas de trabajo, y el código 2 reeja más 30 horas de trabajo. Esto implica que no hay proporcionalidad en ir de 0 a 1 y de 1 a 2.

Simplicación Motivación Los modelos de elección binaria (MLP, probit, logit) podrían ser utilizados agrupando todas las categorías en dos grandes grupos. Esta puede ser una solución razonable cuando la muestra es pequeña y las categorías ordinales pueden lógicamente agruparse en dos categorías principales. En algunos casos, esta es probablemente una muy mala idea (por ejemplo, con intervalos de ingresos)

Consideremos tres resultados observados: y = 0, 1, 2. Consideremos el modelo de variable latente sin constante: donde ε N (0, 1). y = β 1 x 1 +... + β k x k + ε Denimos dos puntos de corte: α 1 < α 2 No observamos y, pero observamos valores discretos de acuerdo con la siguiente regla y = 0 si y α 1 y = 1 si α 1 < y α 2 y = 2 si α 2 < y

Ejemplo: actividad Motivación y = 0 si inactivo, y = 1 si empleado a tiempo parcial, y = 2 si empleado a tiempo completo y = β e educ + β k kids + ε, donde ε N (0, 1) Entonces y = 0 si β e educ + β k kids + ε α 1 y = 1 si α 1 < β e educ + β k kids + ε α 2 y = 2 si α 2 < β e educ + β k kids + ε Nótese que podríamos alternativamente incluir una constante β 0 y suponer que α 1 = 0.

Interpretación Motivación Al igual que en otros modelos no lineales, los efectos marginales se deben calcular para entender los efectos parciales de un pequeño cambio en la variable explicativa x j. Para los modelos ordinales podemos calcular los efectos marginales sobre las probabilidades predichas usando los mismos principios que con los probit y logit.

Efectos marginales sobre las probabilidades Para los modelos de elección binaria nos hemos centrado en los efectos sobre la probabilidad de que y es igual a uno. En los modelos ordinales, las cosas no son tan simples porque ahora tenemos más de dos resultados: Pr(y = 0 x), x j Pr(y = 1 x) Pr(y = 2 x), x j x j Si x j es discreto se calcula como en el caso binario el cambio discreto en las probabilidades predichas asociados con el cambio x j.

Efectos Marginales Motivación El efecto parcial de x j en la probabilidad predicha de el más alto resultado tiene el mismo signo que β j. el resultado más bajo tiene el signo opuesto a β j. los resultados intermedios no se pueden deducir del signo de β j. El último resultado se debe a dos efectos compensatorios. Supongamos que β j > 0 y aumentamos x j. La categoría intermedia Puede ser más probable, ya que la probabilidad de la categoría más baja cae. También puede ser menos probable debido a que la probabilidad de la categoría más alta aumenta. Por lo general, los efectos parciales de probabilidades intermedias son cuantitativamente pequeños y, a menudo estadísticamente insignicante.

Discusión Motivación ¾Cuál es la mejor forma de interpretar los resultados de los modelos ordenados? Una opción es estudiar las estimaciones de los parámetros haciendo hincapié en la ecuación de la variable latente subyacente con la que empezamos. Otra opción es mirar el efecto sobre el valor esperado de la variable de respuesta ordinal, por ejemplo, E(y x) x j = Pr(y = 0 x) 0+ x j Pr(y = 1 x) Pr(y = 2 x) 1+ 2 x j x j Esto puede tener mucho sentido si y es una variable numérica, como en la variable de ingreso. Alternativamente, simplemente podemos reportar el efecto sobre la probabilidad de observar las categorías ordenadas.

La variable dependiente es tal que Más de dos resultados son posibles. Los resultados no tienen una ordenación natural. Una vez más, podríamos agrupar dos o más categorías y así construir una variable de resultado binario de los datos brutos; pero, al hacerlo, eliminamos información potencialmente interesante. OLS tampoco es un buen modelo en este contexto. Sin embargo, el modelo logit para la opción binaria se puede extender a modelar más de dos resultados.

Modelo de Utilidad Aleatoria Supongamos tres alternativas de transporte: bus, coche, tren: U b = x b β b + ε b U c = x cβ c + ε c U t = x tβ t + ε t donde {ε b,ε c,ε t } son los efectos en la utilidad no observados por el econometra. Si x b β b + ε b max {x cβ c + ε c,x tβ t + ε t } entonces y = 0 Si x cβ c + ε c > max { x b β b + ε b,x tβ t + ε t } entonces y = 1 Si x tβ t + ε t > max {x cβ c + ε c,x tβ t + ε t } entonces y = 2

Notación Tenemos dos efectos inobservados netos independientes ε 01 = ε b ε c ε 02 = ε b ε t nótese que ε 12 = ε c ε t = ε 02 ε 01 Dena x b β b x cβ c = x β 01 x b β b x tβ t = x β 02

Supuesto {ε 01,ε 02 } F donde F es simétrica. Entonces Pr(y = 0 x) = ( Pr x β 01 + ε 01 0,x β 02 + ε 02 0 x ) = ( Pr ε 01 ( x ) β 01,ε02 ( x ) ) β 02 x Dada la simetría, Pr(y = 0 x) = F ( x β 01,x ) β 02

Logit Multinomial Motivación Debemos modelar la probabilidad de que un individuo pertenece a la categoría j condicional a tener características x: Pr(y = j x) Cuando el vector {ε b,ε c,ε t } se distribuye conjuntamente con una distribucion de valor extremo tenemos el modelo Logit Multinomial: Pr(y = 0 x) = 1 Pr(y = 1 x) Pr(y = 2 x) exp(x β 1 ) Pr(y = 1 x) = 1 + exp(x β 1 ) + exp(x β 2 ) exp(x β 2 ) Pr(y = 2 x) = 1 + exp(x β 1 ) + exp(x β 2 )

La principal diferencia en comparación con el logit binario es que ahora hay dos vectores de parámetros, β 1 y β 2. En el caso general con J posibles respuestas, hay J 1 vectores de parámetros. Esto hace que la interpretación de los coecientes sea más difícil que en los modelos de elección binaria.

Interpretación con tres alternativas El caso más sencillo es cuando β 1j y β 2j tienen el mismo signo. Si β 1j y β 2j son positivos entonces un aumento en x j hace menos probable que el individuo pertenece a la categoría 0... y Pr(y i = 1 x i ) + Pr(y i = 2 x i ) aumenta para saber cómo se asigna este incremento total entre estas dos probabilidades, tenemos que mirar los efectos marginales: la derivada parcial es muy compleja y el efecto marginal Pr(y=1 x) x j de hecho, puede ser negativo incluso si β 1j > 0!

Independence of irrelevant alternatives (IIA) Una limitación del modelo logit es que la relación de la probabilidad de cualesquiera dos alternativas l y m depende sólo de los vectores de parámetro β l y β m y las variables explicativas x Pr(y = 1 x) Pr(y = 2 x) = exp(x β 1 ) exp(x β 2 ) =exp ( x (β 1 β 2 ) ) La inclusión o exclusión de otras categorías es irrelevante para la relación de las dos probabilidades. Este comportamiento se conoce como la "independencia de alternativas irrelevantes", y puede llevar a un comportamiento contrario a lo que sugeriría la intuición.

Ejemplo: IIA puede ser contra-intuitivo Las personas pueden ir al trabajo por tres medios de transporte: autobús azul, autobús rojo o tren. Las personas eligen una de estas alternativas; el econometra modeliza con un logit multinomial esta decisión, y obtiene una estimación de Pr(y = red x) Pr(y = train x) =exp( x (β red β train ) ) Supongamos que la empresa de autobuses ahora elimina el autobús azul del conjunto de opciones, ¾cree que sería igual que antes? Pr(y=red x) Pr(y=train x)

Otros modelos multinomiales Hay muchos otros modelos econométricos que se pueden utilizar para modelar modelos de respuesta multinomial: Probit multinomial Logit condicional Logit anidado Su estudio supera el objetivo del curso.

Motivación Cuando la variable dependiente tiene un número nito de valores discretos, podemos extender los modelos probit y logit Cuando la variable dependiente contiene información ordinal, entonces podemos utilizar probit ordinal y logit ordinal. Cuando la variable dependiente no contiene ninguna información ordinal, podemos utilizar modelos multinomiales. Un ejemplo es el logit multinomial. Estos son todos modelos no lineales, y todos ellos pueden ser estimados por MV.