Regresión con variable dependiente binaria (SW Capítulo 9)



Documentos relacionados
VARIABLE ALEATORIA Y FUNCIÓN DE DISTRIBUCIÓN

-Métodos Estadísticos en Ciencias de la Vida

RENTABILIDAD Y RIESGO DE CARTERAS Y ACTIVOS TEMA 3- I FUNTAMENTOS DE DIRECCIÓN FINANCIERA. Fundamentos de Dirección Financiera Tema 3- Parte I 1

TEMA 12 INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA 12.1 DISTRIBUCIÓN NORMAL. REPASO DE TÉCNICAS BÁSICAS

La inferencia estadística es primordialmente de naturaleza

6. ESTIMACIÓN PUNTUAL

V Muestreo Estratificado

REGRESIÓN LINEAL SIMPLE

Métodos indirectos de estimación: razón, regresión y diferencia

ANÁLISIS ESTADÍSTICO DEL CONTROL DE CALIDAD EN LAS EMPRESAS

División de Estadísticas y Proyecciones Económicas (DEPE) Centro de Proyecciones Económicas (CPE)

MODELOS DE REGRESIÓN LINEALES Y NO LINEALES: SU

CÁLCULO Y COMENTARIOS SOBRE ALGUNAS MEDIDAS DESCRIPTIVAS. de una variable X, la denotaremos por x y la calcularemos mediante la fórmula:

Modelos de Regresión análisis de regresión diagrama de dispersión coeficientes de regresión

Tema 16: Modelos de distribución de probabilidad: Variables Continuas

ANÁLISIS DE LA VARIANZA ANOVA COMPARACIONES MULTIPLES ENTRE MEDIAS MUESTRALES

Regresión lineal simple

Tema 12: Modelos de distribución de probabilidad: Variables Continuas

En esta sección estudiaremos el caso en que se usa un solo "Predictor" para predecir la variable de interés ( Y )

Regresión - Correlación

X / n : proporción de caras ( = frecuencia relativa del suceso A = f A = n A / n ) Se espera que a medida que n crece la frecuencia relativa de cara

3 Metodología de determinación del valor del agua cruda

Gestión de operaciones

Matemáticas 1 1 EJERCICIOS RESUELTOS: Números Complejos. Elena Álvarez Sáiz. Dpto. Matemática Aplicada y C. Computación. Universidad de Cantabria

1 Estadística. Profesora María Durbán

Análisis de Regresión

Métodos de Predicción Inferencia. Curso María Jesús Sánchez Naranjo y Carolina García-Martos

ESTADÍSTICA poblaciones

MODELOS DE ELECCIÓN BINARIA

x θ es conocida pero se desconoce θ total o ˆθ ) debe ser función de los datos de la muestra

Máximos y Mínimos de funciones de dos variables

Tema 60. PARÁMETROS ESTADÍSTICOS: CÁLCULO, PROPIEDADES Y SIGNIFICADO.

Una Propuesta de Presentación del Tema de Correlación Simple

Introducción a la Inferencia Estadística. Dept. of Marine Science and Applied Biology Jose Jacobo Zubcoff

TEMA 11 OPERACIONES DE AMORTIZACION O PRESTAMO (II)

PROBANDO GENERADORES DE NUMEROS ALEATORIOS

2. Calcular el interés que obtendremos al invertir euros al 4% simple durante 2 años. Solución: 480 euros

I. ANÁLISIS DESCRIPTIVO DE UN CONJUNTO DE DATOS

RELACIÓN ENTRE DOS VARIABLES NUMÉRICAS REGRESIÓN LINEAL SIMPLE. CORRELACIÓN. realizar el calibrado en análisis instrumental.

6- SUMA DE VARIABLES ALEATORIAS Y TEOREMA CENTRAL DEL LÍMITE

Supongamos que hemos aplicado el test F y hemos rechazado la H0.

TEMA 3: ESTIMACIÓN PUNTUAL.

Test de Hipótesis. Error de tipo I: Rechazar H 0 siendo H 0 Verdadera. Error de tipo II: No rechazar H 0 siendo H 0 Falsa

1.1 INTRODUCCION & NOTACION

6.1. Solución. P( de que falle un televisor) = 1/5000 = p X = Número de televisores averiados de entre los asegurados.

V II Muestreo por Conglomerados

ESTADÍSTICA. UNIDAD 3 Características de variables aleatorias. Ingeniería Informática TEORÍA

Respuesta. Si 100 manzanas es una muestra suficientemente grande podemos ocupar el TCL. Por lo tanto:

Colegio Sagrada Familia Matemáticas 4º ESO ESTADÍSTICA DESCRIPTIVA

Colegio Sagrada Familia Matemáticas 4º ESO

TEXTO DE PROBLEMAS DE INFERENCIA ESTADÍSTICA

SIMULACION. Departament d'eio / Notes Curs MEIO/FIB 33

Soluciones Hoja de Ejercicios 2. Econometría I

(Véase el Ejercicio 13 Beneficio de los bancos )

Estadística aplicada al Periodismo

TEMA 3. Medidas de variabilidad y asimetría. - X mín. X máx

ESTADÍSTICA DESCRIPTIVA

ESTRUCTURA Y TECNOLOGÍA A DE COMPUTADORES

PARTE 2 - ESTADISTICA. Parte 2 Estadística Descriptiva Introducción

Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas ESTADÍSTICA. Ingeniería en Informática

Estadística. Tema 2: Medidas de Tendencia Central.. Estadística. UNITEC Tema 2: Medidas de Tendencia Central Prof. L. Lugo

LÍNEA DE REGRESIÓN MÍNIMO CUADRÁTICA BASADA EN ERRORES RELATIVOS

UNIDAD TEMÁTICA 9 REGRESIÓN LINEAL Y CORRELACIÓN ENUNCIADO 1

Solución del examen de Investigación Operativa de Sistemas de septiembre de 2004

Inferencia Estadística

Análisis Numérico y Programación. Unidad III. -Interpolación mediante trazadores: Lineales, cuadráticos y cúbicos

1.2. Medidas de Concentración

Estimación de Parámetros. Estimación Puntual. Universidad Técnica Federico Santa María. Estimación de Parámetros. Estimación de Parámetros.

Los Histogramas. Histograma simple

5. Aproximación de funciones: polinomios de Taylor y teorema de Taylor.

PRIMERA PRUEBA DE TÉCNICAS CUANTITATIVAS III. 14-Abril Grupo A

Control estadístico de procesos. Control de procesos. Definición de proceso bajo control estadístico. Causas de la variabilidad en un proceso

Modelos de Regresión Simple

INTRODUCCIÓN AL CONCEPTO DE VALOR ESPERADO O ESPERANZA MATEMÁTICA DE UNA VARIABLE ALEATORIA

MÉTODOS ESTADÍSTICOS PARA EL CONTROL DE CALIDAD

Algunas Recomendaciones para la Enseñanza de la Estadística Descriptiva o Análisis de Datos

7. Muestreo con probabilidades desiguales.

ANalysis Of VAriance ANOVA Análisis de la Varianza. Teresa Villagarcía

Dada una sucesión x1, x2, x3,... x n dos a dos independientes, con una misma distribución de probabilidad y con esperanza µ y varianza σ

10 Un trabajador cobra por horas según el siguiente baremo:

Distribución conjunta de variables aleatorias

TEMAS SELECTOS I ECONOMÍA FINANCIERA NOTA 7

Análisis acerca de la distribución de Weibull con datos truncados y la distribución generalizada de Pareto aplicado a fallas en dieléctricos

GRADO EN PSICOLOGIA INTRODUCCIÓN AL ANÁLISIS DE DATOS Código Asignatura: FEBRERO 2010 EXAMEN MODELO C

Aplicación de Boostrapping en Regresión I

CURSO BÁSICO DE ESTADÍSTICA DESCRIPTIVA

Signif. codes: 0 *** ** 0.01 *

1 Sucesiones. Ejemplos. a n = n a n = n! a n = n n. a n = p n. a n = 2n3 + n n a n = ln(n)

Las hipotecas y la tasa anual equivalente

ERRORES EN LAS MEDIDAS (Conceptos elementales)

1. Lección 11 - Operaciones Financieras a largo plazo - Préstamos (Continuación)

Inferencia estadística - Estimación puntual

MUESTREO EN POBLACIONES FINITAS (1) Dos aspectos básicos de la inferencia estadística, no vistos aún:

Análisis de Regresión y Correlación Lineal

Guía práctica para la realización de medidas y el cálculo de errores


(Feb03-1ª Sem) Problema (4 puntos). Se dispone de un semiconductor tipo P paralepipédico, cuya distribución de impurezas es

Sucesiones numéricas.

Tema 6: Introducción al muestreo. Estimadores

Estadística Descriptiva

Transcripción:

Regresó co varable deedete bara (SW Caítulo 9) Hasta ahora hemos cosderado que la varable deedete (Y) es cotua: utuacoes e los tests e las escuelas tasa de mortaldad e accdetes de tráfco Pero odemos estar teresados e eteder el efecto de X sobre ua varable bara Y: Y = r a la uversdad o o Y = ser fumador o o Y = coceder ua hoteca o o 9-

Ejemlo: Deegacó de ua hoteca y raza Datos: The Bosto Fed HMDA Solctudes dvduales de hoteca ara famlas uersoales e 990 e el área de Bosto 380 observacoes, recogdas bajo Home Mortgage Dsclosure Act (HMDA) Varables Varable deedete: ococesó o deegacó de la hoteca Varables deedetes: oreta, rqueza, stuacó laboral ootros réstamos, característcas de la casa oraza del solctate 9-

El modelo de robabldad leal (SW Seccó 9.) U uto de artda atural es el modelo de regresó leal co u úco regresor: Pero: Y = β 0 + β X + u Qué sgfca β cuado Y es bara? Es β = Y X? Qué sgfca la recta β 0 + β X cuado Y es bara? Qué sgfca el valor estmado ˆ Y cuado Y es bara? Por ejemlo, qué sgfca ˆ Y = 0.6? 9-3

El modelo de robabldad leal (cot.) Y = β 0 + β X + u Recordemos la hótess #: E(u X ) = 0, or tato: E(Y X ) = E(β 0 + β X + u X ) = β 0 + β X Cuado Y es bara, E(Y) = Pr(Y=) + 0 Pr(Y=0) = Pr(Y=) así que se tee, E(Y X) = Pr(Y= X) 9-4

El modelo de robabldad leal (cot.) Cuado Y es bara, el modelo de regresó leal Y = β 0 + β X + u recbe el ombre de modelo de robabldad leal. El valor estmado es ua robabldad: oe(y X=x) = Pr(Y= X=x) = rob. de Y = dado x oy ˆ = la robabldad estmada de que Y =, dado X β = cambo e la robabldad de que Y = ara u x dado: Pr( ) Pr( ) β = Y = X = x + x Y = X = x x Ejemlo: modelo de robabldad leal, datoshmda 9-5

Deegacó de hotecas vs. rato réstamos a agar/reta (P/I rato) e el cojuto de datos HMDA (subcojuto de dchos datos) 9-6

9-7

Modelo de robabldad leal: datos HMDA deeg = -.080 +.604 P/I rato ( = 380) (.03) (.098) Cuál es el valor estmado ara P/I rato =.3? Pr(deeg= P/I rato=.3) = -.080 +.604.3 =.5 Calculado efectos: crem. de P/I rato de.3 a.4: Pr(deeg= P/I rato=.4) = -.080 +.604.4 =. El efecto sobre la robabldad de deegacó de la hoteca de u cremeto e el P/I rato de.3 to.4 es que se cremeta dcha robabldad e.06, es decr, e 6. utos orcetuales. 9-8

Icluyamos ahora la varable egro como u regresor (egro vale ara dvduos de raza egra): deeg = -.09 +.559 P/I rato +.77 black (.03) (.098) (.05) Probabldad estmada de deegacó de la hoteca: ara u solctate egro co P/I rato =.3: Pr(deeg=) = -.09 +.559.3 +.77 =.54 ara u solctate blaco co P/I rato =.3: Pr(deeg=) = -.09 +.559.3 +.77 0 =.077 dfereca =.77 = 7.7 utos orcetuales El coefcete de egro es sgfcatvo al 5% Todavía habrá muchas varables omtdas (sesgo) 9-9

El modelo de robabldad leal: Resume Modelza la robabldad como ua fucó leal de X Vetajas: oestmacó e terretacó secllas ola fereca es la msma que e el modelo de regresó múltle (ecestamos errores estádar robustos a heterocedastcdad) Desvetajas: o Tee setdo que la robabldad sea leal e X? olas robabldades estmadas uede ser <0 ó >! Este roblema uede resolverse utlzado u modelo de robabldad o leal: regresó robt y logt 9-0

Probt ad Logt Regresso (SW Secto 9.) El roblema co el modelo de robabldad leal es que modelza la robabldad de Y= co ua fucó leal: Pr(Y = X) = β 0 + β X S embargo, queremos que: 0 Pr(Y = X) ara todo X Pr(Y = X) crecete e X (ara β >0) Esto requere ua forma fuctoal o leal ara la robabldad. Qué tal ua curva e forma de S? 9-

El modelo robt satsface estas codcoes: 0 Pr(Y = X) ara todo X Pr(Y = X) es crecete e X (ara β >0) 9-

La regresó robt modelza la robabldad de que Y= usado la fucó de dstrbucó de la ormal estádar, evaluada e z = β 0 + β X: Pr(Y = X) = Φ(β 0 + β X) Φ es la fucó de dstrbucó ormal. z = β 0 + β X es el valor z ó ídce z del modelo robt Ejemlo: Suogamos que β 0 = -, β = 3, X =.4, or tato: Pr(Y = X=.4) = Φ(- + 3.4) = Φ(-0.8) Pr(Y = X=.4) = área bajo la desdad de la ormal estádar que queda a la zquerda de z = -.8, que es 9-3

Pr(Z -0.8) =.9 9-4

Regresó robt (cot.) Por qué usar la dstrbucó de robabldad acumulada de la ormal? La curva e forma de S os da lo que queremos: o 0 Pr(Y = X) ara todo X o Pr(Y = X) crecete e X (ara β >0) Es fácl de usar las robabldades está tabuladas e las tablas de la ormal Tee ua terretacó relatvamete drecta: o valor z = β 0 + β X o ˆ β 0 + ˆ β X es el valor z estmado, dado X oβ es el cambo e el valor z ara u cambo utaro e X 9-5

Ejemlo de STATA: datos HMDA. robt dey _rat, r; Iterato 0: log lkelhood = -87.0853 We ll dscuss ths later Iterato : log lkelhood = -835.6633 Iterato : log lkelhood = -83.80534 Iterato 3: log lkelhood = -83.7934 Probt estmates Number of obs = 380 Wald ch() = 40.68 Prob > ch = 0.0000 Log lkelhood = -83.7934 Pseudo R = 0.046 ------------------------------------------------------------------------------ Robust dey Coef. Std. Err. z P> z [95% Cof. Iterval] -------------+---------------------------------------------------------------- _rat.967908.46534 6.38 0.000.05594 3.87990 _cos -.9459.6497-3.30 0.000 -.57499 -.8708 ------------------------------------------------------------------------------ Pr(deeg= P/I rato) = Φ(-.9 +.97 P/I rato) (.6) (.47) 9-6

Ejemlo de STATA: datos HMDA (cot.) Pr(deeg= P/I rato) = Φ(-.9 +.97 P/I rato) (.6) (.47) Coefcete ostvo: tee setdo? Los errores estádar tee la terretacó habtual Probabldades estmadas: Pr(deeg= P/I rato=0.3) = Φ(-.9 +.97.3) = Φ(-.30) =.097 Efecto del cambo e P/I rato de.3 a.4: Pr(deeg= P/I rato=0.4) = Φ(-.9+.97.4) =.59 La robabldad estmada de o cocesó de hoteca se cremeta, asado de.097 a.59 9-7

Regresó robt co varos regresores Pr(Y = X, X ) = Φ(β 0 + β X + β X ) Φ es la fucó de dstrbucó ormal acumulada. z = β 0 + β X + β X es el valor z ó ídce z del modelo robt β es el efecto e el valor z de u cambo utaro e X, mateedo costate X 9-8

Ejemlo de STATA: datos HMDA. robt dey _rat black, r; Iterato 0: log lkelhood = -87.0853 Iterato : log lkelhood = -800.88504 Iterato : log lkelhood = -797.478 Iterato 3: log lkelhood = -797.3604 Probt estmates Number of obs = 380 Wald ch() = 8.8 Prob > ch = 0.0000 Log lkelhood = -797.3604 Pseudo R = 0.0859 ------------------------------------------------------------------------------ Robust dey Coef. Std. Err. z P> z [95% Cof. Iterval] -------------+---------------------------------------------------------------- _rat.74637.444633 6.7 0.000.8709 3.68 black.708579.083877 8.5 0.000.5453.8708 _cos -.58738.58868-4. 0.000 -.57003 -.947463 ------------------------------------------------------------------------------ Veremos desués los detalles de la estmacó 9-9

Ejemlo de STATA: robabldades robt estmadas. robt dey _rat black, r; Probt estmates Number of obs = 380 Wald ch() = 8.8 Prob > ch = 0.0000 Log lkelhood = -797.3604 Pseudo R = 0.0859 ------------------------------------------------------------------------------ Robust dey Coef. Std. Err. z P> z [95% Cof. Iterval] -------------+---------------------------------------------------------------- _rat.74637.444633 6.7 0.000.8709 3.68 black.708579.083877 8.5 0.000.5453.8708 _cos -.58738.58868-4. 0.000 -.57003 -.947463 ------------------------------------------------------------------------------. sca z = _b[_cos]+_b[_rat]*.3+_b[black]*0;. dslay "Pred rob, _rat=.3, whte: "ormrob(z); Pred rob, _rat=.3, whte:.07546603 NOTE _b[_cos] s the estmated tercet (-.58738) _b[_rat] s the coeffcet o _rat (.74637) sca creates a ew scalar whch s the result of a calculato dslay rts the dcated formato to the scree 9-0

Ejemlo de STATA: datos HMDA (cot.) Pr(deeg= P/I, egro) = =Φ(-.6 +.74 P/I rato +.7 black) (.6) (.44) (.08) El coefcete de egro es estadístcamete sgfcatvo? Valor estmado de la raza ara P/I rato =.3: Pr(deeg=.3, ) = Φ(-.6+.74.3+.7 ) =.33 Pr(deeg=.3, 0) = Φ(-.6+.74.3+.7 0) =.075 Dfereca e las robabldad de o cocesó de la hoteca =.58 (5.8 utos orcetuales) Todavía habrá muchas varables omtdas (sesgos) 9-

Regresó logt La regresó logt modelza la robabldad de Y= como la fucó de dstrbucó acumulada de la logístca estádar, evaluada e z = β 0 + β X: Pr(Y = X) = F(β 0 + β X) F es la fucó de dstrbucó logístca: F(β 0 + β X) = + ( 0 X ) e β + β 9-

Regresó logt (cot.) Pr(Y = X) = F(β 0 + β X) dode F(β 0 + β X) = + ( 0 X ) e β + β. Ejemlo: β 0 = -3, β =, X =.4, or tato, β 0 + β X = -3 +.4 = -. Pr(Y = X=.4) = /(+e (.) ) =.0998 Por qué comlcarse co el logt s teemos el robt? Hstórcamete, ha tedo vetajas comutacoales E la ráctca, es muy smlar al robt 9-3

Ejemlo de STATA: datos HMDA. logt dey _rat black, r; Iterato 0: log lkelhood = -87.0853 Later Iterato : log lkelhood = -806.357 Iterato : log lkelhood = -795.74477 Iterato 3: log lkelhood = -795.695 Iterato 4: log lkelhood = -795.695 Logt estmates Number of obs = 380 Wald ch() = 7.75 Prob > ch = 0.0000 Log lkelhood = -795.695 Pseudo R = 0.0876 ------------------------------------------------------------------------------ Robust dey Coef. Std. Err. z P> z [95% Cof. Iterval] -------------+---------------------------------------------------------------- _rat 5.37036.9633435 5.57 0.000 3.4844 7.5848 black.778.460986 8.7 0.000.9864339.5593 _cos -4.5558.34585 -.93 0.000-4.80336-3.447753 ------------------------------------------------------------------------------. ds "Pred rob, _rat=.3, whte: " > /(+ex(-(_b[_cos]+_b[_rat]*.3+_b[black]*0))); Pred rob, _rat=.3, whte:.0748543 NOTE: the robt redcted robablty s.07546603 9-4

Las robabldades estmadas de los modelos robt y logt so habtualmete muy arecdas. 9-5

Estmacó e Ifereca e Modelos Probt (y Logt) (SW Seccó 9.3) Modelo robt: Pr(Y = X) = Φ(β 0 + β X) Estmacó e fereca o Cómo estmar β 0 y β? o Cuál es la dstrbucó muestral de los estmadores? o Por qué odemos utlzar los métodos de fereca habtuales? Veamos rmero mímos cuadrados o leales (más fácl de exlcar) Desués veamos estmacó or máxma verosmltud (es lo que se hace e la ráctca e estos modelos) 9-6

Estmacó robt or mímos cuadrados o leales Recordemos MCO: m [ Y ( b + b X )] b0, b 0 = El resultado so los estmadores MCO ˆ β 0 y ˆ β E el robt, teemos ua fucó de regresó dferete, el modelo robt o leal. Etoces, odríamos estmar β 0 y β or mímos cuadrados o leales: m [ Y Φ ( b + b X )] b0, b 0 = La solucó de este roblema lleva al estmador de mímos cuadrados o leales de los coefcetes robt. 9-7

Mímos cuadrados o leales (cot.) m [ Y Φ ( b + b X )] b0, b 0 = Cómo resolver este roblema de mmzacó? No teemos ua solucó exlícta. Debe resolverse umércamete usado u ordeador, es decr, or u método de rueba y error, robado co u cojuto de valores ara (b 0,b ), luego robado otro, y otro... Ua dea mejor: usar algortmos esecífcos de mmzacó E la ráctca, o se utlza mímos cuadrados o leales orque o es efcete; u estmador co ua varaza meor es... 9-8

Estmacó robt or máxma veosmltud La fucó de verosmltud es la desdad codcoal de Y,,Y dados X,,X, etedda como fucó de los arámetros descoocdos β 0 y β. El estmador de máxma verosmltud (EMV ó MLE e glés) es el valor de (β 0, β ) que maxmza la fucó de verosmltud. El EMV (MLE) es el valor de (β 0, β ) que mejor descrbe la dstrbucó de los datos. E muestras grades, el EMV (MLE) es: ocosstete ose dstrbuye como ua ormal oefcete (es el estmador de meor varaza) 9-9

Caso esecal: EMV (MLE) robt s X Y= (dstrbucó Beroull) 0 co co robabld ad robabld ad Datos: Y,,Y,..d. La obtecó de la verosmltud emeza co la desdad de Y : Pr(Y = ) = y Pr(Y = 0) = Por tato, y y Pr(Y = y ) = ( ) (comrobar ara y =0, ) 9-30

Desdad cojuta de (Y,Y ): Dado que Y y Y so deedetes, Pr(Y = y,y = y ) = Pr(Y = y ) Pr(Y = y ) y y = [ ( ) y y ] [ ( ) ] Desdad cojuta de (Y,..,Y ): Pr(Y = y,y = y,,y = y ) y y = [ ( ) y y ] [ ( ) ] [ = = y ( ) ( ) y = y ( ) y ] La verosmltud es la desdad cojuta, etedda como fucó de los arámetros descoocdos, que está e : 9-3

f(;y,,y ) = = Y ( ) ( ) Y = El EMV (MLE) maxmza la verosmltud. Se suele trabajar co el logartmo de la verosmltud, l[f(;y,,y )]: l[f(;y,,y )] = ( ) ( ) Y l( ) + Y l( ) = = dl f( ; Y,..., Y ) d + = ( ) ( Y ) Y = 0 = = Resolvedo ara se obtee el EMV (MLE); es decr, ˆ MLE, satsface, 9-3

ó + MLE ˆ ˆ ( ) ( Y ) Y = MLE = = 0 ˆ ˆ ( ) ( Y ) = Y = MLE = MLE ó (dvdedo or y reordeado térmos), ó Y ˆ = Y ˆ MLE MLE ˆ MLE = Y = roorcó de s 9-33

El estmador EMV (MLE) e el caso s X (dstrbucó Beroull): ˆ MLE = Y = roorcó de s Para Y..d. Beroull, el EMV (MLE) es el estmador atural de, la roorcó de s, que es Y Ya coocemos los asectos báscos de la fereca: opara grade, la dstrbucó muestral de ˆ MLE = Y es ua dstrbucó ormal opor tato, la fereca es la habtual : cotrastes de hótess medate el estadístco t, tervalos de cofaza basados e ±.96SE Nota de STATA: ara destacar que se requere grade, la salda de STATA se refere al estadístco z e lugar de al estadístco t ; estadístco ch-cuadrado (= q F) e lugar de estadístco F. 9-34

La verosmltud robt co u regresor X Su obtecó emeza co la desdad de Y, dado X : Pr(Y = X ) = Φ(β 0 + β X ) Pr(Y = 0 X ) = Φ(β 0 + β X ) Por tato, y Pr(Y = y X ) = ( ) [ ( )] y Φ β + β X Φ β + β X 0 0 La fucó de verosmltud robt es la desdad cojuta de Y,,Y dados X,,X, etedda como fucó de β 0, β : f(β 0,β ; Y,,Y X,,X ) Y = { ( ) [ ( )] Y Φ β + β X Φ β + β X } 0 0 Y Y { Φ ( β + β X ) [ Φ ( β + β X )] } 0 0 9-35

La fucó de verosmltud robt: f(β 0,β ; Y,,Y X,,X ) Y = { ( ) [ ( )] Y Φ β + β X Φ β + β X } 0 0 Y Y { Φ ( β + β X ) [ Φ ( β + β X )] } 0 0 No se uede obteer el máxmo de forma exlícta Hay que maxmzar utlzado métodos umércos Como e el caso s X, e muestras grades: o ˆ β MLE 0, ˆ β MLE so cosstetes o ˆ β MLE 0, ˆ β MLE sgue dstrbucó ormal olos errores estádar uede comutarse ocotrastes e tervalos de cofaza: los usuales Para varos X s, ver SW Aédce. 9. 9-36

La verosmltud logt co u X La úca dfereca etre el robt y el logt es la forma fuctoal que se utlza ara la robabldad: e el logt, Φ se reemlaza or la dstrbucó logístca. Por lo demás, la verosmltud es smlar; ver los detalles e SW Aédce. 9. Al gual que e el robt, o ˆ β MLE 0, ˆ β MLE so cosstetes o ˆ β MLE 0, ˆ β MLE tee dstrbucó ormal osus errores estádar uede comutarse ocotrastes e tervalos de cofaza: los usuales 9-37

Meddas de bodad de ajuste R y R o tee setdo e este cotexto (or qué?). Dos meddas de ajuste e este cotexto so:. La roorcó de redccoes correctas = roorcó de Y s ara las que la robabldad estmada es >50% (s Y =) ó es <50% (s Y =0).. El seudo-r mde el ajuste usado la fucó de verosmltud: mde la mejora e el valor del log de la verosmltud relatvo al caso s X (ver SW Aédce. 9.). Esto se reduce al R e el modelo leal co errores ormalmete dstrbudos. 9-38

Dstrbucó del EMV (MLE) ara grade (o está e SW) La calcularemos ara el caso esecal s X, ara el que es el úco arámetro descoocdo. Pasos a segur:. Obteer el log de la verosmltud ( Λ() ) (hecho).. Ecotrar el EMV (MLE) gualado a cero la dervada del log-verosmltud; esto requere resolver ua ecuacó o leal 3. Para grade, ˆ MLE estará cerca del verdadero ( true ), así que la ecuacó o leal uede aroxmarse (localmete) or ua ecuacó leal (exasó de Taylor alrededor de true ). 4. Dcha ecuacó uede resolverse ara ˆ MLE true. 5. Por la LGN y el TCL, ara grade, ( ˆ MLE true ) sgue dstrbucó ormal. 9-39

. Obteer el log de la verosmltud: Recuerda que: la desdad ara la observacó # es: y y Pr(Y = y ) = ( ) (desdad) Por tato, Y Y f(;y ) = ( ) (verosmltud) La verosmltud ara Y,,Y es, f(;y,,y ) = f(;y ) f(;y ) or tato el log de la verosmltud es, Λ() = lf(;y,,y ) = l[f(;y ) f(;y )] = = l f ( Y ; ) 9-40

. Igualar a cero la dervada de Λ() ara obteer el EMV (MLE): L( ) ˆ MLE = l f( ; Y ) = 0 MLE = ˆ 3. Utlzar ua exasó de Taylor alrededor de true ara aroxmar la ecuacó o leal como ua ecuacó leal de ˆ MLE : 0 = L( ) ˆ MLE L( ) true + L( ) true ( ˆ MLE true ) 9-4

4. Resolver esta aroxmacó leal ara ( ˆ MLE true ): L( ) Por tato, ó true L( ) + true L( ) ( ˆ MLE true ) true ( ˆ MLE true ) ( ˆ MLE true ) 0 L( ) L ( ) L( ) true true true 9-4

9-43 5. Susttur y alcar la LGN y el TCL. Λ() = l ( ; ) f Y = ( ) true L = l ( ; ) true f Y = ( ) true L = l ( ; ) true f Y = Por tato, ( ˆ MLE true ) ( ) true L ( ) true L = l ( ; ) true f Y = l ( ; ) true f Y =

Multlcar ambos membros or : ( ˆ MLE true ) l f( ; Y ) = true l f( ; Y ) = true Dado que Y es..d., los termus -ésmos e los sumados també so..d. Etoces, s esos térmos tee sufcetes mometos (e cocreto ), bajo codcoes geerales (o sólo bajo dstrbucó Beroull): 9-44

9-45 l ( ; ) true f Y = a ( costate) (LDGN) l ( ; ) true f Y = d N(0, l f σ ) (TCL) ( Por qué?) Poedo todo juto, ( ˆ MLE true ) l ( ; ) true f Y = l ( ; ) true f Y =

a (costate) (LDGN) true l f( ; Y ) = l f( ; Y ) d N(0, σ = true l f ) (TCL) ( Por qué?) Por tato, ( ˆ MLE true ) d N(0, σ /a ) l f Desarrollo de los detalles ara el caso robt/s X (Beroull): 9-46

Recuerda que: f(;y ) = Y ( ) Y Por tato, l f(;y ) = Y l + ( Y )l( ) y l f ( Y, ) = Y Y = Y ( ) y l f ( Y, ) Y Y ( ) = Y Y ( ) = + 9-47

Deomador: Por tato, l f ( Y, ) l f( ; Y ) = Y Y ( ) = + Y Y = true + = ( ) Y Y ( ) = + + (LGN) ( ) = + = ( ) 9-48

Numerador: so l f ( Y, ) = Y ( ) l f( ; Y ) = = true = Y ( ) = ( ) = ( Y ) d σy N(0, [ ( )] ) 9-49

Poedo todo juto: ( ˆ MLE true ) dode l f( ; Y ) = l f( ; Y ) = true true l f( ; Y ) = ( ) l f( ; Y ) d σy N(0, = true [ ( )] De dode, ( ˆ MLE true ) d N(0, σ ) Y ) true 9-50

Resume: EMV (MLE) robt, caso s X El EMV (MLE): ˆ MLE = Y Trabajado sobre la teoría de la dstrbucó del EMV (MLE), llegamos a que: ( ˆ MLE true ) d N(0, σ ) Y Pero dado que true = Pr(Y = ) = E(Y) = µ Y, teemos que: (Y µ Y ) d N(0, σ ) Y U resultado vsto e las rmeras clases de Ecoometría! 9-5

La dervacó del EMV (MLE) utlza de forma geeral: ( ˆ MLE true ) d N(0, σ l f /a )) Los errores estádar se obtee ecotrado exresoes ara σ l f /a Extesó a varos arámetros (β 0, β ) medate cálculo matrcal Dado que la dstrbucó es ormal ara grade, la fereca se lleva a cabo de la forma habtual, or ejemlo, el tervalo de cofaza al 95% es MLE ±.96SE. La exresó de arrba utlza errores estádar robustos. Se uede smlfcar al caso de errores estádar o robustos s l f ( Y ; ) / es homocedástco. 9-5

Resume: dstrbuto del EMV (MLE) El EMV (MLE) sgue dstrbucó ormal ara grade Hemos trabajado este resultado e detalle ara el modelo robt s X (dstrbucó Beroull) Para grade, los tervalos de cofaza y los cotrastes de hótess se costruye de la forma usual. S el modelo está correctamete esecfcado, el EMV (MLE) es efcete, es dcer, tee meor varaza que cualquer otro estmador (esto o lo hemos desarrollado). Estos métodos se extede a otros modelos co varables deedetes dscretas, or ejemlo, datos de recueto (# deltos/día) ver SW Aédce. 9.. 9-53

Alcacó a los datos de Bosto HMDA (SW Seccó 9.4) Las hotecas so ua arte esecal e la comra de ua casa. Hay dferecas e el acceso a ua hoteca e fucó de la raza? S dos dvduos, uo blaco y otro egro, que e lo demás so guales, solcta ua hoteca, hay dferecas e la robabldad de que la hoteca sea deegada? 9-54

El cojuto de datos HMDA Datos sobre característcas dvduales, característcas de la casa y cocesó o deegacó del réstamo El roceso de solctud de hoteca e Bosto 990-99: oir a ua etdad facera orellear ua solctud (formacó ersoal y ecoómca) oetrevsta co el agete del baco El baco decde e fucó de la ley (s restar atecó a la raza). Presumblemete, el baco quere otorgar réstamos beefcos ara él y el agete quere evtar otecales roblemas or falta de ago. 9-55

La decsó del baco: El baco utlza formacó sobre varables faceras: oratop/i o rato gastos de la casa/reta del dvduo o rato cuatía del réstamo/valor de la casa o hstoral credtco ersoal La regla de decsó o es leal: orato réstamo/valor > 80% orato réstamo/valor > 95% oputuacó e otros crédtos (e fucó de retrasos e el ago, etc) 9-56

Esecfcacoes ara la regresó Pr(deeg= egro, otras X s) = modelo de robabldad leal robt, logt Prcal roblema e todas las esecfcacoes: otecal sesgo de omsó de varables. Todas esas varables: () etra e la fucó de decsó del baco, () está o odría estar correlacoadas co la raza: rqueza, to de trabajo hstoral credtco estatus famlar Varables e los datos HMDA 9-57

9-58

9-59

9-60

9-6

9-6

Resume de los resultados emírcos Los coefcetes de las varables faceras tee setdo. Negro (black) es estadístcamete sgfcatva e todas las esecfcacoes Las teraccó de la raza co varables faceras o so sgfcatvas. La clusó de otros regresores reduce sesblemete el efecto de la reza sobre la robabldad de deegacó del réstamo. MPL, robt, logt: estmacoes smlares del efecto de la raza sobre la robabldad de deegacó del réstamo. Los efectos estmados so bastate grades. 9-63

Ameazas a la valdez tera y extera Valdez tera. sesgo de varables omtdas qué formacó adcoal obtee el baco e la etrevsta ersoal?. forma fucoal correcta (o ) 3. errores de meddad (orgalmete, sí; ahora, o ) 4. seleccó muestra aleatora de solctudes de réstamos defr la oblacó de solctates de réstamos 5. causaldad smultáea (o) Valdez extera Aálss ara Bosto 990-9. Qué asaría hoy? 9-64

Resume (SW Seccó 9.5) S Y es bara, etoces E(Y X) = Pr(Y= X) Tres modelos: omodelo de robabldad leal (regresó leal múltle) orobt (dstrbucó ormal estádar) ologt (dstrbucó logístca estádar) MPL, robt, logt roduce robabldades estmadas El efecto de X es el cambo e la robabldad codcoada de Y=. Para los modelos logt y robt, esto deede del valor cal de X Probt y logt se estma or máxma verosmltud 9-65

olos coefcetes sgue dstrbucó ormal ara grade. olos cotrastes de hótess e tervalos de cofaza ara grade so los habtuales. 9-66