CAPÍTULO 2 MODELO DE REGRESIÓN LOGÍSTICA

Documentos relacionados
Modelos de Regresión análisis de regresión diagrama de dispersión coeficientes de regresión

La inferencia estadística es primordialmente de naturaleza

Regresión - Correlación

REGRESIÓN LINEAL SIMPLE

TEMA 3. Medidas de variabilidad y asimetría. - X mín. X máx

En esta sección estudiaremos el caso en que se usa un solo "Predictor" para predecir la variable de interés ( Y )

Análisis de Regresión

Introducción a la Inferencia Estadística. Dept. of Marine Science and Applied Biology Jose Jacobo Zubcoff

Modelos de Regresión Simple

Qué es ESTADISTICA? OBJETIVO. Variabilidad de las respuestas. Las mismas condiciones no conducen a resultados exactamente similares PROBLEMA SOLUCIÓN

Regresión lineal simple

ESTADÍSTICA poblaciones

(Véase el Ejercicio 13 Beneficio de los bancos )

Estadística. Tema 6: Análisis de Regresión.. Estadística. UNITEC Tema 6: Análisis de Regresión Prof. L. Lugo

Inferencia Estadística

Métodos indirectos de estimación: razón, regresión y diferencia

ANÁLISIS DE REGRESIÓN. Departamento de Matemáticas Universidad de Puerto Rico Recinto Universitario de Mayagüez

Aplicación de Boostrapping en Regresión I

División de Estadísticas y Proyecciones Económicas (DEPE) Centro de Proyecciones Económicas (CPE)

Análisis de Regresión y Correlación Lineal

TEMA 5.- LA DECISIÓN DE INVERTIR EN UN CONTEXTO DE RIESGO Introducción.

1 Estadística. Profesora María Durbán

Análisis de Regresión y Correlación Lineal

Supongamos que hemos aplicado el test F y hemos rechazado la H0.

ANÁLISIS DE REGRESIÓN Y CORRELACIÓN LINEAL

Los Histogramas. Histograma simple

RELACIÓN ENTRE DOS VARIABLES NUMÉRICAS REGRESIÓN LINEAL SIMPLE. CORRELACIÓN. realizar el calibrado en análisis instrumental.

1. Introducción 1.1. Análisis de la Relación

ERRORES EN LAS MEDIDAS (Conceptos elementales)

SEMESTRE DURACIÓN MÁXIMA 2.5 HORAS DICIEMBRE 10 DE 2008 NOMBRE

Tema 60. PARÁMETROS ESTADÍSTICOS: CÁLCULO, PROPIEDADES Y SIGNIFICADO.

UNIDAD TEMÁTICA 9 REGRESIÓN LINEAL Y CORRELACIÓN ENUNCIADO 1

Test de Hipótesis. Error de tipo I: Rechazar H 0 siendo H 0 Verdadera. Error de tipo II: No rechazar H 0 siendo H 0 Falsa

GRADO EN PSICOLOGIA INTRODUCCIÓN AL ANÁLISIS DE DATOS Código Asignatura: FEBRERO 2010 EXAMEN MODELO A

Orden de la tirada. Figura 1: Frecuencia relativa de cara para una sucesión de 400 tiradas.

Modelos Estadísticos de Regresión Lineal

I. ANÁLISIS DESCRIPTIVO DE UN CONJUNTO DE DATOS

Intensificación en Estadística

Probabilidad ( A) Los axiomas de la probabilidad. φ = el conjunto vacío A B = A y no B C

Estadística Descriptiva

x θ es conocida pero se desconoce θ total o ˆθ ) debe ser función de los datos de la muestra

CAPITULO III MARCO TEÓRICO

Tema 2: Distribuciones bidimensionales

Colegio Sagrada Familia Matemáticas 4º ESO

Definición. Número obtenido a partir del análisis de una variable estadística. Procedimiento de cálculo bien definido:

Tema 2: El modelo básico de regresión lineal múltiple (I)

Colegio Sagrada Familia Matemáticas 4º ESO ESTADÍSTICA DESCRIPTIVA

GUÍA DE EJERCICIOS ESTADÍSTICA DESCRIPTIVA

CAPÍTULO III TÉCNICAS DE SIMULACIÓN ESTADÍSTICA. Los datos sintéticos son elementos de suma importancia en los sistemas de diseño en

MODELOS DE REGRESIÓN. Prof. Susana Martín Fernández

Esta t d a í d s í titcos o TEMA 3.3

Análisis Numérico y Programación. Unidad III. -Interpolación mediante trazadores: Lineales, cuadráticos y cúbicos

PARÁMETROS ESTADÍSTICOS ... N

Análisis de la Varianza

VARIABLE ALEATORIA Y FUNCIÓN DE DISTRIBUCIÓN

que queremos ajustar a los datos. Supongamos que la función f( x ) describe la relación entre dos cantidades físicas: x e y = f( x)

CÁLCULO Y COMENTARIOS SOBRE ALGUNAS MEDIDAS DESCRIPTIVAS. de una variable X, la denotaremos por x y la calcularemos mediante la fórmula:

El valor en el que se estabilizan las proporciones se le conceptualiza como la probabilidad

ESTADÍSTICA. UNIDAD 3 Características de variables aleatorias. Ingeniería Informática TEORÍA

V II Muestreo por Conglomerados

ANalysis Of VAriance ANOVA Análisis de la Varianza. Teresa Villagarcía

PROBABILIDAD Y ESTADISTICA

6. ESTIMACIÓN PUNTUAL

Máximos y Mínimos de funciones de dos variables

CÁLCULO NUMÉRICO (0258)

VARIABLES ESTADÍSTICAS UNIDIMENSIONALES.

Signif. codes: 0 *** ** 0.01 *

UNIDAD 14.- Distribuciones bidimensionales. Correlación y regresión (tema 14 del libro)

ÍNDICE 1. INTRODUCCIÓN A LA PROBABILIDAD... 11

MEDIDAS DE CENTRALIZACIÓN

MUESTREO EN POBLACIONES FINITAS (1) Dos aspectos básicos de la inferencia estadística, no vistos aún:

Estadística. Tema 2: Medidas de Tendencia Central.. Estadística. UNITEC Tema 2: Medidas de Tendencia Central Prof. L. Lugo

1 DISTRIBUCIONES DE PROBABILIDAD DE VARIABLE DISCRETA. LA BINOMIAL

Facultad de Ciencias del Mar. Curso 2008/09 25/06/09

Estadística Contenidos NM 4

Estimación de Parámetros. Estimación Puntual. Universidad Técnica Federico Santa María. Estimación de Parámetros. Estimación de Parámetros.

PyE_ EF1_TIPO2_

Especialista en Estadística y Docencia Universitaria PRUEBAS DE NORMALIDAD MÉTODO DE KOLMOGOROV SMIRNOV

ANÁLISIS DE LA VARIANZA ANOVA COMPARACIONES MULTIPLES ENTRE MEDIAS MUESTRALES

7. Muestreo con probabilidades desiguales.

MEDIDAS DE TENDENCIA CENTRAL

Comportamiento Mecánico de Sólidos Capítulo II. Introducción al análisis tensorial. Tensores. x 3 A 3. Figura 1. Componentes de un vector.

4º MEDIO: MEDIDAS DE POSICIÓN

Estadística aplicada al Periodismo

Estadística Espacial. José Antonio Rivera Colmenero

al nivel de significación α P6: Conclusión: Se debe interpretar la decisión tomada en Paso 5.

GRADO EN PSICOLOGIA INTRODUCCIÓN AL ANÁLISIS DE DATOS Código Asignatura: FEBRERO 2010 EXAMEN MODELO C

Tema 1. La medida en Física. Estadística de la medida Cifras significativas e incertidumbre

1. Los postulados de la Mecánica Cuántica. 2. Estados Estacionarios. 3. Relación de Incertidumbre de Heisenberg. 4. Teorema de compatibilidad.

SISTEMAS DE ECUACIONES NO LINEALES

ESTADÍSTICA. Tercera Prueba de Evaluación continua 30 de noviembre de 2015

UNIDAD DIDÁCTICA 13: Estadística Descriptiva

Calificación= (0,4 x Aciertos) - (0,2 x Errores) No debe entregar los enunciados

ENUNCIADOS DE LOS EJERCICIOS PROPUESTOS EN 2010 EN MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES.

MEDIA ARITMÉTICA. Normalmente se suele distinguir entre media aritmética simple y media aritmética ponderada.

1.2. Medidas de Concentración

LECTURA 02: DISTRIBUCIONES DE FRECUENCIAS (PARTE I) DISTRIBUCIONES DE FRECUENCIAS EN PUNTOS AISLADOS

Respuesta. Si 100 manzanas es una muestra suficientemente grande podemos ocupar el TCL. Por lo tanto:

Estadística Contenidos NM 4

x x x x x Y se seguía operando

Transcripción:

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes CAPÍULO MODELO DE REGRESIÓN LOGÍSICA INRODUCCIÓN La Regresó Logístca es ua técca estadístca multvarate que os permte estmar la relacó estete etre ua varable depedete o métrca, e partcular dcotómca y u couto de varables depedetes métrcas o o métrcas El Aálss de Regresó Logístca tee la msma estratega que el Aálss de Regresó Leal Múltple, el cual se dfereca esecalmete del Aálss de Regresó Logístca por que la varable depedete es métrca; e la práctca el uso de ambas téccas tee mucha semeaza, auque sus efoques matemátcos so dferetes La varable depedete o respuesta o es cotua, so dscreta (geeralmete toma valores,0 Las varables eplcatvas puede ser cuattatvas o cualtatvas; y la ecuacó del modelo o es ua fucó leal de partda, so epoecal; s be, por seclla trasformacó logarítmca, puede falmete presetarse como ua fucó leal Así pues el modelo será útl e frecuetes stuacoes práctcas de vestgacó e que la respuesta puede tomar úcamete dos valores:, preseca (co probabldad p; y 0, auseca (co probabldad -p El modelo será de utldad puesto que, muchas veces, el perfl de varables puede estar formado por caracteres cuattatvos y cualtatvos; y se pretede hacer partcpar a todos ellos e ua úca ecuacó couta El modelo puede acercarse mas a la realdad ya que muchos feómeos, como los del campo epdemológco, se asemea más a ua curva que a ua recta Además la curva epoecal elegda como meor auste, puede ser trasformada logarítmcamete e ua ecuacó leal de todas las Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes varables, sedo así que el aparato matemátco estudado para la regresó leal múltple será aplcable; auque el vestgador tega, al fal, que deshacer la trasformacó para terpretar sus coclusoes S para el Modelo de Regresó Logístca ua varable regresora de tpo categórca tee c veles habrá que geerar c- varables fctcas (dummy a f que todas las posbldades de la varable quede be represetadas e el modelo logístco Cuado todas las varables regresoras so categórcas etoces se usa el modelo Log leal, ver Mc Cullagh (983 OBJEIVOS DE LA REGRESIÓN LOGÍSICA El obetvo prmordal de esta técca es el de modelar como fluye las varables regresoras e la probabldad de ocurreca de u suceso partcular Sstemátcamete tee dos obetvos: Ivestgar como fluye e la probabldad de ocurreca de u suceso, la preseca o o de dversos factores y el valor o vel de los msmos Determar el modelo más parsmooso y meor austado que sedo razoable descrba la relacó etre la varable respuesta y u couto de varables regresoras 3 REGRESIÓN LOGÍSICA Y OROS MÉODOS RELACIONADOS El obetvo geeral de la Regresó Logístca es predecr la probabldad de u eveto de terés e ua vestgacó, así como detfcar las varables predctoras útles para tal predccó Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes Se puede usar varos métodos multvarates para predecr ua varable respuesta de aturaleza dcotómca a partr de u grupo de varables regresoras El Aálss de Regresó Leal Múltple y el Aálss Dscrmate so dos métodos efcaces pero platea problemas cuado la varable respuesta es bara E el Aálss de Regresó Leal Múltple cuado la varable respuesta toma solo dos valores, se vola los supuestos de ecesaros para efectuar ferecas, los problemas que se platea so: La dstrbucó de los errores aleatoros o es ormal Los valores predctados o puede ser terpretados como probabldades como e la Regresó Logístca, porque o toma valores detro del tervalo [0,] El Aálss Dscrmate permte la predccó de perteeca de la udad de aálss a uo de los dos grupos pre-establecdos, pero se requere que se cumpla los supuestos de multormaldad de las varables regresoras y la gualdad de matrces de covarazas de los dos grupos, puede ser dferetes també; para que la regla de predccó sea óptma, Johso (98 La Regresó Logístca requere mucho meos supuestos que el AD, por ello cuado satsface los supuestos requerdos para el AD, la Regresó Logístca trabaa be A cotuacó se descrbrá u paralelo etre la Regresó Leal Múltple y la Regresó Logístca, debdo a que ambos tee el msmo obetvo, predecr la varable respuesta a partr de las varables regresoras Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes 4 REVISIÓN DEL MODELO DE REGRESIÓN LINEAL MÚLIPLE La dfereca básca etre los modelos del Aálss de Regresó Leal Múltple y de la Regresó Logístca es aturaleza de la relacó etre la varable respuesta y las varables regresoras Para el Aálss de Regresó Leal Múltple, cosderemos y ua varable respuesta cuattatva y,,, varables regresoras o llamadas també eplcatvas; y se desea descrbr la relacó que hay etre la varable respuesta y las varables eplcatvas, s etre la varable respuesta y las regresoras hay ua relacó leal se espera que: dode: E ( y β + β + β + + β 0, ( para,,, y es el valor de la varable respuesta cuattatva para el -ésmo obeto β ; 0,,,, so los parámetros Sedo el úmero de obetos u observacoes Auque ( o de valores eactos, se espera que varíe lealmete co las varables regresoras, esto es: E y 0 + β + β ( β + + β sedo (,,, 0, para,,, ( toma valores reales y e forma vectoral es: ( y β E dode β ( β β, β,, β 0, ( la -ésma observacó, co 0, (3 es el vector de parámetros, Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes Pero e (3 hay otras varables regresoras que puede flur lealmete sobre y, por tato cada valor de y está varado alrededor de E ( y a esa varacó lo deotamos co ε, esto es: de (4: y ( y ε y E y β y β + ε (4 (5 β + β + β + + β + ε 0, para,,, (6 llamado Modelo de Regresó Leal Múltple poblacoal, a error aleatoro y tee las sguetes propedades: E ( ε ( ε V Cov Cov 0 σ ( ε, ε 0 ( ε, X 0 " (7 ε se le llama las varables regresoras o so varables aleatoras y el comportameto de y es la respuestas a aquellas, así msmo observable ε es ua varable aleatora o Geeralzado el Modelo de Regresó Leal Múltple, (6, medate el álgebra matrcal está dada por: y Xβ + ε (8 dode: ( y, y y (,,,, y,, X, vector de varables respuestas observadas matrz de rago completo y co Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes,, β β β,, β (,, ( 0, ( ε ε, ε ε,, así msmo ( e forma matrcal es: ( y Xβ E (9 el obetvo es estmar los parámetros del modelo (6, los msmos que so estmados medate el método de mímos cuadrados Sea ŷ la estmacó de y, etoces: o equvaletemete: ˆ ˆ ˆ βˆ, yˆ β0 + β + β + + sedo: βˆ βˆ 0, βˆ,, β ˆ ( (0 e su forma matrcal es: para,,, (0 y ˆ βˆ (, el vector de parámetros estmados y ˆ Xβˆ ( los resduos ordaros r es la cotraparte muestral de ε y está dado por: r y yˆ para,,, (3 e forma vectoral es: r y y (4 El estmador de β se obtee usado el método de mímos cuadrados, ver que cosste e mmzar la suma de cuadrados del error y está dada por: ˆ Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes SCE e e e ( y yˆ ( y yˆ co respecto a β, esta suma de cuadrados se epresa e forma cuadrátca como:: al mmzarlo se obtee que: llamada ecuacoes ormales Como ( X X (5 ( y Xβ ( y Xβ ( X X X y βˆ (6 es vertble, por que es smétrca de tamaño (+(+ y de rago completo, etoces la solucó del sstema leal es: ( X X X y β ˆ (7 que es sesble a observacoes pobremete austados y a los putos etremos de X, Motgomery y Pec (99 El vector ( de valores estmados para el vector de varables respuesta es: y ˆ Xβˆ ( X X X y a la matrz X ( X X X y yˆ X (8 proyeccó deotada por H, etoces (8 es: yˆ Hy (9 El vector de resduos es: r, se le llama matrz de cambo o de y y r y Hy (0 r ( ( I H y ˆ Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes El vector r ( r My descrbe las desvacoes de los valores observados de los austados y la matrz M es el subespaco e el cual cae r El vector resdual es mportate para detectar putos etraños A la matrz H se le llama matrz sombrero o de proyeccó, ver Coo y Wesberg (98 Ahora veamos como queda epresado la suma de cuadrados de los resduos, deotada por SCE : Reemplazado ŷ por Y reemplazado βˆ SCE SCE ( y yˆ ( y yˆ (3 X βˆ : (3 es: SCE ( ( β ˆ y X β ˆ y : por ( X X X y La matrz ( Sea ( X X X y (4 y y y X (5 H X X X X, etoces: SCE M I H, etoces (7 es: y y y Hy (6 SCE y ( I H y (7 SCE Bao el supuesto que ε ~ N ( 0, σ y My (8 I, las observacoes y, y,, y so depedetes y dstrbudas coo ua Normal -varada co ( y Xβ E co matrz de varazas y covarazas I σ Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes E la Regresó Logístca, se estma la probabldad de que u eveto ocurra; es decr, el valor esperado de y dado las varables regresoras, debe tomar valores etre 0 y La relacó etre las varables regresoras y la depedete o es leal Las estmacoes de probabldad estará sempre etre 0 y, así, el valor de la varable respuesta se puede defr como ua probabldad de que ocurra o o u eveto sueto a cotrol E la Regresó Logístca, se seleccoa los coefcetes, del modelo, que hace que los resultados sea los más probables Como el modelo de Regresó Logístca o es leal, se requere de u algortmo teratvo para estmar los parámetros E las seccoes sguetes se detallará los aspectos teórcos y la aplcacó de la Regresó Logístca Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes 5 REGRESIÓN LOGÍSICA SIMPLE Este modelo tee la forma: y β 0 + β + ε para,,, De esto se deduce que: S y, ε - β0 - β (9 (30 S y 0, ε -β 0 - β Por tato (3 ε, o puede teer dstrbucó ormal debdo a que toma valores dscretos, el Modelo de Regresó Leal Smple, o es aplcable para el caso de varable respuesta de tpo dcotómco E el Aálss de Regresó Leal smple, el puto cal del proceso de estmacó del modelo es u gráfco de dspersó de la varable respuesta versus la regresora, pero este gráfco resulta lmtado cuado sólo hay dos valores posbles para la varable respuesta, por tato se debe usar otros gráfcos, éstos resulta de la suavzacó de los valores de la varable respuesta, represetado después los valores de la varable respuesta versus la regresora La otacó que se usará e el presete trabao para la Regresó Logístca es msma que emplea Hosmer y Lemeshow (000 Sea ( E( y π (3 Que represeta la meda codcoal de y dado, dode π ( represeta la probabldad de que ocurra y, certamete o se espera que (3 tega relacó leal detro del rago de la varable regresora Qué hay de la relacó etre π ( y para valores termedos de? Se espera ua relacó curvlíea Para cualquer valor grade de, π ( tomará valores cercaos a y para valores pequeños de, π ( tomará Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes valores cercaos a cero El gráfco que muestra el comportameto de π ( versus es: FIGURA Nº curva e forma de S o sgmode que tee las propedades requerdas para π ( y que tee las propedades de ua fucó de dstrbucó de probabldad acumulada, para esta probabldad se usa la fucó de dstrbucó acumulada de la dstrbucó logístca dada por: π ( e β0 + β + e β0 + β (33 (33 tee u gráfco smlar a la Fgura Nº, cuado β 0 < 0 y β, además este modelo toma valores e el tervalo [,] > 0 Cuado, P[ y ] 0 5 muy útl el valor de es: - β0 β 0, que brda formacó Ua trasformacó de π ( que es lo cetral del estudo de la Regresó Logístca es la trasformacó logt, trasformacó que se defe e térmos π ( como: Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes g ( Ø π LŒº - β0 + β ( π ( ø œß (34 Lo mportate de esta trasformacó es que tee muchas propedades semeates al Modelo de Regresó Leal smple, por eemplo es leal e sus parámetros, puede ser cotua y puede tomar cualquer valor real depededo de Para el Modelo de Regresó Leal smple, la varable respuesta, de (4 se epresa como: ( y + ε y E (35 para la varable respuesta dcotómca lo epresamos como: ( ε y π + (36 veamos que ocurre co este modelo: y, ε - π ( y tee probabldad π ( S S 0 y, ε -π ( y tee probabldad - π ( Etoces ( [ π ( ] π - ε tee dstrbucó bomal co meda cero y varaza Por tato la dstrbucó codcoal de la varable respuesta tee dstrbucó de probabldad bomal co meda π ( El lado zquerdo de (34 se llama també logartmo de ODDS RAIO o razó de probabldades de y cotra y 0 ODDS RAIO ( π ( π (37 - o també llamado razó de vetaa a favor de éto, especfcamete: Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes 6 REGRESIÓN LOGÍSICA MÚLIPLE E esta seccó se geeralza el Modelo de Regresó Logístca Smple tratado e la seccó ateror, es decr cosderaremos más de ua varable regresora, e dode por lo meos ua es de tpo cuattatvo 6 MODELO DE REGRESIÓN LOGÍSICA MÚLIPLE Sea el vector de varables regresoras (,,, por el mometo asumremos que está meddas por lo meos bao escala tervalar Sea la probabldad codcoal para que la varable respuesta sea gual a, deotado por: P ( y π ( (39 el logartmo del Modelo de Regresó Logístca Múltple está dado por:, para,,, g ( β 0 + β + β + + β (40 etoces el Modelo de Regresó Logístca Múltple es: ( e g + e ( g( π (4 Al gual que e el caso de Regresó Leal Múltple s es ecesaro usar varables regresoras categórcas, por eemplo s ua tee c veles será ecesaro corporar c- varables fctcas o llamadas dummy, así etoces el logt para u modelo co varables regresoras y ua varable categórca, por eemplo la -ésma es: g c- ( β0 + β + + β l D l+ β para,,, l, (4 Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes 6 AJUSE DEL MODELO DE REGRESIÓN LOGÍSICA MÚLIPLE El auste se efectúa a través del uso de los métodos de máma verosmltud, los msmos que se ecuetra e los softwares estadístcos que permte aalzar datos medate este método Asumremos que dspoemos de ua muestra observacoes depedetes (, y,,,, ; dode y toma valores 0 ó, para estmar 0,, β ( β β β, descoocdos que es el vector de parámetros Para el Modelo de Regresó Leal Múltple se usa el método de Mímos Cuadrados para estmar β, el cual mmza la suma de cuadrados del error, pero cuado la varable respuesta es bara aplcar este método o provee las msmas propedades cuado es usado e varables respuestas cotuas Por ello se usará el método de Máma Verosmltud, ya que obtedremos parámetros estmados que mamza la probabldad de obteer u couto de datos observados La fucó de verosmltud epresa la probabldad de los datos observados como ua fucó de parámetros descoocdos Los Estmadores de Máma Verosmltud de esos parámetros so aquellos que está e cocordaca co los datos observados Cosderemos el Modelo de Regresó Leal Múltple co mayor detalle, supogamos que se dspoe de obetos u observacoes dode para cada uo de ellos este ua respuesta que puede ser: y 0 o y ϖ Sea y ( y y, y dode y B(, π,, ~ y sea Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes (,,, la -ésma observacó para las varables eplcatvas Así el Modelo de Regresó Logístca está dada por la epresó (40: e g( P equvaletemete [ ] ( y π (43 + e g( P [ ] y Ep β0 + β Ł ł + Ep β0 + β Ł ł (44 y la probabldad de que y sea gual a cero es: P P [ 0 ] - P[ ] y [ 0 ] y y, etoces : + Ep β0 + β Ł ł (45 para facltar la otacó usaremos la varable dcadora,,,, 0 Etoces (44 y (45 so respectvamete: P [ ] π ( y β e β + e (46 Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes P [ ] - π ( y dode: (,, 0, varables eplcatvas ( β β β β 0,,, El -ésmo logto es: β + e 0 (47, es el vector que cotee los valores de las es el vector de parámetros a ser estmado π L Ł - π ł β 0 λ (48 como vemos, (48 es ua fucó leal smple del vector de observacoes llamada trasformacó logístca de la probabldad π o smplemete Logt o Logto de la ecuacó, a la epresó (48 també se le llama Modelo Logístco Leal A f de obteer la estmacó mámo verosíml para el vector β, escrbmos la fucó de desdad de probabldad del vector y proporcoal a fucoes (, f B π ( y ; π π ( π π π y ( π, esto es: y ( π π Ep L π π ( π Ep y L y Reemplazado (48 e (49, se obtee: π y el cual es (49 Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes f ( ; π ( -π y ( -π Ep y β 0 Ep y β 0Ł ł (50 El logartmo atural de la fucó (50, llamado fucó soporte es: l ( ; y y β + l( π π (5 0 pero L L (47 : -π [ + Ep ( β ] ( - π L [ + Ep ( β ] ( - L + Ep β 0, etoces π (,5 reemplazado (5 e (5, se obtee: l + π β (53 0 0 ( ; y y β L Ep como vemos (53 es ua fucó que ya o depede de solamete, etoces lo deotamos como: ( y β L + Ep π so de L β β (54 0 0 β Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes es ua fucó que depede eclusvamete del vector β Defamos como: t etoces reemplazado (55 e (54 se tee: L ( β t L + Ep 0 y 0 β (55 β (56 Como (56 es ua fucó eclusva del vector de parámetros β, por el eorema de Factorzacó de Fsher-Neyma, Bcel y Dosum (976, se tee que t para 0,,, so estadístcas sufcetes para los parámetros β, para 0,,,, La varable aleatora t dada e la epresó (56 es la suma de alguos de los térmos de la matrz de dseño X, es decr se cluye e la suma solamete los elemetos que correspode a ua respuesta del tpo y Las ecuacoes de verosmltud, se obtee dervado (54 co respecto a los elemetos de β e gualado a cero: L β y las ecuacoes de verosmltud de (57 so: Ep β 0 + Ep β 0 y ˆ 0 0,,, sedo 0, equvaletemete (58 es: (57 π (58 Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes dode: ( y ˆ 0 0,,, π ˆ π (59 Ep ˆ β 0 + Ep ˆ β 0 ; para,,, es el estmador mámo verosíml de vector La epresó (58 e su forma matrcal es: ( y ˆ XS 0 π y se obtee medate X π (60 βˆ y el Estas ecuacoes so parecdas a las ecuacoes ormales obtedas para estmar el Modelo de Regresó Leal Múltple, pero so o leales e β, lo cual hace que se use u método teratvo para determar los valores del vector βˆ La obtecó de βˆ medate métodos teratvos; para se 0,,, tratará e la sguete seccó, ahora obtedremos la varaza y covaraza de βˆ Sea X (p la matrz de dseño, co p+, co elemetos: Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM X Las ecuacoes de verosmltud e su forma matrcal, de la epresó (60: πˆ X y X (6 dode ( π π π π ˆ,, ˆ, ˆ ˆ ( 0 y π (6 El método de estmacó de las varazas y covarazas lo obtedremos de la matrz de seguda dervada parcal de (6: y tee la forma: ( L π π β (63 para 0,,,, reemplazado: la ecuacó para π e (63, 0,, para 0 0 + Ep Ep L β β β (64

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes L β l para, l l 0,,,, π ( π β (65 reemplazado: L β β l l Ep 0 β + Ep β 0 ato (64 como (65 o so fucoes de (66 y, etoces la matrz de observacó y la matrz de seguda dervada esperada so détcas Ahora be la matrz que cotee el egatvo de las ecuacoes (64 y Ι β, llamada Matrz de Iformacó; las varazas y (66 se deota co ( covarazas de ver Cordero (99 βˆ se obtee tomado la versa de esta matrz, esto es: ( β Ι ( β Cov (67 Los estmadores de la varaza y covaraza, deotada por ˆ ˆ ov C β, obtee evaluado Cov ˆ ( β e β se Etoces la matrz de formacó estmada, matrcalmete tee la forma: V es ua matrz dagoal, esto es: ˆ Ι ˆ β X'VX (68 V Dag [ πˆ ( - πˆ ] Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes de tamaño, además (68 es: ( ˆ ( X ' VX Cˆ ov β (69 y es de tamaño (+(+ escrbremos los elemetos de la matrz (69 Cov ˆ ( β ˆ σˆ ( βˆ σ ( βˆ βˆ σ ( βˆ βˆ 0 ˆ 0, ˆ 0, σˆ ( βˆ σˆ ( βˆ, βˆ σˆ ( βˆ dode: ( σˆ β es la varaza estmada de σ ( βˆ, βˆ l ( ˆ es la covaraza estmada de σ ˆ ˆ β es el error estadar de βˆ βˆ βˆ y La matrz (69 será muy útl cuado se dscuta el auste y la evaluacó del Modelo de Regresó Logístca βˆ l 63 MÉODO DE NEWON RAPHSON PARA ESIMAR LOS PARÁMEROS DEL MODELO DE REGRESIÓN LOGÍSICA Este es u método para resolver ecuacoes o leales, como las obtedas e (57 o equvaletemete e (58, y requere ua solucó medate métodos teratvos para hallar la estmacó de los parámetros que es el mámo de la fucó (54 Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes Uo de los métodos más usados para resolver ecuacoes de este tpo, es el de Newto-Raphso, porque coverge rápdamete E la fgura Nº se lustra el método omado como estmacó cal, se prologa la tagete a la curva e este puto hasta terceptar co el ee de las abscsas al cual llamaremos puto, etoces se toma a como la sguete apromacó Este proceso cotua hasta que u valor de haga que la fucó sea ula o sufcetemete cercaa a cero Para la estmacó del vector β se quere hallar el mámo de ua fucó; etoces usa la prmera dervada, porque se aula e el puto mámo y la seguda dervada para calcular las tagetes E uestro caso es ecesaro hallar la seguda dervada para obteer la matrz de varazas y covarazas de los parámetros estmados Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes Fgura Nº Iterpretacó Geométrca del Método Iteratvo de Newto Raphso F( f( f( Etoces se usa el sguete esquema teratvo: βˆ ( t + β ( t ˆ + Ι βˆ ( t [ ( ] ( ( t S βˆ (70 dode: S ( βˆ y ( βˆ respectvamete Ι so las fucoes de Score y de Iformacó La fucó Score es u vector de tamaño +, dode el -ésmo elemeto de acuerdo a (57 es: Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes L β ( ( t y π (7 La cual es smlar a la epresó (59: ( y 0,, π ˆ, La Fucó de formacó es ua matrz de tamaño (+(+ dode el - ésmo elemeto (l, es: β l β (7 l β l ( y π y βl e le + e l β β β l ( π + e e + e β + e β β e β β π 0,,, ; l 0,,, l e β Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes ( t dode π ( t, es la t-ésma apromacó para πˆ, obteda de β medate: ( t ( t Ep β 0 ( + t Ep β 0 π (73 Etoces el prómo valor reemplazado e (70 es: β ( t β ( t X V ( t X { } ( ( t X y π + [ ( ] π π ( t ( t ( t dode V Dag (74 ( t+ La epresó (70 se usa para obteer π Después de dar u valor cal y así sucesvamete ( 0 β ( 0, se usa (70 para obteer para t>0 las teracoes sguetes se efectúa usado (70 y (7 ( t E el límte, π ( t y e 5 o 6 teracoes β π coverge a los EMV de πˆ y coverge e geeral Este software estadístcos como el SAS y el SPSS co programas para estmar ua regresó logístca usado el método descrto Ua vetaa de este método es que e el paso fal del proceso teratvo se obtee la versa de la fucó de formacó, que es astótcamete la matrz de varazas y covarazas del vector βˆϖ y permte efectuar ferecas sobre los parámetros basado e la teoría ormal Para mayor formacó se recomeda a Afff y Clar (998 y Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes 64 INERPREACIÓN DE LOS COEFICIENES DEL MODELO ESIMADO Recordamos del modelo de regresó múltple que el valor de u coefcete sgfcaba el cambo e udades de la varable depedete por cada udad de la varable depedete a que se refere el coefcete, permaecedo varates los valores del resto de varables depedetes del modelo A vel de coefcetes estmados epoecalmete la terpretacó es muy smlar y la dfereca estrba e que e este caso o se trata del cambo (cremeto o dsmucó de la probabldad de la varable depedete por cada udad de cambo e las depedetes, so del cremeto o dsmucó que se produce e el cocete etre P(Y / P(Y0, epresado por: P ( Y B 0 + B X + BX + + B K X K P ( Y 0 e (75 Más aú, está epresados e logartmos, por lo que sería ecesaro trasformarlos (tomado los valores del atlogartmo de tal forma que se evalúe más fáclmete su efecto sobre la probabldad Los programas de computador lo hace automátcamete calculado tato el coefcete real como el trasformado Utlzar este procedmeto o camba e modo alguo la forma de terpretar el sgo del coefcete U coefcete postvo aumeta la probabldad, metras que u valor egatvo dsmuye la probabldad Así pues s β es postvo, su trasformacó (atlog será mayor a, y el odds rato aumetará Este aumeto se produce cuado la probabldad prevsta de ocurreca de u suceso aumeta y la probabldad prevsta de su o ocurreca dsmuye Por lo tato, el modelo tee ua elevada probabldad de ocurreca De la msma forma, s β es egatvo, el atlogartmo es meor que y el odds rato dsmuye U valor de cero equvale a u valor de, lo que o produce cambo e el odds Har (999 Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes 64 PRUEBA DE HIPÓESIS PARA LOS COEFICIENES DEL MODELO DE REGRESIÓN LOGÍSICA Usualmete e la estmacó del Modelo de Regresó Logístca, como e el Modelo de Regresó Leal Múltple se efectúa pruebas co obetvos dferetes, sedo estos: Determar s ua varable eplcatva tee coefcete gual a cero Determar s u couto de varables eplcatvas tee coefcetes gual a cero 3 Determar la caldad del auste global del modelo Veamos para cada obetvo, como se efectúa el aálss 65 PRUEBA DE WALD Wald(943 estudo ua prueba astótca para estmacoes mámos verosímles, y aseveró que los parámetros estmados e los modelos logístcos tee ua Dstrbucó Normal para muestras grades Esta prueba se usa para evaluar la sgfcaca estadístca de cada varable eplcatva o regresora Sea ( t πˆ que coverge a los EMV de πˆ y y, y,, y respuesta bara depedetes cuyas probabldades satsface ( π β Logt dode π P[ y ] Sedo varables ua observacó que cotee los valores de las varables eplcatvas co (,,,, S perdda de geeraldad, seleccoaremos β como el parámetro de terés Supógase que las hpótess so: Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes H0 : β H : β β 0 β 0 (76 sea βˆ u EMV de ( X I VX β y sea: la versa de la matrz de formacó muestral, etoces la estadístca de Wald para dócmar (75 es: W ( βˆ β 0 σˆ ( βˆ (77 dode σ ( ˆ ˆ β es la estmacó del error estádar de βˆ Bao H 0, por tato: W y para sufcetemete grade se tee que: ~ χ ( βˆ β 0 βˆ ~ β 0 z N, σˆ ~ ξ, z, es χ ( ( ( βˆ ˆ σˆ β χ co parámetro de o cetralzacó: ξ ver Hac y Doer (977 ( β β 0 σˆ ( βˆ (79 (78 Pero la estadístca W, tee la propedad que cuado el valor absoluto del coefcete de Regresó es grade, el error estádar també lo es; esta stuacó hace que la estadístca W sea pequeña y por tato se puede rechazar β gual a cero, cuado e realdad o debería rechazarse Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes Por tato, cuado se ecuetra que u coefcete es grade, es preferble o usar la estadístca de Wald para efectuar dócma dvdual So se recomeda costrur u modelo co y s esa varable y basarse e la prueba de hpótess de la dfereca etre los dos modelos, ver Hac y Doer (977 Para las hpótess estadístcas: La estadístca (77 es: Bao por tato:, W χ ( 0 ~ H0 : β H : β W σˆ 0 0 ( βˆ ( βˆ (80 (8 H y para sufcetemete grade se tee que: z se dstrbuye como ua βˆ βˆ z σˆ ~ N, ( βˆ ( ˆ σˆ β ξ z ~ χ ξ, ( (8 χ co parámetro de o cetralzacó: (ξ, ( β ( βˆ (83 σˆ s la varable eplcatva es categórca, los grados de lbertad es gual al úmero de categorías o veles de la varable meos uo Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes 65 PRUEBA CHI-CUADRADO Esta prueba srve para lograr el segudo obetvo propuesto al carse la seccó 64 y srve para docmar los coefcetes del modelo logístco Para elegr u modelo, se usa la prueba de razó de verosmltud, Bcel y Docsum (977, para probar la hpótess de que los coefcetes correspodetes a las varables eplcatvas retradas, dgamos q varables eplcatvas, del modelo so guales a cero, sedo la hpótess estadístcas: H0 : β H : β β 0, para por βq lo 0 meos Esta prueba se basa e la sguete estadístca: q u [ LL LL ] p q,,, q χ (84 Bao la hpótess de que los coefcetes de las varables retradas so guales a cero, la estadístca (84 tee ua dstrbucó astótca p β χ ( q Valores altos para esta estadístca dca que ua o más de las q varables retradas tee coefcete de regresó dstto de cero La estadístca determada, por eemplo χ q se usa també para probar s ua varable eplcatva, muestra ua asocacó sgfcatva (como factor de resgo cuado se aplca a casos de efermedades para co la varable respuesta e la preseca de las demás varables,,, 653 ESADISICA CHI-CUADRADA DE PEARSON Esta estadístca srve para lograr el obetvo úmero 3, es decr evaluar el modelo austado e forma global La estadístca se basa e la comparacó de los valores observados, y ; y sus respectvas probabldades estmadas, π Las hpótess estadístcas para usar esta estadístca so: Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes H H 0 : β : β o β β 0, para por 0 lo meos u 0,,,,, esta prueba se basa e la estadístca Ch-cuadrado de Pearso, que está dada por: o equvaletemete dode: r v ( y πˆ Dag ( y πˆ π ( π ˆ χ (85 r v ˆ χ (86 ( Vˆ πˆ ( πˆ como observamos la estadístca (86 es gual a (5 Bao la hpótess ula, de que el modelo se austa be a los valores observados, la estadístca (86 tee dstrbucó astótca Ch-cuadrado χ ( ( + Valores altos de la estadístca Ch-cuadrado de Pearso dca dscrepacas co el modelo teórco, Cordero (99 La estadístca (86 es estable cuado πˆ toma valores cercaos a cero o uo, por ello tomar e cueta esta observacó, cuado se realza el aálss 654 DESVIANZA Otra forma de probar el auste global del modelo, es medate la estadístca llamada Desvaza, propuesta por Nelder y Wederbur (98, es aálogo a la suma de cuadrados de los resduales del Modelo de Regresó Leal Múltple Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes Las hpótess estadístcas so: H0 : β H : β β 0, para 0 por lo meos u,,,, Esta estadístca se usa para evtar la establdad de la estadístca Chcuadrado de Pearso La Desvaza esta dada por: dode : D p d (87 log pˆ s y d ;,,, log( pˆ s y 0 La Desvaza bao la hpótess ula, astótcamete, es la msma que la dstrbucó Ch-cuadrado de Pearso, es decr se dstrbuye χ y ( ( + mde la dscrepaca o el desvo etre el modelo bao vestgacó o actual y el modelo saturado La estadístca (87 para el modelo de regresó logístca eta dada por: D ( y log( π + ( y log( π ˆ ˆ (88 Cuado el modelo bao vestgacó es verdadero se compara el valor D ( p co el valor crítco χ de ua dstrbucó sgfcacó gual a α, por tato : χ a u vel de S D > χ ( p el modelo se rechaza y Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes S D χ ( p el modelo o se rechaza dode p + 655 ABLA DE CLASIFICACION ambé llamada Matrz de Cofusó, es ua forma seclla de evaluar el auste del Modelo de Regresó Logístca, o es ta obetva pero se usa como dcador de bodad de auste Es ua tabla seclla de, e el cual se muestra la dstrbucó de los obetos que perteece a las categorías y, es decr cuado y 0 y cuado y, coutamete co la clasfcacó a cualquera de las categorías de acuerdo a la probabldad estmada Para terpretar se hace medate el porcetae de obetos be clasfcados, esto es, aquellos que medate la probabldad estmada permaece e su respectva categoría ambé se terpreta medate el porcetae de obetos mal clasfcados, esto es, aquellos que medate la probabldad estmada se asga a categorías dferetes del cual fuero observados ABLA DE CLASIFICACION GRUPO GRUPO ESIMADO ACUAL 0 OAL MARGINAL 0 + OAL MAGINAL + + + Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes + 00% es el porcetae de obetos be clasfcados medate el Modelo de Regresó Logístca estmado Por tato, lo que se debe esperar es que este porcetae sea lo más alto posble, a f de coclur que el modelo obtedo clasfca be a los obetos o dvduos 656 CONRASE DE BONDAD DE AJUSE DE HOSMER LEMESHOW Este cotraste evalúa la bodad de auste del modelo, es decr el grado e que la probabldad predcha cocde co la observada, costruyedo ua tabla de cotgeca a la que aplca u cotraste Para ello calcula los decles de las probabldades estmadas ( pˆ ;,,, D,D,D 9 y dvde los datos observados e 0 categorías dadas por : A { pˆ [ D, D / {,,, }} ; dode D 0 0, D 0 Sea: J úmero de casos e A ;,,,0 o úmero de y e A ;,,,0 p pˆ A ;,,0 El estadístco del cotraste vee dado por : ( o p (89 p 0 p ( P 8 obs χ z y el p-valor del cotraste es [ ],,, 0 Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes 66 DIAGNOSICO DEL MODELO Es la evaluacó de la bodad de auste caso por caso medate el aálss de los resduos del modelo y de su flueca e la estmacó del vector de parámetros del msmo, se realza usado: 66 RESIDUOS DEL MODELO Los resduos más utlzados so los sguetes: Resduos estadarzados- So el cocete etre los resduales y ua estmacó de la desvacó estádar y pˆ z ;,,, pˆ ( pˆ (90 Resduos studetzados- So el cambo e el valor de la desvaza del modelo s el caso es ecluído y pˆ ( st ;,,, pˆ ( pˆ ( ( (9 dode pˆ ( es la estmacó de p obteda elmado la observacó de la muestra Resduos Desvaza- Para cada observacó la desvaza se calcula : log pˆ s y d ;,,, log( pˆ s y 0 (9 odos estos resduos se dstrbuye apromadamete como ua N(0,, s el modelo austado es correcto 66 MEDIDAS DE INFLUENCIA Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes Cuatfca la flueca que cada observacó eerce sobre la estmacó del vector de parámetros o sobre las predccoes hechas a partr del msmo, de modo que, cuato más grade so, mayor es la flueca que eerce ua observacó e la estmacó del modelo Medda de Apalacameto (Leverage Se utlza para detectar observacoes que tee u gra mpacto e los valores predchos por el modelo / / Se calcula a partr de la matrz H W X ( X ' WX X ' W dode W dag pˆ ( pˆ El apalacameto para la observacó -ésma vee dado por el elemeto -ésmo de la dagoal prcpal de H, h, y toma valores etre 0 y co u valor medo de p/ Las dos meddas sguetes mde el mpacto que tee ua observacó e la estmacó de â Dstaca de Coo- Mde la flueca e la estmacó de â COOK p ' ( ∠∠( X ' WX ( ∠∠( (93 DFBEA- Mde la flueca e la estmacó de ua compoete de â, â Dfbeta ∠∠std(∠( (94 dode âˆ, âˆ( deota las estmacoes del módelo logístco de â y â, elmado la -ésma observacó de la muestra y std ∠el error estádar e la estmacó de â ( 67 VARIABLES EXPLICAIVAS CAEGORICAS VARIABLES DUMMY S ua de las varables eplcatvas es categórca, co c valores posbles, se crea c- varables dcotómcas como varables eplcatvas també Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes llamadas varables dummy Estas varables cuatfca el efecto de u valor de dchas varables co respecto a u valor de refereca Estas varables se usa cuado los datos se muestra como categorías, las categorías puede ser: Nomales: La varable smplemete dca dferetes categoras, las categorías o puede ser ordeadas e u orde partcular Eemplo : Seo (hombre,muer Ordales: La varable además de estar agrupada e categorías puede ser ordeada El que ua categoría este e u orde superor que otra mplca que su medda represeta algo mayor que la otra Eemplo: Clase socal (baa, meda, alta Itervalares: La varables o solo puede ser ordeada, so que su valor mde la dstaca etre categorías Estas tee estádares de udades de medda Eemplo: Altura, temperatura, presó saguíea Cuado se tee varables de este tpo se crea las llamadas varables dummy, s la varable tee c categoras se usa c- varables fctcas o dummy La varable dca s u dato correspode a ua categoría o o Veamos u eemplo de cómo se hace esto: Supogamos que teemos ua varable clase socal, codfcada : Baa, :Meda, y 3:Alta, etoces creamos dos varables dummy : Clase : s el dato correspode a la clase socal Baa, 0 s el dato o perteece a la clase Baa Clase : s el dato correspode a la clase socal Meda, 0 s el dato o perteece a la clase Meda Como se puede ver estas os permte clasfcar cualquer dato e ua de las categoras estetes Supogamos que creamos las varables dummy Id e Id para ua varable X de tres categorías, como sgue: X Id Id Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM

Estmacó de la ocurreca de cdecas e declaracoes de pólzas de mportacó Salcedo Poma, Cela Mercedes 0 0 3 0 0 E este caso la ecuacó del modelo austado vee dada por: p( Id, INd ; β log β 0 + βid+ β Id p( Id, Id; β Sea p p[y/x];,,3 Se tee: p p e Se sgue que: p p β + β 0 p3 p 3, e p p β, e p p β + β 0, p3 p p3 p 3 3 e e β β 0 (95 Por lo tato, e,, β compara los odds rato correspodetes a X,, frete al de la categoría de refereca X3 Elaboracó y dseño e formato PDF, por la Ofca Geeral del Sstema de Bblotecas y Bbloteca Cetral UNMSM