Sobre Regresión Logística

Documentos relacionados
TAMAÑO DE LA MUESTRA

Sistemas de control: Elementos componentes, variables, función de transferencia y diagrama funcional.

Coeficiente de correlación parcial

Límites finitos cuando x: ˆ

Límite Idea intuitiva del significado Representación gráfica

Capítulo V CONDICIONES DE FRONTERA Y MODELAMIENTO NUMÉRICO EN ECUACIONES DIFERENCIALES

CARACTERÍSTICAS EXTERNAS y REGULACIÓN de TRANSFORMADORES

- Se trata en el fondo, de la misma manera de medir la asociación entre X y M.

Energía. Reactivos. Productos. Coordenada de reacción

I. E. S. ATENEA. SAN SEBASTIÁN DE LOS REYES EXAMEN PARCIAL. PRIMERA EVALUACIÓN. ANÁLISIS

Prueba ji-cuadrado: χ 2. Estudiar la relación entre dos variables cualitativas. Estudiar la relación entre dos variables cualitativas

EJERCICIOS RESUELTOS DE FUNCIONES REALES DE VARIABLE REAL

Tema 2 La oferta, la demanda y el mercado

EL FILTRO DE KALMAN. Introducción. Qué es el Filtro de Kalman

CAPÍTULO 14: LAS EXPECTATIVAS: LOS INSTRUMENTOS BÁSICOS

LECCIÓN 5: ECUACIONES DIFERENCIALES ORDINARIAS DE PRIMER ORDEN DE VARIABLES SEPARABLES

Reporte Nº: 05 Fecha: JULIO ANÁLISIS DE SITUACIÓN MIGRATORIA DE EXTRANJEROS DE NACIONALIDAD HAITIANA 1. DESCRIPCIÓN DEL REPORTE

Estas pruebas permiten verificar que la población de la cual proviene una muestra tiene una distribución especificada o supuesta.

2º Bachillerato: ejercicios modelo para el examen de las lecciones 11, 12 y 13

LÍMITES, CONTINUIDAD, ASÍNTOTAS 11.1 LÍMITE DE UNA FUNCIÓN LÍMITE DE UNA FUNCIÓN EN UN PUNTO. Límite de una función en un punto

Soluciones a los ejercicios propuestos Unidad 1. El conjunto de los números reales Matemáticas aplicadas a las Ciencias Sociales I

LÍMITE DE FUNCIONES. lim. lim. lim. LÍMITE DE UNA FUNCIÓN CUANDO x + LÍMITE FINITO. DEFINICIÓN

III. FUNCIONES EXPONENCIALES Y LOGARÍTMICAS

Material del curso Recursos metodológicos y estadísticos para la docencia e investigación Manuel Miguel Ramos Álvarez

Ejercicios resueltos Distribuciones discretas y continuas

Tema 3 La elasticidad y sus aplicaciones

lasmatemáticas.eu Pedro Castro Ortega materiales de matemáticas y x 12x 2 y log 2 x ln x e e y ln 1 x

APLICACIONES DE LAS ECUACIONES DIFERENCIALES ORDINARIAS DE PRIMER ORDEN A PROBLEMAS QUE INVOLUCRAN A LA RECTA TANGENTE Y LA RECTA NORMAL

PROBLEMAS RESUELTOS DE RECTAS TANGENTES Y NORMALES

Elementos de acero Factores de longitud efectiva para el cálculo de la resistencia de elementos sometidos a compresión.

CAPITULO 5. ECUACIONES DIFERENCIALES DE ORDEN N Introducción Reducción de orden

ANÁLISIS DEL AMPLIFICADOR EN EMISOR COMÚN

núm. 38 martes, 25 de febrero de 2014 III. ADMINISTRACIÓN LOCAL DIPUTACIÓN PROVINCIAL DE BURGOS SERVICIO DE PERSONAL

2º BACHILLERATO CINETICA QUÍMICA

ASÍNTOTAS Y RAMAS INFINITAS Cálculo y representación

VARIACIÓN DE IMPEDANCIAS CON LA FRECUENCIA EN CIRCUITOS DE CORRIENTE ALTERNA

DISPERSIÓN - ESPECTRÓMETRO DE PRISMA

COMPUTACIÓN. Práctica nº 2

98 EJERCICIOS de DERIVABILIDAD 2º BACH.

91 EJERCICIOS de DERIVABILIDAD 2º BACH.

1.-PROCEDIMIENTO PARA EL CÁLCULO DE LÍMITES. Límites cuando

Funciones de Variable Compleja

RESUMEN DE FUNCIONES. LIMITE Y CONTINUIDAD

RADIO CRÍTICO DE AISLACIÓN

GRUPOS Y SEMIGRUPOS. Unidad 5

2. En el punto x = 0, f ( x) a) Un mínimo local. b) Un máximo local. c) Ninguna de las anteriores. Solución:

4 ANALISIS DIMENSIONAL Y SIMILITUD FISICA

DEPARTAMENTO DE QUÍMICA ANALÍTICA Y TECNOLOGÍA DE ALIMENTOS FUNDAMENTOS DE ANÁLISIS INSTRUMENTAL. 3ª RELACIÓN DE PROBLEMAS.

INTEGRAL INDEFINIDA MÉTODOS ELEMENTALES DE INTEGRACIÓN

FIZIKA SPANYOL NYELVEN

Paso de los diagramas de grafos a los diagramas de bloques

LÍMITES DE FUNCIONES.

PRÁCTICA 8 ESTUDIO DE ENGRANAJES 3º INGENIERÍA INDUSTRIAL

Anexo V "Acuerdos de Sistemas para la Facturación' del Convenio poro la Comercialización o Reventa de Servicios

Aplicaciones de la distribución weibull en ingeniería

Tema 3 La economía de la información

APLICACIONES DE LA DERIVADA

Solución: Para que sea continua deben coincidir los límites laterales con su valor de definición en dicho punto x = 2. b 1 + b

UNIDAD 2 HIDRAÚLICA. GENERALIDADES. Capítulo 2 PRESIONES EN LOS LÍQUIDOS : HIDROSTATICA SECCIÓN 2 : EMPUJES SOBRE SUPERFICIES PLANAS Y CURVAS

4.2. Ejemplo de aplicación.

Asamblea Nacional Secretaría General TRÁMITE LEGISLATIVO

APUNTES DE CLASE MACROECONOMÍA CAPÍTULO Nº 8 LA RENTABILIDAD EN MONEDA NACIONAL DE UNA INVERSIÓN EN MONEDA EXTRANJERA AGOSTO 2008 LIMA PERÚ

Ofertas y Contratos Agiles

núm. 234 miércoles, 11 de diciembre de 2013

Tema 5 El Mercado y el Bienestar. Las externalidades


MOVIMIENTO CIRCULAR UNIFORMEMENTE RETARDADO

TEMA 4. APLICACIONES DE LA DERIVADA.

ESTUDIO DE UNA FUNCIÓN CON AYUDA DE LA DERIVADA. OPTIMIZACIÓN. Aplicaciones de la derivada: condiciones de máximo, mínimo, inflexión

Núm. 36 Martes, 22 de febrero de III. ADMINISTRACIÓN local. DIpuTACIÓN provincial De burgos. secretaría general

Mercados Financieros y Expectativas Profesor: Carlos R. Pitta CAPÍTULO 8. Macroeconomía General

La función gamma. en la disciplina Matemática para las carreras de ingeniería

Tema 4 La política económica: impuestos y subvenciones por unidad vendida y controles de precios

REPRESENTACION GRAFICA.

TEOREMAS DEL VALOR MEDIO., entonces existe algún punto c (a, b) tal que f ( c)

Valledupar como vamos: Demografía, Pobreza y Pobreza Extrema y empleo.

Rutas críticas para la elaboración del trabajo de titulación en las diferentes modalidades. Planes de estudio 2012

núm. 109 miércoles, 11 de junio de 2014 III. ADMINISTRACIÓN LOCAL DIPUTACIÓN PROVINCIAL DE BURGOS UNIDAD DE CULTURA

TEMAS 3-6: EJERCICIOS ADICIONALES

Opción A Ejercicio 1 opción A, modelo Septiembre 2011

Matemáticas II TEMA 8 Derivadas. Teorema. Regla de L Hôpital Problemas Propuestos

Seguridad en máquinas

Convocatoria de Febrero 26 de Enero de Nombre y Apellidos:

A Microeconometric Approach to the Determinants of Travel Mode Choice

Matemáticas II TEMA 7 Límites y continuidad de funciones

UNIVERSIDAD DEL FÚTBOL Y CIENCIAS DEL DEPORTE MODELO ACADÉMICO DEPORTIVO ALTO RENDIMIENTO TUZO

LA ORGANIZACIÓN DEL DEPARTAMENTO FINANCIERO

CENTRO DE EXCELENCIA MEDICA EN ALTURA. Clave:CEMA-PR-FC-ACON-23 Versión: 0001 Próxima revisión: cada 30 días. Página 1 de 9

UNA INVITACIÓN AL ESTUDIO DE LAS ECUACIONES DIFERENCIALES ORDINARIAS. Maritza de Franco

CENTRO UNIVERSITARIO DEL FUTBOL Y CIENCIAS DEL DEPORTE, S. C. PROCEDIMIENTO PARA LA ENTREGA DE DOCUMENTOS A IHEMSYS Vigente a partir de:

Asamblea Nacional Secretaría General TRÁMITE LEGISLATIVO

INSTITUTO POLITECNICO NACIONAL PROBLEMARIO DE CALCULO DIFERENCIAL E INTEGRAL

El Riesgo de Interés

DISCRETOS LINEALES CON RESPUESTAS AL IMPULSO PERIÓDICAS

RESUMEN MOTORES CORRIENTE CONTINUA

FÍSICA CUÁNTICA LOS ORÍGENES DE LA FÍSICA CUÁNTICA

Practica 9: Tipo de cambio y paridad de poder adquisitivo

núm. 222 jueves, 21 de noviembre de 2013 V. OTROS ANUNCIOS OFICIALES SODEBUR SOCIEDAD PARA EL DESARROLLO DE LA PROVINCIA DE BURGOS

INTERCAMBIADOR DE CALOR AIRE AIRE PARA EL ACONDICIONAMIENTO TÉRMICO DE UNA CAMARA DE REPRODUCCION AGAMICA DE PLANTAS

TEMA 4: LA OFERTA AGREGADA

Transcripción:

Modlo caractrizado por la naturalza singular d su variabl rspusta o dpndint, Y, al tratars d una variabl dicotómica o d Brnoulli, n su modlo más sncillo: no ocurr l vnto d int rés Y sí ocurr l vnto d int rés ocurrncia dl vnto y y f(y) p ( p) ; y, ; p parámtro qu sñala la probabilidad d El valor prdicho d Y, o valor mdio condicional, razón d d sr d los modlos d rgrsión, no s otra cosa qu l parámtro p, la probabilidad d ocurrncia dl risgo. Si dsamos cuantificar l risgo d padcr una nfrmdad coronaria, por jmplo, rspcto d los siguints factors d risgo: status fumador, dad, antcdnts d hiprtnsión, diabts, práctica d jrcicio, tc o, n qué mdida los factors d risgo afctan al risgo, dbrmos intgrar dichos factors n variabls prdictoras o indpndints, al margn d cuáls considrmos d intrés primario y cuáls d control, ajust o confusión. La corrspondint modlización s nmarca n la dnominada Rgrsión Logística.

Para introducir l procdiminto, volvamos al vnto padcr una nfrmdad coronaria (CHD), considrando xclusivamnt la EDAD como variabl prdictora o xplicativa: Variabl rspusta: Y CHD no ocurr l risgo sí ocurr l risgo Variabl rgrsora o xplicativa: XEDAD En st caso, no tnmos la funt d inspiración qu ha supusto l modlo normal multivariant n los modlos clásicos d rgrsión, n los qu la variabl rspusta s d distribución normal, por tanto, una variabl continua. Para vr l modo d actuar, partamos dl fichro d datos chdag.dta, qu afcta a una mustra hipotética d tamaño, rspcto dl par d variabls antriors. S raliza una agrupación d la variabl EDAD por class y s raliza la rprsntación gráfica d la proporción d ocurrncia dl vnto por clas:

Si unimos los puntos, tndríamos una curva n forma d S (sigmoid)

La nub d puntos s pud ajustar a una curva sigmoid, smjant a la función d distribución d una variabl alatoria (a mdida qu aumnta la dad, aumnta la proporción d ocurrncia dl vnto). Esta curva podría corrspondr a la rprsntación gráfica d una función tipo logística: f(z) z z z + + cuyas propidads prmitn modlar una probabilidad, concrtamnt E(Y x) p π(x) probabilidad condicional probabilidad d qu ocurra l vnto para l valor x d la variabl prdictora o indpndint. En fcto, f(z) crc d a, dsd - a +, y z podría rprsntar un índic qu intgraría la contribución d uno o varios factors d risgo, d manra qu f(z) sñalaría la probabilidad d qu ocurra l vnto para z, la contribución cuantitativa d unos valors n concrto d los factors d risgo. La xprsión más sncilla para z sría la qu corrspondría a una forma linal, rspcto d las variabls prdictoras o xplicativas (los factors d risgo) qu, n l jmplo prsntado, sría z β + β x

Por tanto, formulamos l siguint modlo (LOGÍSTICO): π(x) f(z) f( β probabilidad d qu ocurra l vnto + β x) + + ( β + βx) ( β + β x) ( β + β x) Est modlo s totalmnt quivalnt al siguint: π(x) ln ( β + β x) g(x) función d nlac π(x) log it (transformación logit) Esta función d nlac o transformación logit corrspond con la part linal dl modlo intgra l fcto, n st caso simpl, dl único factor d risgo. Si nos dtnmos n la transformación logit antrior, podmos obsrvar qu l cocint, qu s dsigna por ODDS (vntaja) para l valor x, ODDS x dtrmina cuánto más probabl s qu ocurra l vnto a qu no ocurra, para l valor x d la variabl prdictora. π(x) π(x)

Vamos d qué forma podmos stablcr cuantitativamnt la asociación ntr Y y X, n st simpl modlo logístico, a partir dl coficint b, y su significado: Tomamos, como n los modlos d rgrsión clásicos, los valors x+ y x d la variabl xplicativa y sus corrspondints ODDS ODDS ODDS x + x π(x + ) π(x + ) π(x) π(x) Su cocint, dnominado ODDS RATIO, no s otra cosa qu l valor d la xponncial n b : π(x + ) ODDSx + π(x + ) OR(x ) vrsus (x) β + ODDS π(x) x π(x) una mdida d cuánto más probabl s qu ocurra l risgo o vnto con x+ qu con x (al aumntar x una unidad o por unidad d x). Esta cantidad s aproxima al risgo rlativo, si la probabilidad d ocurrncia dl vnto s baja.

D manra qu si b s conocido o s ha stimado n bas a una mustra, n l jmplo qu stamos manjando β stablcría una mdida d la variación d la probabilidad d sufrir una nfrmdad coronaria si la dad aumnta un año, o cuánto varía la probabilidad d qu ocurra por año. Otro jmplo qu nos pud ayudar a intrprtar β, part dl vnto dsarrollar un cáncr d garganta, codificado como variabl rspusta o dpndint, considrando como único factor d risgo o variabl prdictiva l status fumador: Si l modlo logístico fus π(x) + β ntoncs l odds ratio dtrmina una mdida d cuánto más probabl s dsarrollar cáncr d garganta si s s fumador, ntr fumadors qu ntr no fumadors. no dsarrolla cáncr d garganta Y sí dsarrolla cáncr d garganta no fumador X sí fumador ( β + β x) ( β + β x)

Estimación d parámtros n l modlo d rgrsión logística. Considrando l modlo más simpl ( β + β x) π(x) + ( β + β x) hay qu dsarrollar un procdiminto para stimar b y b a partir d (y i,x i ), i,,n; una mustra d n obsrvacions, dond (y i,x i ) dsignan, rspcto al i-ésimo individuo, l valor d la variabl rspusta dicotómica Y, y l corrspondint d la variabl prdictora o xplicativa X. En los métodos clásicos d rgrsión s utiliza habitualmnt, como bin s sabido, l método d stimación d los mínimos cuadrados, qu stablc los coficints dl modlo qu minimizan la suma d cuadrados d las dsviacions ntr los valors obsrvados d la variabl rspusta y los valors prdichos por l modlo. Por jmplo, si considramos l modlo d rgrsión linal simpl, sta suma d cuadrados d los rsiduos o dsviacions s: n i β β i 2 i SSE y ( + x ) Est método tin bunas propidads cuando la variabl rspusta s continua y concrtamnt con distribución normal; pro dsafortunadamnt no s l caso con una variabl rspusta dicotómica.

En l modlo d rgrsión logística l método d stimación d los parámtros s l d máxima vrosimilitud, qu a continuación rcordamos para l caso más simpl, con sólo una variabl xplicativa. El valor prdicho o valor mdio condicionado n studio s: π(x i) p(y i x i), dond Y i s la rspusta Y asociada a la i-ésima obsrvación y y y cuya dnsidad d probabilidad s f(y) π(x ) ( π(x )), y, i i i i i i Como las n obsrvacions son indpndints, la dnsidad conjunta o función d vrosimilitud o vrosimilitud d (Y,Y 2,,Y n ) srá i ( β + β x ) ( β + β x ) i i n n yi y i y i yi n i i β + β i β + β i i i + + l( β, β ) f(y)f(y )...f (y ) π(x ) ( π(x )) ( ) ( ) 2 2 n ( x) ( x) Est método consist n dtrminar las stimacions d b y b qu maximicn sta función d vrosimilitud. Para llo y para facilidad d cálculo, s considra l logaritmo npriano d la función d vrosimilitud n i { } L( β) ln(l( β, β)) yiln( π(x)) i + ( y)ln( i π(x)) i Como s habitual, rcurrirmos al softwar stadístico adcuado para llvar a cabo las stimacions d los parámtros dl modlo plantado.

Ants d abordar un primr jmplo d rgrsión logística, sñalarmos l stadístico d rfrncia n los corrspondints análisis, qu juga l mismo papl qu l cocint d sumas d cuadrados mdios, con distribución F d Fishr, n los modlos clásicos d rgrsión. S trata dl stadístico d la razón o cocint d vrosimilituds (liklihood ratio statistic): vrosimilitud sin un grupo d variabls G 2ln( ) vrosimilitud con l grupo d variabls D manra qu, si plantmos l modlo logístico múltipl: ( β + β x + β x +... β x ) p p 2 2 π(x) ( β + βx+ β x +... βpx p) + 2 2, dond X (x,x,...,x ) 2 p qu afcta a p variabls prdictoras o xplicativas (factors d risgo), y dsamos contrastar, por jmplo, la significación n bloqu (chunk tst) d un subgrupo d r variabls (x i,x i2,,x ir ), s tin qu 2 l( todos mnos βi, βi,..., βi ) 2 r G ln( ) l( β, β, β,..., β ) 2 p 2 qu, si βi βi... βi, s distribuy sgún una χ (r) 2 r

Rtomamos l fichro d datos chdag.dta, qu afcta a la variabl rspusta CHD y a la xplicativa o factor d risgo EDAD. Los procdimintos logit y logistic d Stata, gnran los rsultados: Significación dl modlo con G (liklihood ratio statistic) ˆ ODDS RATIO β Significación dl coficint b con stadístico d Wald Z ˆβ β SE( ˆ ˆβ )

El modlo final stimado sría: ˆπ (x) π( dad) Transformación logit ( ˆβ + ˆβ dad) ( 5. 39+. dad) ˆ ( ˆβ + ˆβ dad) ( 5. 39+. dad) + + (ˆ β + ˆβ x) ˆg(x) 539. +. dad ODDS RATIO ˆ β ÔR ˆ β + 2. x vrsus x 2. Cada año qu pasa s multiplica por la probabilidad d sufrir una nfrmdad coronaria

Con las stimacions por intrvalos d la transformación logit o función d nlac, s pud obtnr una stimación por intrvalos d la prdicción para una nuva obsrvación x, s dcir, d la probabilidad d qu ocurra l vnto para un individuo d dad x. Para llo, una vz qu hmos jcutado logit o logistic, s utiliza la opción Poststimation d Statistics para obtnr las stimacions puntuals d la transformación logit, d las prdiccions y d los rrors stándars d la transformacions logit ; asícomo la matriz d covarianzas stimadas ntr los stimadors d b y b : S dja qu l alumno comprub, con los datos antriors, qu una prdicción por intrvalos (al 95%) para un individuo d 5 años s (.435 ;.677), intrprtando st rsultado. Comprub también qu 3.3 s una stimación puntual dl OR d x+ vrsus x intrprétlo adcuadamnt.

Ejmplo sobr un hipotético studio dond la variabl rspusta: Y status CHD (nfrmdad coronaria)(no, sí), rspcto a la variabl xplicativa RAZA con 4 catgorías: blanca, ngra, latina y otras qu, al codificarla con variabls indicadoras, rsultarían raza_2 raza_3 raza_4 blanca ngra latina otras El modlo logístico sría: π(x) + ( β + β raza _ 2+ β raza _ 3+ β raza _ 4) 2 3 ( β + β raza _ 2+ β raza _ 3+ β raza _ 4) 2 3 Los ODDS Ratio tinn, n st caso, un significado muy concrto, simpr n rlación a la raza blanca: β OR OR OR ngra vrsus blanca latina vrsus blanca otras vrsus blanca β β 2 3

β 2 Por jmplo sñalaría una mdida d cuánto más probabl, o cuánto mnos probabl, s qu dsarroll la nfrmdad coronaria la raza latina qu la raza blanca. Rsulta obvio qu para comparar las razas ngra y latina, habría qu considrar l cocint OR OR ngra vrsus blanca latina vrsus blanca β β 2 Vamos con los siguints datos, cómo s obtndrían las stimacions d los parámtros por máxima vrosimilitud, al margn qu, n st simpl caso, s pudn obtnr dirctamnt d la tabla: β β 2 CHD blanca ngra latina otras total Sí 5 2 5 5 No 2 5 Total 25 3 25 2 ODDS RATIO 8 6 4 Ln(odds ratio) ˆβ 28. ˆ β 2 79. ˆ β 3 39. Para X(,,), s tndría ˆβ 5 ˆ(X) π ˆβ. ˆβ 39 25 +

D manra quivalnt, con l fichro chd vrsus raza.dta, Stata gnra los rsultados: Significación dl modlo con G (liklihood ratio statistic) Significación individual d los coficints con l stadístico d Wald ODDS RATIO

Para ilustrar una d las stratgias, quizás la más mplada, n los modlos d rgrsión logística, considramos l siguint studio cuyo objtivo s stablcr n qué mdida dtrminados factors d risgo afctan al bajo pso al nacr: Variabl rspusta: YEstatus: bajo pso al nacr (, si pso 25 gr.;, si pso<25 gr.). Variabls xplicativas o prdictoras (factors d risgo): lwt pso madr último priodo mnstrual (n libras). ag dad. raza (blanca, ngra, otras; codificada con dos dummy) ftv nº d visitas al gincólogo n l r trimstr mbarazo. Esta stratgia rcib dl nombr d backward (hacia atrás), jrárquica y por bloqus (chunk tsts), stratgia también mplada n los modlos clásicos d rgrsión. La transformación logit d modlo complto, sin términos d intracción por l momnto, sría g(x) ( β + β + β + β + β + β ) Transformación logit lwt ag raza2 raza3 ftv 2 3 4 5

Etapa : Análisis d la significación dl modlo complto H : β β β2 β3 β4 β5 H : al mnos un coficint s con ayuda d G, l stadístico d la razón d vrosimilituds. Si no s significativo s valor d stadístico, s dcir, si las variabls xplicativas parc qu no xplican la variabilidad d la rspusta, ntoncs STOP. En nustro caso (fichro lowbwt2.dta) los rsultados d Stata dfindn la validz dl modlo, por lo qu pasamos a la sgunda tapa: Significación dl modlo con G (liklihood ratio statistic) Logaritmo npriano d la vrosimilitud dl modlo complto

Etapa 2: S obsrva la significación individual d las variabls (coficints) con l tst d Wald : Significación individual d coficints (tst d Wald) Parc qu AGE (dad) y FTV no son significativas y hay dudas acrca d RAZA. Djamos por l momnto l caso d RAZA, y contrastamos n bloqu la significación d FTV y AGE: Lo hacmos n bloqu para prvnir rrors d tipo I (dclarar más variabls significativas d las ncsarias) y así tnr n cunta l principio d parsimonia. Est contrast s basa n l stadístico G qu, para st caso, adopta la siguint forma: qu bajo H sigu l modlo H : β β5 H : al mnos un coficint s vrosimilitud sin las variabls AGE y FTV G 2ln( ) vrosimilitud con todas las variabls 2 χ ( 2 )

Para obtnr st valor d G, procdmos como sigu (Statistics ö Poststimation ö Manag stimation rsults ö Stor stimation rsults):,s dcir, almacnamos n la variabl mod_complto l valor dl logaritmo npriano d la vrosimilitud dl modlo con todas las variabls. Como dbmos obtnr sta cantidad para l modlo sin AGE y FTV, rajustamos l modlo: y la almacnamos n mod_s_ag_ftv. Con l siguint comando (Statistics ö Poststimation ö Tsts ö Liklihood-ratio tst), obtnmos l valor d G: No Significativo: G.69, p-valor.7

Al rajustar l modlo con sólo lwt, raza2 y raza3, n los rsultados d la página antrior obsrvamos qu raza parc no significativa por lo qu contrastamos, d nuvo n bloqu, con En bas a los rsultados H : β3 β4 H : al mnos un coficint s vrosimilitud sin las variabls AGE, FTV, raza2, raza3 (solo lwt) G 2ln( ) vrosimilitud con lwt, raza2 y raza3 qu stán al límit d la significación, quizás por falta d potncia, l invstigador dcid mantnr la variabl raza, clínicamnt important ; por lo qu l modlo stimado final sría: ˆ(x) π + ( ˆβ + ˆβ lwt+ ˆβ raza2+ ˆβ raza 3) (. 8. 5lwt +. 8raza 2+. 48raza 3) 3 4 ( ˆβ ˆ lwt ˆ raza ˆ + β + β3 2+ β4raza 3) + ( 8. 5. lwt + 8. raza 2+ 48. raza 3)

El fnómno d la intracción: Como ya tuvimos ocasión d analizar n rgrsión múltipl, cuando la intracción ntr variabls xplicativas stá prsnt, la asociación ntr l factor d risgo primario y la variabl rspusta dpnd n alguna mdida dl valor o nivl d otra covariant o variabl indpndint: la covariant modifica l fcto dl factor d risgo primario; por sta razón, los pidmiólogos usan l término modificador para dscribir una variabl qu intractúa con un factor d risgo. El modlo más sncillo para incluir la intracción s aqul n l qu la transformación logit s también linal, pro con pndints distintas n función dl valor d la covariant modificadora. Para aclarar su trataminto y significado n rgrsión logística, considrmos l jmplo siguint: Variabl rspusta: Y status CHD Factor d risgo primario: Fstatus sxo ( hombr, mujr) Covariant, variabl d control o posibl fcto modificador: XEdad transformación logit g(sxo, dad) β + β sxo + β dad + β sxo dad con β 3 Los ODDS RATIO para l sxo, y por tanto sus stimacions, dbn sr stablcidas con rfrncia a una dad spcífica. 2 3

En gnral, si F s l factor d risgo primario, X la covariant y FX su intracción: log it(f, x) g(f, x) β + βf + β2x + β3fx D manra qu si dsamos stablcr l odds ratio, comparando los nivls f y f, para l valor x, localizamos n primr lugar los logit: g(f, x) β + βf + β2x + β3fx g(f, x) β + β f + β x + β f x 2 3 Evaluando su difrncia, obtndrmos l logaritmo dl ODDS RATIO: ln OR(f,f,x) g(f, x) g(f, x) β(f f ) + β3(f f ) x (f f ) (f f ) x OR(f, f, x) β + β 3 Si f f +, aumnto d una unidad n l factor d risgo, s tndrá OR β + β 3 x qu compara n alguna mdida las probabilidads d qu s produzca l risgo, si l factor d risgo cambia n una unidad, y para l valor spcífico x d la variabl d control o covariant. Si fus prciso una stimación por intrvalos dl logaritmo dl odds ratio o dl odds ratio, bajo la intracción, rmplazarmos los parámtros por sus stimacions, y tndrmos n cunta las varianzas stimadas:

Var ˆ ln(or) ˆ 2 2 (f f ) ˆβ + (f f )x ˆβ (f f )xcov( ˆ + ˆβ, ˆβ ) 3 2 3 SE ˆ ln(or) ˆ 2 2 (f f ) ˆβ + (f f )x ˆβ (f f )xcov( ˆ + ˆβ, ˆβ ) 3 2 3 S obtndría, finalmnt, la structura dl dicho intrvalo al -a d nivl d confianza: Tomando la xponncial d los xtrmos, tndríamos la stimación por intrvalos dl odds ratio: Como jmplo ilustrando la intracción, rtommos l studio sobr l vnto o risgo: bajo pso al nacr, d la página 7, n l qu discrtizamos, con una variabl indicadora, la variabl prdictiva o factor d risgo pso d la madr (, si lwt< libras;, sino), con l fin d obtnr un fcto discriminatorio mayor d st factor. Una vz cargado l fichro lowbwt2.dta, rcodificamos lwt, tal y como s ha mncionado, y considrando l modlo con variabl rspusta LOW (bajo pso al nacr), gr_lwt, como factor d risgo primario; dad, como variabl d control, y la posibl intracción gr_lwt x dad. ˆ β (f f ) + β (f f )x ± z α SE ln(or(f, f, x) ˆ ˆ 3 / 2 ˆ β (f f ) ˆ β (f f )x z ˆ ˆ α/ SE ln(or(f,f,x) + 3 ± 2

Alta significación dl modlo complto. Significación d la intracción al nivl. **

La intracción no s significativa al nivl.5 (quizás por falta d potncia) pro sí al nivl.. S opta por mantnr l término d intracción, ya qu qu n rgrsión logística s adoptan nivls d significación d hasta.5 (incluso supriors), n bas a lo qu los pidmiólogos dnominan significación clínica : s prfir no dscartar un factor d risgo, ralmnt important, n dtrimnto d incluir covariants sin significación stadística. Para qu puda vr gráficamnt la intracción, s rprsntan n la página siguint las transformacions logit para los dos grupos d pso d la madr (no hay parallismo): ˆlogit _ ˆβ ˆ ˆ ag ˆ + β + β2 + β3 ag. 774. 94. 796ag +. 32ag. 22 +. 52ag ˆlogit _ ˆβ + ˆβ + ˆβ ag + ˆβ ag. 774. 796ag Admás, 2 3 3 ÔR(, ag) vrsus ˆβ + ˆβ ag. 94+. 32ag (Para mujrs d 25 años d dad, por jmplo, l odds d bajo pso al nacr s multiplica por casi 4 al tnr bajo pso la madr, rspcto d las d las madrs con pso normal),(n ralidad, l cocint d probabilidads d ocurrncia dl vnto s prácticamnt 8).

D la gráfica d la transformacions logit, pud dducirs qu l ODDS para las madrs con bajo pso aumnta a mdida qu aumnta la dad; mintras qu disminuy n l caso d madrs con pso normal. A continuación, rtomarmos st caso pro n una situación más complja, n tanto qu considramos cuatro variabls xplicativas y varios téminos d intracción.

Con l fichro d datos lowbwt2.dta nos plantamos un modlo d rgrsión logística n l qu: Objtivo dl análisis: Estudiar la asociación ntr bajo pso al nacr y l pso d la madr, considrando como covariants la dad, la raza y l nº d visitas d la madr al gincólogo n l r trimstr d mbarazo. Variabl rspusta (risgo) (dpndint): YLOW (status) Variabl (factor d risgo) d intrés primario ( indpndint): LWTpso madr n l último priodo mnstrual. Rsto d covariants(variabl d control o ajust): EDAD(AGE), RAZA(RACE2, RACE3), FTV(visitas gincólogo). Términos d intracción: LWTxAGE, LWTxRACE2, LWTxRACE3, LWTxFTV.

Con Stata s gnran los cuatro términos d intracción y s procsa l modlo logístico complto con 9 variabls prdictoras: ( β + β lwt+ β ag+ β ftv+ β rac2+ β rac3+ β lwt _ ag+ β lwt _ rac2+ β lwt _ rac3+ β lwta _ ftv) 4 7 π(x) + 2 3 5 6 8 9 ( β + β lwt+ β ag+ β ftv+ β rac2+ β rac3+ β lwt _ ag+ β lwt _ rac2+ β lwt _ rac3+ β lwta _ ftv) 2 3 4 5 6 7 8 9 No Significación dl modlo complto al nivl.5 pro sí al nivl.5. Causas posibls: No significación d algunas variabls prdictoras; falta d potncia,

Con l fin d rsolvr la aparnt no significación dl modlo complto, ralizamos n primr lugar un diagrama d disprsión dl LOW vrsus LWT: S obsrva una gran variabilidad d la rspusta LOW, para casi todos los valors d LWT (pso d la madr), lo qu pud dificultar la rlación funcional ntr LOW y LWT Una forma d rducir tal variabilidad s la agrupación por intrvalos, s dcir, discrtizar LWT, con pso bajo y normal, potnciando su fcto discriminatorio rspcto d la rspusta.

S obsrva, lo qu confirma la asociación, una corrlación significativa ngativa ntr LOW y LWT (al aumntar l pso d la madr, l risgo d bajo pso al nacr disminuy): Discrtizamos LWT con para pso normal ( libras) y para bajo pso (< libras) y calculamos los coficints d corrlación condicional : No s dtcta corrlación significativa ntr LOW y LWT n ninguno d los dos grupos: cuando l pso d la madr s bajo, s indifrnt lo bajo qu sa; y si s normal, s indifrnt su magnitud. Esto dfind la discrtización d LWT

D todo lo antrior, rtomamos l modlo complto, rmplazando LWT por su discrtización gr_lwt, n todos los términos, y rcalculamos : Alta significación dl modlo complto, una vz discrtizada LWT. Obdcindo al principio jrárquico, a continuación contrastamos la significación n bloqu d los términos d intracción, con ayuga d G.

Contrast n bloqu d la intracción: con H : β6 β7 β8 β9 H : al mnos un coficint s vrosimilitud sin las variabls gr_lwt_ag, gr_lwt_rac2, gr_lwt_rac3, gr_lwt_ftv G 2ln( ) vrosimilitud modlo complto A continuación, contrast d significación n bloqu d AGE y FTV. No significativo: liminar los términos d intracción.

Contrast n bloqu d AGE y FTV: con H : β2 β3 H : al mnos un coficint s vrosimilitud sin las variabls ag y ftv G 2ln( ) vrosimilitud dl modlo con gr_lwt, ag, ftv, rac2 y rac3 A continuación, contrast d significación n bloqu d rac2 y rac3 No significativo: liminar las variabls AGE y FTV.

Contrast n bloqu d rac2 y rac3: con H : β4 β5 H : al mnos un coficint s vrosimilitud sin las variabls rac2 y rac3 G 2ln( ) vrosimilitud dl modlo con gr_lwt, rac2 y rac3 No significativo al nivl.5 pro sí al nivl.: s mantinn rac2 y rac3

Modlo final stimado: ˆ(X) π ( ˆβ ˆ gr _ lwt ˆ rac ˆ + β + β4 2+ β5rac 3) ( 4. +. gr_lwt +. rac 2+ 499. rac 3) ( ˆβ + ˆβ gr_lwt+ ˆβ rac + ˆβ rac ) + (. +. gr_lwt +. rac +. rac ) 4 2 4 2 499 3 5 3 + A partir d las prdiccions stimadas d la probabilidad dl vnto, d las stimacions d la transformación logit y sus corrspondints rrors stándars, y d las covarianzas d los stimadors d los coficints dl modlo final, todo llo rfrido a las obsrvacions; y qu s pudn obtnr con los siguints comandos d Stata:

Estimación puntual y por intrvalos (95%)y significado d Estimación puntual y por intrvalos (95%)y significado d Estimación puntual y por intrvalos (95%)y significado d Estimación puntual y por intrvalos (95%) d probabilidad d risgo (bajo pso al nacr) para gr_lwt y raza ngra, y significado: OR(gr _lwt gr _lwt,rac 2,rac 3) vrsus OR(gr _ lwt, raza ngravrsusraza blanca) OR(gr _ lwt, raza ngravrsusotras razas) π (gr _ lwt, raza ngra) Indicacions: tal y como s obsrva n págs. 4 y 5, convin dtrminar, n primr lugar, las stimacions d los coficints dl modlo y/o transformacions logit y utilizar, dspués, las xponncials corrspondints. PRACTICA FINAL CON ESTUDIO EVANS (n hojas sparadas)