Modlo caractrizado por la naturalza singular d su variabl rspusta o dpndint, Y, al tratars d una variabl dicotómica o d Brnoulli, n su modlo más sncillo: no ocurr l vnto d int rés Y sí ocurr l vnto d int rés ocurrncia dl vnto y y f(y) p ( p) ; y, ; p parámtro qu sñala la probabilidad d El valor prdicho d Y, o valor mdio condicional, razón d d sr d los modlos d rgrsión, no s otra cosa qu l parámtro p, la probabilidad d ocurrncia dl risgo. Si dsamos cuantificar l risgo d padcr una nfrmdad coronaria, por jmplo, rspcto d los siguints factors d risgo: status fumador, dad, antcdnts d hiprtnsión, diabts, práctica d jrcicio, tc o, n qué mdida los factors d risgo afctan al risgo, dbrmos intgrar dichos factors n variabls prdictoras o indpndints, al margn d cuáls considrmos d intrés primario y cuáls d control, ajust o confusión. La corrspondint modlización s nmarca n la dnominada Rgrsión Logística.
Para introducir l procdiminto, volvamos al vnto padcr una nfrmdad coronaria (CHD), considrando xclusivamnt la EDAD como variabl prdictora o xplicativa: Variabl rspusta: Y CHD no ocurr l risgo sí ocurr l risgo Variabl rgrsora o xplicativa: XEDAD En st caso, no tnmos la funt d inspiración qu ha supusto l modlo normal multivariant n los modlos clásicos d rgrsión, n los qu la variabl rspusta s d distribución normal, por tanto, una variabl continua. Para vr l modo d actuar, partamos dl fichro d datos chdag.dta, qu afcta a una mustra hipotética d tamaño, rspcto dl par d variabls antriors. S raliza una agrupación d la variabl EDAD por class y s raliza la rprsntación gráfica d la proporción d ocurrncia dl vnto por clas:
Si unimos los puntos, tndríamos una curva n forma d S (sigmoid)
La nub d puntos s pud ajustar a una curva sigmoid, smjant a la función d distribución d una variabl alatoria (a mdida qu aumnta la dad, aumnta la proporción d ocurrncia dl vnto). Esta curva podría corrspondr a la rprsntación gráfica d una función tipo logística: f(z) z z z + + cuyas propidads prmitn modlar una probabilidad, concrtamnt E(Y x) p π(x) probabilidad condicional probabilidad d qu ocurra l vnto para l valor x d la variabl prdictora o indpndint. En fcto, f(z) crc d a, dsd - a +, y z podría rprsntar un índic qu intgraría la contribución d uno o varios factors d risgo, d manra qu f(z) sñalaría la probabilidad d qu ocurra l vnto para z, la contribución cuantitativa d unos valors n concrto d los factors d risgo. La xprsión más sncilla para z sría la qu corrspondría a una forma linal, rspcto d las variabls prdictoras o xplicativas (los factors d risgo) qu, n l jmplo prsntado, sría z β + β x
Por tanto, formulamos l siguint modlo (LOGÍSTICO): π(x) f(z) f( β probabilidad d qu ocurra l vnto + β x) + + ( β + βx) ( β + β x) ( β + β x) Est modlo s totalmnt quivalnt al siguint: π(x) ln ( β + β x) g(x) función d nlac π(x) log it (transformación logit) Esta función d nlac o transformación logit corrspond con la part linal dl modlo intgra l fcto, n st caso simpl, dl único factor d risgo. Si nos dtnmos n la transformación logit antrior, podmos obsrvar qu l cocint, qu s dsigna por ODDS (vntaja) para l valor x, ODDS x dtrmina cuánto más probabl s qu ocurra l vnto a qu no ocurra, para l valor x d la variabl prdictora. π(x) π(x)
Vamos d qué forma podmos stablcr cuantitativamnt la asociación ntr Y y X, n st simpl modlo logístico, a partir dl coficint b, y su significado: Tomamos, como n los modlos d rgrsión clásicos, los valors x+ y x d la variabl xplicativa y sus corrspondints ODDS ODDS ODDS x + x π(x + ) π(x + ) π(x) π(x) Su cocint, dnominado ODDS RATIO, no s otra cosa qu l valor d la xponncial n b : π(x + ) ODDSx + π(x + ) OR(x ) vrsus (x) β + ODDS π(x) x π(x) una mdida d cuánto más probabl s qu ocurra l risgo o vnto con x+ qu con x (al aumntar x una unidad o por unidad d x). Esta cantidad s aproxima al risgo rlativo, si la probabilidad d ocurrncia dl vnto s baja.
D manra qu si b s conocido o s ha stimado n bas a una mustra, n l jmplo qu stamos manjando β stablcría una mdida d la variación d la probabilidad d sufrir una nfrmdad coronaria si la dad aumnta un año, o cuánto varía la probabilidad d qu ocurra por año. Otro jmplo qu nos pud ayudar a intrprtar β, part dl vnto dsarrollar un cáncr d garganta, codificado como variabl rspusta o dpndint, considrando como único factor d risgo o variabl prdictiva l status fumador: Si l modlo logístico fus π(x) + β ntoncs l odds ratio dtrmina una mdida d cuánto más probabl s dsarrollar cáncr d garganta si s s fumador, ntr fumadors qu ntr no fumadors. no dsarrolla cáncr d garganta Y sí dsarrolla cáncr d garganta no fumador X sí fumador ( β + β x) ( β + β x)
Estimación d parámtros n l modlo d rgrsión logística. Considrando l modlo más simpl ( β + β x) π(x) + ( β + β x) hay qu dsarrollar un procdiminto para stimar b y b a partir d (y i,x i ), i,,n; una mustra d n obsrvacions, dond (y i,x i ) dsignan, rspcto al i-ésimo individuo, l valor d la variabl rspusta dicotómica Y, y l corrspondint d la variabl prdictora o xplicativa X. En los métodos clásicos d rgrsión s utiliza habitualmnt, como bin s sabido, l método d stimación d los mínimos cuadrados, qu stablc los coficints dl modlo qu minimizan la suma d cuadrados d las dsviacions ntr los valors obsrvados d la variabl rspusta y los valors prdichos por l modlo. Por jmplo, si considramos l modlo d rgrsión linal simpl, sta suma d cuadrados d los rsiduos o dsviacions s: n i β β i 2 i SSE y ( + x ) Est método tin bunas propidads cuando la variabl rspusta s continua y concrtamnt con distribución normal; pro dsafortunadamnt no s l caso con una variabl rspusta dicotómica.
En l modlo d rgrsión logística l método d stimación d los parámtros s l d máxima vrosimilitud, qu a continuación rcordamos para l caso más simpl, con sólo una variabl xplicativa. El valor prdicho o valor mdio condicionado n studio s: π(x i) p(y i x i), dond Y i s la rspusta Y asociada a la i-ésima obsrvación y y y cuya dnsidad d probabilidad s f(y) π(x ) ( π(x )), y, i i i i i i Como las n obsrvacions son indpndints, la dnsidad conjunta o función d vrosimilitud o vrosimilitud d (Y,Y 2,,Y n ) srá i ( β + β x ) ( β + β x ) i i n n yi y i y i yi n i i β + β i β + β i i i + + l( β, β ) f(y)f(y )...f (y ) π(x ) ( π(x )) ( ) ( ) 2 2 n ( x) ( x) Est método consist n dtrminar las stimacions d b y b qu maximicn sta función d vrosimilitud. Para llo y para facilidad d cálculo, s considra l logaritmo npriano d la función d vrosimilitud n i { } L( β) ln(l( β, β)) yiln( π(x)) i + ( y)ln( i π(x)) i Como s habitual, rcurrirmos al softwar stadístico adcuado para llvar a cabo las stimacions d los parámtros dl modlo plantado.
Ants d abordar un primr jmplo d rgrsión logística, sñalarmos l stadístico d rfrncia n los corrspondints análisis, qu juga l mismo papl qu l cocint d sumas d cuadrados mdios, con distribución F d Fishr, n los modlos clásicos d rgrsión. S trata dl stadístico d la razón o cocint d vrosimilituds (liklihood ratio statistic): vrosimilitud sin un grupo d variabls G 2ln( ) vrosimilitud con l grupo d variabls D manra qu, si plantmos l modlo logístico múltipl: ( β + β x + β x +... β x ) p p 2 2 π(x) ( β + βx+ β x +... βpx p) + 2 2, dond X (x,x,...,x ) 2 p qu afcta a p variabls prdictoras o xplicativas (factors d risgo), y dsamos contrastar, por jmplo, la significación n bloqu (chunk tst) d un subgrupo d r variabls (x i,x i2,,x ir ), s tin qu 2 l( todos mnos βi, βi,..., βi ) 2 r G ln( ) l( β, β, β,..., β ) 2 p 2 qu, si βi βi... βi, s distribuy sgún una χ (r) 2 r
Rtomamos l fichro d datos chdag.dta, qu afcta a la variabl rspusta CHD y a la xplicativa o factor d risgo EDAD. Los procdimintos logit y logistic d Stata, gnran los rsultados: Significación dl modlo con G (liklihood ratio statistic) ˆ ODDS RATIO β Significación dl coficint b con stadístico d Wald Z ˆβ β SE( ˆ ˆβ )
El modlo final stimado sría: ˆπ (x) π( dad) Transformación logit ( ˆβ + ˆβ dad) ( 5. 39+. dad) ˆ ( ˆβ + ˆβ dad) ( 5. 39+. dad) + + (ˆ β + ˆβ x) ˆg(x) 539. +. dad ODDS RATIO ˆ β ÔR ˆ β + 2. x vrsus x 2. Cada año qu pasa s multiplica por la probabilidad d sufrir una nfrmdad coronaria
Con las stimacions por intrvalos d la transformación logit o función d nlac, s pud obtnr una stimación por intrvalos d la prdicción para una nuva obsrvación x, s dcir, d la probabilidad d qu ocurra l vnto para un individuo d dad x. Para llo, una vz qu hmos jcutado logit o logistic, s utiliza la opción Poststimation d Statistics para obtnr las stimacions puntuals d la transformación logit, d las prdiccions y d los rrors stándars d la transformacions logit ; asícomo la matriz d covarianzas stimadas ntr los stimadors d b y b : S dja qu l alumno comprub, con los datos antriors, qu una prdicción por intrvalos (al 95%) para un individuo d 5 años s (.435 ;.677), intrprtando st rsultado. Comprub también qu 3.3 s una stimación puntual dl OR d x+ vrsus x intrprétlo adcuadamnt.
Ejmplo sobr un hipotético studio dond la variabl rspusta: Y status CHD (nfrmdad coronaria)(no, sí), rspcto a la variabl xplicativa RAZA con 4 catgorías: blanca, ngra, latina y otras qu, al codificarla con variabls indicadoras, rsultarían raza_2 raza_3 raza_4 blanca ngra latina otras El modlo logístico sría: π(x) + ( β + β raza _ 2+ β raza _ 3+ β raza _ 4) 2 3 ( β + β raza _ 2+ β raza _ 3+ β raza _ 4) 2 3 Los ODDS Ratio tinn, n st caso, un significado muy concrto, simpr n rlación a la raza blanca: β OR OR OR ngra vrsus blanca latina vrsus blanca otras vrsus blanca β β 2 3
β 2 Por jmplo sñalaría una mdida d cuánto más probabl, o cuánto mnos probabl, s qu dsarroll la nfrmdad coronaria la raza latina qu la raza blanca. Rsulta obvio qu para comparar las razas ngra y latina, habría qu considrar l cocint OR OR ngra vrsus blanca latina vrsus blanca β β 2 Vamos con los siguints datos, cómo s obtndrían las stimacions d los parámtros por máxima vrosimilitud, al margn qu, n st simpl caso, s pudn obtnr dirctamnt d la tabla: β β 2 CHD blanca ngra latina otras total Sí 5 2 5 5 No 2 5 Total 25 3 25 2 ODDS RATIO 8 6 4 Ln(odds ratio) ˆβ 28. ˆ β 2 79. ˆ β 3 39. Para X(,,), s tndría ˆβ 5 ˆ(X) π ˆβ. ˆβ 39 25 +
D manra quivalnt, con l fichro chd vrsus raza.dta, Stata gnra los rsultados: Significación dl modlo con G (liklihood ratio statistic) Significación individual d los coficints con l stadístico d Wald ODDS RATIO
Para ilustrar una d las stratgias, quizás la más mplada, n los modlos d rgrsión logística, considramos l siguint studio cuyo objtivo s stablcr n qué mdida dtrminados factors d risgo afctan al bajo pso al nacr: Variabl rspusta: YEstatus: bajo pso al nacr (, si pso 25 gr.;, si pso<25 gr.). Variabls xplicativas o prdictoras (factors d risgo): lwt pso madr último priodo mnstrual (n libras). ag dad. raza (blanca, ngra, otras; codificada con dos dummy) ftv nº d visitas al gincólogo n l r trimstr mbarazo. Esta stratgia rcib dl nombr d backward (hacia atrás), jrárquica y por bloqus (chunk tsts), stratgia también mplada n los modlos clásicos d rgrsión. La transformación logit d modlo complto, sin términos d intracción por l momnto, sría g(x) ( β + β + β + β + β + β ) Transformación logit lwt ag raza2 raza3 ftv 2 3 4 5
Etapa : Análisis d la significación dl modlo complto H : β β β2 β3 β4 β5 H : al mnos un coficint s con ayuda d G, l stadístico d la razón d vrosimilituds. Si no s significativo s valor d stadístico, s dcir, si las variabls xplicativas parc qu no xplican la variabilidad d la rspusta, ntoncs STOP. En nustro caso (fichro lowbwt2.dta) los rsultados d Stata dfindn la validz dl modlo, por lo qu pasamos a la sgunda tapa: Significación dl modlo con G (liklihood ratio statistic) Logaritmo npriano d la vrosimilitud dl modlo complto
Etapa 2: S obsrva la significación individual d las variabls (coficints) con l tst d Wald : Significación individual d coficints (tst d Wald) Parc qu AGE (dad) y FTV no son significativas y hay dudas acrca d RAZA. Djamos por l momnto l caso d RAZA, y contrastamos n bloqu la significación d FTV y AGE: Lo hacmos n bloqu para prvnir rrors d tipo I (dclarar más variabls significativas d las ncsarias) y así tnr n cunta l principio d parsimonia. Est contrast s basa n l stadístico G qu, para st caso, adopta la siguint forma: qu bajo H sigu l modlo H : β β5 H : al mnos un coficint s vrosimilitud sin las variabls AGE y FTV G 2ln( ) vrosimilitud con todas las variabls 2 χ ( 2 )
Para obtnr st valor d G, procdmos como sigu (Statistics ö Poststimation ö Manag stimation rsults ö Stor stimation rsults):,s dcir, almacnamos n la variabl mod_complto l valor dl logaritmo npriano d la vrosimilitud dl modlo con todas las variabls. Como dbmos obtnr sta cantidad para l modlo sin AGE y FTV, rajustamos l modlo: y la almacnamos n mod_s_ag_ftv. Con l siguint comando (Statistics ö Poststimation ö Tsts ö Liklihood-ratio tst), obtnmos l valor d G: No Significativo: G.69, p-valor.7
Al rajustar l modlo con sólo lwt, raza2 y raza3, n los rsultados d la página antrior obsrvamos qu raza parc no significativa por lo qu contrastamos, d nuvo n bloqu, con En bas a los rsultados H : β3 β4 H : al mnos un coficint s vrosimilitud sin las variabls AGE, FTV, raza2, raza3 (solo lwt) G 2ln( ) vrosimilitud con lwt, raza2 y raza3 qu stán al límit d la significación, quizás por falta d potncia, l invstigador dcid mantnr la variabl raza, clínicamnt important ; por lo qu l modlo stimado final sría: ˆ(x) π + ( ˆβ + ˆβ lwt+ ˆβ raza2+ ˆβ raza 3) (. 8. 5lwt +. 8raza 2+. 48raza 3) 3 4 ( ˆβ ˆ lwt ˆ raza ˆ + β + β3 2+ β4raza 3) + ( 8. 5. lwt + 8. raza 2+ 48. raza 3)
El fnómno d la intracción: Como ya tuvimos ocasión d analizar n rgrsión múltipl, cuando la intracción ntr variabls xplicativas stá prsnt, la asociación ntr l factor d risgo primario y la variabl rspusta dpnd n alguna mdida dl valor o nivl d otra covariant o variabl indpndint: la covariant modifica l fcto dl factor d risgo primario; por sta razón, los pidmiólogos usan l término modificador para dscribir una variabl qu intractúa con un factor d risgo. El modlo más sncillo para incluir la intracción s aqul n l qu la transformación logit s también linal, pro con pndints distintas n función dl valor d la covariant modificadora. Para aclarar su trataminto y significado n rgrsión logística, considrmos l jmplo siguint: Variabl rspusta: Y status CHD Factor d risgo primario: Fstatus sxo ( hombr, mujr) Covariant, variabl d control o posibl fcto modificador: XEdad transformación logit g(sxo, dad) β + β sxo + β dad + β sxo dad con β 3 Los ODDS RATIO para l sxo, y por tanto sus stimacions, dbn sr stablcidas con rfrncia a una dad spcífica. 2 3
En gnral, si F s l factor d risgo primario, X la covariant y FX su intracción: log it(f, x) g(f, x) β + βf + β2x + β3fx D manra qu si dsamos stablcr l odds ratio, comparando los nivls f y f, para l valor x, localizamos n primr lugar los logit: g(f, x) β + βf + β2x + β3fx g(f, x) β + β f + β x + β f x 2 3 Evaluando su difrncia, obtndrmos l logaritmo dl ODDS RATIO: ln OR(f,f,x) g(f, x) g(f, x) β(f f ) + β3(f f ) x (f f ) (f f ) x OR(f, f, x) β + β 3 Si f f +, aumnto d una unidad n l factor d risgo, s tndrá OR β + β 3 x qu compara n alguna mdida las probabilidads d qu s produzca l risgo, si l factor d risgo cambia n una unidad, y para l valor spcífico x d la variabl d control o covariant. Si fus prciso una stimación por intrvalos dl logaritmo dl odds ratio o dl odds ratio, bajo la intracción, rmplazarmos los parámtros por sus stimacions, y tndrmos n cunta las varianzas stimadas:
Var ˆ ln(or) ˆ 2 2 (f f ) ˆβ + (f f )x ˆβ (f f )xcov( ˆ + ˆβ, ˆβ ) 3 2 3 SE ˆ ln(or) ˆ 2 2 (f f ) ˆβ + (f f )x ˆβ (f f )xcov( ˆ + ˆβ, ˆβ ) 3 2 3 S obtndría, finalmnt, la structura dl dicho intrvalo al -a d nivl d confianza: Tomando la xponncial d los xtrmos, tndríamos la stimación por intrvalos dl odds ratio: Como jmplo ilustrando la intracción, rtommos l studio sobr l vnto o risgo: bajo pso al nacr, d la página 7, n l qu discrtizamos, con una variabl indicadora, la variabl prdictiva o factor d risgo pso d la madr (, si lwt< libras;, sino), con l fin d obtnr un fcto discriminatorio mayor d st factor. Una vz cargado l fichro lowbwt2.dta, rcodificamos lwt, tal y como s ha mncionado, y considrando l modlo con variabl rspusta LOW (bajo pso al nacr), gr_lwt, como factor d risgo primario; dad, como variabl d control, y la posibl intracción gr_lwt x dad. ˆ β (f f ) + β (f f )x ± z α SE ln(or(f, f, x) ˆ ˆ 3 / 2 ˆ β (f f ) ˆ β (f f )x z ˆ ˆ α/ SE ln(or(f,f,x) + 3 ± 2
Alta significación dl modlo complto. Significación d la intracción al nivl. **
La intracción no s significativa al nivl.5 (quizás por falta d potncia) pro sí al nivl.. S opta por mantnr l término d intracción, ya qu qu n rgrsión logística s adoptan nivls d significación d hasta.5 (incluso supriors), n bas a lo qu los pidmiólogos dnominan significación clínica : s prfir no dscartar un factor d risgo, ralmnt important, n dtrimnto d incluir covariants sin significación stadística. Para qu puda vr gráficamnt la intracción, s rprsntan n la página siguint las transformacions logit para los dos grupos d pso d la madr (no hay parallismo): ˆlogit _ ˆβ ˆ ˆ ag ˆ + β + β2 + β3 ag. 774. 94. 796ag +. 32ag. 22 +. 52ag ˆlogit _ ˆβ + ˆβ + ˆβ ag + ˆβ ag. 774. 796ag Admás, 2 3 3 ÔR(, ag) vrsus ˆβ + ˆβ ag. 94+. 32ag (Para mujrs d 25 años d dad, por jmplo, l odds d bajo pso al nacr s multiplica por casi 4 al tnr bajo pso la madr, rspcto d las d las madrs con pso normal),(n ralidad, l cocint d probabilidads d ocurrncia dl vnto s prácticamnt 8).
D la gráfica d la transformacions logit, pud dducirs qu l ODDS para las madrs con bajo pso aumnta a mdida qu aumnta la dad; mintras qu disminuy n l caso d madrs con pso normal. A continuación, rtomarmos st caso pro n una situación más complja, n tanto qu considramos cuatro variabls xplicativas y varios téminos d intracción.
Con l fichro d datos lowbwt2.dta nos plantamos un modlo d rgrsión logística n l qu: Objtivo dl análisis: Estudiar la asociación ntr bajo pso al nacr y l pso d la madr, considrando como covariants la dad, la raza y l nº d visitas d la madr al gincólogo n l r trimstr d mbarazo. Variabl rspusta (risgo) (dpndint): YLOW (status) Variabl (factor d risgo) d intrés primario ( indpndint): LWTpso madr n l último priodo mnstrual. Rsto d covariants(variabl d control o ajust): EDAD(AGE), RAZA(RACE2, RACE3), FTV(visitas gincólogo). Términos d intracción: LWTxAGE, LWTxRACE2, LWTxRACE3, LWTxFTV.
Con Stata s gnran los cuatro términos d intracción y s procsa l modlo logístico complto con 9 variabls prdictoras: ( β + β lwt+ β ag+ β ftv+ β rac2+ β rac3+ β lwt _ ag+ β lwt _ rac2+ β lwt _ rac3+ β lwta _ ftv) 4 7 π(x) + 2 3 5 6 8 9 ( β + β lwt+ β ag+ β ftv+ β rac2+ β rac3+ β lwt _ ag+ β lwt _ rac2+ β lwt _ rac3+ β lwta _ ftv) 2 3 4 5 6 7 8 9 No Significación dl modlo complto al nivl.5 pro sí al nivl.5. Causas posibls: No significación d algunas variabls prdictoras; falta d potncia,
Con l fin d rsolvr la aparnt no significación dl modlo complto, ralizamos n primr lugar un diagrama d disprsión dl LOW vrsus LWT: S obsrva una gran variabilidad d la rspusta LOW, para casi todos los valors d LWT (pso d la madr), lo qu pud dificultar la rlación funcional ntr LOW y LWT Una forma d rducir tal variabilidad s la agrupación por intrvalos, s dcir, discrtizar LWT, con pso bajo y normal, potnciando su fcto discriminatorio rspcto d la rspusta.
S obsrva, lo qu confirma la asociación, una corrlación significativa ngativa ntr LOW y LWT (al aumntar l pso d la madr, l risgo d bajo pso al nacr disminuy): Discrtizamos LWT con para pso normal ( libras) y para bajo pso (< libras) y calculamos los coficints d corrlación condicional : No s dtcta corrlación significativa ntr LOW y LWT n ninguno d los dos grupos: cuando l pso d la madr s bajo, s indifrnt lo bajo qu sa; y si s normal, s indifrnt su magnitud. Esto dfind la discrtización d LWT
D todo lo antrior, rtomamos l modlo complto, rmplazando LWT por su discrtización gr_lwt, n todos los términos, y rcalculamos : Alta significación dl modlo complto, una vz discrtizada LWT. Obdcindo al principio jrárquico, a continuación contrastamos la significación n bloqu d los términos d intracción, con ayuga d G.
Contrast n bloqu d la intracción: con H : β6 β7 β8 β9 H : al mnos un coficint s vrosimilitud sin las variabls gr_lwt_ag, gr_lwt_rac2, gr_lwt_rac3, gr_lwt_ftv G 2ln( ) vrosimilitud modlo complto A continuación, contrast d significación n bloqu d AGE y FTV. No significativo: liminar los términos d intracción.
Contrast n bloqu d AGE y FTV: con H : β2 β3 H : al mnos un coficint s vrosimilitud sin las variabls ag y ftv G 2ln( ) vrosimilitud dl modlo con gr_lwt, ag, ftv, rac2 y rac3 A continuación, contrast d significación n bloqu d rac2 y rac3 No significativo: liminar las variabls AGE y FTV.
Contrast n bloqu d rac2 y rac3: con H : β4 β5 H : al mnos un coficint s vrosimilitud sin las variabls rac2 y rac3 G 2ln( ) vrosimilitud dl modlo con gr_lwt, rac2 y rac3 No significativo al nivl.5 pro sí al nivl.: s mantinn rac2 y rac3
Modlo final stimado: ˆ(X) π ( ˆβ ˆ gr _ lwt ˆ rac ˆ + β + β4 2+ β5rac 3) ( 4. +. gr_lwt +. rac 2+ 499. rac 3) ( ˆβ + ˆβ gr_lwt+ ˆβ rac + ˆβ rac ) + (. +. gr_lwt +. rac +. rac ) 4 2 4 2 499 3 5 3 + A partir d las prdiccions stimadas d la probabilidad dl vnto, d las stimacions d la transformación logit y sus corrspondints rrors stándars, y d las covarianzas d los stimadors d los coficints dl modlo final, todo llo rfrido a las obsrvacions; y qu s pudn obtnr con los siguints comandos d Stata:
Estimación puntual y por intrvalos (95%)y significado d Estimación puntual y por intrvalos (95%)y significado d Estimación puntual y por intrvalos (95%)y significado d Estimación puntual y por intrvalos (95%) d probabilidad d risgo (bajo pso al nacr) para gr_lwt y raza ngra, y significado: OR(gr _lwt gr _lwt,rac 2,rac 3) vrsus OR(gr _ lwt, raza ngravrsusraza blanca) OR(gr _ lwt, raza ngravrsusotras razas) π (gr _ lwt, raza ngra) Indicacions: tal y como s obsrva n págs. 4 y 5, convin dtrminar, n primr lugar, las stimacions d los coficints dl modlo y/o transformacions logit y utilizar, dspués, las xponncials corrspondints. PRACTICA FINAL CON ESTUDIO EVANS (n hojas sparadas)