ODELOS DE ELECCIÓN DISCRETA Eva dna oral - www.va.mdnaam.s (Dcmbr 3. INTRODUCCIÓN. INTERRETACIÓN ESTRUCTURAL DE LOS ODELOS DE ELECCIÓN DISCRETA 3. ODELO LINEAL DE ROBABILIDAD (L Espcfcacón ntrprtacón dl L Lmtacons d la stmacón por CO 4. ODELOS DE ROBABILIDAD NO LINEAL Espcfcacón d los modlos d lccón dscrta (Logt y robt Estmacón d los parámtros n los modlos Logt A. Estmacón con obsrvacons no rptdas: étodo d áxma- Vrosmltud B. Estmacón con obsrvacons rptdas: étodo ínmos Cuadrados Gnralzados Contrast y valdacón d hpótss A. Sgnfcatvdad stadístca d los parámtros stmados B. ddas d bondad d ajust dl modlo 5. ODELOS DE RESUESTA ÚLTILE odlos d rspusta múltpl con datos no ordnados A. El modlo Logt ultnomal B. El modlo Logt Condconal C. El modlo Logt Andado odlos d rspusta múltpl con datos ordnados
. INTRODUCCIÓN La utldad d los modlos d lccón dscrta frnt a la conomtría tradconal radca n qu los prmros prmtn la modlzacón d varabls cualtatvas, a través dl uso d técncas propas d las varabls dscrtas. S dc qu una varabl s dscrta cuando stá formada por un númro fnto d altrnatvas qu mdn cualdads. Esta caractrístca xg la codfcacón como paso prvo a la modlzacón, procso por l cual las altrnatvas d las varabls s transforman n códgos o valors cuántcos, suscptbls d sr modlzados utlzando técncas conométrcas. La modlzacón d st tpo d varabls s conoc gnércamnt con l nombr d modlos d lccón dscrta, dntro d la cual xst una ampla tpología d modlos. En concrto, sgún l númro d altrnatvas ncludas n la varabl ndógna, s dstngun los modlos d rspusta dcotómca frnt a los dnomnados modlos d rspusta o lccón múltpl. Sgún la funcón utlzada para la stmacón d la probabldad xst l modlo d probabldad lnal truncado, l modlo Logt y l modlo robt. Sgún qu las altrnatvas d la varabl ndógna san xcluynts o ncorporn nformacón ordnal s dstngu ntr los modlos con datos no ordnados y los modlos con datos ordnados. Dntro d los prmros, sgún qu los rgrsors hagan rfrnca a aspctos spcífcos d la mustra o d las altrnatvas ntr las qu s ha d lgr, s dstngu ntr los modlos multnomals y los condconals. Tnndo n cunta todos los lmntos qu nfluyn n l procso d spcfcacón d los modlos d lccón dscrta, s pud stablcr una clasfcacón gnral d los msmos, qu quda rcogda n la l sgunt cuadro. Nº d altrnatvas odlos d rspusta dcotómca ( altrnatvas odlos d rspusta múltpl (más d altrnatvas Clasfcacón d los modlos d lccón dscrta Tpo d altrnatvas Complmntaras No ordnadas Tpo d funcón Lnal Logístca Normal tpfcada El rgrsor s rfr a: Caractrístcas (d los ndvduos Atrbutos (d las altrnatvas odlo d robabldad Lnal Truncado Logt ultnomal odlo Logt odlo robt Logt Codconal Logístca - Logt Andado - Logt Andado - Logt xto - Logt xto robt ultnomal robt Condconal Normal tpfcada robt ultvarant robt ultvarant Ordnadas Logístca Normal tpfcada Logt Ordnado robt Ordnado
. INTERRETACIÓN ESTRUCTURAL DE LOS ODELOS DE ELECCIÓN DISCRETA En la ltratura xstn dos nfoqus para la ntrprtacón structural d los modlos d lccón dscrta. El prmro hac rfrnca a la modlzacón d una varabl latnt a través d una funcón índc, qu trata d modlzar una varabl nobsrvabl o latnt. El sgundo d los nfoqus prmt ntrprtar los modlos d lccón dscrta bajo la toría d la utldad alatora, d tal manra qu la altrnatva slcconada n cada caso srá aqulla qu maxmc la utldad sprada. ara ntndr ambos nfoqus, l razonamnto mplado s aplcará al caso sncllo d la modlzacón d una varabl dcotómca, sndo la aplcacón gnralzada al caso d los modlos d rspusta múltpl nmdata. Bajo l prmro d los nfoqus s trata d modlzar una varabl índc, nobsrvabl o latnt no lmtada n su rango d varacón, * I. Cuando la varabl latnt supra un dtrmnado nvl, la varabl dscrta toma l valor, y s no lo supra toma l valor. La varabl latnt dpnd d un conjunto d varabls xplcatvas qu gnran las altrnatvas qu s dan n la raldad y qu prmtn xprsar l modlo dcotómco como: s I * > lo qu ocurr cuando ε > s I * < lo qu ocurr cuando ε < dond l supusto sobr la dstrbucón d ε dtrmna l tpo d modlo a stmar: s s supon una funcón d dstrbucón unform, s utlza l odlo Lnal d robabldad truncado; s s dstrbuy como una normal con mda cro y varanza uno, l modlo gnrado srá un robt; mntras qu s s supon qu s dstrbuy como una curva logístca, s trataría d un modlo Logt. La hpótss d qu l umbral a suprar por la varabl latnt sa cro s pud modfcar por cualqur otro valor sugréndos, n dtrmnados studos, qu l valor crítco sa l dfndo por l térmno constant. Bajo st nfoqu l modlo probablístco qudaría dfndo por * r ob( r ob( I > r ob( ε > F( ( La varabl latnt stá rlaconada con sus caractrístcas a través d un modlo d rgrsón: dond I * rcb l nombr d funcón índc. ε 3
Con l modlo así dfndo, la varabl ndógna dl modlo dcotómco rprsnta la probabldad d ocurrnca dl fnómno analzado, sndo la probabldad d qu ocurra la opcón más lvada cuando mayor sa l valor d I *. El sgundo d los nfoqus para la ntrprtacón d los modlos d rspusta dcotómca s l qu hac rfrnca a la modlzacón a través d la formulacón d una utldad alatora. Bajo st nfoqu un ndvduo db adoptar una dcsón qu l prmta lgr ntr dos altrnatvas xcluynts, la o la, lo qu hará maxmzando la utldad sprada qu l proporcona cada una d las altrnatvas posbls sobr las qu tn qu dcdr. Es dcr, l ndvduo -ésmo lgrá una d las dos altrnatvas dpndndo d qu la utldad qu l proporcona dcha dcsón sa supror a la qu l proporcona su complmntara. La formulacón dl modlo bajo sta toría part dl supusto d qu la utldad drvada d una lccón, U o U, s funcón d las varabls xplcatvas d dcha dcsón, qu son las caractrístcas propas d cada una d las altrnatvas d lccón y las caractrístcas prsonals propas dl ndvduo, d manra qu suponndo lnaldad n las funcons, s tn U U ε ε ( dond los ε j rcogn las dsvacons qu los agnts tnn rspcto a lo qu sría l comportamnto dl agnt mdo y qu s db a factors alatoros. El agnt lgrá la opcón s la utldad d sa dcsón supra la d la opcón y vcvrsa, d manra qu, s U >U s U <U l modlo dcotómco qudaría dfndo por, r ob ( r ob( U > U r ob( U U > F( (3 Sgún qu la funcón asocada a la prturbacón alatora ε j (qu srá la funcón d dstrbucón, F (, qu s suponga sga dcha probabldad, sa una funcón d dstrbucón unform, la funcón d dstrbucón d la normal tpfcada o la d la curva logístca, s obtnn l odlo Lnal d robabldad Truncado, l robt o l Logt, rspctvamnt. 4
Ambos nfoqus, l d la funcón índc y l d la formulacón d una utldad alatora, justfcan n térmnos structurals la xstnca d los modlos probablístcos bajo dos torías conómcas altrnatvas, aunqu n ambos casos, la xprsón fnal qu dfn la formulacón dl modlo s la msma. 3. ODELO LINEAL DE ROBABILIDAD (L Espcfcacón ntrprtacón dl L La prmra tntatva tórca dsarrollada para studar modlos con varabls dcotómcas s plantó como una mra xtnsón dl odlo Lnal Gnral qu vn xprsado por: ε (4 dond: s ocurr una altrnatva n caso contraro Varabls xplcatvas ε Varabl alatora qu s dstrbuy normal N (, σ La dstrbucón d la mustra n st tpo d modlos s caractrza por confgurar una nub d puntos d tal manra qu las obsrvacons mustrals s dvdn n dos subgrupos. Uno d llos stá formado por las obsrvacons n las qu ocurró l acontcmnto objto d studo (, y l otro, por los puntos mustrals n los qu no ocurró (. Una rprsntacón gráfca d la nub d puntos para l caso d una sola varabl xplcatva s la qu aparc n l gráfco, n l qu la varabl xplcatva s rprsnta n l j d abscsas y la varabl ndógna n l j d ordnadas. La laboracón dl modlo lnal d probabldad rqur l ajust d sa nub d puntos a una funcón lnal (rcta d rgrsón capaz d xplcar d la mjor manra l comportamnto d la mustra. ENDOGENA Nub d puntos n un modlo d rspusta dcotómca.5..5. -.5 3 4 5 6 I 5
El odlo Lnal d robabldad, cuacón (4, s pud ntrprtar n térmnos probablístcos, n l sntdo d qu un valor concrto d la rcta d rgrsón md la probabldad d qu ocurra l acontcmnto objto d studo. Es dcr, ˆ s pud consdrar como la stmacón d la probabldad d qu ocurra l acontcmnto objto d studo ( sgundo l sgunt crtro: valors próxmos a cro s corrspondn con una baja probabldad d ocurrnca dl acontcmnto analzado (mnor cuanto más próxmos a cro; mntras qu a valors próxmos a uno s ls asgna una probabldad lvada d ocurrnca (mayor cuanto más próxmos a uno. La ntrprtacón d los cofcnts stmados n los odlos Lnals d robabldad (L s la msma qu la dl odlo Lnal Gnral, rcogndo l valor dl parámtro l fcto d una varacón untara n cada una d las varabls xplcatvas sobr la probabldad d ocurrnca dl acontcmnto objto d studo. Así, s s produc un ncrmnto d una undad n la varabl xplcatva, s aumnto provocaría una varacón gual a n la probabldad f (. Lmtacons d la stmacón por CO La stmacón dl modlo antror por ínmos Cuadrados Ordnaros planta una sr d lmtacons qu s pasan a comntar a contnuacón:. El valor stmado pud star fura dl rango ( -. La stmacón dl odlo Lnal d robabldad a través d CO no garantza qu los valors stmados d stén ntr y, lo cual carc d lógca al ntrprtars l valor stmado como una probabldad. Est problma s solucona truncando l rango d varacón dl valor stmado, dando lugar al modlo conocdo con l nombr d odlo robablístco Lnal Truncado, y qu, para una únca varabl xplcatva, s xprsa d la forma: < < Sn mbargo, s s rstrngn los valors d a y, los valors dl térmno ndpndnt y la pndnt varían sgún los valors d, d tal forma qu: - ara / : Térmno ndpndnt y pndnt guals a. - ara / ( / : Térmno ndpndnt gual y pndnt gual a. 6
- ara ( / : Térmno ndpndnt gual a y pndnt gual a. Esto hará qu s s ncluyn n la stmacón puntos n los qu ( / los stmadors srán ssgados nconsstnts. / ó. La prturbacón alatora pud no sgur una dstrbucón Normal: Dados los valors qu toma la prturbacón alatora no s pud asgurar qu ésta s dstrbuya como una normal, al tratars d una dstrbucón bnara o dcotómca. S bn l ncumplmnto d la hpótss d normaldad no nvalda la stmacón por CO, ya qu los stmadors así stmados sgun sndo ELIO, sn mbargo, la ausnca d normaldad mposblta l uso d los stadístcos habtuals utlzados para ralzar l contrast d hpótss tals como la t-studnt, la F-Sndcor, tc, al basars dchos contrasts n la hpótss d normaldad d la prturbacón alatora. 3. roblmas d htrocdastcdad: Aún n l caso d qu s cumplsn las hpótss d mda y corrlacón nula n la prturbacón alatora ( E( ε y E( ε ε para todo j no s cumpl la hpótss d varanza constant, s dcr, la prturbacón alatora no s homocdástca. ara comprobarlo s calcula la varanza d la prturbacón alatora a través d su dfncón: j Var( ε E( ε E( ε E( ε ( f ( ( ( f ( ( f ( f ( ( f ( ( f ( ( f ( f ( ( f ( f ( ( f ( f ( (5 La varanza d la prturbacón alatora s una funcón d la probabldad f (, la cual s a su vz funcón d cada una d las obsrvacons d las varabls xplcatvas. La prturbacón alatora s, por tanto, htrocdástca y la stmacón dl modlo mdant l método d CO obtn unos stmadors d los cofcnts d rgrsón con varanza no mínma, s dcr, no fcnts. Est problma podría soluconars stmando l modlo a través d ínmos Cuadrados Gnralzados (CG. A st tpo d modlos s ls dnomna odlos Lnals robablístcos ondrados. La stmacón a través d CG rqur la ralzacón d los sgunts pasos: - S stma l modlo (4 mdant CO sn tnr n cunta l problma d htrocdastcdad, obtnéndos l valor stmado ˆ. - El valor ˆ s utlza para calcular la varanza d la prturbacón alatora, a través d la fórmula antrormnt obtnda: 7
( f ( f ( ˆ ( ˆ σ Var( ε (6 - S los valors stmados d ˆ son mayors qu la undad o mnors qu cro, dbn sustturs por la undad (n l prmr caso o por cro (n l sgundo. En ambos casos l valor rsultant dl cálculo d la varanza d ε srá cro, lo qu gnraría problmas al utlzar la Var( ε como pondrador. Ant sta stuacón s pud optar por lmnar las obsrvacons qu gnran stos valors, ncurrndo n pérdda d nformacón. Es por llo qu la opcón prfrda s susttur los valors mayors o guals a la undad por,999, y los valors mnors o guals a cro por,. - S pondra l modlo (4 dvdndo ambos mmbros d la cuacón por la dsvacón típca stmada σ ˆ ( ˆ, con l fn d transformar l modlo n homocdástco. σ... ε (7 σ σ σ σ La stmacón por CO dl modlo transformado s quvalnt a aplcar CG n l modlo (4 y n ambos casos s obtnn stmacons fcnts d los cofcnts d rgrsón. Sn mbargo, uno d los problmas qu prsnta la stmacón por CG s la pérdda dl térmno ndpndnt n l modlo. La omsón dl térmno ndpndnt pud provocar qu la suma d los rsduos sa dstnta d cro lo qu pud tnr conscuncas sobr l cofcnt d dtrmnacón (pud sr ngatvo, la funcón d vrosmltud stmada a partr d los rsduos y los stadístcos qu s obtnn a partr d lla. 4. El cofcnt d dtrmnacón R stá substmado. La suma d los cuadrados d los rsduos ( s más grand d lo habtual dbdo a la forma spcífca n qu s dstrbuy la nub d puntos d una varabl dcotómca. Dado qu l cálculo dl cofcnt d dtrmnacón s v afctado por, l R stmacón por CO s más pquño d lo qu ralmnt dbría sr. calculado n la El cofcnt d dtrmnacón s obtn a través d la fórmula R ( ˆ 8
4. ODELOS DE ROBABILIDAD NO LINEAL La stmacón ntrprtacón d los modlos probablístcos lnals planta una sr d problmas qu han llvado a la búsquda d otros modlos altrnatvos qu prmtan stmacons más fabls d las varabls dcotómcas. ara vtar qu la varabl ndógna stmada puda ncontrars fura dl rango (,, las altrnatvas dsponbls son utlzar modlos d probabldad no lnals, dond la funcón d spcfcacón utlzada garantc un rsultado n la stmacón comprnddo n l rango -. Las funcons d dstrbucón cumpln st rqusto, ya qu son funcons contnuas qu toman valors comprnddos ntr y. Espcfcacón d los modlos d lccón dscrta (Logt y robt Dado qu l uso d una funcón d dstrbucón garantza qu l rsultado d la stmacón sté acotado ntr y, n prncpo las posbls altrnatvas son varas, sndo las más habtuals la funcón d dstrbucón logístca, qu ha dado lugar al modlo Logt, y la funcón d dstrbucón d la normal tpfcada, qu ha dado lugar al modlo robt. Tanto los modlos Logt como los robt rlaconan, por tanto, la varabl ndógna con las varabls xplcatvas a través d una funcón d dstrbucón. En l caso dl modlo Logt, la funcón utlzada s la logístca, por lo qu la spcfcacón d st tpo d modlos quda como sgu ε ε (8 En l caso dl modlo robt la funcón d dstrbucón utlzada s la d la normal tpfcada, con lo qu l modlo quda spcfcado a través d la sgunt xprsón, (π / s ds ε (9 dond la varabl s s una varabl muda d ntgracón con mda cro y varanza uno. Dada la smltud xstnt ntr las curvas d la normal tpfcada y d la logístca, los rsultados stmados por ambos modlos no dfrn mucho ntr sí 3, sndo las 3 Dscrpan, úncamnt, n la rapdz con qu las curvas s aproxman a los valors xtrmos, y así la funcón logístca s más achatada qu la normal al alcanzar, sta últma, más rápdamnt los valors xtrmos ( y. 9
dfrncas opratvas, dbdas a la compljdad qu prsnta l cálculo d la funcón d dstrbucón normal frnt a la logístca, ya qu la prmra solo pud calculars n forma d ntgral. La mnor compljdad d manjo qu caractrza al modlo Logt s lo qu ha potncado su aplcacón n la mayoría d los studos mpírcos. Al gual qu n l odlo Lnal d robabldad, l odlo Logt (8 s pud ntrprtar n térmnos probablístcos, s dcr, srv para mdr la probabldad d qu ocurra l acontcmnto objto d studo (. En cuanto a la ntrprtacón d los parámtros stmados n un modlo Logt, l sgno d los msmos ndca la drccón n qu s muv la probabldad cuando aumnta la varabl xplcatva corrspondnt, sn mbargo, la cuantía dl parámtro no concd con la magntud d la varacón n la probabldad (como s ocurría n l L. En l caso d los modlos Logt, al suponr una rlacón no lnal ntr las varabls xplcatvas y la probabldad d ocurrnca dl acontcmnto, cuando aumnta n una undad la varabl xplcatva los ncrmntos n la probabldad no son smpr guals ya qu dpndn dl nvl orgnal d la msma. Una ntrprtacón más snclla dl parámtro stmado s la qu s obtn a través d la lnalzacón dl modlo. ara llo, partndo d la cuacón gnral dl odlo Logt (8 y dfndo como la probabldad dl stado o la altrnatva, s tn E( rob( ( d dond: ( ( ( Al cocnt ntr la probabldad d qu ocurra un hcho, o d qu s lja la opcón, frnt a la probabldad d qu no sucda l fnómno, o d qu s lja la opcón, s la dnomna como la rato odds. Su ntrprtacón s la vntaja o prfrnca d la opcón frnt a la, s dcr, l númro d vcs qu s más probabl qu ocurra l fnómno frnt a qu no ocurra. Rato odds (
El rato odds 4, tal y como stá construdo (cocnt ntr probabldads, smpr srá mayor o gual qu. El campo d varacón dl rato va dsd hasta, y su ntrprtacón s ralza n funcón d qu l valor sa gual, mnor o supror a la undad: s toma l valor sgnfca qu la probabldad d qu ocurra la altrnatva s la msma qu la d qu no ocurra; s l rato s mnor qu ndca qu la ocurrnca d la altrnatva tn mnor probabldad qu la ocurrnca d la altrnatva ; mntras qu s s mayor qu la undad la opcón s más probabl qu la. El ntrés d sta mdda adqur sntdo cuando s comparan las vntajas para dstntos valors d la varabl xplcatva, calculándos l cocnt ntr odds. Así, s s compara la stuacón d la obsrvacón con la d la obsrvacón j (qu sul sr la d rfrnca, l cocnt ntr odds md cuanto s más probabl qu s d la altrnatva n qu n j. Cocnt ntr odds ( ( jj j j ( j S l valor obtndo s mayor a la undad, la probabldad d ocurra la altrnatva n la obsrvacón s mayor qu n la obsrvacón j, mntras qu s l valor obtndo s nfror a uno, la probabldad d ocurrnca d la altrnatva s supror n la obsrvacón j qu n la. S l valor obtndo s gual a la undad sgnfca qu las probabldads n ambas obsrvacons son guals. El cálculo dl cocnt ntr odds faclta la ntrprtacón d los parámtros stmados cuando s aplca al caso concrto d calcular la varacón n la prfrnca o vntaja d un ndvduo cuando ncrmnta n una undad una d las varabls xplcatvas, frnt a la vntaja o prfrnca dl msmo ndvduo cuando s ncuntra n la stuacón d rfrnca, obtnéndos para st caso concrto 4 Tomando logartmos npranos dl rato odds s lnalza la cuacón dl modlo Logt, rsptando l objtvo d qu los valors stmados cagan dntro dl rango (-, obtnéndos la xprsón: Ln Ln( La nuva varabl Ln probabldads d qu ocurra la altrnatva y su contrara. gnrada rprsnta n una scala logarítmca la dfrnca ntr las
Cocnt ntr Odds ( ( ( ( j D dond l parámtro s un factor d cambo n l cocnt ntr odds cuando l valor d la varabl aumnta n una undad y l rsto d varabls xplcatvas s mantnn constants. Es dcr, l parámtro s ntrprta como l númro d vcs qu ncrmnta l logartmo d la vntaja o prfrnca d la opcón frnt a la cuando ncrmnta n una undad. En muchas ocasons lo qu s analza s l valor dl antlogartmo dl parámtro d tal manra qu s valú d una forma más drcta su fcto sobr la probabldad. Estmacón d los parámtros n los modlos Logt Ants d abordar l método d stmacón n los modlos Logt, s prcso dstngur la xstnca d dos casos dfrncados qu mplcan la utlzacón d métodos d stmacón dstntos: los modlos Logt con obsrvacons rptdas y con obsrvacons no rptdas. ara l caso sncllo d una únca varabl xplcatva, nos ncontramos n una stuacón con obsrvacons rptdas cuando la varabl s dscrta y prsnta un númro rducdo d altrnatvas o ntrvalos (F, d manra qu para cada altrnatva d la varabl tndrmos n obsrvacons d, pudéndos calcular las proporcons o probabldads mustrals. En st caso la matrz d n datos mustrals qudará rducda a F obsrvacons sndo los valors qu tom la varabl ndógna ( las proporcons mustrals calculadas a través d la xprsón F n ( La gnralzacón dl modlo a varabls xplcatvas mplca la xstnca d obsrvacons rptdas d para cada combnacón d las varabls xplcatvas, pudéndos calcular las proporcons o probabldads mustrals d la msma forma qu n l caso antror. En st caso, s bn los valors d la varabl ndógna stán acotados n l rango -, son valors contnuos, por lo qu l método utlzado para la stmacón d los parámtros dl modlo s l qu habtualmnt s utlza n la conomtría tradconal qu trabaja con varabls contnuas.
or lo tanto, ant la prsnca d obsrvacons rptdas, s podría aplcar l método d ínmos Cuadrados Ordnaros. Sn mbargo, la xstnca d htrocdastcdad n l modlo oblga a stmar por ínmos Cuadrados Gnralzados, para garantzar l cumplmnto d las propdads d los parámtros stmados, utlzándos la nvrsa d la varanza d los rrors como pondracón dl modlo. Sn mbargo, lo más habtual s no podr calcular las probabldads mustrals, bn porqu las varabls xplcatvas ncludas n l modlo son contnuas, o bn porqu aún sndo éstas dscrtas, la combnacón d las msmas mpd la obtncón d obsrvacons rptdas d la varabl ndógna para cada uno d los ntrvalos F. En sta stuacón, la matrz d datos mustrals stará formada por n obsrvacons pudndo sr l valor d la varabl ndógna para cada una d llas ó. La naturalza dcotómca d la varabl dpndnt n st tpo d modlos mpd la utlzacón d los métodos tradconals n la stmacón d los parámtros, al no podrs calcular la nvrsa d la varanza utlzada como pondracón dl modlo. ara la stmacón d los parámtros s utlza l método d áxma Vrosmltud. A contnuacón s dscrbn ambos métodos d stmacón (máxma vrosmltud y mínmos cuadrados gnralzados comnzando por l caso más habtual d ausnca d obsrvacons rptdas. A. Estmacón con obsrvacons no rptdas: étodo d áxma-vrosmltud Dada una varabl alatora, caractrzada por unos parámtros, y dada una mustra poblaconal, s consdran stmadors áxmo-vrosímls d los parámtros d una poblacón dtrmnada, aqullos valors d los parámtros qu gnrarían con mayor probabldad la mustra obsrvada. Es dcr, los stmadors áxmo-vrosímls son aqullos valors para los cuals la funcón d dnsdad conjunta (o funcón d vrosmltud alcanza un máxmo. Suponndo qu las obsrvacons son ndpndnts, la funcón d dnsdad conjunta d la varabl dcotómca quda como: rob(...... n n ( (3 dond rcog la probabldad d qu. or smplcdad s trabaja con la funcón d dnsdad conjunta n logartmos, cuya xprsón s: ln L ln ( ln( ln ( ln( n (4 3
4 El método d stmacón d máxma vrosmltud lg l stmador dl parámtro qu maxmza la funcón d vrosmltud ( ln L, por lo qu l procdmnto a sgur srá calcular las drvadas d prmr ordn d sta funcón con rspcto a los parámtros qu qurmos stmar, gualarlas a y rsolvr l sstma d cuacons rsultant. Las drvadas d prmr ordn d la funcón d vrosmltud rspcto a los parámtros y, tras pquñas manpulacons, qudan como sgun: ( n ˆ ˆ ˆ ˆ (5 ( n ˆ ˆ ˆ ˆ (6 y susttuyndo por su valor quda: ˆ ˆ ˆ ˆ n ˆ ˆ ˆ ˆ n S trata d un sstma d cuacons no lnals por lo qu s ncsaro aplcar un método tratvo o algortmo d optmzacón qu prmta la convrgnca n los stmadors. B. Estmacón con obsrvacons rptdas: étodo ínmos Cuadrados Gnralzados La stmacón dl modlo con datos agrupados podría ralzars mdant l procdmnto habtual utlzado para stmar rgrsons lnals, ya qu la varabl a modlzar ya no s dcotómca (s contnua aunqu acotada n l rango -. ara llo s ncsaro lnalzar l modlo, lo cual s fácl d ralzar a través d la transformacón ya comntada antrormnt, y por la cual: Ln ε dond ε s l valor d la prturbacón alatora ncluda n la spcfcacón d todo modlo d rgrsón lnal y qu cumpl las hpótss d prturbacón sférca y ausnca d autocorrlacón. El modlo así transformado pud stmars por l
procdmnto habtual d ínmos Cuadrados Ordnaros (CO. Sn mbargo, y dado qu l valor d s dsconocdo y db sustturs por su stmacón mustral, l modlo a stmar qudaría como: Ln ε ε ' dond ε ' rcog l rror comtdo al utlzar la stmacón mustral d la probabldad, n vz d su valor dsconocdo. Al susttur por su stmacón mustral, los rrors, supustos ndpndnts, cumpln la condcón asntótca d normaldad xgda para ralzar contrastacons y construccón d ntrvalos d confanza, pro, djan d cumplr la condcón d homocdastcdad ya qu su varanza no s constant 5. La prsnca d htrocdastcdad mpd la stmacón a través d ínmos Cuadrados Ordnaros, sndo ncsaro aplcar l método d ínmos Cuadrados Gnralzados, qu sn xgr la condcón d homocdastcdad d los rrors, prmt stmar stmadors ELIO. Est procdmnto transforma l modlo a stmar n otro, dond todas las varabls qudan pondradas por los nvrsos d las varanzas d los rrors, y dado qu s dsconocn dchos valors vrdadros, éstos s susttuyn por su stmacón mustral, d dond: s n ( (7 Var ˆ ( ε ' qudando l modlo a stmar como: s Ln s s ε (8 Contrast y valdacón d hpótss En l caso d trabajar con obsrvacons rptdas la contrastacón y valdacón dl modlo stmado sgu la msma mtodología qu la mplada n l análss d rgrsón tradconal, por lo qu rmtmos a ést para profundzar n st tma. ntras qu s nos ncontramos n l caso d no dsponr d obsrvacons rptdas, 5 La varanza d la prturbacón alatora no s homocdástca ya qu dpnd dl nvl n qu s ncuntr la varabl xplcatva, al dfnrs ε ' Ln Ln 5
la tapa d contrastacón y valdacón dl modlo stmado por máxma-vrsomltud s llva a cabo aplcando los stadístcos spcífcos qu s comntan a contnuacón. A. Sgnfcatvdad stadístca d los parámtros stmados La dstrbucón dl stmador dl parámtro s aproxmadamnt: N ; Var( ˆ En tal stuacón, s pud construr un ntrvalo d confanza dl parámtro stmado, para tstar s dcho valor s sgnfcatvamnt dstnto d cro d forma ndvdual. El contrast a ralzar qudaría dfndo como: H : El parámtro s gual a cro H : El parámtro s dstnto d cro El ntrvalo d confanza proporcona un rango d posbls valors para l parámtro, por lo qu s l valor stmado no prtnc a dcho ntrvalo, s dbrá rchazar la hpótss nula. El ntrvalo qudaría dfndo como: ˆ z Var( ˆ ˆ z Var( ˆ / / dond s la probabldad d qu l vrdadro valor dl parámtro s hall fura dl ntrvalo, y z s l valor tabular d la dstrbucón N(; qu dja a su drcha una probabldad gual a /. A partr d la xprsón antror s pud fjar un rchazo d la hpótss nula cuando: ˆ Var( ˆ z / B. ddas d bondad d ajust dl modlo El uso d la funcón d vrosmltud n la stmacón, hac qu la bondad dl ajust n los modlos d lccón dscrta sa un tma controvrtdo, ya qu n stos modlos no xst una ntrprtacón tan ntutva como n l modlo d rgrsón clásco. A contnuacón s dscrbn los contrasts más utlzados n la ltratura conométrca para mdr la bondad d ajust n un modlo Logt y qu concrtarmos n: índc d 6
cocnt d vrosmltuds, l stadístco ch-cuadrado d arson, l porcntaj d acrtos stmados n l modlo, y la pruba d Hosmr-Lmshow. B.. Índc d cocnt d vrosmltuds La funcón d vrosmltud pud tambén utlzars para obtnr un stadístco, qu tn crta smjanza con l cofcnt d dtrmnacón calculado n la stmacón lnal, conocdo índc d cocnt d vrosmltuds. Est stadístco compara l valor d la funcón d vrosmltud d dos modlos: uno corrspond al modlo stmado qu ncluy todas las varabls xplcatvas (modlo complto y l otro sría l dl modlo cuya únca varabl xplcatva s la constant (modlo rstrngdo. El stadístco, tambén conocdo como R d cfaddn ya qu fu propusto por cfaddn n 974, s dfn como : RV log L ICV (9 log L( dond L s l valor d la funcón d vrosmltud dl modlo complto (l stmado con todas las varabls xplcatvas y L( s l valor corrspondnt dl modlo rstrngdo (l qu ncluy úncamnt n la stmacón l térmno constant. El rato calculado tndrá valors comprnddos ntr y d forma qu: - Valors próxmos a s obtndrán cuando L( sa muy parcdo a L, stuacón n la qu nos ncontrarmos cuando las varabls ncludas n l modlo san poco sgnfcatvas, s dcr, la stmacón d los parámtros no mjora l rror qu s comt s dchos parámtros s gualaran a. or lo qu n st caso la capacdad xplcatva dl modlo srá muy rducda. - Cuanto mayor sa la capacdad xplcatva dl modlo, mayor srá l valor d L sobr l valor d L(, y más s aproxmará l rato d vrosmltud calculado al valor. B.. Una mdda dl rror: l stadístco χ d arson ara mdr la bondad dl ajust tambén s utlzan mddas dl rror qu cuantfcan la dfrnca ntr l valor obsrvado y l stmado. En concrto, para contrastar la hpótss nula d qu H ˆ : ; lo qu quval a H : ˆ 7
s construy un stadístco qu rcog los rsduos standarzados o d arson 6 dl modlo Logt, qu s dfnn como la dfrnca ntr l valor obsrvado d la varabl rspusta y l stmado, dvddo por la stmacón d la dsvacón típca, ya qu la spranza s nula. A través dl contrast d multplcadors d Lagrang, s pud calcular l stadístco conocdo con l nombr d χ d arson, qu s dfn como ( ˆ χ ( ˆ n n ˆ ( Est stadístco s smlar a la suma d cuadrados d los rsduos dl modlo d rgrsón convnconal. El ajust dl modlo srá mjor cuanto más crca sté l valor dl stadístco d cro. ara sabr a partr d qu valor pud consdrars l ajust como acptabl s ncsaro conocr la dstrbucón dl stadístco. Ést stadístco, bajo la hpótss nula, s dstrbuy como una ch-cuadrado con (n- grados d lbrtad, por lo qu su valor s compara con l valor tórco d las tablas d la ch-cuadrado para contrastar la hpótss nula. S l valor calculado s supror al valor tórco s rchaza la hpótss nula lo qu quval a dcr qu l rror comtdo s sgnfcatvamnt dstnto d cro, s dcr, s trataría d un mal ajust. B.3 orcntaj d acrtos stmados n l modlo Otra d las vías utlzadas para dtrmnar la bondad d un modlo Logt s prdcr con l modlo los valors d la varabl ndógna d tal manra qu s ˆ > c ó s ˆ < c. Gnralmnt, l valor qu s asgna a c para dtrmnar s l valor d la prdccón s gual a o a s d,5, pusto qu parc lógco qu la prdccón sa cuando l modlo dc qu s más probabl obtnr un qu un. Sn mbargo, la lccón d un umbral gual a,5 no smpr s la mjor altrnatva. En l caso n qu la mustra prsnt dsqulbros ntr l númro d unos y l d cros la lccón d un umbral gual a,5 podría conducr a no prdcr nngún uno o nngún cro. Así, supusta una mustra d. obsrvacons dond son y l rsto, s l modlo ncluy térmno constant, la mda d las probabldads stmadas n la mustra srá, 7, por lo qu srá cas mposbl qu s obtnga un valor stmado supror a,5. S l umbral slcconado s d,5, con sta rgla nunca s llgarían a 6 Los rsduos standarzados o d arson s dfnn como: ˆ ˆ ( ˆ 7 Como s ha comntado antrormnt, d la condcón d prmr ordn qu quda rcogda n la cuacón (III.44 s dduc qu la mda d las probabldads stmadas por l modlo, ha d concdr con la proporcón d unos qu haya n la mustra. 8
stmar valors guals a. El modo d rsolvr st problma s tomar un umbral más pquño. Con cualqur tpo d rgla prdctva smlar s comtrán dos rrors: habrá cros qu s clasfqun ncorrctamnt como unos y unos qu s clasfqun ncorrctamnt como cros. S s rduc l umbral por dbajo d,5 aumntará l númro d vcs qu s clasfcan corrctamnt obsrvacons para las qu, pro tambén aumntará l númro d vcs n qu s clasfqun obsrvacons como unos para las qu. Cambando l valor dl umbral s rducrá smpr la probabldad d un rror d un tpo y s aumntará la probabldad dl otro tpo d rror. or lo qu l valor qu db tomar l umbral dpnd d la dstrbucón d datos n la mustra y d la mportanca rlatva d cada tpo d rror. Una vz slcconado l nvl dl umbral, y dado qu los valors rals d son conocdos, basta con contablzar l porcntaj d acrtos para dcr s la bondad dl ajust s lvada o no. A partr d st rcunto s pud construr l sgunt cuadro d clasfcacón: rdccón d ˆ Cuadro d clasfcacón d acrtos Valor ral d ˆ < c ˆ > c Dond y corrspondrán a prdccons corrctas (valors bn prdchos n l prmr caso y valors bn prdchos n l sgundo caso, mntras qu y corrspondrán a prdccons rrónas (valors mal prdchos n l prmr caso y valors mal prdchos n l sgundo caso. A partr d stos valors s pudn dfnr los índcs qu aparcn n l sgunt cuadro. 9
Índcs para mdr la bondad dl ajust Indc Dfncón Exprsón Tasa d acrtos Tasa d rrors Espcfcdad Snsbldad Tasa d falsos cros Tasa d falsos unos Cocnt ntr las prdccons corrctas y l total d prdccons Cocnt ntr las prdccons ncorrctas y l total d prdccons roporcón ntr la frcunca d valors corrctos y l total d valors obsrvados Razón ntr los valors corrctos y l total d valors obsrvados roporcón ntr la frcunca d valors ncorrctos y l total d valors obsrvados Razón ntr los valors ncorrctos y l total d valors obsrvados B.4. ruba d Hosmr-Lmshow Otra mdda global d la xacttud prdctva, no basada n l valor d la funcón d vrosmltud sno n la prdccón ral d la varabl dpndnt, s l contrast d clasfcacón dsñado por Davd W. Jr. Hosmr y Stanly Lmshow n 989. Dcho contrast consst n ralzar comparacons ntr l valor stmado y l obsrvado por grupos. ara llo las obsrvacons s dvdn n J grupos (gnralmnt aproxmadamnt guals, dvdndo l rcorrdo d la probabldad n dcls d rsgo (sto s probabldad d ocurrnca dl fnómno <., <., y así hasta <. Cada uno d los grupos contn n j obsrvacons, y n cada uno d los J grupos s dfn: - j como la suma d los valors n cada uno d los grupos ( j ˆ - j como la mda d los valors prdchos n cada grupo ( j. n j A partr d sta nformacón s pud construr una tabla d contngnca a través d la qu s compara tanto la dstrbucón d ocurrnca, como la d no ocurrnca prvsta por la cuacón y los valors ralmnt obsrvados. El contrast s ralza comparando las frcuncas obsrvadas y spradas a través dl cálculo dl stadístco HL J ( j n jj j n jj( j (
Hosmr y Lmshow dmustran qu cuando l modlo s corrcto l stadístco HL sgu una dstrbucón ch-cuadrado con J- grados d lbrtad, por lo qu valors nfrors dl stadístco calculado rspcto al tórco ndcarán un bun ajust dl modlo. El uso corrcto d st contrast rqur un tamaño d mustra adcuado para asgurar qu cada grupo cunta al mnos con cnco obsrvacons. Admás l stadístco chcuadrado s snsbl al tamaño mustral, prmtndo qu sta mdda ncuntr dfrncas stadístcamnt muy pquñas cuando l tamaño mustral crc. 5. ODELOS DE RESUESTA ÚLTILE Cuando la varabl ndógna a modlzar s una varabl dscrta con varas altrnatvas posbls d rspusta (J nos ncontramos ant los modlos d rspusta múltpl. Estos modlos s clasfcan n dos grands grupos sgún qu las altrnatvas qu prsnta la varabl ndógna s pudan ordnar (modlos con datos ordnados o no s pudan ordnar (modlos con datos no ordnados. odlos d rspusta múltpl con datos no ordnados La spcfcacón gnral d los modlos d rspusta múltpl con datos no ordnados quda rcogda a través d la sgunt xprsón: r ob( j J j ' Zj ' Z j ( dond Z j rprsnta la matrz d los rgrsors dl modlo. Dchas varabls xplcatvas pudn sr d dos tpos: - Varabls qu contnn aspctos spcífcos dl ndvduo y por tanto, su valor srá l msmo n todas las altrnatvas. Est tpo d varabls rcbn l nombr d caractrístcas, y s las dnota por W. - Varabls qu contnn aspctos spcífcos d las altrnatvas ntr las qu s ha d lgr, y varían tanto ntr ndvduos como ntr altrnatvas. Est tpo d varabls rcbn l nombr d atrbutos d las altrnatvas y s las dnota por j. A partr d sta spcfcacón gnral, y tnndo n cunta qu la nclusón n l modlo d varabls xplcatvas qu hagan rfrnca a caractrístcas o atrbutos
prmt la spcfcacón d modlos dfrnts dnomnados, modlo logt multnomal n l prmr caso y modlo logt condconal n l sgundo. A. El modlo Logt ultnomal Est tpo d modlos s l qu s utlza con más frcunca n los trabajos aplcados. En st modlo los valors d las varabls xplcatvas varían para cada ndvduo pro son constants para cualqur altrnatva, por lo qu no s pud aprcar la nflunca d la varabl n cada altrnatva a no sr qu s ntroduzca una varabl fctca, multplcada por los valors d W, qu rprsnt a cada altrnatva. ara vtar problmas d sngulardad, l númro d varabls fctcas a ntroducr n l modlo srá gual al númro d altrnatvas mnos uno (J-. La formulacón d un Logt ultnomal quda rcogda a través d la sgunt cuacón 8 : r ob( j ' j j J j ' j (3 dond j rprsnta l índc asocado a cada altrnatva y va dsd hasta (J-. El vctor d parámtros llva asocado l subíndc corrspondnt a la altrnatva concrta analzada. Las cuacons stmadas proporconan un conjunto d probabldads para cada una d las altrnatvas qu pud tomar un ndvduo y tnga como caractrístcas ndvduals. En l modlo Logt ultnomal xst una ndtrmnacón cuando s trata d stmar l valor d los parámtros. ara soluconar st problma s normalza l modlo tomando para los parámtros qu acompañan a la altrnatva cro l valor cro,. Las probabldads rsultants son r ob( j ' j J j j' para j,,..., (J- (4 8 A psar d qu las caractrístcas spcífcas d cada ndvduo s han dnotado con W, n lo qu sgu s dnotarán con al hacr rfrnca a las varabls xplcatvas d un modlo conométrco n l qu tradconalmnt s utlza sa dnomnacón.
3 ' ( r J j j ob para j Dond s tn qu cumplr qu J j j ara l caso sncllo d un modlo n l qu la varabl ndógna prsnta trs posbls altrnatvas d lccón y sólo xst una varabl xplcatva n la modlzacón, la probabldad asocada a cada una d las altrnatvas posbls d lccón tomarían las sgunts xprsons 9 (5 con la matrz d dsño vndrá xprsada como n n............ B. El modlo Logt Condconal Cuando las varabls xplcatvas qu s utlzan para stmar las probabldads asocadas a cada una d las posbls altrnatvas qu prsnta la varabl ndógna s 9 S dntfcan con la ltra los parámtros qu acompañan al térmno ndpndnt y con la ltra los qu acompañan a las varabls xplcatvas.
rfrn a atrbutos d las dstntas altrnatvas, y no a caractrístcas spcífcas d los ndvduos, l modlo qu s utlza n la stmacón s l llamado Logt Condconal. En st caso, l valor d cada varabl varará para cada altrnatva y pud hacrlo o no para cada ndvduo. La dfrnca d st modlo con l Logt ultnomal s qu n st caso solo xst un vctor d parámtros a stmar, mntras qu n l caso antror xstían tantos vctors como altrnatvas mnos una. Es por llo, qu n la formulacón dl modlo l vctor d parámtros, al sr únco, no llva asocado nngún subíndc rlaconado con la altrnatva a la qu acompaña, como ocurría n l caso antror. La otra dfrnca hac rfrnca a qu n st caso no xst nnguna ndtrmnacón a la hora d stmar los parámtros, por lo qu no s ncsaro gualar nngún vctor a cro. La xprsón formal dl modlo quda dfnda como r ob( j J C. El modlo Logt Andado j ' j ' j para j,,..., J (6 Uno d los problmas qu s plantan n los modlos xpustos d rspusta múltpl s l d qu s construyn bajo la hpótss d prsnca d altrnatvas rrlvants o suprfluas, sgún la cual la rlacón ntr las probabldads d dcdr ntr dos altrnatvas no dpnd dl rsto d las altrnatvas. Esta propdad s db al supusto ncal d qu las prturbacons alatoras dl modlo son ndpndnts, s dcr, las prturbacons afctan d la msma forma a la dfrnca d utldad ntr cualqur par d altrnatvas. El caso contraro sría la prsnca d autocorrlacón n l modlo, lo cual s daría, por jmplo, cuando un ndvduo prcb unas altrnatvas más smlars ntr sí qu otras. S bn asumr la hpótss d ndpndnca d las altrnatvas rrlvants smplfca l procso d stmacón, supon una rstrccón n la modlzacón dl comportamnto d los ndvduos qu no parc razonabl n dtrmnadas crcunstancas. Así, sta propdad carc d valdz cuando algunas d las altrnatvas son susttutvos crcanos, ya qu n st caso xstrían altrnatvas corrlaconadas. Como altrnatva para rlajar la hpótss d ndpndnca d altrnatvas rrlvants, s ha dsarrollado l modlo Logt andado o Logt jrárquco (qu n trmnología anglosajona s conocdo como Nstd Logt. 4
La construccón dl modlo s ralza agrupando l conjunto d altrnatvas posbls n subgrupos y mantnndo la hpótss d ndpndnca d altrnatvas rrlvants dntro d cada grupo y n la lccón ntr grupos. En st modlo, la lccón d una d las altrnatvas posbls s ralza n dos o más tapas, dfnéndos una structura arbóra: prmro s scog ntr los conjuntos d altrnatvas y dspués s lg una altrnatva spcífca prtncnt al conjunto slcconado n prncpo. Suponndo qu las J altrnatvas posbls pudn dvdrs n L conjuntos d altrnatvas, y qu las varabls xplcatvas dl modlo son j/l, las qu s rlaconan con las altrnatvas dntro d un grupo, y Z l, las qu s rlaconan con los conjuntos d altrnatvas, la forma matmátca dl modlo quda xprsada como: j/ l l J J l l j j ' j / l ' j / l γ ' Zl τ li l γ ' Z l τ lil (7 dond J l I l ln j ' j / l. Uno d los aspctos problmátcos d st modlo radca n la spcfcacón d la structura arbóra. En algunos casos, la partcón n subgrupos dl conjunto d altrnatvas posbls s hac d modo natural. Sn mbargo, n otros casos, dcha partcón dl conjunto d posbls altrnatvas s hac sn nngún crtro lógco, por lo qu rsulta procupant qu los rsultados obtndos dpndan d cómo s han dfndo las ramas. D momnto, no xst nngún contrast qu prmta slcconar la mjor structura arbóra d ntr varas, por lo qu muchos d los trabajos mpírcos qu stman st modlo prsntan los rsultados supustas dstntas spcfcacons d la structura arbóra. odlos d rspusta múltpl con datos ordnados Cuando la varabl dpndnt s dscrta, pro sus valors ndcan un ordn, no s corrcto ralzar la stmacón d la msma a través d los modlos prsntados n l apartado antror, ya qu la nclusón d la nformacón qu aporta l ordn d las altrnatvas n la spcfcacón dl modlo prmt obtnr unos mjors rsultados. Tampoco sría corrcto l uso d un modlo d rgrsón clásco, ya qu codfcadas las posbls altrnatvas como,,,...(j,..., J, s staría consdrando la dfrnca ntr (j y (j como la xstnt ntr y, lo cual no tn porqu sr así ya qu 5
los númros utlzados n la codfcacón solo rprsntan un ordn dntro d una clasfcacón. La formulacón dl modlo Logt ordnado quda como sgu: r ob( Λ( ' r ob( Λ( µ ' Λ( ' r ob( Λ( µ ' Λ( µ '... r ob( ( J ( J Λ( µ ' (8 dond µ, µ,..., µ ( J son parámtros qu rprsntan los valors d los umbrals o barrras y s stman a la vz qu y Λ ' rprsnta la funcón d dstrbucón logístca. ( ara qu todas las probabldads san postvas s db cumplr < µ < µ <... < µ ( J El sgunt gráfco, para l qu la varabl obsrvada prsnta cnco posbls altrnatvas, srv para lustrar la structura qu subyac n la construccón dl modlo Logt ordnado. f( ε,3 Cálculo d probabldads n l modlo Logt Ordnado,5,,5,,5, 3 4 3 5 7 9 3 5 7 - ' µ ' µ ' µ 3 ' 9 ε Λ ' ( ' ' 6