REGRESIÓN LOGISTICA Índice

Tamaño: px
Comenzar la demostración a partir de la página:

Download "REGRESIÓN LOGISTICA Índice"

Transcripción

1 REGRESIÓN LOGISTICA Índce. OBJETIVOS.... INTRODUCCIÓN AL MODELO DE REGRESIÓN LOGÍSTICA INTRODUCCIÓN A LA SELECCIÓN DE VARIABLES CONCEPTO DE REGRESIÓN LOGÍSTICA Regresón logístca bnara REQUISITOS Y ETAPAS DE LA REGRESIÓN LOGÍSTICA ESTIMACIÓN DE LOS COEFICIENTES DEL MODELO Y DE SUS ERRORES ESTÁNDAR El estadístco de Wald El estadístco G de razón de verosmltud La prueba Score MULTICOLINEALIDAD LAS VARIABLES SIMULADAS (DUMMY) FUNCIÓN DE VEROSIMILITUD Método de Newton-Raphson TIPOS DE MODELOS DE REGRESIÓN LOGÍSTICA INTERPRETACIÓN DEL MODELO LOGÍSTICO MEDIDAS DE CONFIABILIDAD DEL MODELO Devanza Crtero AIC de Akake Prueba de bondad de ajuste de Hosmer-Lemeshov ESTADÍSTICOS INFLUENCIALES PARA REGRESIÓN LOGÍSTICA Resduales de Pearson Resduales de devanza Uso de la regresón logístca en clasfcacón DIAGNÓSTICO EN REGRESIÓN LOGÍSTICA MODELOS PREDICTIVOS MÉTODOS DE SELECCIÓN AUTOMÁTICA Haca adelante Haca atrás Stepwse Consderacones VALORACIÓN DE LA CAPACIDAD PREDICTIVA DEL MODELO Clasfcacón Cálculo del área bajo la curva ROC Eleccón del punto de corte óptmo VALIDACIÓN DEL MODELO REGRESIÓN LOGÍSTICA CONDICIONAL ESTUDIOS DE CASOS Y CONTROLES APAREADOS REGRESIÓN MULTINOMIAL REGRESIÓN ORDINAL Odds-proporconales Categorías adyacentes ELEMENTOS DE INTERÉS EN REGRESIÓN LOGÍSTICA ELEMENTOS DERIVADOS BIBLIOGRAFÍA...

2 . Objetvos Estudar los modelos de regresón logístca consderando sus fundamentos teórcos y sus aplcacones. Se pretende que al fnalzar el curso los alumnos hayan adqurdo los conocmentos relatvos a las formulacones, supuestos y condcones de aplcacón del modelo de regresón logístca. El objetvo fnal es que los alumnos puedan plantear y dseñar una nvestgacón empírca en la que se requera aplcar dchos modelos.. Introduccón al modelo de regresón logístca Los modelos de regresón logístca son modelos estadístcos en los que se desea conocer la relacón entre: Una varable dependente cualtatva, dcotómca (regresón logístca bnara o bnomal) o con más de dos valores (regresón logístca multnomal). Una o más varables explcatvas ndependentes, o covarables, ya sean cualtatvas o cuanttatvas, sendo la ecuacón ncal del modelo de tpo exponencal, s ben su transformacón logarítmca (logt) permte su uso como una funcón lneal. Como se ve, las covarables pueden ser cuanttatvas o cualtatvas. Las covarables cualtatvas deben ser dcotómcas, tomando valores 0 para su ausenca y para su presenca (esta codfcacón es mportante, ya que cualquer otra codfcacón provocaría modfcacones en la nterpretacón del modelo). Pero s la covarable cualtatva tuvera más de dos categorías, para su nclusón en el modelo debería realzarse una transformacón de la msma en varas covarables cualtatvas dcotómcas fctcas o de dseño (las llamadas varables dummy), de forma que una de las categorías se tomaría como categoría de referenca. Con ello cada categoría entraría en el modelo de forma ndvdual. En general, s la covarable cualtatva posee n categorías, habrá que realzar n covarables fctcas. Por sus característcas, los modelos de regresón logístca permten dos fnaldades: Cuantfcar la mportanca de la relacón exstente entre cada una de las covarables y la varable dependente, lo que lleva mplícto tambén clarfcar la exstenca de nteraccón y confusón entre covarables respecto a la varable dependente (es decr, conocer la odds rato para cada covarable). Clasfcar ndvduos dentro de las categorías (presente/ausente) de la varable dependente, según la probabldad que tenga de pertenecer a una de ellas dada la presenca de determnadas covarables. No cabe duda que la regresón logístca es una de las herramentas estadístcas con mejor capacdad para el análss de datos en nvestgacón clínca y epdemología, de ahí su ampla utlzacón. El objetvo prmordal que resuelve esta técnca es el de modelar cómo nfluye en la probabldad de aparcón de un suceso, habtualmente dcotómco, la presenca o no de dversos factores y el valor o nvel de los msmos. Tambén puede ser usada para estmar la probabldad de aparcón de cada una de las posbldades de un suceso con más de dos categorías (poltómco). 3. Introduccón a la seleccón de varables Pero, del conjunto de varables que pueda tener un estudo, qué varables deben ntroducrse en el modelo? El modelo debe ser aquél más reducdo que explque los datos (prncpo de parsmona), y que además sea clíncamente congruente e nterpretable. Hay que tener en cuenta que un mayor número de varables en el modelo mplcará mayores errores estándar. Deben nclurse todas aquellas varables que se consderen clíncamente mportantes para el modelo, con ndependenca de s un análss unvarado prevo se demostró o no su sgnfcacón estadístca. Por otro lado, no debería dejarse de nclur toda varable que en un análss unvarado prevo demostrara una relacón "sufcente" con la varable dependente. Como se ve, no se habla de sgnfcacón estadístca p < 0,05, que sería un crtero excesvamente restrctvo, sno de un certo grado de relacón (por ejemplo ( ) p < 0, 5 ). La laxtud de esta recomendacón se debe a que un crtero tan restrctvo como una p < 0,05 puede conducr a dejar de nclur en el modelo covarables con una débl asocacón a la varable dependente en soltaro pero que podrían demostrar ser fuertes predctores de la msma al tomarlas en conjunto con el resto de covarables. Una cuestón mportante a tener en cuenta es el correcto manejo de las varables cualtatvas transformadas en varas varables fctcas.

3 Sempre que se decda nclur (o exclur) una de estas varables, todas sus correspondentes varables fctcas deben ser ncludas (o excludas) en bloque. No hacerlo así mplcaría que se habría recodfcado la varable, y por tanto la nterpretacón de la msma no sería gual. Otro aspecto de nterés es la sgnfcacón que pudera tener cada varable fctca. No sempre todas las varables fctcas de una covarable son sgnfcatvas, o todas no sgnfcatvas. En estos casos es recomendable contrastar el modelo completo frente al modelo sn la covarable medante la prueba de razón de verosmltud (es decr, se sacarían del modelo en bloque todas las varables fctcas de la covarable de nterés). La decsón se tomaría dependendo del resultado de la prueba y del nterés clínco de la covarable: S se obtene sgnfcacón en este contraste, la varable permanece en el modelo; s no se obtene sgnfcacón y la covarable es de nterés clínco a crtero del nvestgador, habría que valorar la magntud en la que se dstanca de la sgnfcacón para decdr s la covarable debe permanecer o no en el modelo. Una vez se dspone de un modelo ncal debe procederse a su reduccón hasta obtener el modelo más reducdo que sga explcando los datos. Para ello se puede recurrr a métodos de seleccón paso a paso, ben medante nclusón "haca adelante" o por elmnacón "haca atrás", o a la seleccón de varables por mejores subconjuntos de covarables. Estos métodos se encuentran mplementados en numerosos paquetes estadístcos, por lo que son muy populares. Dado que para la comprensón de los métodos de seleccón paso a paso se requere un conocmento prevo acerca del ajuste del modelo, éste es un aspecto que debe ser tratado en otro momento; se sugere al lector que se ntroduzca en este aspecto una vez tenga conocmentos sobre el análss del ajuste del modelo. No obstante hay que advertr que su uso nunca puede susttur a la valoracón jucosa de los modelos que van surgendo de forma serada en cada paso y del modelo fnal. No hacerlo así puede llevar a dar por bueno un modelo surgdo de forma automátca (por crteros preestablecdos por el paquete estadístco muchas veces mal conocdos por el usuaro del software), con escaso valor clínco. Cada vez que se encuentre ante un modelo de regresón logístca (el ncal, cualquera de los ntermedos o el fnal), se tendrá que contrastar su sgnfcacón global, medante las pruebas de ajuste global del modelo. Una vez se dspone un modelo prelmnar, se podrían nclur factores de nteraccón, es decr, estudar cómo la asocacón de dos o más covarables puede nflur en la varable dependente. Exsten estrategas de desarrollo de modelos de regresón por las que se recomenda la nclusón en el modelo ncal de todas las covarables necesaras más las nteraccones de las msmas, o por lo menos, las nteraccones de prmer orden (tomadas las covarables dos a dos), a los que se les llama modelos saturados. Interaccones de mayor orden suelen ser de dfícl nterpretacón. En cualquer caso sempre hay que tener presente las lmtacones de tamaño muestral (que se verán luego), y de nterpretacón desde el punto de vsta clínco (no se deberían nclur nteraccones de sgnfcado ncerto). Otra estratega en el desarrollo del modelo fnal es el dseño y ajuste de un modelo fnal prelmnar sn nteraccones, en el que luego se ensayarían la nclusón, uno por uno, de térmnos de nteraccón que puderan tener traduccón clínca (Hosmer y Lemeshow), y valorar su sgnfcacón respecto del modelo prevo sn nteraccones. Una vez se haya decddo la nclusón de un factor de nteraccón, se tendrá en cuenta que sempre deberán estar ncludas tambén de forma aslada en el modelo las covarables que componen la nteraccón (prncpo jerárquco): s la nteraccón es "HTA-dabetes", en el modelo se encontrarán como covarables HTA y dabetes (DM): logt = β + β HTA + β DM + β HTA DM + [a] 0 3 Por otra parte, y en relacón con la nclusón de nteraccones, hay que tener en cuenta que la nclusón de las msmas puede generar multcolnealdad, tanto más probable cuanto mayor sea el número de nteraccones. Sempre debe consderarse la sufcenca del tamaño muestral para el número de covarables que se desea nclur en el modelo: modelos excesvamente grandes para muestras con tamaños muestrales relatvamente pequeños mplcarán errores estándar grandes o coefcentes estmados falsamente muy elevados (sobreajuste). En general se recomenda que por cada covarable se cuente con un mínmo de 0 ndvduos por cada evento de la varable dependente con menor representacón (Peduzz). Por ejemplo, s la varable dependente Y es muerte y en los datos hay 0 sujetos vvos y 36 sujetos muertos, el evento de Y menos representado es muerte, con 36 sujetos; de esta forma el modelo no debería contener más de covarables. Lo anteror es váldo sempre que se trate de covarables cuanttatvas o cualtatvas con dstrbucones ben equlbradas. La stuacón se complca s una o más de las covarables cualtatvas no tene una dstrbucón 3

4 equlbrada (uno de sus dos valores tene una mínma representacón); en ese caso se recomenda que en su tabla de contngenca respecto a la varable dependente, en cada celda haya un mínmo de 0 observacones. En el sguente ejemplo se debería dsponer de sufcente tamaño muestral como para que en cada celda haya 0 ó más sujetos (es decr, que tanto a, b, c como d sean mayores de 0). x = 0 x = y = 0 a b y = c d 4. Concepto de regresón logístca La regresón logístca es un nstrumento estadístco de análss bvarado o multvarado, de uso tanto explcatvo como predctvo. Resulta útl su empleo cuando se tene una varable dependente dcotómca (un atrbuto cuya ausenca o presenca se ha puntuado con los valores cero y uno, respectvamente) y un conjunto de m varables predctoras o ndependentes, que pueden ser cuanttatvas (que se denomnan covarables o covaradas) o categórcas. En este últmo caso, se requere que sean transformadas en varables fctcas o smuladas ( dummy ). El propósto del análss es: Predecr la probabldad de que a alguen le ocurra certo evento: por ejemplo, estar desempleado = o no estarlo = 0; ser pobre = o no ser pobre = 0; graduarse como socólogo = o no graduarse = 0; Determnar qué varables pesan más para aumentar o dsmnur la probabldad de que a alguen le suceda el evento en cuestón. Esta asgnacón de probabldad de ocurrenca del evento a un certo sujeto, así como la determnacón del peso que cada una de las varables dependentes en esta probabldad, se basan en las característcas que presentan los sujetos a los que, efectvamente, les ocurren o no estos sucesos. Por ejemplo, la regresón logístca tomará en cuenta los valores que asumen en una sere de varables (edad, sexo, nvel educatvo, poscón en el hogar, orgen mgratoro, etc.) los sujetos que están efectvamente desocupados (= ) y los que no lo están (= 0). En base a ello, predecrá a cada uno de los sujetos ndependentemente de su estado real y actual una determnada probabldad de ser desocupado (es decr, de tener valor en la varable dependente). Es decr, s alguen es un joven no amo de casa, con baja educacón y de sexo masculno y orgen emgrante (aunque esté ocupado) el modelo le predecrá una alta probabldad de estar desocupado (puesto que la tasa de desempleo de el grupo así defndo es alta), generando una varable con esas probabldades estmadas. Y procederá a clasfcarlo como desocupado en una nueva varable, que será el resultado de la predccón. Además, analzará cuál es el peso de cada uno de estas varables ndependentes en el aumento o la dsmnucón de esa probabldad. Por ejemplo, cuando aumenta la educacón dsmnurá en algo la probabldad de ser desocupado. En cambo, cuando el sexo pase de 0 = mujer a = varón, aumentará en algo la probabldad de desempleo porque la tasa de desempleo de los jóvenes de sexo masculno es mayor que la de las mujeres jóvenes. El modelo, obvamente, estma los coefcentes de tales cambos. Cuanto más concdan los estados pronostcados con los estados reales de los sujetos, mejor ajustará el modelo. Uno de los prmeros ndcadores de mportanca para aprecar el ajuste del modelo logístco es el doble logartmo del estadístco de verosmltud (lkelhood). Se trata de un estadístco que sgue una dstrbucón smlar a χ y compara los valores de la predccón con los valores observados en dos momentos: (a) en el modelo sn varables ndependentes, sólo con la constante y (b) una vez ntroducdas las varables predctoras. Por lo tanto, el valor de la verosmltud debera dsmnur sensblemente entre ambas nstancas e, dealmente, tender a cero cuando el modelo predce ben. 4..Regresón logístca bnara Los modelos de regresón logístca bnara resultan los de mayor nterés ya que la mayor parte de las crcunstancas analzadas en medcna responden a este modelo (presenca o no de enfermedad, éxto o fracaso, etc.). Como se ha vsto, la varable dependente será una varable dcotómca que se codfcará como 0 ó (respectvamente, ausenca y presenca ). Este aspecto de la codfcacón de las varables no es banal (nfluye en la forma en que se realzan los cálculos matemátcos), y habrá que tenerlo muy en 4

5 cuenta s se emplean paquetes estadístcos que no recodfcan automátcamente las varables cuando éstas se encuentran codfcadas de forma dferente (por ejemplo, el uso frecuente de para la presenca y ó para la ausenca). La ecuacón de partda en los modelos de regresón logístca es: n exp b0 + b x = Pr ( y= x) = n + exp b0 + b x = [b] donde: Pr ( y= X) es la probabldad de que y tome el valor (presenca de la característca estudada), en presenca de las covarables X ; x, x,, xn que forman parte del modelo; X es un conjunto de n covarables { } b0 b es la constante del modelo o térmno ndependente; los coefcentes de las covarables. Es lo que se denomna dstrbucón logístca. En la sguente magen vemos un ejemplo de esta dstrbucón: la probabldad de padecer enfermedad coronara en funcón de la edad. Como puede verse, la relacón entre la varable dependente (cualtatva dcotómca), y la covarable (edad, cuanttatva contnua en este caso), no es defnda por una recta (lo que correspondería un modelo lneal), sno que descrbe una forma sgmodea (dstrbucón logístca). Fgura. S se dvde la expresón [] por su complementaro, es decr, s se construye su odds (en el ejemplo de presenca o no de enfermedad, la probabldad de estar enfermo entre la probabldad de estar sano), se obtene una expresón de manejo matemátco más fácl: n Pr ( y= x) = exp b0 + b x Pr( y x ) [] = = Pero esta expresón aún es dfícl de nterpretar. Su representacón gráfca es (fgura ): 5

6 Fgura S ahora se realza su transformacón logartmo natural, se obtene una ecuacón lneal que lógcamente es de manejo matemátco aún más fácl y de mayor comprensón: o smplfcando: ( y= x) ( ) Pr n log = b0 + b x Pr y x [3] = = log p = β + 0 β x p En la expresón [3] se ve a la zquerda de la gualdad el llamado logt, es decr, el logartmo natural de la odds de la varable dependente (esto es, el logartmo de la razón de proporcones de enfermar, de fallecer, de éxto, etc.). El térmno a la derecha de la gualdad es la expresón de una recta, déntca a la del modelo general de regresón lneal: y = a + b x + b x + + b x [4] n n Sguendo el ejemplo de las fguras y, se puede representar el logt frente a la edad como se observa en la fgura 3: [3a] Fgura 3. Pero la regresón lneal presenta una dferenca fundamental respecto al modelo de regresón logístca. En el modelo de regresón lneal se asume que los errores estándar de cada coefcente sguen una dstrbucón normal de meda 0 y varanza constante (homoscedastcdad). En el caso del modelo de regresón logístca no pueden realzarse estas asuncones pues la varable dependente no es contnua (sólo puede tomar dos valores, 0 ó, pero nngún valor ntermedo). Llamando ε al posble error de predccón para cada covarable x se tendrá que el error cometdo dependerá del valor que llegue a tomar la varable dependente, tal como se ve en [5]. y= ε = Pr( x) y = Pr ( x) + ε [5] y = 0 ε = Pr( x) 6

7 Esto mplca que ε sgue una dstrbucón bnomal, con meda y varanza proporconales al tamaño Pr y= x (la probabldad de que y = dada la presenca de x ). muestral y a ( ) 5. Requstos y etapas de la regresón logístca Recodfcar las varables ndependentes categórcas u ordnales en varables fctcas o smuladas y de la varable dependentes en 0 y ; Evaluar efectos de confusón y de nteraccón del modelo explcatvo; Evaluar la bondad de ajuste de los modelos; Analzar la fuerza, sentdo y sgnfcacón de los coefcentes, sus exponencales y estadístcos de prueba (Wald). 6. Estmacón de los coefcentes del modelo y de sus errores estándar Para la estmacón de los coefcentes del modelo y de sus errores estándar se recurre al cálculo de estmacones de máxma verosmltud, es decr, estmacones que hagan máxma la probabldad de obtener los valores de la varable dependente Y proporconados por los datos de nuestra muestra. Estas estmacones no son de cálculo drecto, como ocurre en el caso de las estmacones de los coefcentes de regresón de la regresón lneal múltple por el método de los mínmos cuadrados. Para el cálculo de estmacones máxmo verosímles se recurre a métodos teratvos, como el método de Newton Raphson. Dado que el cálculo es complejo, normalmente hay que recurrr al uso de rutnas de programacón o a paquetes estadístcos. De estos métodos surgen no sólo las estmacones de los coefcentes de regresón, sno tambén de sus errores estándar y de las covaranzas entre las covarables del modelo. El sguente paso será comprobar la sgnfcacón estadístca de cada uno de los coefcentes de regresón en el modelo. Para ello se pueden emplear báscamente tres métodos: el estadístco de Wald, el estadístco G de razón de verosmltud y la prueba Score. 6.. El estadístco de Wald Contrasta la hpótess de que un coefcente aslado es dstnto de 0, y sgue una dstrbucón normal de meda 0 y varanza. Su valor para un coefcente concreto vene dado por el cocente entre el valor del coefcente y su correspondente error estándar. La obtencón de sgnfcacón ndca que dcho coefcente es dferente de 0 y merece la pena su conservacón en el modelo. En modelos con errores estándar grandes, el estadístco de Wald puede proporconal falsas ausencas de sgnfcacón (es decr, se ncrementa el error tpo II). Tampoco es recomendable su uso s se están empleando varables de dseño. 6.. El estadístco G de razón de verosmltud Se trata de r contrastando cada modelo que surge de elmnar de forma aslada cada una de las covarables frente al modelo completo. En este caso cada estadístco G sgue una χ con un grado de lbertad (no se asume normaldad). La ausenca de sgnfcacón mplca que el modelo sn la covarable no empeora respecto al modelo completo (es decr, da gual su presenca o su ausenca), por lo que según la estratega de obtencón del modelo más reducdo (prncpo de parsmona), dcha covarable debe ser elmnada del modelo ya que no aporta nada al msmo. Esta prueba no asume nnguna dstrbucón concreta, por lo que es la más recomendada para estudar la sgnfcacón de los coefcentes La prueba Score Su cálculo para el caso de una únca varable vene dado por: S = n = ( ) x y y n ( ) ( ) y y x x = [6] 7

8 En el caso de múltples covarables hay que utlzar cálculo matrcal, s ben no requere un cálculo teratvo (precsamente su rapdez de cálculo sería su aspecto más favorable). En contra del msmo dos aspectos: (a) Se sabe que este estadístco se ncrementa conforme aumenta el número de covarables (es decr tende a dar sgnfcacón con mayor frecuenca). (b) Este estadístco tambén asume una dstrbucón normal con meda 0 y varanza. Al gual que en los casos anterores, s alcanza sgnfcacón ndca que la covarable debería permanecer en el modelo. Su uso en algunos paquetes estadístcos ha quedado relegado a la seleccón de varables en métodos paso a paso (por la mayor rapdez de cálculo). Cuando la covarable es cualtatva con n categorías (sendo n > ), en el modelo se analzará la sgnfcacón de cada una de sus n varables fctcas, así como la sgnfcacón global de la covarable comparando la presenca en bloque frente a la ausenca en bloque de sus n covarables fctcas. En el sguente ejemplo, tomado de Hosmer y realzado con SPSS, se analza la varable edad (AGE) y la varable IVHX (usuaro de drogas por vía parenteral); esta segunda era una varable con tres categorías ( nunca, preva y recente ), por lo que se crearon dos varables fctcas: IVHX() e IVHX(); el resultado es una estmacón de los β con sus errores estándar, la sgnfcacón para IVHX() e IVHX(), y la sgnfcacón de IVHX consderada como la entrada frente a la salda en bloque del modelo de IVHX() e IVHX(). Fgura 4. Una vez se ha estmado los coefcentes de regresón y sus correspondentes errores estándar se calcularán los correspondentes ntervalos de confanza para las estmacones, bajo la hpótess de que dchos coefcentes se dstrbuyen según respectvas dstrbucones normales. Para un determnado coefcente, su ntervalo de confanza al 95 % vendrá dado por: IC 95% ( β) = ( β,96 ee), ( β +,96ee) [7] IC95% ( OR) = exp( β,96 ee), exp( β +,96ee) Junto a la sgnfcacón del estadístco empleado para contrastar la sgnfcacón de los coefcentes de regresón, la nclusón de la undad en el ntervalo de confanza es, lógcamente, ndcatva de la ausenca de sgnfcacón. En ocasones exstrán modelos que llaman la atencón por la falta de sentdo de sus estmacones. Esta sorpresa suele venr dada por la presenca de estmacones de grandes errores estándar, con frecuenca asocadas a estmacones de coefcentes de regresón tambén anormalmente elevados. Las posbles causas de este hecho pueden ser: (a) Presenca de una frecuenca cero en una tabla de contngenca Y x X. Cuando esto ocurre provoca en el cálculo de la correspondente odds la presenca de un 0 en el denomnador (y por tanto no es calculable). S esta covarable se ntenta ntroducr en el modelo de regresón que se está dseñando, el software puede comportarse de forma ncorrecta: desde exclurla por entender que predce perfectamente la varable dependente, a nclurla y comuncar un error (porque la rutna de teracón para el cálculo de estmacones de máxma verosmltud o ben no llega a converger o ben llega al máxmo de teracones prefjadas). Esta crcunstanca puede y debe ser detectada durante el análss unvarado. En el caso de tratarse de una varable cualtatva con más de dos categorías, una solucón es colapsar dos de esas categorías. (b) Tambén puede ocurrr que se ncluyan nteraccones que mplquen una excesva estratfcacón para la muestra dsponble. El resultado puede ser una estmacón elevada del correspondente coefcente de 8

9 regresón y de su error estándar. En el análss unvarado, al realzar efectvamente las dos tablas de contngenca de la estratfcacón, se observará que alguna de las ocho celdas contene el cero. S no puede recurrr al colapso de categorías, puede decdrse dseñar una nueva varable que sea la combnacón de las dos covarables con sus correspondentes categorías, e nclurla como tal en el modelo. Presenca de una o más covarables que dscrmnan perfectamente las dos categorías de la varable dependente. Algunos ejemplos servrán para explcar esta crcunstanca: S sempre que se admnstran antmcrobanos los sujetos con una determnada enfermedad nfeccosa vven y sempre que no se admnstran mueren, la covarable antmcrobanos dscrmna perfectamente a la varable muerte ; o s sempre que se tenen más de 65 años se padece de cardopatía squémca y por debajo no, la covarable edad dscrmna perfectamente a la varable cardopatía squémca. En la práctca esta crcunstanca mpde que se puedan realzar estmacones de coefcentes por máxma verosmltud, lo que no quere decr que el paquete estadístco necesaramente no de falsas estmacones, como en el punto anteror. Este problema está en estrecha relacón con el tamaño muestral y el número de covarables que se desean ntroducr en el modelo: la probabldad de dscrmnacón completa es elevada en los modelos con muestras con tamaños muestrales pequeños, sobre todo cuando una de las categorías de la varable dependente está poco representada, y tanto más cuanto mayor es el número de covarables ntroducdas en el modelo. (c) Multcolnealdad. S ben exsten pruebas que permten comprobar la exstenca de colnealdad entre covarables (que se verá más adelante), cabe reseñar aquí que al gual que en los casos anterores, los modelos con multcolnealdad entre las covarables ntroducdas llamarán la atencón por la presenca de grandes errores estándar, y frecuentemente, estmacones de coefcentes anormalmente elevadas. Sn embargo la multcolnealdad no afecta al sentdo de las estmacones (la multcolnealdad no hará que aparezca sgnfcacón donde no la hay, y vceversa). 7. Multcolnealdad Se dce que exste multcolnealdad cuando dos o más de las covarables del modelo mantenen una relacón lneal. Cuando la colnealdad es perfecta, es decr, cuando una covarable puede determnarse según una ecuacón lneal de una o más de las restantes covarables, es posble estmar un únco coefcente de todas las covarables mplcadas. En estos casos debe elmnarse la covarable que actúa como dependente. Normalmente lo que se hallará será una multcolnealdad moderada, es decr, una mínma correlacón entre covarables. S esta correlacón fuera de mayor mportanca, su efecto sería, como ya se vo anterormente, el ncremento exagerado de los errores estándar, y en ocasones, del valor estmado para los coefcentes de regresón, lo que hace las estmacones poco creíbles. Un prmer paso para analzar este aspecto puede ser examnar la matrz de coefcentes de correlacón entre las covarables. Coefcentes de correlacón muy elevados llevarán a nvestgar con mayor profunddad. Sn embargo, este método, bueno para detectar colnealdad entre dos covarables, puede conducr a no poder detectar multcolnealdad entre más de dos de ellas. Exsten otros procedmentos analítcos para detectar multcolnealdad. Puede desentenderse por el momento de la varable dependente y realzar sendos modelos en los que una de las covarables actuará como varable dependente y las restantes covarables como varables ndependentes de aquella. A cada uno de estos modelos se le puede calcular la R (o dspersón total, medda de ajuste que se verá más adelante). Se denomna toleranca al complementaro de R, y factor de nflacón de la varanza (FIV) al nverso de la toleranca, R ( ) R, ( ). Cuando exste estrecha relacón entre covarables la toleranca tende a ser 0, y por tanto FIV tende al nfnto. Como regla general debería preocupar tolerancas menores de 0, y FIV mayores de 0. SPSS ofrece la matrz de correlacones, pero no aporta índces de multcolnealdad para la regresón logístca. La solucón a la multcolnealdad no es fácl: Puede ntentarse elmnar la varable menos necesara mplcada en la colnealdad, a resgo de obtener un modelo menos váldo; Puede ntentar cambarse la escala de medda de la varable en conflcto (es decr, transformarla), para evtar sacarla del modelo, s ben no sempre se encontrará una transformacón de forma drecta. Algunas transformacones frecuentes son el centrado respecto de la meda, la estandarzacón o la creacón de varables sntétcas medante un análss prevo de componentes prncpales (que es otro 9

10 tpo de análss multvarado). Estas transformacones por el contraro hacen al modelo muy dependente de los datos actuales, nvaldando su capacdad predctva; Tambén se puede recurrr a aumentar la muestra para así aumentar la nformacón en el modelo, lo que no sempre será posble. 8. Las varables smuladas (dummy) A veces se necesta ncorporar al modelo de regresón logístca varables ndependentes que no son numércas sno categórcas. Supóngase, por ejemplo, que se quere predecr la probabldad de una persona de ser pobre. Tal vez resulte mportante ncorporar varables que no son cuanttatvas: por ejemplo, la categoría ocupaconal ( empleador, trabajador por cuenta propa, asalarado trabajador sn remuneracón ). En este caso, esta varable podría ser ncorporada a la ecuacón s se la transforma en una varable smulada. Ello consste en generar n varables dcotómcas con valores cero y uno, sendo n el número de categorías de la varable orgnal. Para el caso de la varable categoría ocupaconal, la transformacón sería la sguente: categoría ocupaconal varable fctíca empleador cuenta propa asalarado empleador 0 0 cuenta propa 0 0 asalarado 0 0 trabajador sn remuneracón Se crearían tres varables dcotómcas: la prmera de ellas sería empleador. Quen lo sea tendrá valor en esa varable y valor cero en las varables cuenta propa y asalarado. Los por cuenta propa tendrán valor en la segunda varable y cero en las otras, etc. No se necesta crear, en cambo, una varable llamada trabajador sn remuneracón : lo será quen tenga valores cero en las tres anterores. Esta últma es la categoría base de las varables smuladas. Una vez realzada esta transformacón, estas varables pueden ser ncorporadas en una ecuacón de regresón: sus valores sólo pueden varar entre cero y uno y sus coefcentes b ndcarán, en cada caso, cuanto aumentan o dsmnuyen los odds de probabldad del evento que se procura predecr cuando una de estas varables pasa de cero a uno (por ejemplo, cuando alguen es un empleador, seguramente la probabldad de que sea pobre dsmnurá, lo que se expresará en un coefcente b negatvo en la ecuacón logístca). 9. Funcón de verosmltud Se sabe que cualquer varable dependente de otra u otras varables, toma valores según los valores de las varables de las que depende. Por otra parte, esa varable dependente rá tomando valores sguendo o descrbendo una determnada dstrbucón de frecuencas; es decr, tomen los valores que tomen las varables ndependentes, s el expermento se repte múltples veces, la varable dependente tomará para esos valores de las ndependentes un determnado valor, y la probabldad de ocurrenca de dcho valor vendrá dado por una dstrbucón de frecuencas concreta: una dstrbucón normal, una dstrbucón bnomal, una dstrbucón hpergeométrca, etc. En el caso de una varable dependente dcotómca (como el caso que nos ocupa), la dstrbucón de frecuencas que segurá será la bnomal, que depende de la tasa de éxtos ( X sujetos de un total de N, que sería el elemento varable), para un determnado tamaño muestral N y probabldad Pr () de ocurrenca del evento valorado por la varable dependente (parámetros constantes). La funcón de densdad de esta dstrbucón de frecuencas vendrá dada por la sguente expresón: N Pr x x ( y) f ( x) = p ( p) N x [8] 0

11 S en la expresón anteror ntroducmos los datos concretos de nuestra muestra de N sujetos (es decr, se converte el elemento varable X en parámetro), y se hace depender el resultado de la funcón de densdad del parámetro "probabldad de ocurrenca" ( p, que de esta forma se converte en varable), se está generando su funcón de verosmltud, f ( p x ) (funcón dependente de p dado el valor muestral de x ) o L( p ) (L de lkelhood), que ofrece como resultados las probabldades de la funcón de densdad ajustada a los datos: N f p x p p x x ( ) = ( ) N x Se deduce que, para una muestra concreta, esa probabldad será dferente según qué valores tome el parámetro "probabldad de ocurrenca": [9] Fgura 5. Se demuestra que la mejor estmacón del parámetro ê es aquel valor que maxmza esta funcón de verosmltud, ya que son estmadores consstentes (conforme crece el tamaño muestral, la estmacón se aproxma al parámetro desconocdo), sufcentes (aprovechan la nformacón de toda la muestra), asntótcamente normales y asntótcamente efcentes (con mínma varanza), s ben no sempre son nsesgados (no sempre la meda de las estmacones para dferentes muestras tenderá haca el parámetro desconocdo). 9.. Método de Newton-Raphson Se trata de un método teratvo, empleado en dversos problemas matemátcos, como en la determnacón de las raíces de ecuacones, y en el presente caso, en la estmacón de los coefcentes de regresón β por el procedmento de máxma verosmltud. Por facldad de cálculo toda la formulacón se expresará en forma de matrces. Las partculardades del cálculo matrcal escapan del ámbto de este documento. Téngase presente la base de datos (una tabla con flas y columnas). Se dspondrá de: Una varable Y, que es la varable dependente. Expresada como matrz será una matrz de N flas y una columna, cuyo contendo será de ceros y unos (ya que se trata de una varable dcotómca). y y Y = [0] y n y n Un conjunto de M covarables, que pueden expresarse como una matrz de N flas y M columnas. Sn embargo, dado que el modelo contene una constante, ésta se puede expresar como una columna

12 adconal en la que todos sus elementos son. Por tanto la matrz X queda como una matrz con N M + columnas, de la forma: flas y ( ) x, x, m+ x, x, m X + = [] xn, x n, m+ Y por últmo un conjunto de coefcentes de regresón β, uno para cada covarable, ncluda la covarable creada para la constante, con una fla y ( M + ) columnas (,,, m ) β = β β β + [] El proceso se nca construyendo la funcón de verosmltud (lkelhood functon) de la ecuacón de regresón logístca: y N y L = p p [3] ( β ) ( ) ( ) o mejor, su transformacón logarítmca (log lkelhood): donde ( β ) = ln ( ) + ( ) ln ( ) [4] LL y p N y p p es la probabldad de ocurrenca de y = con los valores muestrales de las covarables {,,, m } X x x x +,,, N LL β se llama devanza y mde en qué grado el modelo se ajusta a los datos: cuanto menor sea su valor, mejor es el ajuste. =, para el sujeto = { }. El valor ( ) Se trata de conocer aquellos valores de β que hacen máxma la funcón de verosmltud (o su logartmo). Se sabe que s se guala a cero la dervada parcal de una funcón respecto a un parámetro, el resultado es unos valores de dcho parámetro que hacen llevar a la funcón a un valor máxmo o un valor mínmo (un punto de nflexón de la curva). Para confrmar que se trata de un máxmo y no de un mínmo, la segunda dervada de la funcón respecto a dcho parámetro debe ser menor de cero. La prmera dervada de LL( β ) respecto de β (llamada funcón score) en su forma matrcal es: ( β ) LL U( β ) = = X Y p β ( ) donde: p es una matrz de N flas y una columna que contene las probabldades de cada ndvduo de que tengan su correspondente evento La segunda dervada, llamada matrz nformatva o hessana, es: ( ) LL( β ) H β = = XWX [6] β β donde: W y es una matrz dagonal de n flas y n columnas, en la que los elementos de su dagonal venen dados por los respectvos productos p ( p ), de manera que W queda de la forma sguente: [5] Matrz cuadrada en la que todos sus elementos son 0 excepto su dagonal

13 y para cada fla su W p es: p p ( p ) 0 0 ( p ) 0 p 0 = 0 0 p = + exp m+ j = β j x j n ( pn) Una vez se dspone todos los elementos necesaros, se procede a explcar como tal el método teratvo para la determnacón de los coefcentes de regresón. Se le asgna un valor ncal empírco a los coefcentes de regresón, en general cero a todos ellos En cada teracón t la matrz de nuevos coefcentes de regresón expermentales resulta de sumar matrcalmente un gradente a la matrz de coefcentes expermentales del paso anteror. Este gradente es el resultado del cocente entre la prmera dervada y la segunda dervada de la funcón de verosmltud de la ecuacón de regresón. ˆ = ˆ + XW X X Y p [9] ( t- ) ( ) β β t t t El segundo paso se repte tantas veces como sea necesaro hasta que la dferenca entre la matrz de coefcentes de regresón en dcha teracón y la matrz de la teracón preva, sea 0 o práctcamente 0 (por ejemplo <0 6 ). Los paquetes estadístcos suelen tener un límte de teracones que pueden modfcarse s no se obtene convergenca ncalmente. SPSS tene además otras condcones de parada: LL( β ) muy cercana a cero; Dferenca entre LL( β ) de dos teracones consecutvas muy cercana a cero. Una vez fnalzadas las teracones, la nversa de la matrz nformatva de la últma teracón ofrece los valores de varanzas y covaranzas de las estmacones de los coefcentes de regresón estmados. En concreto, el error estándar de cada coefcente de regresón concde con la raíz cuadrada del elemento respectvo de la dagonal prncpal (es decr el elemento (,) sería el cuadrado del error estándar del coefcente β, el elemento (,) el cuadrado del error estándar del coefcente β, y así sucesvamente). Por debajo de esta dagonal quedan las covaranzas de cada pareja de covarables (es decr, el elemento (,) es la covaranza de β y β, el elemento (3,) es la covaranza de β y β 3, etc.). Hay programas estadístcos que ofrecen esta matrz de varanzas y covaranzas; SPSS no lo hace, sno que ofrece la matrz de correlacones. En ese caso se podrá calcular la matrz de varanzas y covaranzas sabendo que la covaranza de dos varables es gual al producto del coefcente de correlacón de ambas ( r ) y los dos respectvos errores estándar: cov, = r, ee ee [0] ( β β) ( β β) ( β) ( β ) Entender esta formulacón y el algortmo de las teracones puede ser de gran utldad, pues con conocmentos báscos de programacón faclta el desarrollo de rutnas propas, por ejemplo en VsualBasc dentro de una base de datos de Access, que pueden lberar de la dependenca de costosos paquetes estadístcos. Odds rato: Es un cocente de proporcones de enfermos por cada sano entre el grupo con un factor de resgo y el grupo sn dcho factor de resgo. Supóngase el sguente ejemplo: [8] [7] 3

14 s factor de resgo no s enfermedad no En este caso, entre los que tenen el factor de resgo hay 0 enfermos por cada 80 sanos (0,5), y entre los que no tenen el factor de resgo hay 30 enfermos por cada 70 sanos (0,), por lo que las personas con el factor de resgo tenen un resgo de enfermar,5 veces superor (0,5/0,) que las personas sn el factor de resgo. Prncpo jerárquco: sempre que se ncluya en el modelo un térmno de nteraccón, el modelo debe nclur tambén todos los térmnos de orden nferor, y s el térmno de nteraccón resultase sgnfcatvo y permanecese en el modelo, tambén deberían permanecer los térmnos de orden nferor, aunque no se lograra demostrar sgnfcacón para ellos. Modelo con nteraccón de prmer orden: y = a + bx + b x + b3 xx Modelo con nteraccón de segundo orden: y = a + bx + b x + b3 x3 + b4 xx + b5 xx3 + b6 x x3 + b7 xx x3 Prncpo de parsmona: En gualdad de condcones la solucón más senclla que explque completamente un problema es probablemente la correcta (Gullermo de Ockham). Según este prncpo, cuando más de un modelo se ajuste a las observacones, se retendrá el modelo más smple que explque dchas observacones con un grado adecuado de precsón. 0. Tpos de modelos de regresón logístca Modelo logístco unvarante smple y ( a + bx) ( a bx) exp = + exp + Modelo logístco unvarante múltple exp( β,0 + β x + β, x + + β, k xk) y = + exp β + β x + β x + + β x Modelo logístco multvarante smple (,0,, k k) y ( a + bx) ( a bx) exp = + exp + Modelo logístco multvarante múltple exp( β,0 + β x + β, x + + β, k xk) y = + exp β + β x + β x + + β x. Interpretacón del modelo logístco (,0,, k k) β. A veces, se Los parámetros del modelo son: β 0, la ordenada en el orgen, y = { β, β,, βk} utlzan tambén como parámetros exp( β 0 ) y exp( β ), que se denomnan odds ratos o razón de probabldades. Estos valores ndcan cuánto se modfcan las probabldades por undad de cambo en las varables x. De [3a] se deduce que: 4

15 O p = = p exp k ( β0 ) exp( β j) Supóngase que dos elementos tenen valores guales en todas las varables menos en una. Sean ( x,, x,,, x, h,, x, k) ( x j,, x j,,, x jh,,, x jk, ) j = los valores de las varables para el prmer elemento y para el segundo, y todas las varables son las msmas en ambos elementos menos en la varable h donde x, = x, +. Entonces, el odds rato para estas dos observacones es: h jh O O j = exp( β h ) e ndca cuánto se modfca el rato de probabldades cuando la varable S se consdera p = 0,5 en el modelo logt, entonces p log = β0 + βx, + + βk xk, p = 0 es decr, x, = β β x β β k 0 j, j j = x j x j aumenta en una undad. donde x, representa el valor de x que hace gualmente probable que un elemento cuyas restantes x, x pertenezca a la prmera o la segunda poblacón. varables son (, k, ). Meddas de confabldad del modelo.. Devanza Es smlar a la suma de cuadrados del error de la regresón lneal y se defne como: n pˆ pˆ D = ylog + ( y) log = y y S D es mayor que una modelo logístco es confable. χ con n p grados de lbertad para un nvel de sgnfcacón dado entonces el.. Crtero AIC de Akake Se defne como ( ) AIC = D + p + donde p es el número de varables predctoras..3. Prueba de bondad de ajuste de Hosmer-Lemeshov Se defne como c = g ( O n p) = n p ( p) 5

16 donde g es el número de grupos; n es el numero de observacones en el ésmo grupo; O es la suma de las Y en el ésmo grupo; y p es el promedo de las p en el ésmo grupo. 3. Estadístcos nfluencales para regresón logístca Exsten varos tpos de resduales que permten cotejar s una observacón es nfluencal o no. 3.. Resduales de Pearson Defndos como: donde r = y m pˆ m pˆ ( pˆ ) y representa el número de veces que y = entre las m repetcones de X s los valores de la varable de respuesta están agrupadas, El resdual de Pearson es smlar al resdual estudentzado usado en regresón lneal. Así, un resdual de Pearson mayor que ndca un dato anormal. S el modelo es correcto, los resduales de Pearson serán varables de meda cero y varanza undad que pueden servr para hacer el dagnóstco de dcho modelo. El estadístco χ k 0 e = = permte realzar un χ con ( ) contraste global de la bondad del ajuste. Se dstrbuye asntótcamente como una n k grados de lbertad, donde k + es el número de parámetros en el modelo. En lugar de los resduos de Pearson se pueden utlzar, tambén, las desvacones o pseudoresduos defndos por: ( ˆ ( ) ( ˆ )) d = y log p + y log p 3.. Resduales de devanza Defndos como: ( pˆ ) m p m D = sgn( y m p) ylog + ( m y) log y m y S la devanza es mayor que 4 entonces la observacón correspondente es anormal Uso de la regresón logístca en clasfcacón Para efectos de clasfcacón la manera más fácl de dscrmnar es consderar que s 0,5 p > entonces la observacón pertenece a la clase que nteresa. Pero algunas veces esto puede resultar njusto sobre todo s se conoce s una de las clases es menos frecuente que la otra. Métodos alternatvos son: (a) Representar gráfcamente el porcentaje de observacones que poseen el evento (o sean que pertenecen al grupo () y que han sdo correctamente clasfcadas (sensbldad) frente a dstntos nveles de probabldad y el porcentaje de observacones de la otra clase que han sdo correctamente clasfcadas (especfcdad) frente a los msmos nveles de probabldad anterormente usados, en la msma gráfca. La probabldad que se usará para clasfcar las observacones se obtenen cortando las dos curvas. 6

17 (b) Usar la curva ROC (recever operatng characterstc). En este caso se representa gráfcamente la sensbldad frente a (-especfdad)00 %, y se escoge como el p deal aquel que está más cerca a la esquna superor zquerda, o sea al punto (00, 0). 4. Dagnóstco en regresón logístca Verfcar que el modelo es adecuado, (bondad de ajuste): Con datos agrupados: devanca resdual; Con datos ndvduales hace falta una referenca, que puede obtenerse a partr del modelo saturado, sempre que se trabaje con pocas varables y éste sea estmable; Otros estadístcos: ( O E) sobre cada observacón; E ( O E) Hosmer y Lemeshow: sobre 0 categorías de p. E 5. Modelos predctvos El objetvo del modelo puede ser: Generar una ecuacón con capacdad predctva, como una clasfcacón (análss dscrmnante); Buscar qué factores tenen capacdad predctva S la respuesta es la aparcón de un evento, pueden llamarse modelos pronóstcos. En este tpo de estudos es típco contar con un gran número de varables a explorar. 6. Métodos de seleccón automátca 6.. Haca adelante. Se nca con un modelo vacío (sólo α );. Se ajusta un modelo y se calcula el p valor de nclur cada varable por separado; 3. Se seleccona el modelo con la más sgnfcatva; 4. Se ajusta un modelo con la(s) varable(s) selecconada(s) y se calcula el p valor de añadr cada varable no selecconada por separado; 5. Se seleccona el modelo con la más sgnfcatva; 6. Se repte 4-5 hasta que no queden varables sgnfcatvas para nclur. 6.. Haca atrás. Se nca con un modelo con TODAS las varables canddatas;. Se elmnan, una a una, cada varable y se calcula la pérdda de ajuste al elmnar; 3. Se seleccona para elmnar la menos sgnfcatva; 4. Se repte 3 hasta que todas las varables ncludas sean sgnfcatvas y no pueda elmnarse nnguna sn que se perda ajuste Stepwse Se combnan los métodos adelante y atrás; Puede empezarse por el modelo vacío o por el completo, pero en cada paso se exploran las varables ncludas, por s deben salr y las no selecconadas, por s deben entrar; No todos los métodos llegan a la msma solucón necesaramente; 7

18 6.4. Consderacones Crtero exclusvamente estadístco: no se tenen en cuenta otros conocmentos sobre las varables más nteresantes a nclur (aunque se puede forzar a que algunas varables sempre estén en el modelo); S hay un conjunto de varables muy correlaconadas, sólo una será selecconada; No es fácl tener en cuenta nteraccones entre varables (los modelos deben ser jerárqucos). 7. Valoracón de la capacdad predctva del modelo El modelo permte calcular una predccón del resultado en escala de probabldad; Puede decdrse clasfcar un ndvduo en el grupo de sucesos s su probabldad supera un valor π : Pr > π y e = clasfcacón = Pr π y e = 0 7..Clasfcacón realdad y 0 0 VP FP modelo y e 0 FN VN Sensbldad = VP/(VP+FN) Especfcdad = VN/(VN+FP) Area bajo la curva ROC construda para todos los posbles puntos de corte de π para clasfcar los ndvduos: Fgura Cálculo del área bajo la curva ROC Guardar los valores que predce el modelo (esperados) Calcular la U de Mann-Whtney respecto a los esperados: U AUC = n n 0 donde n y n0 son respectvamente el número esperado de y 0. 8

19 Fgura 9. AUC U 673 = = = 0,69 n n Un AUC = 0,5 corresponde a una capacdad predctva nula. El máxmo es Eleccón del punto de corte óptmo Debe optmzarse la sensbldad y la especfcdad, y elegr un punto según la naturaleza del modelo predctvo El cambo en el punto de corte corresponde a emplear dferentes constantes en el modelo logístco Con frecuenca la constante estmada,α, consgue una sensbldad y especfcdad máxma, pero puede no ser el caso. 8. Valdacón del modelo El cálculo de la capacdad predctva (CP) del modelo sobre la msma muestra que lo generó sempre es optmsta, y debe valdarse; Dferentes estrategas: Probar el modelo en otra muestra dferente; Elaborar el modelo con un 75 % de la muestra y calcular la CP en el 5 % restante; Usar la msma muestra, pero calcular los ndcadores de CP medante técncas de bootstrap o valdacón cruzada, que corrgen el optmsmo. 9. Regresón logístca condconal Estudos con datos apareados; Generalzacón (modelo) del test de McNemar; Las observacones no son ndependentes. S se gnora, la correlacón (postva) entre las observacones genera un sesgo haca la hpótess nula; Se perde poder estadístco. 0. Estudos de casos y controles apareados Para cada caso se elge uno o varos controles que son déntcos (o muy parecdos) al caso en varables que se quere controlar forzosamente: sexo, edad, resdenca, fecha de dagnóstco; Estas varables quedarán gualadas entre casos y controles: no se podrá estmar un efecto; Debe controlarse la correlacón que generan: modelo condconal; Cada caso se compara exclusvamente con sus controles; Las parejas (caso control) que sean guales en el factor de nterés no son nformatvas; Es un método menos efcente 9

20 I ( β, x) = sets exp( α + β x 0 ) ( α + β x 0) + ( α + β x) + + ( α + β xr ) exp exp exp La constante del modelo se anula (es gual para casos y para controles). Ajuste del modelo Software: Se puede usar un programa para analzar modelos de Cox de supervvenca, pues la funcón de verosmltud es la msma. Es un modelo lneal generalzado, por lo que pueden emplearse los msmos métodos para valorar efectos; Los coefcentes β son log ( OR) : OR = e β.. Regresón multnomal La varable dependente es categórca con más de dos grupos; Puede analzarse con regresón logístca poltómca (modelo multnomal); Se elge una categoría como referenca y se modelan varos logts smultáneamente, uno para cada una de las restantes categorías respecto a la de referenca. Ejemplo: hábto tabáquco La varable resultado tene tres categorías: Fumador; Exfumador; No fumador (referenca). Se modelan dos logts smultáneamente: logt fumador / no fumador z = α + β z ; ( ) logt ex fumador / no fumador z = α + β z ( ) Las covarables z son comunes pero se estman coefcentes dferentes para cada logt (ncluso dferente constante).. Regresón ordnal La varable respuesta tene más de dos categorías ordenadas; Se modela un únco logt que recoge la relacón (de tendenca) entre la respuesta y las covarables; Hay varos modelos posbles según nterese modelar la tendenca: odds proporconales (acumulado); categorías adyacentes (parejas).. Odds-proporconales Se compara un promedo de los posbles loga acumulados (respecto a la prmera categoría): logt 3 respuesta muy bajo bajo alto muy alto Cada logt tene una constante dferente pero comparten el coefcente de las covarables 0

CURSO INTERNACIONAL: CONSTRUCCIÓN DE ESCENARIOS ECONÓMICOS Y ECONOMETRÍA AVANZADA. Instructor: Horacio Catalán Alonso

CURSO INTERNACIONAL: CONSTRUCCIÓN DE ESCENARIOS ECONÓMICOS Y ECONOMETRÍA AVANZADA. Instructor: Horacio Catalán Alonso CURSO ITERACIOAL: COSTRUCCIÓ DE ESCEARIOS ECOÓMICOS ECOOMETRÍA AVAZADA Instructor: Horaco Catalán Alonso Modelo de Regresón Lneal Smple El modelo de regresón lneal representa un marco metodológco, que

Más detalles

Modelos lineales Regresión simple y múl3ple

Modelos lineales Regresión simple y múl3ple Modelos lneales Regresón smple y múl3ple Dept. of Marne Scence and Appled Bology Jose Jacobo Zubcoff Modelos de Regresón Smple Que tpo de relacón exste entre varables Predccón de valores a partr de una

Más detalles

Figura 1

Figura 1 5 Regresón Lneal Smple 5. Introduccón 90 En muchos problemas centífcos nteresa hallar la relacón entre una varable (Y), llamada varable de respuesta, ó varable de salda, ó varable dependente y un conjunto

Más detalles

CAPÍTULO 5 REGRESIÓN CON VARIABLES CUALITATIVAS

CAPÍTULO 5 REGRESIÓN CON VARIABLES CUALITATIVAS CAPÍTULO 5 REGRESIÓN CON VARIABLES CUALITATIVAS Edgar Acuña Fernández Departamento de Matemátcas Unversdad de Puerto Rco Recnto Unverstaro de Mayagüez Edgar Acuña Analss de Regreson Regresón con varables

Más detalles

Aspectos fundamentales en el análisis de asociación

Aspectos fundamentales en el análisis de asociación Carrera: Ingenería de Almentos Perodo: BR01 Docente: Lc. María V. León Asgnatura: Estadístca II Seccón A Análss de Regresón y Correlacón Lneal Smple Poblacones bvarantes Una poblacón b-varante contene

Más detalles

CAPÍTULO 4 MARCO TEÓRICO

CAPÍTULO 4 MARCO TEÓRICO CAPÍTULO 4 MARCO TEÓRICO Cabe menconar que durante el proceso de medcón, la precsón y la exacttud de cualquer magntud físca está lmtada. Esta lmtacón se debe a que las medcones físcas sempre contenen errores.

Más detalles

Problema: Existe relación entre el estado nutricional y el rendimiento académico de estudiantes de enseñanza básica?

Problema: Existe relación entre el estado nutricional y el rendimiento académico de estudiantes de enseñanza básica? Relacones entre varables cualtatvas Problema: xste relacón entre el estado nutrconal y el rendmento académco de estudantes de enseñanza básca? stado Nutrconal Malo Regular Bueno TOTAL Bajo 13 95 3 55 Rendmento

Más detalles

EJERCICIO 1 1. VERDADERO 2. VERDADERO (Esta afirmación no es cierta en el caso del modelo general). 3. En el modelo lineal general

EJERCICIO 1 1. VERDADERO 2. VERDADERO (Esta afirmación no es cierta en el caso del modelo general). 3. En el modelo lineal general PRÁCTICA 6: MODELO DE REGRESIÓN MÚLTIPLE SOLUCIÓN EJERCICIO. VERDADERO. VERDADERO (Esta afrmacón no es certa en el caso del modelo general. 3. En el modelo lneal general Y =X β + ε, explcar la forma que

Más detalles

Examen Final de Econometría Grado

Examen Final de Econometría Grado Examen Fnal de Econometría Grado 17 de Mayo de 2016 15.30 horas Apelldos: Grado (ADE/ ECO): Nombre del profesor(a): Nombre: Grupo: Emal: Antes de empezar a resolver el examen, rellene TODA la nformacón

Más detalles

Tema 7: Regresión Logística p. 1/1

Tema 7: Regresión Logística p. 1/1 Tema 7: Regresón Logístca Pedro Larrañaga, Iñak Inza, Abdelmalk Moujahd Departamento de Cencas de la Computacón e Intelgenca Artfcal Unversdad del País Vasco http://www.sc.ehu.es/sg/ Tema 7: Regresón Logístca

Más detalles

Tema 6. Estadística descriptiva bivariable con variables numéricas

Tema 6. Estadística descriptiva bivariable con variables numéricas Clase 6 Tema 6. Estadístca descrptva bvarable con varables numércas Estadístca bvarable: tpos de relacón Relacón entre varables cuanttatvas Para dentfcar las característcas de una relacón entre dos varables

Más detalles

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 17 de Mayo de :00 horas

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 17 de Mayo de :00 horas EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 7 de Mayo de 08 9:00 horas Prmer Apelldo: Nombre: DNI: Teléfono: Segundo Apelldo: Grupo y Grado: Profesor(a): e-mal: Pregunta A B C En Blanco

Más detalles

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 19 de Septiembre de :30 horas. Pregunta 19 A B C En Blanco

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 19 de Septiembre de :30 horas. Pregunta 19 A B C En Blanco EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 19 de Septembre de 01 15:30 horas Prmer Apelldo: Nombre: DNI: Teléfono: Segundo Apelldo: Grupo y Grado: Profesor(a): e mal: Pregunta 1 A B C

Más detalles

Ejemplo: Consumo - Ingreso. Ingreso. Consumo. Población 60 familias

Ejemplo: Consumo - Ingreso. Ingreso. Consumo. Población 60 familias Ejemplo: Consumo - Ingreso Ingreso Consumo Poblacón 60 famlas ( YX ) P = x [ YX ] E = x Línea de regresón poblaconal 80 60 Meda Condconal 40 20 00 [ X = 200] EY o o o o [ X = 200] EY 80 o o o 60 o 40 8

Más detalles

TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE

TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE LECTURA OBLIGATORIA Regresón Lneal Múltple. En Ral, A. y Varela, J. (008). Estadístca Práctca para la Investgacón en Cencas de la Salud. Coruña: Netbblo.

Más detalles

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 6 de Junio de :00 horas. Pregunta 19 A B C En Blanco. Pregunta 18 A B C En Blanco

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 6 de Junio de :00 horas. Pregunta 19 A B C En Blanco. Pregunta 18 A B C En Blanco EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 6 de Juno de 3 9: horas Prmer Apelldo: Nombre: DNI: Teléfono: Segundo Apelldo: Grupo y Grado: Profesor(a): e mal: Pregunta A B C En Blanco Pregunta

Más detalles

Problemas donde intervienen dos o más variables numéricas

Problemas donde intervienen dos o más variables numéricas Análss de Regresón y Correlacón Lneal Problemas donde ntervenen dos o más varables numércas Estudaremos el tpo de relacones que exsten entre ellas, y de que forma se asocan Ejemplos: La presón de una masa

Más detalles

TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE

TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE LECTURA OBLIGATORIA Regresón Lneal Múltple. En Ral, A. y Varela, J. (008). Estadístca Práctca para la Investgacón en Cencas de la Salud. Coruña: Netbblo.

Más detalles

OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls

OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls Redes de Neuronas: Preparacón de datos para el aprendzaje y meddas de evaluacón 1. Preparacón de datos Característcas de los datos

Más detalles

Licenciatura en Administración y Dirección de Empresas INTRODUCCIÓN A LA ESTADÍSTICA EMPRESARIAL

Licenciatura en Administración y Dirección de Empresas INTRODUCCIÓN A LA ESTADÍSTICA EMPRESARIAL INTRODUCCIÓN A LA ESTADÍSTICA EMPRESARIAL Relacón de Ejerccos nº 2 ( tema 5) Curso 2002/2003 1) Las cento trenta agencas de una entdad bancara presentaban, en el ejercco 2002, los sguentes datos correspondentes

Más detalles

1.Variables ficticias en el modelo de regresión: ejemplos.

1.Variables ficticias en el modelo de regresión: ejemplos. J.M.Arranz y M.M. Zamora.Varables fctcas en el modelo de regresón: ejemplos. Las varables fctcas recogen los efectos dferencales que se producen en el comportamento de los agentes económcos debdo a dferentes

Más detalles

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 20 DE JUNIO DE horas

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 20 DE JUNIO DE horas EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 0 DE JUNIO DE 018 15.30 horas Prmer Apelldo: Nombre: DNI: Teléfono: Segundo Apelldo: Grupo y Grado: Profesor(a): e-mal: Pregunta 1 A B C En Blanco

Más detalles

Estadística con R. Modelo Probabilístico Lineal

Estadística con R. Modelo Probabilístico Lineal Estadístca con R Modelo Probablístco Lneal Modelo Probablístco Lneal Forma de la funcón: Y b 0 +b 1 X +e Varable dependente, endógena o a explcar dcotómca : Y, S Y 0 e -b 0 - b 1 X con probabldad p. S

Más detalles

FE DE ERRATAS Y AÑADIDOS AL LIBRO FUNDAMENTOS DE LAS TÉCNICAS MULTIVARIANTES (Ximénez & San Martín, 2004)

FE DE ERRATAS Y AÑADIDOS AL LIBRO FUNDAMENTOS DE LAS TÉCNICAS MULTIVARIANTES (Ximénez & San Martín, 2004) FE DE ERRATAS Y AÑADIDOS AL LIBRO FUNDAMENTOS DE LAS TÉCNICAS MULTIVARIANTES (Xménez & San Martín, 004) Capítulo. Nocones báscas de álgebra de matrces Fe de erratas.. Cálculo de la transpuesta de una matrz

Más detalles

Inferencia en Regresión Lineal Simple

Inferencia en Regresión Lineal Simple Inferenca en Regresón Lneal Smple Modelo de regresón lneal smple: Se tenen n observacones de una varable explcatva x y de una varable respuesta y, ( x, y)(, x, y),...,( x n, y n ) el modelo estadístco

Más detalles

Estadísticos muéstrales

Estadísticos muéstrales Estadístcos muéstrales Hemos estudado dferentes meddas numércas correspondentes a conjuntos de datos, entre otras, estudamos la meda, la desvacón estándar etc. Ahora vamos a dstngur entre meddas numércas

Más detalles

Instituto Tecnológico Superior del Sur del Estado de Yucatán EGRESIÓN LINEAL REGRESI. 10 kg. 10 cm

Instituto Tecnológico Superior del Sur del Estado de Yucatán EGRESIÓN LINEAL REGRESI. 10 kg. 10 cm Insttuto Tecnológco Superor del Sur del Estado de Yucatán REGRESI EGRESIÓN LINEAL 100 90 80 70 60 10 kg. 50 40 10 cm. 30 140 150 160 170 180 190 200 Objetvo de la undad Insttuto Tecnológco Superor del

Más detalles

Medidas de Variabilidad

Medidas de Variabilidad Meddas de Varabldad Una medda de varabldad es un ndcador del grado de dspersón de un conjunto de observacones de una varable, en torno a la meda o centro físco de la msma. S la dspersón es poca, entonces

Más detalles

PRÁCTICA 16: MODELO DE REGRESIÓN MÚLTIPLE SOLUCIÓN

PRÁCTICA 16: MODELO DE REGRESIÓN MÚLTIPLE SOLUCIÓN PRÁCTICA 6: MODELO DE REGRESIÓN MÚLTIPLE SOLUCIÓN EJERCICIO. VERDADERO. VERDADERO (Esta afrmacón no es certa en el caso del modelo general). 3. En el modelo lneal general Y = X b + e, explcar la forma

Más detalles

truncación inferior en el punto a=25 es igual a El grado de truncación es del

truncación inferior en el punto a=25 es igual a El grado de truncación es del ECONOMETTRÍ ÍA III II.. Cuurrssoo 22000022- -0033 (f( f cchheer roo: : ccuueesst t oonneess lleecccc l 33) ) CUESTTI IONES SOBRE LLA LLECCI IÓN 33: : MODELLOS DE VARIABLLE DEPENDIENTTE LLI IMITTADA 1.

Más detalles

PUBLICACIONES DE 4º CURSO

PUBLICACIONES DE 4º CURSO PUBLICACIONES DE 4º CURSO Grado: DERECHO-ADE Asgnatura: ECONOMERÍA Grupos: Únco ema: ESQUEMA EMA Profesores: Inmaculada Vllanúa Departamento de ANÁLISIS ECONÓMICO Curso Académco 04/5 ema : El Modelo Lneal

Más detalles

DISTRIBUCIONES BIDIMENSIONALES

DISTRIBUCIONES BIDIMENSIONALES Matemátcas 1º CT 1 DISTRIBUCIONES BIDIMENSIONALES PROBLEMAS RESUELTOS 1. a) Asoca las rectas de regresón: y = +16, y = 1 e y = 0,5 + 5 a las nubes de puntos sguentes: b) Asgna los coefcentes de correlacón

Más detalles

Probabilidad Grupo 23 Semestre Segundo examen parcial

Probabilidad Grupo 23 Semestre Segundo examen parcial Probabldad Grupo 3 Semestre 015- Segundo examen parcal La tabla sguente presenta 0 postulados, algunos de los cuales son verdaderos y otros son falsos. Analza detendamente cada postulado y elge tu respuesta

Más detalles

H 0 : La distribución poblacional es uniforme H 1 : La distribución poblacional no es uniforme

H 0 : La distribución poblacional es uniforme H 1 : La distribución poblacional no es uniforme Una hpótess estadístca es una afrmacón con respecto a una característca que se desconoce de una poblacón de nterés. En la seccón anteror tratamos los casos dscretos, es decr, en forma exclusva el valor

Más detalles

Regresión múltiple k k

Regresión múltiple k k Métodos de Regresón Estadístca Ismael Sánchez Borrego Regresón múltple El modelo de regresón múltple es la extensón a k varables explcatvas del modelo de regresón smple estudado en el apartado anteror.

Más detalles

CAPÍTULO 1: VARIABLES ALEATORIAS Y SUS DISTRIBUCIONES

CAPÍTULO 1: VARIABLES ALEATORIAS Y SUS DISTRIBUCIONES CAÍTULO : VARIABLES ALEATORIAS SUS DISTRIBUCIONES En este capítulo el alumno debe abordar el conocmento de un mportante concepto el de VARIABLE ALEATORIA tpos de varables aleatoras cómo se dstrbue la funcón

Más detalles

Regresión de Datos de Vida

Regresión de Datos de Vida Regresón de Datos de Vda Resumen El procedmento Regresón de Datos de Vda está dseñado para ajustar un modelo estadístco paramétrco relaconado con tempos de falla a una o más varables predctoras. Los predctores

Más detalles

17/02/2015. Ángel Serrano Sánchez de León

17/02/2015. Ángel Serrano Sánchez de León Ángel Serrano Sánchez de León 1 Índce Introduccón Varables estadístcas Dstrbucones esde frecuencas c Introduccón a la representacón gráfca de datos Meddas de tendenca central: meda (artmétca, geométrca,

Más detalles

SEMANA 13. CLASE 14. MARTES 20/09/16

SEMANA 13. CLASE 14. MARTES 20/09/16 SEMAA 3. CLASE. MARTES 20/09/6. Defncones de nterés.. Estadístca descrptva. Es la parte de la Estadístca que se encarga de reunr nformacón cuanttatva concernente a ndvduos, grupos, seres de hechos, etc..2.

Más detalles

Capítulo 2: ANALISIS EXPLORATORIO de DATOS Estadística Computacional 1º Semestre 2003

Capítulo 2: ANALISIS EXPLORATORIO de DATOS Estadística Computacional 1º Semestre 2003 Unversdad Técnca Federco Santa María Departamento de Informátca ILI-80 Capítulo : ANALISIS EXPLORATORIO de DATOS Estadístca Computaconal º Semestre 003 Profesor :Héctor Allende Págna : www.nf.utfsm.cl/~hallende

Más detalles

1 + e z. 1 + e. 1 + e = 1 0 2

1 + e z. 1 + e. 1 + e = 1 0 2 Tema 7. Regresón Logístca Pedro Larrañaga, Iñak Inza, Abdelmalk Moujahd Departamento de Cencas de la Computacón e Intelgenca Artfcal Unversdad del País Vasco Euskal Herrko Unbertstatea 7. Introduccón En

Más detalles

1 EY ( ) o de E( Y u ) que hace que g E ( Y ) sea lineal. Por ejemplo,

1 EY ( ) o de E( Y u ) que hace que g E ( Y ) sea lineal. Por ejemplo, Modelos lneales generalzados En los modelos no lneales (tanto en su formulacón con coefcentes fjos o coefcentes aleatoros) que hemos vsto hasta ahora, exsten algunos que se denomnan lnealzables : son modelos

Más detalles

Muestra: son datos de corte transversal correspondientes a 120 familias españolas.

Muestra: son datos de corte transversal correspondientes a 120 familias españolas. Capítulo II: El Modelo Lneal Clásco - Estmacón Aplcacones Informátcas 3. APLICACIONES INFORMÁTICAS Fchero : cp.wf (modelo de regresón smple) Seres: : consumo famlar mensual en mles de pesetas RENTA: renta

Más detalles

Un ejemplo de Análisis Factorial de Correspondencias

Un ejemplo de Análisis Factorial de Correspondencias Estadístca Anàls de Dades (curs 001-00) Un ejemplo de Análss Factoral de Correspondencas Se trata de estudar la estructura de las ventas de una empresa que dstrbuye 10 productos en 8 mercados. Para ello

Más detalles

TODO ECONOMETRIA. Variables cualitativas

TODO ECONOMETRIA. Variables cualitativas TODO ECONOMETRIA Varables cualtatvas Índce Defncón de las varables dummy (o varables fctcas) Regresón con varables explcatvas dummy Varables dummy S queremos estudar s los hombres ganan más que las mujeres,

Más detalles

Tema 8 - Estadística - Matemáticas CCSSI 1º Bachillerato 1

Tema 8 - Estadística - Matemáticas CCSSI 1º Bachillerato 1 Tema 8 - Estadístca - Matemátcas CCSSI 1º Bachllerato 1 TEMA 8 - ESTADÍSTICA 8.1 NOCIONES GENERALES DE ESTADÍSTICA 8.1.1 INTRODUCCIÓN Objetvo: La estadístca tene por objeto el desarrollo de técncas para

Más detalles

PyE_ EF2_TIPO1_

PyE_ EF2_TIPO1_ UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉICO FACULTAD DE INGENIERÍA DIVISIÓN DE CIENCIAS BÁSICAS COORDINACIÓN DE CIENCIAS APLICADAS DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA SEGUNDO EAMEN FINAL RESOLUCIÓN SEMESTRE

Más detalles

Análisis de la varianza de un factor

Análisis de la varianza de un factor Análss de la varanza de un factor El test t de muestras se aplca cuando se queren comparar las medas de dos poblacones con dstrbucones normales con varanzas guales y se observan muestras ndependentes para

Más detalles

EJERCICIOS: Tema 3. Los ejercicios señalados con.r se consideran de conocimientos previos necesarios para la comprensión del tema 3.

EJERCICIOS: Tema 3. Los ejercicios señalados con.r se consideran de conocimientos previos necesarios para la comprensión del tema 3. EJERCICIOS: Tema 3 Los ejerccos señalados con.r se consderan de conocmentos prevos necesaros para la comprensón del tema 3. Ejercco 1.R Dos bblotecas con el msmo fondo bblográfco especalzado ofrecen las

Más detalles

EXPERIMENTACIÓN COMERCIAL(I)

EXPERIMENTACIÓN COMERCIAL(I) EXPERIMENTACIÓN COMERCIAL(I) En un expermento comercal el nvestgador modfca algún factor (denomnado varable explcatva o ndependente) para observar el efecto de esta modfcacón sobre otro factor (denomnado

Más detalles

Introducción a la Física. Medidas y Errores

Introducción a la Física. Medidas y Errores Departamento de Físca Unversdad de Jaén Introduccón a la Físca Meddas y Errores J.A.Moleón 1 1- Introduccón La Físca y otras cencas persguen la descrpcón cualtatva y cuanttatva de los fenómenos que ocurren

Más detalles

INTRODUCCIÓN. Técnicas estadísticas

INTRODUCCIÓN. Técnicas estadísticas Tema : Estadístca Descrptva Undmensonal ITRODUCCIÓ Fenómeno determnsta: al repetrlo en déntcas condcones se obtene el msmo resultado. (Ejemplo: lómetros recorrdos en un ntervalo de tempo a una velocdad

Más detalles

ANEXO A: Método de Interpolación de Cokriging Colocado

ANEXO A: Método de Interpolación de Cokriging Colocado ANEXO A: Método de Interpolacón de Corgng Colocado A. Conceptos Báscos de Geoestadístca Multvarada La estmacón conunta de varables aleatoras regonalzadas, más comúnmente conocda como Corgng (Krgng Conunto),

Más detalles

T. 9 El modelo de regresión lineal

T. 9 El modelo de regresión lineal 1 T. 9 El modelo de regresón lneal 1. Conceptos báscos sobre el análss de regresón lneal. Ajuste de la recta de regresón 3. Bondad de ajuste del modelo de regresón Modelos predctvos o de regresón: la representacón

Más detalles

Tema 1: Estadística Descriptiva Unidimensional

Tema 1: Estadística Descriptiva Unidimensional Fenómeno determnsta: al repetrlo en déntcas condcones se obtene el msmo resultado. Fenómeno aleatoro: no es posble predecr el resultado. La estadístca se ocupa de aquellos fenómenos no determnstas donde

Más detalles

Riesgos Proporcionales de Cox

Riesgos Proporcionales de Cox Resgos Proporconales de Cox Resumen El procedmento Resgos Proporconales de Cox esta dseñado para ajustar un modelo estadístco sem-parámetrco a los tempos de falla de una o mas varables predctoras. Los

Más detalles

Solución de los Ejercicios de Práctica # 1. Econometría 1 Prof. R. Bernal

Solución de los Ejercicios de Práctica # 1. Econometría 1 Prof. R. Bernal Solucón de los Ejerccos de ráctca # 1 Econometría 1 rof. R. Bernal 1. La tabla de frecuencas está dada por: Marca A Marca B

Más detalles

ESTADÍSTICA BIDIMENSIONAL ÍNDICE GENERAL

ESTADÍSTICA BIDIMENSIONAL ÍNDICE GENERAL ESTADÍSTICA BIDIMESIOAL ÍDICE GEERAL 1.-Varable Estadístca Bdmensonal. Tablas de frecuenca... 1.1.- Concepto de varable estadístca bdmensonal. Eemplos.... 1..-Tablas bdmensonales de frecuencas. Tablas

Más detalles

MUESTREO EN POBLACIONES FINITAS

MUESTREO EN POBLACIONES FINITAS MUESTREO EN POBLACIONES FINITAS Antono Morllas A.Morllas: Muestreo 1 MUESTREO EN POBLACIONES FINITAS 1. Conceptos estadístcos báscos. Etapas en el muestreo 3. Tpos de error 4. Métodos de muestreo 5. Tamaño

Más detalles

Regresión Binomial Negativa

Regresión Binomial Negativa Regresón Bnomal Negatva Resumen El procedmento Regresón Bnomal Negatva está dseñado para ajustar un modelo de regresón en el cual la varable dependente Y consste de conteos. El modelo de regresón ajustado

Más detalles

Población 1. Población 1. Población 2. Población 2. Población 1. Población 1. Población 2. Población 2. Frecuencia. Frecuencia

Población 1. Población 1. Población 2. Población 2. Población 1. Población 1. Población 2. Población 2. Frecuencia. Frecuencia MAT-3 Estadístca I Tema : Meddas de Dspersón Facltador: Félx Rondón, MS Insttuto Especalzado de Estudos Superores Loyola Introduccón Las meddas de tendenca central son ndcadores estadístcos que resumen

Más detalles

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio. Tema 9 - Estadístca - Matemátcas B 4º E.S.O. 1 TEMA 9 - ESTADÍSTICA 9.1 DOS RAMAS DE LA ESTADÍSTICA 9.1.1 - INTRODUCCIÓN Objetvo: La estadístca tene por objeto el desarrollo de técncas para el conocmento

Más detalles

Econometría de corte transversal. Pablo Lavado Centro de Investigación de la Universidad del Pacífico

Econometría de corte transversal. Pablo Lavado Centro de Investigación de la Universidad del Pacífico Econometría de corte transversal Pablo Lavado Centro de Investgacón de la Unversdad del Pacífco Contendo Defncones báscas El contendo mínmo del curso Bblografía recomendada Aprendendo econometría Defncones

Más detalles

Tema 1:Descripción de una variable. Tema 1:Descripción de una variable. 1.1 El método estadístico. 1.1 El método estadístico. Describir el problema

Tema 1:Descripción de una variable. Tema 1:Descripción de una variable. 1.1 El método estadístico. 1.1 El método estadístico. Describir el problema Tema :Descrpcón de una varable Tema :Descrpcón de una varable. El método estadístco. Descrpcón de conjuntos de datos Dstrbucones de frecuencas. Representacón gráfca Dagrama de barras Hstograma. Meddas

Más detalles

Medidas de centralización

Medidas de centralización 1 Meddas de centralzacón Meda Datos no agrupados = x X = n = 0 Datos agrupados = x X = n = 0 Medana Ordenamos la varable de menor a mayor. Calculamos la columna de la frecuenca relatva acumulada F. Buscamos

Más detalles

ESTADÍSTICA. Definiciones

ESTADÍSTICA. Definiciones ESTADÍSTICA Defncones - La Estadístca es la cenca que se ocupa de recoger, contar, organzar, representar y estudar datos referdos a una muestra para después generalzar y sacar conclusones acerca de una

Más detalles

A. Una pregunta muy particular que se puede hacer a una distribución de datos es de qué magnitud es es la heterogeneidad que se observa.

A. Una pregunta muy particular que se puede hacer a una distribución de datos es de qué magnitud es es la heterogeneidad que se observa. MEDIDA DE DIPERIÓ A. Una pregunta muy partcular que se puede hacer a una dstrbucón de datos es de qué magntud es es la heterogenedad que se observa. FICHA º 18 Las meddas de dspersón generalmente acompañan

Más detalles

) para toda permutación (p p 1 p

) para toda permutación (p p 1 p 09 Elena J. Martínez do cuat. 004 Análss de la varanza de dos factores El problema anteror consderaba la comparacón de muestras para detectar dferencas entre las respectvas poblacones. En el modelo de

Más detalles

TEMA 14. ESCALAMIENTO CONJUNTO. INTRODUCCIÓN A LA TEORÍA DE LA RESPUESTA A LOS ITEMS (TRI)

TEMA 14. ESCALAMIENTO CONJUNTO. INTRODUCCIÓN A LA TEORÍA DE LA RESPUESTA A LOS ITEMS (TRI) TEMA 14. ESCALAMIENTO CONJUNTO. INTRODUCCIÓN A LA TEORÍA DE LA RESPUESTA A LOS ITEMS (TRI) 14.1. La Curva Característca de los ítems (CCI) 14.. Los errores típcos de medda 14.3. La Funcón de Informacón

Más detalles

16/02/2015. Ángel Serrano Sánchez de León

16/02/2015. Ángel Serrano Sánchez de León Ángel Serrano Sánchez de León Índce Introduccón Varables estadístcas Dstrbucones de frecuencas Introduccón a la representacón gráfca de datos Meddas de tendenca central: meda (artmétca, geométrca, armónca,

Más detalles

Análisis de la varianza de un factor

Análisis de la varianza de un factor Análss de la varanza de un factor El test t de muestras se aplca cuando se queren comparar las medas de dos poblacones con dstrbucones normales con varanzas guales y se observan muestras ndependentes para

Más detalles

TEMA 7. ANÁLISIS DE SUPERVIVENCIA

TEMA 7. ANÁLISIS DE SUPERVIVENCIA TEMA 7. ANÁLISIS DE SUPERVIVENCIA CONTENIDOS 7. Funcón de supervvenca. 7.2 Estmacón no paramétrca de la funcón de supervvenca. 7.2. Tempos de supervvenca dscretos. Estmador de Kaplan-Meer. 7.2.2 Tempos

Más detalles

Tema 2.- Regresión lineal múltiple (I) Introducción 2.2. Especificación del modelo de regresión lineal múltiple. 2.3.

Tema 2.- Regresión lineal múltiple (I) Introducción 2.2. Especificación del modelo de regresión lineal múltiple. 2.3. Tema.- Regresón lneal múltple (I)... Introduccón.. Especfcacón del modelo de regresón lneal múltple..3. Estmacón de los parámetros del modelo por mínmos cuadrados..4. Interpretacón de la ecuacón de regresón..5.

Más detalles

TEMA 1.- CONCEPTOS BÁSICOS

TEMA 1.- CONCEPTOS BÁSICOS TEMA 1.- CONCEPTOS BÁSICOS 1.1.- Cuestones tpo test 1.- En las encuestas personales puede codfcarse, por ejemplo, con un cero las que son contestadas por una mujer y con un uno las que lo son por un varón.

Más detalles

Prueba de Evaluación Continua

Prueba de Evaluación Continua Estadístca Descrptva y Regresón y Correlacón Prueba de Evaluacón Contnua 1-III-18 1.- Dada la varable x y la nueva varable y=a+bx, ndcar (demostrándolo) la expresón exstente entre las respectvas medas

Más detalles

FISICOQUÍMICA FARMACÉUTICA (0108) UNIDAD 1. CONCEPTOS BÁSICOS DE CINÉTICA QUÍMICA

FISICOQUÍMICA FARMACÉUTICA (0108) UNIDAD 1. CONCEPTOS BÁSICOS DE CINÉTICA QUÍMICA FISICOQUÍMICA FARMACÉUTICA (008) UNIDAD. CONCEPTOS BÁSICOS DE CINÉTICA QUÍMICA Mtra. Josefna Vades Trejo 06 de agosto de 0 Revsón de térmnos Cnétca Químca Estuda la rapdez de reaccón, los factores que

Más detalles

Midiendo la Asociación lineal entre dos variables

Midiendo la Asociación lineal entre dos variables Unversdad de Sonora XVIII Semana Regonal de Investgacón y Docenca en Matemátcas Mdendo la Asocacón lneal entre dos varables Rosa Ma. Montesnos Csneros Adán Durazo Armenta Departamento de Matemátcas Hermosllo,

Más detalles

Tema 4: Variables aleatorias

Tema 4: Variables aleatorias Estadístca 46 Tema 4: Varables aleatoras El concepto de varable aleatora surge de la necesdad de hacer más manejables matemátcamente los resultados de los expermentos aleatoros, que en muchos casos son

Más detalles

El Impacto de las Remesas en el PIB y el Consumo en México, 2015

El Impacto de las Remesas en el PIB y el Consumo en México, 2015 El Impacto de las Remesas en el y el Consumo en Méxco, 2015 Ilana Zárate Gutérrez y Javer González Rosas Cudad de Méxco Juno 23 de 2016 1 O B J E T I V O Durante muchos años la mgracón ha sdo vsta como

Más detalles

Para dos variables x1 y x2, se tiene el espacio B 2 el que puede considerarse definido por: {0, 1}X{0, 1} = {(00), (01), (10), (11)}

Para dos variables x1 y x2, se tiene el espacio B 2 el que puede considerarse definido por: {0, 1}X{0, 1} = {(00), (01), (10), (11)} Capítulo 4 1 N-cubos 4.1. Representacón de una funcón booleana en el espaco B n. Los n-cubos representan a las funcones booleanas, en espacos n-dmensonales dscretos, como un subconjunto de los vértces

Más detalles

MODELOS DE ELECCIÓN BINARIA

MODELOS DE ELECCIÓN BINARIA MODELOS DE ELECCIÓN BINARIA Econometría I UNLP http://www.econometra1.depeco.econo.unlp.edu.ar/ Modelos de Eleccón Bnara: Introduccón Estamos nteresados en la probabldad de ocurrenca de certo evento Podemos

Más detalles

Reconocimiento de Locutor basado en Procesamiento de Voz. ProDiVoz Reconocimiento de Locutor 1

Reconocimiento de Locutor basado en Procesamiento de Voz. ProDiVoz Reconocimiento de Locutor 1 Reconocmento de Locutor basado en Procesamento de Voz ProDVoz Reconocmento de Locutor Introduccón Reconocmento de locutor: Proceso de extraccón automátca de nformacón relatva a la dentdad de la persona

Más detalles

Regresión Lineal Simple y Correlación

Regresión Lineal Simple y Correlación 4 Regresón Lneal Smple y Correlacón 4.1. Fundamentos teórcos 4.1.1. Regresón La regresón es la parte de la estadístca que trata de determnar la posble relacón entre una varable numérca, que suele llamarse

Más detalles

Ejercicios y Talleres. puedes enviarlos a

Ejercicios y Talleres. puedes enviarlos a Ejerccos y Talleres puedes envarlos a klasesdematematcasymas@gmal.com www.klasesdematematcasymas.com EJERCICIOS DE REGRESIONES Y ANALISIS DE COVARIANZA Analzar la nformacón recoplada por medo de los dferentes

Más detalles

IMPLEMENTACIÓN PRÁCTICA DE UN BANCO DE FILTROS UNIFORME. S Q Salida del filtro Q h(n) Filtro s(n) Señal L Tamaño de la ventana del filtro 0 # n # L-1

IMPLEMENTACIÓN PRÁCTICA DE UN BANCO DE FILTROS UNIFORME. S Q Salida del filtro Q h(n) Filtro s(n) Señal L Tamaño de la ventana del filtro 0 # n # L-1 IMPEMEACIÓ PRÁCICA DE U BACO DE FIROS UIFORME En este tpo de bancos, la forma de la respuesta espectral de cada uno de los fltros es la msma, y su frecuenca central se raparte de manera unforme en el espectro:

Más detalles

( ) MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO ( mas ) y Y. N n. S y. MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO ( mas )

( ) MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO ( mas ) y Y. N n. S y. MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO ( mas ) MUETREO ALEATORIO IMPLE I Este esquema de muestreo es el más usado cuando se tene un marco de muestreo que especfque la manera de dentfcar cada undad en la poblacón. Además no se tene conocmento a pror

Más detalles

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio. Tema 9 - Estadístca - Matemátcas B 4º E.S.O. 1 TEMA 9 - ESTADÍSTICA 9.1 DOS RAMAS DE LA ESTADÍSTICA 9.1.1 - INTRODUCCIÓN La estadístca tene por objeto el desarrollo de técncas para el conocmento numérco

Más detalles

OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls. Examen Final

OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls. Examen Final OPENCOURSEWARE REDES DE NEURONAS ARTIFICIALES Inés M. Galván José M. Valls Examen Fnal Pregunta ( punto) Responda brevemente a las sguentes preguntas: a) Cuál es el obetvo en el aprendzae del Perceptron

Más detalles

CAPÍTULO IV. MEDICIÓN. De acuerdo con Székely (2005), existe dentro del período información

CAPÍTULO IV. MEDICIÓN. De acuerdo con Székely (2005), existe dentro del período información IV. Base de Datos CAPÍTULO IV. MEDICIÓN De acuerdo con Székely (2005), exste dentro del período 950-2004 nformacón representatva a nvel naconal que en algún momento se ha utlzado para medr la pobreza.

Más detalles

Relaciones entre variables

Relaciones entre variables Relacones entre varables Las técncas de regresón permten hacer predccones sobre los valores de certa varable Y (dependente), a partr de los de otra (ndependente), entre las que se ntuye que exste una relacón.

Más detalles

Métodos específicos de generación de diversas distribuciones discretas

Métodos específicos de generación de diversas distribuciones discretas Tema 3 Métodos específcos de generacón de dversas dstrbucones dscretas 3.1. Dstrbucón de Bernoull Sea X B(p). La funcón de probabldad puntual de X es: P (X = 1) = p P (X = 0) = 1 p Utlzando el método de

Más detalles

Tema 1.- Variable aleatoria discreta (V2.1)

Tema 1.- Variable aleatoria discreta (V2.1) Tema.- Varable aleatora dscreta (V2.).- Concepto de varable aleatora A cada posble resultado de un expermento lo llamamos suceso elemental, y lo denotamos con ω, ω 2, Llamamos espaco muestral al conjunto

Más detalles

Erratas y modificaciones

Erratas y modificaciones Erratas y modfcacones Págna 39 Tabla fnal: Dce: Expermental T Debe decr: Expermental T Págna 40 Tabla comenzo: Dce: T 0 Debe decr: T Dce: 3 T Debe decr: 3 T Págna 05 Párrafo : Debe qutarse el acento de

Más detalles

COLEGIO INGLÉS MEDIDAS DE DISPERSIÓN

COLEGIO INGLÉS MEDIDAS DE DISPERSIÓN COLEGIO IGLÉS DEPARTAMETO IVEL: CUARTO MEDIO PSU. UIDAD: ESTADISTICA 3 PROFESOR: ATALIA MORALES A. ROLADO SAEZ M. MIGUEL GUTIÉRREZ S. JAVIER FRIGERIO B. MEDIDAS DE DISPERSIÓ Las meddas de dspersón dan

Más detalles

Height (altura) Extraction (extracción)

Height (altura) Extraction (extracción) Regresón Posson Resumen El procedmento Regresón Posson está dseñado para ajustar un modelo de regresón en el cual la varable dependente Y consste de conteos. El modelo de regresón ajustado relacona Y con

Más detalles

Guía para el Trabajo Práctico N 5. Métodos Estadísticos en Hidrología

Guía para el Trabajo Práctico N 5. Métodos Estadísticos en Hidrología Guía para el Trabajo Práctco 5 Métodos Estadístcos en Hdrología er. PASO) Realzar el ajuste de la funcón de dstrbucón normal a una muestra de datos totales anuales de una varable (caudal, precptacón, etc.)

Más detalles

Lección 4. Ejercicios complementarios.

Lección 4. Ejercicios complementarios. Introduccón a la Estadístca Grado en Tursmo Leccón 4. Ejerccos complementaros. Ejercco 1 (juno 06). La nformacón relatva al mes de enero sobre los ngresos (X) y los gastos (Y), expresados en mles de euros,

Más detalles

ESTADÍSTICA (GRUPO 12)

ESTADÍSTICA (GRUPO 12) ESTADÍSTICA (GRUPO 12) CAPÍTULO II.- ANÁLISIS DE UNA CARACTERÍSTICA (DISTRIBUCIONES UNIDIMENSIONALES) TEMA 7.- MEDIDAS DE CONCENTRACIÓN. DIPLOMATURA EN CIENCIAS EMPRESARIALES UNIVERSIDAD DE SEVILLA 1.

Más detalles