Epidat 4: Ayuda de Regresión logística. Octubre REGRESIÓN LOGÍSTICA.
|
|
- Nicolás Juan Luis Ortíz Belmonte
- hace 7 años
- Vistas:
Transcripción
1 Epdat 4: Ayuda de Regresón logístca. Octubre 014. REGRESIÓN LOGÍSTICA
2 Epdat 4: Ayuda de Regresón logístca. Octubre 014. ÍNDICE Conceptos generales El modelo logístco Cocente de verosmltudes Varables dummy Ajuste del modelo Caldad del ajuste Recomendacones generales Manejo del módulo Manejo básco Datos tabulados Opcones adconales Valdacón Predccón Ejemplos Bblografía Anexo 1: Novedades del módulo de regresón logístca Anexo : Fórmulas del módulo de regresón logístca... 35
3 Epdat 4: Ayuda de Regresón logístca. Octubre Conceptos generales Entre los propóstos de muchas nvestgacones epdemológcas se halla el establecmento de las leyes que rgen el desenvolvmento de las enfermedades. El examen se realza típcamente en un marco complejo, donde la coexstenca de factores mutuamente relaconados determna el comportamento de otros. Para sondear o ncluso desentrañar la naturaleza de tales relacones, el nvestgador puede auxlarse, entre otras alternatvas, del análss de regresón. La regresón logístca (RL) es la varante de la regresón que corresponde al caso en que se valora la contrbucón de dferentes factores en la ocurrenca de un evento smple. En general, la RL es adecuada cuando la varable de respuesta (llamémosle Y en lo sucesvo) es poltómca (admte varas categorías de respuesta, tales como MEJORA MUCHO, MEJORA, SE MANTIENE IGUAL, EMPEORA, EMPEORA MUCHO); pero es especalmente útl cuando solo hay dos posbles desenlaces (cuando la varable de respuesta es dcotómca), que es el caso más común. Es lo que ocurre, por ejemplo, en las sguentes stuacones: el pacente hosptalzado muere o sobrevve durante las prmeras 48 horas de su ngreso, el organsmo acepta o no un órgano trasplantado, se produjo o no un ntento sucda antes de los 60 años, etc.. En cada uno de estos ejemplos puede desearse la construccón de un modelo que exprese la probabldad de ocurrenca del evento de que se trate en funcón de un conjunto de varables ndependentes. La varable Y se codfca de certa manera, por ejemplo como 1 s se produce certo desenlace, y como 0 en caso opuesto, de modo que la RL expresa P(Y=1) en funcón de certas varables relevantes a los efectos del problema que se haya planteado. La fnaldad con que se construye ese modelo no es únca; báscamente, hay tres propóstos posbles: que se trate de una mera contrbucón a la descrpcón de certo proceso, que se aplque en la búsqueda de explcacones causales o para la construccón de un modelo para la predccón. La RL es una de las técncas estadístco-nferencales más empleadas en la produccón centífca contemporánea. Surge en la década del 60 con la aparcón del trabajo de Cornfeld, Gordon y Smth [1] sobre el resgo de padecer una enfermedad coronara que consttuye su prmera aplcacón práctca trascendente. Su generalzacón dependía de la solucón que se dera al problema de la estmacón de los coefcentes. El algortmo de Walker-Duncan [] para la obtencón de los estmadores de máxma verosmltud vno a soluconar en parte este problema, pero era de naturaleza tal que el uso de computadoras resultaba mprescndble. De su amplo y crecente empleo han dado cuenta varas revsones. Slva, Pérez y Cuellar [3] consgnan que ésta fue la técnca estadístca más usada entre los artículos publcados por Amercan Journal of Epdemology entre 1986 y 1990 (cas 3 de cada 10 trabajos allí publcados). Levy y Stolte [4] llevaron a cabo un estudo para caracterzar la tendenca en el uso de métodos estadístcos surgdos (entre los 60 y los 70) y que, además, huberan tendo un mpacto consderable en el análss de datos bomédcos; entre ellos fgura la regresón logístca. En PUBMED, base de datos que contene referencas bblográfcas y resúmenes de mles de las connotadas revstas bomédcas de habla nglesa y contene más de mllones de ctacones, se encontró en juno de 013 que el crecmento en el uso de la RL a lo largo de los últmos trenta años ha sdo espectacular: los artículos publcados que hacen mencón al térmno logstc regresson son, para sete años selecconados, como muestra la Tabla 1:
4 Epdat 4: Ayuda de Regresón logístca. Octubre 014. Tabla 1. Número de artículos de PUBMED que emplearon la expresón logstc regresson para años selecconados. Año Número de artículos Como se lustra más adelante, una de las razones que confere especal nterés a la regresón logístca en el marco epdemológco es que con ella se pueden controlar varas varables potencalmente confusoras (de cualquer naturaleza) a la vez. Este rasgo es especalmente atractvo en el marco observaconal, pues en el de los ensayos clíncos, tal control lo ejerce la aleatorzacón, elemento naplcable en los estudos de cohorte o de casos y controles. Hasta que el uso de la RL se generalzó (gracas a las computadoras personales), el recurso al que se podía apelar era la realzacón de análss estratfcados de las asocacones entre posbles causas y efectos, un procedmento artesanal y sumamente lmtado del que ahora puede prescndrse por entero El modelo logístco El problema que resuelve la regresón logístca es expresar la probabldad de certo desenlace (Y=1) en funcón de r varables X 1, X X r las cuales pueden ser de cualquer naturaleza (contnuas, dscretas, dcotómcas, ordnales o nomnales, aunque en este últmo caso han de manejarse a través de varables dummy, como se explca debajo). Concretamente, el resultado fundamental del programa consste en hallar los coefcentes β 0, β 1 β r, que mejor se ajustan a la sguente representacón funconal: P Y 1) 1 exp 1 X r X r donde exp(.) representa la funcón exponencal Cocente de verosmltudes Para que un modelo sea consderado adecuado, éste debe atrbur una alta probabldad de que se produzca el desenlace de nterés a aquellos sujetos para los cuales, efectvamente, se tene Y=1 y vceversa. Por tanto, una medda razonable para valorar el grado en que el modelo arroja resultados coherentes con los datos usados para su construccón sería el producto de todas las probabldades (predchas por el modelo) de que los n sujetos de la muestra empleada para su construccón tengan la condcón que realmente tenen. S se llama p a la probabldad estmada por el modelo de que el -ésmo sujeto tenga certa condcón, y tenemos que d ndvduos tenen la condcón, se puede computar la expresón sguente: V p p p 1 p 1 p... p 1... d d 1 d 1 n donde los prmeros d factores corresponden a sujetos con la condcón y los restantes n-d a los que no la tenen. La magntud V un número sempre mayor que 0- es conocda como la verosmltud del modelo. A un modelo completamente extoso, el cual atrbuya una probabldad de tener la condcón
5 Epdat 4: Ayuda de Regresón logístca. Octubre 014. gual a 1 a cada sujeto que realmente la tenga y de 0 a cada sujeto lbre de ella, correspondería una verosmltud máxma de 1; por el contraro, un modelo defcente tendría una verosmltud pequeña, cercana a 0. En consecuenca, la proxmdad de la verosmltud a 1 expresa cuán efcente ha sdo el ajuste realzado para modelar la realdad [5]. Debdo a que la funcón de verosmltud mde la plausbldad de un modelo de regresón logístca, no debe sorprender que para valorar su capacdad predctva sea central la consderacón de la verosmltud; es decr, de la magntud V antes ntroducda. Concretamente, se suele emplear la expresón: L lnv A esta transformacón se le conoce como lejanía del modelo (devance en nglés). Nótese que, sendo V<1, su logartmo sempre será negatvo; de modo que la lejanía L sempre será un número postvo. El grado de ajuste de un modelo será mejor cuanto más próxma a 1 es la verosmltud y, en consecuenca, cuanto más se aproxma a cero la lejanía. Sempre que se ajusta un modelo, el algortmo de la regresón logístca computa dos lejanías: la que corresponde propamente al modelo que se ha ajustado (L), y la que corresponde al modelo nulo (L 0) que es aquel en que no se ha ncorporado nnguna varable ndependente. La lejanía del modelo nulo es más grande que la de cualquer modelo amplado. Esto es razonable, debdo a que se trata de un modelo mucho menos sofstcado (que no ncorpora nformacón alguna de posbles varables explcatvas ) y debe necesaramente tener una ncapacdad predctva mayor. La dferenca entre estas lejanías mde el aporte que hacen las varables ncorporadas al modelo. Es decr, para valorar dcho aporte se puede calcular el cocente o razón de verosmltudes: V0 CV L0 L ln V0 ln V ln 0 ln V V V CV es un estadístco de gran relevanca, ya que tene una nterpretacón clara y debdo a que se conoce que se dstrbuye J-cuadrado con r grados de lbertad, donde r es el número de varables presentes en el modelo amplado. En general, esta razón de verosmltudes es útl para determnar s hay una dferenca sgnfcatva entre nclur en el modelo todas las varables y no nclur nnguna; o, dcho de otro modo: RV srve para valorar s las varables X 1, X X r tomadas en conjunto, contrbuyen efectvamente a "explcar" las modfcacones que se producen en P(Y=1). Tambén es útl porque permte valorar el aporte atrbuble a certo conjunto de varables adconadas a las de un prmer ajuste. En efecto, s se ajusta un modelo que produce certo valor CV 1 y se ajusta otro al que se agregaron h varables, el cual produce un cocente CV, entonces CV -CV 1 se dstrbuye J-cuadrado con h grados de lbertad, lo cual permte evaluar s la adcón de las h varables hace un aporte sgnfcatvo.
6 Epdat 4: Ayuda de Regresón logístca. Octubre Varables dummy Las varables explcatvas de tpo nomnal deben ser ncludas en el modelo señalando que tenen esa condcón. Se trata de varables que no son numércas (v.g. estado cvl o raza) o que, aunque los valores que contene aparezcan como números, son en realdad códgos o se queren manejar como tales (por ejemplo, s se asgna el valor 1 para ndcar que se trata de un sujeto soltero, el valor para un dvorcado, etc.). Supongamos que la varable en cuestón tene k clases o categorías (donde k ). Epdat 4 construye automátcamente k-1 varables dummy para manejar esta stuacón. Brevemente dcho, el sentdo de las varables dummy es el sguente: supóngase que certa varable es nomnal (raza, relgón profesada, grupo sanguíneo, etc.) y consta de k categorías; se crean entonces k-1 varables dcotómcas, que son las llamadas varables dummy asocadas a esta varable nomnal y que se denotarán por Z 1, Z,..., Z k-1. A cada categoría o clase de la varable nomnal le corresponde un conjunto de valores de los Z con el cual se dentfca dcha clase. La manera más usual de defnr estas k-1 varables es la sguente: s el sujeto pertenece a la prmera categoría, entonces las k-1varables dummy valen 0: se tene Z 1= Z =...= Z k-1=0; s el sujeto se halla en la segunda categoría, entonces Z 1=1 y las restantes valen 0; Z vale 1 solo para aquellos ndvduos que están en la tercera categoría, en cuyo caso las otras varables asumen el valor 0, y así sucesvamente hasta llegar a la últma categoría, para la cual Z k-1 es la únca que vale 1. Para más detalles, véase Slva [6]. Por ejemplo, s la varable nomnal de nterés es el grupo sanguíneo, la cual tene k = 4 categorías (sangre tpo A, tpo AB y tpo B y tpo O), entonces se tendrían los sguentes valores de las 3 varables dummy para cada grupo sanguíneo: Varable nomnal (grupo sanguíneo) Z 1 Z Z 3 A AB B O En cualquer caso, s se ajusta un modelo que ncluya una varable nomnal con k clases, esta será susttuda por las k-1 varables dummy, y a cada una de ellas corresponderá su respectvo coefcente. A estos efectos, Epdat ordenará las categorías alfabétcamente Ajuste del modelo Caldad del ajuste Sempre que se quere obtener un modelo de regresón, de cualquer tpo, una precaucón mportante a los efectos de sacar conclusones es la de corroborar que este modelo se ajusta efectvamente a los datos usados. La RL no es una excepcón. Es ben conocdo que, en el contexto de la regresón lneal múltple, se suele emplear el llamado coefcente de determnacón (R ) para cuantfcar medante una únca medda, con cotas nterpretables, el grado de explcacón de la varabldad de la varable de respuesta consegudo con el modelo por parte de las varables ndependentes. Varas sugerencas se han hecho para obtener algo smlar en el marco de la RL. Sn embargo, no hay una opnón
7 Epdat 4: Ayuda de Regresón logístca. Octubre 014. unánme sobre cuál podría ser la mejor. Epdat 4 ha ncorporado una, preferda por Mttlböck y Schemper [7] (quenes examnan 1 posbles medcones) a la que se denomna aquí, análogamente, coefcente de determnacón. R es un número que se halla necesaramente entre 0 y 1. Alcanza el valor 1 cuando el vatcno es perfecto (esto quere decr, que R alcanzaría el valor máxmo solo s el modelo atrbuyera probabldad 1 a aquellos sujetos de la muestra que efectvamente tuveron el evento, y valores guales a 0 a quenes no lo tuveron) y R se aproxma a 0 en la medda que las probabldades atrbudas por el modelo dsten más, respectvamente, de 1 y 0. Otros ndcadores que se han sugerdo con la msma fnaldad son el Coefcente de Cox y Snell y el Coefcente de Nagelkerke, los cuales son, en certo sentdo, varacones del prmero. Epdat 4 ofrece los tres ndcadores como salda regular. Cabe advertr, no obstante, que estos coefcentes no mden la bondad del ajuste (un concepto dferente al de varabldad explcada por el modelo ), la cual debe valorarse a través de las pruebas específcamente dseñadas con ese fn (en partcular, la prueba de Hosmer y Lemeshow [8]). Epdat 4 permte evaluar la caldad del ajuste del modelo estmado medante dcha prueba. El estadístco que ellos proponen se calcula a través de varos grupos empleando los decles de las probabldades predchas por el modelo, y comparando las frecuencas observadas en dchos grupos con las esperadas. S ben Epdat 4 realza una prueba de bondad de ajuste (PBA) formal en esta stuacón, procede recordar (véase Slva [9], epígrafe 6.6.1) que todos los modelos son mperfectos, aunque muchos de ellos resultan, no obstante, útles. Consecuentemente, resulta un poco absurdo que se consdere útl un modelo por el solo hecho de que no se ha poddo demostrar que es mperfecto o consderarlo nútl por el hecho de que tal mperfeccón se ha puesto de manfesto. S la hpótess nula afrma, como ocurre con las PBA, que los datos sguen certa dstrbucón, entonces sensu strctu dcha hpótess sempre es falsa; y por lo tanto se rechazará nexorablemente s la muestra es sufcentemente grande. A dferenca de lo que ocurre con otras pruebas de hpótess, en el caso de las PBA, el rechazo de la hpótess nula no es el desenlace deseado. De tal suerte, la mejor manera de consegur lo que se desea sería adoptar la absurda medda cautelar de no tomar una muestra demasado grande. Y vceversa, con una muestra sufcentemente grande, es altamente probable que consgamos rechazar la hpótess (aunque este es un problema presente en todas las pruebas de sgnfcacón). Sntetzando, el empleo de un test formal como el de Hosmer-Lemeshow, es cuestonable. Algunos autores sugeren smplemente nspecconar de manera nformal los valores esperados y los observados y, s las dferencas no son muy notables, admtr que el modelo es adecuado. En los modelos múltples puede ser nteresante ncorporar la nteraccón entre dos varables predctoras. Esto procede cuando se sospecha o se sabe que la nfluenca de una varable sobre la respuesta puede ser dferente en funcón de los valores que tome otra varable tambén ncluda en el modelo. Epdat 4 tene la lmtacón de no contemplar la posbldad de defnr nteraccones de forma automátca, pero esto se puede consegur por parte del usuaro defnendo prevamente el producto de las dos varables cuya nteraccón se desea nclur en el modelo como una varable predctora más. Véase Ejemplo 1. Naturalmente, esta dea puede extenderse a más varables; podrían ncorporarse térmnos que nvolucren a tres o más de ellas, pero esto es sumamente nusual.
8 Epdat 4: Ayuda de Regresón logístca. Octubre Recomendacones generales - Las varables explcatvas deben tener una relacón monótona con la probabldad del evento que se estuda. Vale decr, cuando el valor de una varable ndependente crece, la probabldad del desenlace ha de aumentar o de dsmnur (es decr, no ha de pasar de una tendenca a la opuesta en algún punto del recorrdo de la varable ndependente). - Las varables ndependentes nvolucradas en el modelo no deben estar muy correlaconadas entre sí. S la correlacón entre dos varables es alta, entonces los resultados de la RL son poco confables. Concretamente, los errores estándares se ncrementan ndebdamente y puede ocurrr, ncluso, que el proceso teratvo para la estmacón no converja. - Debe recordarse que el conjunto de varables dummy consttuye un todo ndsoluble con el cual se suple a una varable nomnal. Cualquer decsón que se adopte o valoracón que se haga concerne al conjunto íntegro (por ejemplo, s una de las varables dummy es sgnfcatva, entonces toda la varable nomnal lo es). - Es muy mportante dstngur entre un contexto explcatvo y uno predctvo. Debe tenerse en cuenta, en este caso, que una varable puede tener valor predctvo aunque no sea parte del mecansmo causal que produce el fenómeno en estudo. - En lo posble ha de procurarse que haya en la base al menos 10 sujetos con cada una de las respuestas posbles para la varable ndependente Manejo del módulo Manejo básco La entrada de la nformacón está conformada por una matrz con n flas (tamaño de la muestra) y r+1 columnas. Una de ellas ha de contener los datos correspondentes a una varable dependente (o de respuesta) dcotómca. Las restantes r columnas recogen la nformacón para respectvas varables ndependentes (tambén llamadas de entrada, explcatvas o predctoras dependendo del contexto). El usuaro ha de ndcar, para cada una de estas últmas s han de tratarse como numércas o como categórcas; en este últmo caso, Epdat 4 las manejará a través de la construccón de varables dummy. Las que estén en el prmer caso no pueden contener valores que no sean números. Las dcotómcas, naturalmente, son un caso partcular de las categórcas (poltómcas con dos categorías). Ya en ese punto, el programa puede proceder a producr el modelo estmado. Como en el resto de Epdat 4, el usuaro puede defnr un fltro para trabajar con un subconjunto de la muestra defndo por las condcones que mponga, basadas en restrccones para las varables que contenga el archvo que fue proveído Datos tabulados Ocasonalmente, algunos elementos de la muestra contenen exactamente la msma nformacón (un msmo perfl de entrada y un msmo desenlace). Dcho de otro modo, no necesaramente todas las flas de la matrz tenen que ser dferentes. En tal caso, la nformacón de entrada en el programa puede colocarse compactada (tabulada). Para ello debe crearse una varable numérca (que solo admtrá números enteros mayores que 0) que contenga la frecuenca de cada una de las flas dferentes. El usuaro ha de marcar la opcón
9 Epdat 4: Ayuda de Regresón logístca. Octubre 014. Tabla de frecuencas y declarar luego cuál es la varable que contene las frecuencas (véanse Ejemplos y 3) Opcones adconales Adconalmente, el usuaro puede solctar que Epdat 4 realce un test de bondad de ajuste y que calcule (y exhba) la curva ROC asocada. El usuaro tene dos opcones adconales: a) Pedr que se realce una valdacón del modelo. b) Aplcar el modelo a un conjunto de perfles para las varables de entrada Estas dos opcones se explcan a contnuacón Valdacón Como es ben conocdo, los modelos nunca consttuyen una fnaldad en sí msma. Todo modelo procura representar una realdad general, usando para ello nformacón específca que provene de ella. Para que su aplcacón sea fructuosa en otro contexto, sn embargo, el modelo debe ser valdado con datos procedentes de ese otro contexto. El acto de corroborar que tene este mérto (o sea, que hace las predccones que se supone que hace) se conoce como valdacón del modelo. Para ello se procede en esenca del modo sguente: a) Se construye el modelo usando una Muestra1 de tamaño n 1. b) Se busca una Muestra, ndependente de la prmera, de tamaño n, de la que tenemos toda la nformacón (tanto los datos de entrada X 1, X X r, como el valor de Y para cada uno de sus elementos). c) Se aplca el modelo menconado en a) a cada vector X 1, X X r de la Muestra y se obtenen n valores de Pˆ. d) Se valora el grado en que los n valores de Pˆ obtendos se parecen a los respectvos valores de Y. Nota: Ocasonalmente se nca el proceso con una muestra de tamaño n = n 1 + n. La Muestra1 resulta de una subseleccón smple aleatora de tamaño n 1 tomada de la muestra ncal, y la valdacón se realza usando la submuestra complementara. S la valdacón es extosa, entonces suele conformarse el modelo defntvo usando la muestra total. Tal procedmento, sn embargo, puede ser en certa medda objetado, pues, aunque la valdacón no se hace con la propa muestra creada para la confeccón del modelo, cabe esperar que el proceso sea favorecdo por el hecho de que ambas muestras serán parecdas. En cualquer caso, para realzar la valdacón ha de proveerse una nueva base de datos. El programa aplca el modelo que se acaba de construr a cada uno de los sujetos de dcha base. Con los verdaderos desenlaces acaecdos a ellos y con las estmacones resultantes de la aplcacón menconada, se aplca la prueba de bondad de ajuste de Hosmer y Lemeshow y luego se estma el número esperado de casos con la condcón medante la suma de las probabldades obtendas. La comparacón de los valores esperados bajo el modelo que se valda y los resultados objetvamente producdos, tanto en un caso como en el otro, permte conformar un juco sobre la valdez del modelo.
10 Epdat 4: Ayuda de Regresón logístca. Octubre 014. Nota cautelar: Cabe advertr que la segunda base de datos tene que contener todas las varables empleadas en la elaboracón ncal del modelo que se quere valdar. Por otra parte, puede ocurrr lo sguente: en la prmera base hay una varable declarada nomnal y en la segunda tambén comparece dcha varable, pero en esta últma aparece al menos un caso para el cual dcha varable adopta certo valor que no estaba presente en nnguno de los casos ncludos en la base orgnal (por ejemplo, en la prmera se tene el estado cvl y los sujetos que contene son casados, solteros o dvorcados, pero no hay nngún vudo; mentras que en la segunda base s aparece al menos un vudo). En esa stuacón, al realzarse la valdacón, Epdat elmna de la segunda base todos los casos donde se presente esta sngulardad (en el ejemplo, prescndrá de las flas en las que se declare que el sujeto es vudo) Predccón Conceptos generales Una vez construdo el modelo, se puede solctar a Epdat 4 la estmacón de probabldades correspondentes a un conjunto dado de perfles de entrada. El usuaro ha de proveer una matrz de datos. Todas las varables ndependentes presentes en el modelo ajustado han de fgurar en esta matrz. Para cada uno de los perfles ncludos, Epdat 4 no solo realza una estmacón puntual sno que computa un ntervalo de confanza, empleando para ello la técnca bootstrap. Típcamente, en la segunda matrz se ncluyen algunos perfles que el usuaro consdera que son teórca o práctcamente relevantes (Véanse ejemplos 1, y 4). Sn embargo, la dmensón de la matrz ntroducda para la predccón no tene restrccones. S el número de flas (perfles) supera a 0, Epdat no presentará las estmacones en la pantalla de salda sno que, drectamente, solo las envará a un archvo para que sea salvado por el usuaro. Nota cautelar: Procede advertr que la segunda base de datos ha de contener todas las varables empleadas para la construccón ncal del modelo. Además, puede ocurrr que en la prmera base haya alguna varable declarada como categórca, tambén presente en la segunda, pero con la sngulardad de que en esta últma aparece al menos un caso para el cual dcha varable tene una condcón no presente en nnguno de los casos ncludos en la base ncal (por ejemplo, en la prmera se tene que en la varable RELIGIÓN aparecen sujetos católcos, protestantes o musulmanes, pero no hay nngún sujeto ateo; mentras que en la segunda base s aparece al menos un ateo). En esa stuacón, al realzarse la predccón Epdat elmna de la segunda base todos los casos donde se presente esta sngulardad (es decr, todas las flas correspondentes a ndvduos ateos) Teorema de Bayes y predccón Supongamos que se tene una probabldad P a pror de que determnada condcón morbosa E esté presente en un sujeto (llamaremos O=1-P a su complemento, la probabldad de que esté sano, E ), y que se cuenta con una prueba dagnóstca T que puede arrojar dos resultados (postvo T+ y negatvo T-). Medante el Teorema de Bayes se puede computar cuál es la probabldad a posteror de estar enfermo en cada uno de los dos casos. Para ello han de conocerse dos parámetros nherentes a la prueba: la sensbldad y la especfcdad. El prmero mde la capacdad de la
11 Epdat 4: Ayuda de Regresón logístca. Octubre 014. prueba para detectar a un sujeto enfermo; expresa cuán "sensble" es la prueba ante la presenca de la enfermedad y vene defndo por la probabldad condconal = P(T E). La segunda se defne a través de la probabldad condconal = P(T E), la cual mde cuán específca es la prueba dagnóstca en el sentdo sguente: cuanto mayor sea, menor será su complemento P(T E) ;o sea, menor es la probabldad de que declare como enfermos a sujetos que no sufren esta enfermedad. Lo que resulta deseable en este contexto es que, s el resultado de la prueba es postvo, la probabldad de que el sujeto esté efectvamente enfermo sea muy alta y, análogamente, que sea elevada la de que el ndvduo esté sano, supuesto que la prueba arroja un resultado negatvo. En térmnos formales, lo deal es que sean muy altos los valores P(E T ) y P( E T ) que son probabldades condconales a las que se les denomna valores predctvos de la prueba. Aplcando el Teorema de Bayes se obtenen entonces el valor predctvo postvo y el valor predctvo negatvo medante las sguentes fórmulas, respectvamente: P(E T+)= y + (1- ) P( E T )= + (1- ) Cuando el valor se obtene a través de la RL, se dan las condcones para estmar por este conducto con más precsón la probabldad de que el sujeto esté sano y la de que esté enfermo, combnando este resultado con lo que pudera arrojar una prueba dagnóstca adconal (véase Ejemplo 4). Cuando se trabaja con la predccón sempre se agregan 3 columnas (el valor estmado de P y sus respectvos límtes de confanza), pero s se marca que sí se queren valores predctvos (el supuesto por defecto es que no), entonces se agregarían 9 columnas en total debdo a que se estman 3 parámetros y para cada uno de ellos, los dos límtes del ntervalo de confanza Predccón con muestras no representatvas Al emplear la RL, como ocurre en rgor con cualquer otra técnca estadístca, se debe ser cauteloso. S ben el modelo no tene restrccones en cuanto a la dstrbucón de las varables ndependentes (eso es lo que hace posble, por certo, que se pueda emplear con datos tabulados; véase Seccón 11.5.), para que el análss tenga sentdo pleno, debe aplcarse con fnes predctvos solo en los estudos prospectvos, cuando se tenga certeza de que los acontecmentos regstrados por las varables ndependentes ocurreron antes que los desenlaces. Análogamente, se sobrentende que la muestra que ha sdo objeto del segumento en este tpo de estudos es representatva de la poblacón de procedenca. Hay en prncpo dos stuacones en que el modelo obtendo no se puede aplcar drectamente para hacer cómputos de la probabldad (es decr, para hacer la predccón) correspondente a un perfl dado. En ambos casos debdo a que la muestra empleada no se puede consderar representatva de la poblacón. La prmera concerne a los estudos retrospectvos (estudos de casos y controles). Típcamente, el número de casos (para los cuales Y=1) es mucho mayor que el de casos con ese desenlace en la poblacón. Por ejemplo, puede ocurrr que la tasa de prevalenca o ncdenca de dcho problema sea, dgamos, gual al 4% del total, mentras que para hacer el estudo se han tomado tantos casos como controles (es decr, la fraccón en la muestra es de un 50%). La segunda stuacón se da cuando el modelo predctvo se ha obtendo en determnado contexto (certo país o certo hosptal) y luego se quere aplcar a otro contexto, donde las condcones (por ejemplo, tecnológcas, ambentales o demográfcas) son otras.
12 Epdat 4: Ayuda de Regresón logístca. Octubre 014. En ambos casos, es necesaro hacer correccones que permtan emplear el modelo orgnalmente obtendo. La stuacón típca es la sguente. Llamemos Modelo 1 al que se obtuvo orgnalmente y Modelo al que se debe aplcar. Este segundo modelo hace uso de las estmacones que el prmero arrojó para los r coefcentes correspondentes a las varables ncludas: β 1, β β r pero debe corregr el valor del coefcente ndependente β 0. Concretamente, habría que obtener un coefcente β 0 * medante la fórmula: * 1 f 0 0 ln f1 donde f 1 es la tasa en el entorno donde se hzo el estudo y f es la tasa f de aquel en el cual se quere aplcar. Por ejemplo, s se ha hecho un ajuste para la probabldad de que un sujeto quemado muera antes de egresar del hosptal (véase ejemplo 1) en un enclave donde el 15% de los pacentes mueren, y se quere aplcar en otro donde esto ocurre con el 35% de los pacentes (quzás debdo a que en el prmero se tenen recursos terapéutcos mucho más avanzados), y s el coefcente ndependente resultante del ajuste fue β 0=-9,488; entonces, para aplcarlo en el segundo enclave hay que emplear β 0 *=-9,488-ln(0,15 0,65/0,35)=-9,008. S el estudo se realzó usando el método de casos y controles donde se tomaron tantos casos como controles, se tendría f 1=0,5. Para calcular probabldades en la poblacón donde, supongamos que muere realmente el 6% de los ngresados, entonces habría que consderar f =0,15 y el coefcente ndependente a emplear sería: = β 0 *=-9,488-ln(0,5 0,94/0,06)=-11, Curva ROC En un contexto predctvo, con frecuenca se desea selecconar el mejor modelo entre todos los posbles. El área bajo la curva ROC puede ayudar, por ser una vía para comparar dferentes modelos, y por ofrecer una medda de las respectvas capacdades predctvas que ostentan. Cuanto mayor sea esa área, más efcente es el modelo. Para un modelo concreto, la curva ROC se construye del modo que se expone a contnuacón. S fjamos un punto de corte, un valor cualquera entre 0 y 1, podemos clasfcar las n probabldades predchas por el modelo en una tabla de : por una parte se tenen las que están por debajo o por arrba de dcho punto y, por otra, las que corresponden a sujetos que presentan el evento (respuesta Y=1) y las que corresponden a quenes no lo presentan (respuesta Y=0). Desde esta perspectva, puede consderarse el modelo de regresón logístca como un medo para defnr una prueba dagnóstca cuanttatva. Así podemos entenderlo s se fja un umbral para hacer el dagnóstco (por ejemplo, dagnostcar enfermo a un sujeto s P(Y=1)>0,8 y declararlo sano en caso contraro) en una stuacón en que se conozcan los verdaderos desenlaces. Usando la tabla antedcha, es posble calcular la sensbldad (porcentaje de sujetos con la condcón que son clasfcados correctamente por el modelo) y la especfcdad (porcentaje de sujetos sn ella que son clasfcados como tales por el modelo). Ahora, s se toman varos puntos de corte o umbrales sucesvamente, se tendrán respectvas parejas de valores de sensbldad y especfcdad. La curva ROC se obtene representando, en un cuadrado de lado 1, los valores de 1-especfcdad en el eje de abscsas frente a sensbldad en el de las ordenadas para todos los puntos de corte consderados. Epdat 4 construye la curva usando cada uno de los valores predchos como puntos de corte, de modo que se tendrán tantos puntos en la curva como tamaño tenga la muestra. La curva empeza en el punto (0,0), que corresponde al punto de corte 1, y termna en (1,1) que se obtene al consderar el 0 como punto de corte. S el modelo tene capacdad predctva nula,
13 Epdat 4: Ayuda de Regresón logístca. Octubre 014. la curva concde con la dagonal prncpal del cuadrado, y el área bajo la curva toma su valor mínmo de 0,5. Por el contraro, un modelo perfecto tene una curva ROC con área 1. Además de la estmacón del área bajo la curva ROC, Epdat 4 ofrece un ntervalo de confanza para esta estmacón Ejemplos Ejemplo 1: Predccón en un servco de caumatología En un servco hosptalaro de quemados se quere construr un modelo predctvo para la muerte de los pacentes que ngresan. Los especalstas han valorado que las sguentes 6 varables de los pacentes puderan tener valor predctvo a los efectos de que sobrevvan (egresen vvos) o mueran (fallezcan en el hosptal): - Edad medda en años (E). - Porcentaje del cuerpo con quemaduras hpodérmcas (Q1). - Porcentaje del cuerpo con quemaduras epdérmcas (Q). - Porcentaje del cuerpo con quemaduras ntermedas (Q3). - Dabetes, dcotómca: 1 o 0 para ndcar que la padece o no, respectvamente (DIA). - Las quemaduras afectan o no la cabeza del pacente: 1 o 0 para ndcar s ocurre o no, respectvamente (CAB) La varable de respuesta se llamará MUERE y puede tomar los valores SI o NO en dependenca de cuál haya sdo el estado del pacente al egresar. Supongamos que se tomaron los últmos egresados en dcho servco para construr el modelo. El lbro en formato Excel nombrado QUEMADOS.XLS contene cnco hojas. En la prmera, llamada MODELO, fguran los perfles y los desenlaces correspondentes (muerte o no) para los ndvduos. En la hoja MODELO-INT se ha agregado a la anteror una varable para valorar la nteraccón de otras dos (véase debajo). En VALID se ncluyeron los otros pacentes (por ejemplo, los anterores a los de la muestra ncal). En la hoja UNIDO se han colocado las dos bases anterores juntas. En la hoja PRED, fnalmente fguran los 8 perfles concretos sguentes, para los cuales se queren estmar las probabldades de muerte: E Q1 Q3 Q DIA CAB Al correr el programa usando la hoja MODELO se obtene lo sguente (nótese que en este caso las varables DIA y CAB se pueden nclur como numércas y como categórcas debdo a que en ambos casos sus valores posbles se han codfcado como números; los resultados serán los msmos):
14 Epdat 4: Ayuda de Regresón logístca. Octubre 014. Resultados con Epdat 4:
15 Epdat 4: Ayuda de Regresón logístca. Octubre 014. Resultados con Epdat 4 (contnuacón):
16 Epdat 4: Ayuda de Regresón logístca. Octubre 014. Supongamos que se quere valorar el posble efecto de la nteraccón de la edad con el porcentaje total de quemaduras. En ese caso, hay que crear una varable adconal formada por el producto del valor de la edad y la suma de Q1, Q y Q3. La hoja llamada MODELO- INT, que se ncluyó en el lbro QUEMADOS.XLSX, ncluye tal varable (con el nombre EDAD-QT). Resultados con Epdat 4: Como se apreca, s se emplea el test de Wald para valorarlo, la nteraccón entre EDAD y QT dsta de ser sgnfcatva (p=0,518), de modo que se pensaría en prncpo que no rge tal nteraccón. Para la valdacón, luego de haber corrdo el programa con la hoja MODELO, se usa la hoja VALID como segunda matrz. Los resultados obtendos son los sguentes:
17 Epdat 4: Ayuda de Regresón logístca. Octubre 014. Más allá de que p es mucho mayor que 0,05 (no hay una dscrepanca sgnfcatva), la tabla anteror permte observar que el número esperado de muertos es muy smlar al esperado (159 y 15) y que las frecuencas observadas y esperadas son certamente muy smlares en la atomzacón que hace el test de Hosmer Lemeshow, el modelo queda claramente valdado. Sendo así, se pueden unr las bases para hacer un ajuste fnal. Al trabajar con la hoja UNIDO, que contene 000 quemados, se obtene: Los coefcentes son muy parecdos; pero los errores estándar con claramente menores que en el caso en que se trabajó solo con las prmeras 1000 observacones, algo coherente con el notable aumento del tamaño muestral.
18 Epdat 4: Ayuda de Regresón logístca. Octubre 014. Obsérvese a contnuacón lo que arroja el test de bondad de ajuste en este caso en que n=000: En este contexto predctvo, la probabldad del suceso para un perfl de entrada dado ha de computarse empleando los coefcentes estmados. Por ejemplo, s se quere saber cuál es la probabldad de que muerte de un pacente, hay que aplcar la fórmula sguente: P muere exp 0 1E Q1 3Q 4Q3 5DIA 6CAB dónde: β 0=-9,316 β 1=0,054 β =0,9 β 3=0,100 β 4=0,151 β 5=1,361 β 6=1,561. S se tratara de un sujeto de 30 años, con 10, 15 y 0% del cuerpo afectado con quemaduras hpodérmcas, epdérmcas e ntermedas respectvamente, las cuales no afectan la cabeza y que no es dabétco, la fórmula arroja: P(muere 1) 0,39. Las estmacones de las probabldades que se obtuveron al usar la hoja PRED (véase arrba) con ese fn, resultan ser:
19 Epdat 4: Ayuda de Regresón logístca. Octubre 014. Obsérvese que Epdat 4 no solo calcula la probabldad de muerte sno tambén los ntervalos de confanza correspondentes. Por ejemplo, para el qunto sujeto, dcha probabldad es, en efecto, gual a 4% (0,39) y ella se halla entre 15 y 36% con confabldad del 95%. NOTA: s el usuaro reproduce este proceso obtendrá ntervalos lgeramente dferentes debdo a que la estmacón se realza medante la técnca boostrap y en cada caso las submuestras que EPIDAT elge para llevarla adelante serán dferentes. Ejemplo : Influenca de un régmen de atencón de cudados de enfermería sobre recuperacón de pacentes con fractura de cadera. Se estuda la nfeccón hosptalara posqurúrgca en pacentes operados de la cadera. Se desea evaluar la efcaca de un nuevo régmen técnco-organzatvo de los cudados de enfermería que se dspensan a estos pacentes. El resultado se mde a través de la varable INFEC (INFEC=1 cuando el pacente se nfecta a lo largo de la prmera semana, INFEC=0 s no se nfecta). Se defne la varable REGIMEN, de naturaleza dcotómca, que vale 0 s el sujeto estuvo ngresado bajo el nuevo régmen y 1 en caso de que haya estado atenddo bajo el régmen convenconal. Se han estudado 80 pacentes de dferentes edades, 36 de los cuales se han ubcado en el régmen expermental y 44 en el régmen convenconal. La expectatva, claro está, es que el nuevo régmen sea mejor y, por tanto, que haya menos casos de nfeccón en este últmo que en el precedente. Los resultados se recogen en la Tabla. Tabla. Dstrbucón de pacentes según régmen de atencón enfermera y condcón respecto de la nfeccón. Infeccón Régmen Sí (1) No (0) Convenconal (1) 37 7 Expermental (0) 14 OR=3,36
20 Epdat 4: Ayuda de Regresón logístca. Octubre 014. S a partr de los datos brutos se estma el efecto del régmen de los cudados de enfermería sobre el hecho de desarrollar una nfeccón, el odds rato resultante es de 3,36 (procedente de computar la llamada razón de productos cruzados [1437]/[7]). Consdérese, además, que se quere evaluar s la edad del pacente (se nombrará EDAD a esta varable) consttuye una varable de confusón en la relacón que pudera exstr entre el régmen organzatvo y el hecho de desarrollar una nfeccón. Está claro que la varable EDAD cumple con los tres crteros convenconalmente admtdos [10] para ser consderada como varable de confusón. Prmero, el resgo de nfeccón aumenta con la edad. Segundo la proporcón de pacentes mayores de 40 años es mayor en el grupo que recbó el régmen de atencón convenconal. Por últmo, el supuesto de que el efecto protector del régmen expermental sobre el hecho de desarrollar una nfeccón se produzca a través de la edad carece de fundamento. Para valorarlo, los datos se dvden en dos categorías de edad (menores o guales, o mayores de 40 años, GRUPO=0 y GRUPO=1, respectvamente, lo que produce la confguracón que recoge la Tabla 3. Los estmados del odds rato en las dos categorías son de,77 y,44 respectvamente. Tabla 3. Dstrbucón de pacentes según régmen de atencón enfermera, condcón respecto de la nfeccón y grupo de edad. Infeccón Sí (1) No (0) Grupo (1) Edad 40 Grupo (0) Edad>40 Régmen convenconal (1) 15 5 Régmen expermental (0) 13 1 Régmen convenconal (1) Régmen expermental (0) 9 OR 1=,77 OR =,44 Un método usual para valorar una confusón consste en comparar de forma drecta el estmado bruto del efecto y el estmado de éste una vez controlado el presunto factor de confusón. Para ello se debe obtener una estmacón del efecto global a partr de los datos estratfcados, medante una meda ponderada de las estmacones de los efectos por estrato. Retomando nuevamente el ejemplo, será posble que el odds rato total de 3,36 refleje, en alguna dmensón, el efecto confusor que pudera tener la edad en la relacón entre el régmen de atencón de enfermería y la nfeccón? Dentro de cada categoría o estrato formado por los dos grupos de edad (40 o menos y mayores de 40) se puede calcular el odds rato como únca medda de la asocacón entre el régmen y la nfeccón. Una medda únca global se obtene, como se ha dcho, medante un promedo ponderado de los odds rato dentro de los estratos. Esto es exactamente lo que provee el odds rato de Mantel Haenszel que, en este caso, como puede corroborarse a través del análss de tablas x estratfcadas, arroja el valor,68. Al usar el submódulo de regresón logístca en esta stuacón hay que preparar una hoja en Excel, que contenga una tabla de contngenca de 3 entradas con 8 celdas, para que el programa la lea automátcamente según la sguente estructura:
21 Epdat 4: Ayuda de Regresón logístca. Octubre 014. INFEC REGIMEN GRUPO FREQ El archvo CADERA.xls que se ncluye en Epdat 4 contene en su prmera hoja (CADERA- GRUPO) la tabla arrba expuesta. Al emplear el programa, el usuaro puede elegr cuántas y cuáles varables ndependentes ncorporar al modelo. A contnuacón se exponen los resultados que se obtenen cuando se pone una sola varable (REGIMEN), y luego los que se producen cuando se adcona la varable GRUPO. Caso en que solo se ncluye la varable REGIMEN como ndependente: Obsérvese que la estmacón global del OR asocado al régmen de cudados es la msma: 3,36 (es el logartmo natural de 1,13).
22 Epdat 4: Ayuda de Regresón logístca. Octubre 014. Caso en que se ncluyen REGIMEN y GRUPO como varables ndependentes: En este ejemplo, se controla el efecto del grupo de edad. La estmacón del OR pasa a ser,68 (lo msmo que arrojara la estratfcacón de Mantel Haenszel). Ahora ben, el manejo que se ha hecho ha sdo a través de datos tabulados. Sn embargo, s tenemos en cuenta que se conocen las edades ndvduales de todos los partcpantes y no solo la composcón por grupos, el control de la edad puede realzarse ncorporando esta edad real al modelo en lugar de usar la opcón de datos tabulados. Usando la segunda hoja de la base CADERA.XLS, llamada CADERA-EDAD, se obtene lo sguente: Nuevamente, se ha controlado el efecto de la edad y ahora el OR pasa a ser,08. Esta estmacón, mucho más refnada (sn la pérdda de nformacón que supuso consderar la edad a nvel dcotómco), sería la más adecuada en este caso en que se cuenta con datos de edad ndvduales. Este ejemplo pone de manfesto que la valoracón sobre el posble papel confusor de un factor se desarrolla de manera ágl. Basta correr el modelo con y sn el factor y comparar los coefcentes de la varable ndependente. En el ejemplo de los operados de la cadera, se compara 3,36 con,08 lo cual permte pensar que sí hay efecto confusor. Sn embargo, lo
23 Epdat 4: Ayuda de Regresón logístca. Octubre 014. verdaderamente relevante es que el REGIMEN de atencón mantene (aunque dsmnudo) su condcón de factor nfluyente en la dsmnucón de las nfeccones. Ejemplo 3: Prevalencas de postvdad a un antcuerpo. Supóngase que se quere modelar (caracterzar epdemológcamente) el modo en que se dstrbuye certo vrus según 4 zonas. Se consdera la varable VIRUS (varable de respuesta: SI y NO) y la varable ZONA (NORTE, SUR, ESTE y OESTE). Estudados sujetos, la dstrbucón según zonas y presenca o no del vrus, fue la sguente: VIRUS ZONA FRECUENCIA NO NORTE 909 NO SUR NO ESTE 99 NO OESTE 56 SI NORTE 38 SI SUR SI ESTE 17 SI OESTE 606 Es fácl convencerse de que las tasas de prevalenca (expresadas como una fraccón y con 3 decmales) son las que aparecen en la Tabla 4. Tabla 4. Prevalencas estmadas de postvdad al vrus para las dferentes zonas geográfcas. Zona Tamaño Número de Tasa de muestral postvos prevalenca Este ,635 Norte ,08 Oeste ,535 Sur ,51 En este punto, y solo a título lustratvo, resulta nteresante encarar esta tarea a través de la RL. El archvo VIRUS.xls, contene una hoja llamada ZONA con una tabla de contngenca con los datos de los sujetos que consttuyen la muestra. Usando la alternatva de Tablas de Frecuenca y declarando la varable ZONA como categórca, Epdat 4.0 crea las sguentes tres varables dummy: ZONA1 ZONA ZONA3 Este Norte Oeste Sur 0 0 1
24 Epdat 4: Ayuda de Regresón logístca. Octubre 014. Epdat 4 ordena alfabétcamente las categorías y toma la prmera como referenca (todas las varables dummy valen 0) y de ahí en adelante sgue asgnando el 1 y los 0 en ese msmo orden, como se ve en la tabla anteror. Con estos datos se genera el sguente modelo: S ahora aplcamos la funcón logístca: 1 PVrus 1 1 exp 0 1ZONA1 ZONA 3ZONA 3 a cada uno de los conjuntos de varables dummy (es decr, para cada zona) obtenemos cas exactamente los msmos valores para las tasas de prevalenca que había arrojado el smple cómputo de la fraccón de postvos (Tabla 3) entre sujetos de la muestra en cada zona. Por ejemplo, para el NORTE (ZONA1=1; ZONA=0; ZONA3=0), se tene: P Vrus 1 1 exp 1 1 ZONA1 1 exp 1 exp 0,55 1, ,08 Como nota fnal, se llama la atencón acerca de cómo en este caso la bondad de ajuste es perfecta:
25 Epdat 4: Ayuda de Regresón logístca. Octubre 014. Un comentaro nteresante en este caso es el sguente. Para aplcar la predccón en este caso, se puede usar la hoja VIRUS-PRED, la cual meramente contene los 4 perfles posbles. El resultado es: Prob. (VIRUS=1) Límte Inf. Límte Sup. 0,635 0,578 0,695 0,07 0,183 0,30 0,535 0,506 0,564 0,51 0,493 0,59 La comparacón de la prmera columna de esta tabla con la últma de la Tabla 4 arroja lo esperado: la RL estma las tasas de la msma manera que cuando se hace la mera dvsón del número de postvos entre el tamaño muestral en cada zona. Pero resulta nteresante, y fácl de corroborar por el lector, que los ntervalos de confanza -construdos a través de la técnca boostrap- concden cas exactamente con los que se obtendrían s se aplca la fórmula clásca para la estmacón de un porcentaje: p 1,96 p1 p/ n : Zona Tasa de prevalenca Intervalo 95% Este 0,6347 0,577 0,69 Norte 0,075 0,184 0,31 Oeste 0,5353 0,506 0,564 Sur 0,513 0,495 0,530 Ejemplo 4: Influenca del tpo de contrato en accdentes laborales. Se tene la hpótess de que aquellos trabajadores que laboran bajo un contrato ndefndo tenden a padecer menos accdentes que aquellos cuyo contrato es de tpo temporal. Tal conjetura se basa en la dea de que quenes están en este últmo caso no exgen (por temor a no ser recontratados) que se cumplan las reglas de segurdad establecdas. Con el propósto de evaluar dcha hpótess, se realza un estudo de cohortes con sujetos, tenen contratos temporales y los tenen ndefndos y para todos los cuales se observó s tuveron o no un accdente en el curso de los sguentes 5 años posterores al nco del estudo. Los resultados fueron: Contrato Accdente Temporal Indefndo Con accdente (1) a=1.44 c=534 Sn accdente (0) b=1.598 d=.86 Obsérvese que el OR es mucho mayor que 1, cas gual a 5. Eso hace pensar que aproxmadamente es 5 veces más pelgroso tener un contrato temporal que uno ndefndo: OR ab cd ,78
26 Epdat 4: Ayuda de Regresón logístca. Octubre 014. S se quere hacer una prueba de sgnfcacón, se obtendrá: obs nad bc b da ca bc d ,0 al cual se asoca un valor de p=0,000, de modo que la asocacón sería altamente sgnfcatva. Ahora ben, puede consderarse probada la hpótess de causaldad? Para avanzar en esa línea, habría que valorar s exsten varables confusoras que puedan controlarse. Un análss del problema conduce a pensar que verosímlmente las personas con más experenca deberían tener menos accdentes y a la vez ser las que con más frecuenca tendrían contratos ndefndos. Algo smlar ocurrría con la categoría laboral (por ejemplo, un arqutecto debe tener menos propensón a accdentarse que un albañl y smultáneamente sería más probable que este últmo tuvera un contrato temporal que el prmero). Esto ocurrría análogamente con la edad y con la escolardad. Obsérvese, por ejemplo, cómo las tasas (%) de accdentados van dsmnuyendo a medda que aumenta la escolardad en la muestra: Escolardad Accdentados Total % ANALFABETO ,6 PRIMARIO , SECUNDARIO ,5 MEDIO ,5 SUPERIOR ,9 Total ,9 La pregunta relevante sería entonces: la probabldad de que se produzca (o no) un accdente es mayor para los temporales que para los ndefndos, ndependentemente del tpo de trabajo, de los años de experenca, de la escolardad y de la edad? A través de la RL, el hecho de que un sujeto tenga o no un accdente se pondrá en funcón de todas estas varables, para poder controlarlas todas a la vez, aparte, claro está, de la varable en estudo (el tpo de contrato). Las varables del modelo serían: - Tpo de contrato CONTRATO (x 1), dcotómca (1.TEMPORAL,.INDEFINIDO). - Tempo de experenca EXPER (x ), cuanttatva (AÑOS). - Edad del sujeto EDAD (x 3), cuanttatva (AÑOS). - Categoría laboral CATEG (x 4), ordnal (codfcada como 1=MANUAL, =TÉCNICO, 3=PROFESIONAL). - Máxma escolardad alcanzada ESCO (x 5), ordnal (codfcada como 1=ANALFABETO, =PRIMARIO, 3=SECUNDARIO, 4=MEDIO, 5=SUPERIOR).
27 Epdat 4: Ayuda de Regresón logístca. Octubre 014. El lbro ACCIDENTES.xls contene todos estos datos para ndvduos de la cohorte. Los prmeros 10 son los sguentes: TRABAJADOR ACCIDENTE CONTRATO EDAD CATEG EXPER ESCO INDEFINIDO TEMPORAL TEMPORAL INDEFINIDO INDEFINIDO INDEFINIDO INDEFINIDO INDEFINIDO INDEFINIDO INDEFINIDO S se corre el modelo ncorporando solo el contrato como varable ndependente, se obtene la msma estmacón del OR que la arrba obtenda:
EXPERIMENTACIÓN COMERCIAL(I)
EXPERIMENTACIÓN COMERCIAL(I) En un expermento comercal el nvestgador modfca algún factor (denomnado varable explcatva o ndependente) para observar el efecto de esta modfcacón sobre otro factor (denomnado
Más detallesProblemas donde intervienen dos o más variables numéricas
Análss de Regresón y Correlacón Lneal Problemas donde ntervenen dos o más varables numércas Estudaremos el tpo de relacones que exsten entre ellas, y de que forma se asocan Ejemplos: La presón de una masa
Más detallesEJERCICIO 1 1. VERDADERO 2. VERDADERO (Esta afirmación no es cierta en el caso del modelo general). 3. En el modelo lineal general
PRÁCTICA 6: MODELO DE REGRESIÓN MÚLTIPLE SOLUCIÓN EJERCICIO. VERDADERO. VERDADERO (Esta afrmacón no es certa en el caso del modelo general. 3. En el modelo lneal general Y =X β + ε, explcar la forma que
Más detallesRelaciones entre variables
Relacones entre varables Las técncas de regresón permten hacer predccones sobre los valores de certa varable Y (dependente), a partr de los de otra (ndependente), entre las que se ntuye que exste una relacón.
Más detallesCAPÍTULO 5 REGRESIÓN CON VARIABLES CUALITATIVAS
CAPÍTULO 5 REGRESIÓN CON VARIABLES CUALITATIVAS Edgar Acuña Fernández Departamento de Matemátcas Unversdad de Puerto Rco Recnto Unverstaro de Mayagüez Edgar Acuña Analss de Regreson Regresón con varables
Más detallesPronósticos. Humberto R. Álvarez A., Ph. D.
Pronóstcos Humberto R. Álvarez A., Ph. D. Predccón, Pronóstco y Prospectva Predccón: estmacón de un acontecmento futuro que se basa en consderacones subjetvas, en la habldad, experenca y buen juco de las
Más detallesInvestigación y Técnicas de Mercado. Previsión de Ventas TÉCNICAS CUANTITATIVAS ELEMENTALES DE PREVISIÓN UNIVARIANTE. (IV): Ajustes de Tendencia
Investgacón y Técncas de Mercado Prevsón de Ventas TÉCNICAS CUANTITATIVAS ELEMENTALES DE PREVISIÓN UNIVARIANTE. (IV): s de Tendenca Profesor: Ramón Mahía Curso 00-003 I.- Introduccón Hasta el momento,
Más detallesCARTAS DE CONTROL. Han sido difundidas exitosamente en varios países dentro de una amplia variedad de situaciones para el control del proceso.
CARTAS DE CONTROL Las cartas de control son la herramenta más poderosa para analzar la varacón en la mayoría de los procesos. Han sdo dfunddas extosamente en varos países dentro de una ampla varedad de
Más detallesAnálisis de Regresión y Correlación
1 Análss de Regresón y Correlacón El análss de regresón consste en emplear métodos que permtan determnar la mejor relacón funconal entre dos o más varables concomtantes (o relaconadas). El análss de correlacón
Más detalles3. VARIABLES ALEATORIAS.
3. VARIABLES ALEATORIAS. Una varable aleatora es una varable que toma valores numércos determnados por el resultado de un epermento aleatoro (no hay que confundr la varable aleatora con sus posbles valores)
Más detallesPRÁCTICA 16: MODELO DE REGRESIÓN MÚLTIPLE SOLUCIÓN
PRÁCTICA 6: MODELO DE REGRESIÓN MÚLTIPLE SOLUCIÓN EJERCICIO. VERDADERO. VERDADERO (Esta afrmacón no es certa en el caso del modelo general). 3. En el modelo lneal general Y = X b + e, explcar la forma
Más detallesReconocimiento de Locutor basado en Procesamiento de Voz. ProDiVoz Reconocimiento de Locutor 1
Reconocmento de Locutor basado en Procesamento de Voz ProDVoz Reconocmento de Locutor Introduccón Reconocmento de locutor: Proceso de extraccón automátca de nformacón relatva a la dentdad de la persona
Más detallesTema 1.3_A La media y la desviación estándar
Curso 0-03 Grado en Físca Herramentas Computaconales Tema.3_A La meda y la desvacón estándar Dónde estudar el tema.3_a: Capítulo 4. J.R. Taylor, Error Analyss. Unv. cence Books, ausalto, Calforna 997.
Más detallesDicha tabla adopta la forma del diagrama de árbol del dibujo. En éste, a cada uno de los sucesos A y A c se les ha asociado los sucesos B y B c.
Estadístca robablístca 6. Tablas de contngenca y dagramas de árbol. En los problemas de probabldad y en especal en los de probabldad condconada, resulta nteresante y práctco organzar la nformacón en una
Más detallesMODELOS DE ELECCIÓN BINARIA
MODELOS DE ELECCIÓN BINARIA Econometría I UNLP http://www.econometra1.depeco.econo.unlp.edu.ar/ Modelos de Eleccón Bnara: Introduccón Estamos nteresados en la probabldad de ocurrenca de certo evento Podemos
Más detallesHistogramas: Es un diagrama de barras pero los datos son siempre cuantitativos agrupados en clases o intervalos.
ESTADÍSTICA I. Recuerda: Poblacón: Es el conjunto de todos los elementos que cumplen una determnada propedad, que llamamos carácter estadístco. Los elementos de la poblacón se llaman ndvduos. Muestra:
Más detallesREGRESION Y CORRELACION
nav Estadístca (complementos) 1 REGRESION Y CORRELACION Fórmulas báscas en la regresón lneal smple Como ejemplo de análss de regresón, descrbremos el caso de Pzzería Armand, cadena de restaurantes de comda
Más detallesINTRODUCCIÓN. Técnicas estadísticas
Tema : Estadístca Descrptva Undmensonal ITRODUCCIÓ Fenómeno determnsta: al repetrlo en déntcas condcones se obtene el msmo resultado. (Ejemplo: lómetros recorrdos en un ntervalo de tempo a una velocdad
Más detallesCorrelación y regresión lineal simple
. Regresón lneal smple Correlacón y regresón lneal smple. Introduccón La correlacón entre dos varables ( e Y) se refere a la relacón exstente entre ellas de tal manera que a determnados valores de se asocan
Más detallesVida Util, características de la Fiabilidad e Inviabilidad y distribuciones teóricas en el terreno de la fiabilidad
Vda Utl, característcas de la Fabldad e Invabldad y dstrbucones teórcas en el terreno de la fabldad Realzado por: Mgter. Leandro D. Torres Vda Utl Este índce se refere a una vda útl meda nomnal y se puede
Más detallesEconometría. Ayudantía # 01, Conceptos Generales, Modelo de Regresión. Profesor: Carlos R. Pitta 1
Escuela de Ingenería Comercal Ayudantía # 01, Conceptos Generales, Modelo de Regresón Profesor: Carlos R. Ptta 1 1 cptta@spm.uach.cl Escuela de Ingenería Comercal Ayudantía 01 Parte 01: Comentes Señale
Más detallesMétodos específicos de generación de diversas distribuciones discretas
Tema 3 Métodos específcos de generacón de dversas dstrbucones dscretas 3.1. Dstrbucón de Bernoull Sea X B(p). La funcón de probabldad puntual de X es: P (X = 1) = p P (X = 0) = 1 p Utlzando el método de
Más detallesTRABAJO 1: Variables Estadísticas Unidimensionales (Tema 1).
TRABAJO 1: Varables Estadístcas Undmensonales (Tema 1). Técncas Cuanttatvas I. Curso 2016/2017. APELLIDOS: NOMBRE: GRADO: GRUPO: DNI (o NIE): A: B: C: D: En los enuncados de los ejerccos que sguen aparecen
Más detallesCÁLCULO DE INCERTIDUMBRE EN MEDIDAS FÍSICAS: MEDIDA DE UNA MASA
CÁLCULO DE INCERTIDUMBRE EN MEDIDAS FÍSICAS: MEDIDA DE UNA MASA Alca Maroto, Rcard Boqué, Jord Ru, F. Xaver Rus Departamento de Químca Analítca y Químca Orgánca Unverstat Rovra Vrgl. Pl. Imperal Tàrraco,
Más detallesMuestra: son datos de corte transversal correspondientes a 120 familias españolas.
Capítulo II: El Modelo Lneal Clásco - Estmacón Aplcacones Informátcas 3. APLICACIONES INFORMÁTICAS Fchero : cp.wf (modelo de regresón smple) Seres: : consumo famlar mensual en mles de pesetas RENTA: renta
Más detalles2.2 TASA INTERNA DE RETORNO (TIR). Flujo de Caja Netos en el Tiempo
Evaluacón Económca de Proyectos de Inversón 1 ANTECEDENTES GENERALES. La evaluacón se podría defnr, smplemente, como el proceso en el cual se determna el mérto, valor o sgnfcanca de un proyecto. Este proceso
Más detallesRegresión Binomial Negativa
Regresón Bnomal Negatva Resumen El procedmento Regresón Bnomal Negatva está dseñado para ajustar un modelo de regresón en el cual la varable dependente Y consste de conteos. El modelo de regresón ajustado
Más detallesAnálisis de Weibull. StatFolio de Muestra: Weibull analysis.sgp
Análss de Webull Resumen El procedmento del Análss de Webull está dseñado para ajustar una dstrbucón de Webull a un conjunto de n observacones. Es comúnmente usado para analzar datos representando tempos
Más detallesModelos unifactoriales de efectos aleatorizados
Capítulo 4 Modelos unfactorales de efectos aleatorzados En el modelo de efectos aleatoros, los nveles del factor son una muestra aleatora de una poblacón de nveles. Este modelo surge ante la necesdad de
Más detallesDe factores fijos. Mixto. Con interacción Sin interacción. No equilibrado. Jerarquizado
Análss de la varanza con dos factores. Introduccón Hasta ahora se ha vsto el modelo de análss de la varanza con un factor que es una varable cualtatva cuyas categorías srven para clasfcar las meddas de
Más detallesApéndice A: Metodología para la evaluación del modelo de pronóstico meteorológico
Apéndce A: Metodología para la evaluacón del modelo de pronóstco meteorológco Apéndce A: Metodología para la evaluacón del modelo de pronóstco meteorológco Tabla de contendos Ap.A Apéndce A: Metodología
Más detallesENCUESTA ESTRUCTURAL DE TRANSPORTE POR CARRETERA AÑO CONTABLE 2011 INSTITUTO NACIONAL DE ESTADÍSTICAS
METODOLOGÍA ENCUESTA ESTRUCTURAL DE TRANSPORTE POR CARRETERA AÑO CONTABLE 0 INSTITUTO NACIONAL DE ESTADÍSTICAS 03 ÍNDICE I. METODOLOGÍA ENCUESTA ESTRUCTURAL DE TRANSPORTE INTERURBANO DE PASAJEROS POR CARRETERA.
Más detallesTema 3. Estadísticos univariados: tendencia central, variabilidad, asimetría y curtosis
Tema. Estadístcos unvarados: tendenca central, varabldad, asmetría y curtoss 1. MEDIDA DE TEDECIA CETRAL La meda artmétca La medana La moda Comparacón entre las meddas de tendenca central. MEDIDA DE VARIACIÓ
Más detallesReconciliación de datos experimentales. MI5022 Análisis y simulación de procesos mineralúgicos
Reconclacón de datos expermentales MI5022 Análss y smulacón de procesos mneralúgcos Balances Balances en una celda de flotacón En torno a una celda de flotacón (o un crcuto) se pueden escrbr los sguentes
Más detallesMedidas de centralización
1 Meddas de centralzacón Meda Datos no agrupados = x X = n = 0 Datos agrupados = x X = n = 0 Medana Ordenamos la varable de menor a mayor. Calculamos la columna de la frecuenca relatva acumulada F. Buscamos
Más detallesCapitalización y descuento simple
Undad 2 Captalzacón y descuento smple 2.1. Captalzacón smple o nterés smple 2.1.1. Magntudes dervadas 2.2. Intereses antcpados 2.3. Cálculo de los ntereses smples. Métodos abrevados 2.3.1. Método de los
Más detallesEfectos fijos o aleatorios: test de especificación
Cómo car?: Montero. R (2011): Efectos fjos o aleatoros: test de especfcacón. Documentos de Trabajo en Economía Aplcada. Unversdad de Granada. España Efectos fjos o aleatoros: test de especfcacón Roberto
Más detallesT. 9 El modelo de regresión lineal
1 T. 9 El modelo de regresón lneal 1. Conceptos báscos sobre el análss de regresón lneal. Ajuste de la recta de regresón 3. Bondad de ajuste del modelo de regresón Modelos predctvos o de regresón: la representacón
Más detallesPoblación: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.
Tema 9 - Estadístca - Matemátcas B 4º E.S.O. 1 TEMA 9 - ESTADÍSTICA 9.1 DOS RAMAS DE LA ESTADÍSTICA 9.1.1 - INTRODUCCIÓN La estadístca tene por objeto el desarrollo de técncas para el conocmento numérco
Más detallesTema 4: Variables aleatorias
Estadístca 46 Tema 4: Varables aleatoras El concepto de varable aleatora surge de la necesdad de hacer más manejables matemátcamente los resultados de los expermentos aleatoros, que en muchos casos son
Más detallesComparación entre distintos Criterios de decisión (VAN, TIR y PRI) Por: Pablo Lledó
Comparacón entre dstntos Crteros de decsón (, TIR y PRI) Por: Pablo Lledó Master of Scence en Evaluacón de Proyectos (Unversty of York) Project Management Professonal (PMP certfed by the PMI) Profesor
Más detallesLECTURA 07: MEDIDAS DE TENDENCIA CENTRAL (PARTE II) LA MEDIANA Y LA MODA TEMA 17: LA MEDIANA Y LA MODA
LECTURA 07: MEDIDAS DE TENDENCIA CENTRAL (PARTE II) LA MEDIANA Y LA MODA TEMA 17: LA MEDIANA Y LA MODA. LA MEDIANA: Es una medda de tendenca central que dvde al total de n observacones debdamente ordenadas
Más detallesREGRESION LINEAL SIMPLE
REGREION LINEAL IMPLE Jorge Galbat Resco e dspone de una mustra de observacones formadas por pares de varables: (x 1, y 1 ) (x, y ).. (x n, y n ) A través de esta muestra, se desea estudar la relacón exstente
Más detallesOrganización y resumen de datos cuantitativos
Organzacón y resumen de datos cuanttatvos Contendos Organzacón de datos cuanttatvos: dagrama de tallos y hojas, tablas de frecuencas. Hstogramas. Polígonos. Ojvas ORGANIZACIÓN Y RESUMEN DE DATOS CUANTITATIVOS
Más detallesAPLICACIÓN DEL ANALISIS INDUSTRIAL EN CARTERAS COLECTIVAS DE VALORES
APLICACIÓN DEL ANALISIS INDUSTRIAL EN CARTERAS COLECTIVAS DE VALORES Documento Preparado para la Cámara de Fondos de Inversón Versón 203 Por Rodrgo Matarrta Venegas 23 de Setembre del 204 2 Análss Industral
Más detallesTEMA 3. VARIABLE ALEATORIA
TEMA 3. VARIABLE ALEATORIA 3.. Introduccón. 3... Dstrbucón de Probabldad de una varable aleatora 3... Funcón de Dstrbucón de una varable aleatora 3.. Varable aleatora dscreta 3... Funcón masa de probabldad
Más detallesTÉCNICAS AUXILIARES DE LABORATORIO
TÉCNICAS AUXILIARES DE LABORATORIO I.- ERRORES 1.- Introduccón Todas las meddas epermentales venen afectadas de una mprecsón nherente al proceso de medda. Puesto que en éste se trata, báscamente, de comparar
Más detallesTema 1: Análisis de datos unidimensionales
Tema : Análss de datos undmensonales. Varables estadístcas undmensonales. Representacones gráfcas.. Característcas de las dstrbucones de frecuencas undmensonales.. Varables estadístcas undmensonales. Representacones
Más detallesMETODOLOGÍA MUESTRAL ENCUESTA A LAS PEQUEÑAS Y MEDIANAS EMPRESAS
SUBDIRECCIÓN TÉCNICA DEPARTAMENTO DE INVESTIGACIÓN Y DESARROLLO ÁREA DE ANÁLISIS ESTADÍSTICAS ECONÓMICAS METODOLOGÍA MUESTRAL ENCUESTA A LAS PEQUEÑAS Y MEDIANAS EMPRESAS Santago, Enero de 2008. Departamento
Más detallesMedia es la suma de todas las observaciones dividida por el tamaño de la muestra.
Estadístcos Los estadístcos son valores calculados con los datos de una varable cuanttatva y que mden alguna de las característcas de la dstrbucón muestral. Las prncpales característcas son: tendenca central,
Más detalles1. Lección 7 - Rentas - Valoración (Continuación)
Apuntes: Matemátcas Fnanceras 1. Leccón 7 - Rentas - Valoracón (Contnuacón) 1.1. Valoracón de Rentas: Constantes y Dferdas 1.1.1. Renta Temporal y Pospagable En este caso, el orgen de la renta es un momento
Más detallesRegresión y correlación simple 113
Regresón y correlacón smple 113 Captulo X ANALISIS DE REGRESION Y CORRELACION El análss de regresón consste en emplear métodos que permtan determnar la mejor relacón funconal entre dos o más varables concomtantes
Más detallesMaestría en Administración. Medidas Descriptivas. Formulario e Interpretación. Dr. Francisco Javier Cruz Ariza
Maestría en Admnstracón Meddas Descrptvas Formularo e Interpretacón Dr. Francsco Javer Cruz Arza A contnuacón mostramos el foco de atencón de las dstntas meddas que abordaremos en el presente manual. El
Más detallesTema 8 - Estadística - Matemáticas CCSSI 1º Bachillerato 1
Tema 8 - Estadístca - Matemátcas CCSSI 1º Bachllerato 1 TEMA 8 - ESTADÍSTICA 8.1 NOCIONES GENERALES DE ESTADÍSTICA 8.1.1 INTRODUCCIÓN Objetvo: La estadístca tene por objeto el desarrollo de técncas para
Más detallesLECTURA 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) LA MEDIA ARITMÉTICA TEMA 15: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION
Unversdad Católca Los Ángeles de Chmbote LECTURA 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) LA MEDIA ARITMÉTICA TEMA 15: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION 1. DEFINICION: Las meddas estadístcas
Más detallesTEMA 8: PRÉSTAMOS ÍNDICE
TEM 8: PRÉSTMOS ÍNDICE 1. CONCEPTO DE PRÉSTMO: SISTEMS DE MORTIZCIÓN DE PRÉSTMOS... 1 2. NOMENCLTUR PR PRÉSTMOS DE MORTIZCIÓN FRCCIOND... 3 3. CUDRO DE MORTIZCIÓN GENERL... 3 4. MORTIZCIÓN DE PRÉSTMO MEDINTE
Más detallesEconomía de la Empresa: Financiación
Economía de la Empresa: Fnancacón Francsco Pérez Hernández Departamento de Fnancacón e Investgacón de la Unversdad Autónoma de Madrd Objetvo del curso: Dentro del contexto de Economía de la Empresa, se
Más detallesESTADÍSTICA BIDIMENSIONAL ÍNDICE GENERAL
ESTADÍSTICA BIDIMESIOAL ÍDICE GEERAL 1.-Varable Estadístca Bdmensonal. Tablas de frecuenca... 1.1.- Concepto de varable estadístca bdmensonal. Eemplos.... 1..-Tablas bdmensonales de frecuencas. Tablas
Más detallesTERMODINÁMICA DEL EQUILIBRIO CAPÍTULO V. EQUILIBRIO DE REACCIÓN QUÍMICA
Ing. Federco G. Salazar Termodnámca del Equlbro TERMODINÁMICA DEL EQUILIBRIO CAPÍTULO V. EQUILIBRIO DE REACCIÓN QUÍMICA Contendo 1. Conversón y Coordenada de Reaccón. 2. Ecuacones Independentes y Regla
Más detallesCENTRO DE ESTUDIOS ESTADÍSTICOS DE JUSTICIA CONSTITUCIONAL
CENTRO DE ESTUDIOS ESTADÍSTICOS DE JUSTICIA CONSTITUCIONAL Ajuste de modelo de regresón logístca para la medcón de accón de tutela como factor de congestón de los Trbunales y Juzgados de las Jursdccones
Más detallesCAPÍTULO 7 ESTIMACIÓN DE PARÁMETROS
CAPÍTULO 7 ESTIMACIÓN DE PARÁMETROS En los capítulos anterores se han analzado varos modelos usados en la evaluacón de stocks, defnéndose los respectvos parámetros. En las correspondentes fchas de ejerccos
Más detallesTEMA 1: PROBABILIDAD
robabldad TEM : ROBBILIDD Índce del tema Índce del tema.. Introduccón 2.2. Defncón de probabldad 3.2.. ropedades nmedatas 3 Ejemplo 7 Ejemplo 2 8 Ejemplo 3 9.3. robabldad condconada 0.3.. Introduccón 0.3.2.
Más detallesModelos de elección simple y múltiple. Regresión logit y probit. Modelos multilogit y multiprobit.
Modelos de eleccón smple y múltple. Regresón logt y probt. Modelos multlogt y multprobt. Sga J.Muro(14/4/2004) 2 Modelos de eleccón dscreta. Modelos de eleccón smple. Modelos de eleccón múltple. Fnal J.Muro(14/4/2004)
Más detallesTERMODINÁMICA AVANZADA
TERMODINÁMICA AVANZADA Undad III: Termodnámca del Equlbro Ecuacones para el coefcente de actvdad Funcones de eceso para mezclas multcomponentes 9/7/0 Rafael Gamero Funcones de eceso en mezclas bnaras Epansón
Más detallesDiseño de la Muestra. Introducción. Tipo de muestreo y estratificación
Dseño de la Muestra A Introduccón Sguendo las orentacones dadas por la Ofcna Estadístca de la Unón Europea (EUROSTAT) se a selecconado una muestra probablístca representatva de la poblacón de los ogares
Más detallesPROBABILIDAD Y ESTADÍSTICA
PROBABILIDAD Y ESTADÍSTICA 1. S A es un suceso de probabldad 0.3, la probabldad de su suceso contraro es: a) 0. b) 1.0 c) 0.7 (Convocatora juno 006. Eamen tpo H) S A es un suceso, la probabldad de su suceso
Más detallesLa adopción y uso de las TICs en las Microempresas Chilenas
Subdreccón Técnca Depto. Investgacón y Desarrollo Estadístco Subdreccón de Operacones Depto. Comerco y Servcos INFORME METODOLÓGICO DISEÑO MUESTRAL La adopcón y uso de las TICs en las Mcroempresas Clenas
Más detallesRegresión Lineal Simple y Correlación
4 Regresón Lneal Smple y Correlacón 4.1. Fundamentos teórcos 4.1.1. Regresón La regresón es la parte de la estadístca que trata de determnar la posble relacón entre una varable numérca, que suele llamarse
Más detallesCAPITULO 3.- ANÁLISIS CONJUNTO DE DOS VARIABLES. 3.1 Presentación de los datos. Tablas de doble entrada.
Introduccón a la Estadístca Empresaral Capítulo - Análss conjunto de dos varables Jesús ánchez Fernández CAPITULO - AÁLII COJUTO DE DO VARIABLE Presentacón de los datos Tablas de doble entrada En el capítulo
Más detallesLECTURA N 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) TEMA 14: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION
Unversdad Católca Los Ángeles de Chmbote LECTURA N 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) TEMA 4: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION. DEFINICION Las meddas estadístcas son meddas de resumen
Más detallesModelos triangular y parabólico
Modelos trangular y parabólco ClassPad 0 Prof. Jean-Perre Marcallou INTRODUCCIÓN La calculadora CASIO ClassPad 0 dspone de la Aplcacón Prncpal para realzar los cálculos correspondentes a los modelos trangular
Más detallesDiseño y Análisis de Experimentos en el SPSS 1
Dseño y Análss de Expermentos en el SPSS EJEMPLO. Los sguentes datos muestran las meddas de hemoglobna (gramos por 00 ml) en la sangre de 40 ejemplares de una espece de truchas marrones. Las truchas se
Más detallesCESMA BUSINESS SCHOOL
CESMA BUSINESS SCHOOL MATEMÁTICAS FINANCIERAS. TEMA 4 RENTAS y MÉTODOS DE AMORTIZACIÓN Javer Blbao García 1 1.- Introduccón Defncón: Conjunto de captales con vencmentos equdstantes de tempo. Para que exsta
Más detallesTEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE
TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE LECTURA OBLIGATORIA Regresón Lneal Múltple. En Ral, A. y Varela, J. (008). Estadístca Práctca para la Investgacón en Cencas de la Salud. Coruña: Netbblo.
Más detallesPruebas Estadísticas de Números Pseudoaleatorios
Pruebas Estadístcas de Números Pseudoaleatoros Prueba de meda Consste en verfcar que los números generados tengan una meda estadístcamente gual a, de esta manera, se analza la sguente hpótess: H 0 : =
Más detallesFugacidad. Mezcla de gases ideales
Termodnámca del equlbro Fugacdad. Mezcla de gases deales rofesor: Alí Gabrel Lara 1. Fugacdad 1.1. Fugacdad para gases Antes de abarcar el caso de mezclas de gases, debemos conocer como podemos relaconar
Más detallesAnálisis de error y tratamiento de datos obtenidos en el laboratorio
Análss de error tratamento de datos obtendos en el laboratoro ITRODUCCIÓ Todas las meddas epermentales venen afectadas de una certa mprecsón nevtable debda a las mperfeccones del aparato de medda, o a
Más detallesOPERACIONES ARMONIZACION DE CRITERIOS EN CALCULO DE PRECIOS Y RENDIMIENTOS
P L V S V LT R A BANCO DE ESPAÑA OPERACIONES Gestón de la Informacón ARMONIZACION DE CRITERIOS EN CALCULO DE PRECIOS Y RENDIMIENTOS El proceso de ntegracón fnancera dervado de la Unón Monetara exge la
Más detallesEJERCICIOS RESUELTOS TEMA 2
EJERCICIOS RESUELTOS TEMA.1. La Moda, para el grupo de Varones de la Tabla 1, es: A) 4,5; B) 17; C) 60.. Con los datos de la Tabla 1, la meda en para las Mujeres es: A) gual a la meda para los Varones;
Más detallesUNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS FACULTAD DE CIENCIAS MATEMÁTICAS E.A.P. DE..ESTADÍSTICA La fecunddad y su relacón con varables socoeconómcas, demográfcas y educatvas aplcando el Modelo de Regresón
Más detallesGANTT, PERT y CPM INDICE
GANTT, PERT y CPM INDICE 1 Antecedentes hstórcos...2 2 Conceptos báscos: actvdad y suceso...2 3 Prelacones entre actvdades...3 4 Cuadro de prelacones y matrz de encadenamento...3 5 Construccón del grafo...4
Más detallesUna renta fraccionada se caracteriza porque su frecuencia no coincide con la frecuencia de variación del término de dicha renta.
Rentas Fnanceras. Renta fracconada 6. RETA FRACCIOADA Una renta fracconada se caracterza porque su frecuenca no concde con la frecuenca de varacón del térmno de dcha renta. Las característcas de la renta
Más detallesFIABILIDAD (V): COMPARACIÓN (NO PARAMÉTRICA) DE MUESTRAS
FIABILIDAD (V): COMPARACIÓN (NO PARAMÉTRICA) DE MUESTRAS Autores: Ángel A Juan Pérez (ajuanp@uocedu), Rafael García Martín (rgarcamart@uocedu) RELACIÓN CON OTROS MATH-BLOCS Este math-block forma parte
Más detallesIES Menéndez Tolosa (La Línea) Física y Química - 1º Bach - Gráficas
IES Menéndez Tolosa (La Línea) Físca y Químca - 1º Bach - Gráfcas 1 Indca qué tpo de relacón exste entre las magntudes representadas en la sguente gráfca: La gráfca es una línea recta que no pasa por el
Más detallesTratamiento de datos experimentales. Teoría de errores
Tratamento de datos expermentales. Teoría de errores. Apéndce II Tratamento de datos expermentales. Teoría de errores (Fuente: Práctcas de Laboratoro: Físca, Hernández et al., 005) El objetvo de la expermentacón
Más detallesTasas de Caducidad. - Guía de Apoyo para la Construcción y Aplicación - Por: Act. Pedro Aguilar Beltrán. paguilar@cnsf.gob.mx
Tasas de Caducdad - Guía de Apoyo para la Construccón y Aplcacón - Por: Act. Pedro Agular Beltrán pagular@cnsf.gob.m 1. Introduccón La construccón y aplcacón de tasas de caducdad en el cálculo de utldades
Más detallesANEXO METODOLOGÍA EVALUACIÓN DE IMPACTO
GOBIERNO DE CHILE MINISTERIO DE HACIENDA Dreccón de Presupuestos ANEXO METODOLOGÍA EVALUACIÓN DE IMPACTO Dvsón de Control de Gestón Santago, Mayo 2009 CHILE PRESENTACIÓN * El anexo que a contnuacón se
Más detallesElectricidad y calor
Electrcdad y calor Webpage: http://pagnas.sca.uson.mx/qb 2007 Departamento de Físca Unversdad de Sonora Temas 4. Prmera ley de la Termodnámca.. Concepto de Trabajo aplcado a gases.. Trabajo hecho por un
Más detallesUNIVERSIDAD DE GUADALAJARA, CUCEI DEPARTAMENTO DE ELECTRÓNICA LABORATORIO DE ELECTRÓNICA II
UNIVERSIDAD DE GUADALAJARA, CUCEI DEPARTAMENTO DE ELECTRÓNICA LABORATORIO DE ELECTRÓNICA II PRACTICA 11: Crcutos no lneales elementales con el amplfcador operaconal OBJETIVO: El alumno se famlarzará con
Más detallesElaboración de Tablas ó Cuadros. La elaboración de tablas o cuadros, facilita el análisis y la presentación de la información.
Elaboracón de Tablas ó Cuadros La elaboracón de tablas o cuadros, faclta el análss la presentacón de la nformacón. Para elaborar los cuadros, se debe, antes que todo, dentfcar las varables, característcas
Más detalles8 MECANICA Y FLUIDOS: Calorimetría
8 MECANICA Y FLUIDOS: Calormetría CONTENIDOS Dencones. Capacdad caloríca. Calor especíco. Equlbro térmco. Calormetría. Calorímetro de las mezclas. Marcha del calorímetro. Propagacón de Errores. OBJETIVOS
Más detallesElectricidad y calor. Un repaso... Temas. 4. Primera ley de la Termodinámica. Webpage: Algunas definiciones
Electrcdad y calor Webpage: http://pagnas.sca.uson.mx/qb 2007 Departamento de Físca Unversdad de Sonora Temas 4. Prmera ley de la Termodnámca.. Concepto de Trabajo aplcado a gases.. Trabajo hecho por un
Más detalles3. Algunos modelos estadísticos
3. Algunos modelos estadístcos Con las herramentas computaconales a nuestra dsposcón, en las sguentes seccones se revsarán algunos de los modelos estadístcos más usados en la práctca y la forma de hacer
Más detalles4 Contraste de hipótesis en el modelo de regresión múltiple
4 Contraste de hpótess en el modelo de regresón múltple Ezequel Urel Unversdad de Valenca Versón: 9-13 4.1 El contraste de hpótess: una panorámca 1 4.1.1 Formulacón de la hpótess nula y de la hpótess alternatva
Más detallesMaestría en Economía Facultad de Ciencias Económicas Universidad Nacional de La Plata TESIS DE MAESTRIA. ALUMNO Laura Carella. DIRECTOR Alberto Porto
Maestría en Economía Facultad de Cencas Económcas Unversdad Naconal de La Plata TESIS DE MAESTRIA ALUMNO Laura Carella TITULO Educacón unverstara: medcón del rendmento académco a través de fronteras de
Más detallesCAPÍTULO 3 METODOLOGÍA. En el siguiente capítulo se presenta al inicio, definiciones de algunos conceptos actuariales
CAPÍTULO 3 METODOLOGÍA En el sguente capítulo se presenta al nco, defncones de algunos conceptos actuarales que se utlzan para la elaboracón de las bases técncas del Producto de Salud al gual que la metodología
Más detallesOferta de Trabajo Parte 2. Economía Laboral Julio J. Elías LIE - UCEMA
Oferta de Trabajo Parte 2 Economía Laboral Julo J. Elías LIE - UCEMA Curva de oferta de trabajo ndvdual Consumo Salaro por hora ($) G w=$20 F w=$25 25 Curva de Oferta de Trabajo Indvdual w=$14 20 14 w
Más detallesVisión moderna del modelo de transporte clásico
Vsón moderna del modelo de transporte clásco Zonfcacón y Red Estratégca Datos del Año Base Datos de Planfcacón Para el Año de Dseño Base de Datos año base futuro Generacón de Vajes Demanda Dstrbucón y
Más detallesUNIVERSIDAD CARLOS III DE MADRID Ingeniería Informática Examen de Investigación Operativa 21 de enero de 2009
UNIVERSIDAD CARLOS III DE MADRID Ingenería Informátca Examen de Investgacón Operatva 2 de enero de 2009 PROBLEMA. (3 puntos) En Murca, junto al río Segura, exsten tres plantas ndustrales: P, P2 y P3. Todas
Más detallesMATEMÁTICAS para estudiantes de primer curso de facultades y escuelas técnicas
Unversdad de Cádz Departamento de Matemátcas MATEMÁTICAS para estudantes de prmer curso de facultades y escuelas técncas Tema 13 Dstrbucones bdmensonales. Regresón y correlacón lneal Elaborado por la Profesora
Más detalles