Epidat 4: Ayuda de Regresión logística. Octubre REGRESIÓN LOGÍSTICA.

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Epidat 4: Ayuda de Regresión logística. Octubre REGRESIÓN LOGÍSTICA."

Transcripción

1 Epdat 4: Ayuda de Regresón logístca. Octubre 014. REGRESIÓN LOGÍSTICA

2 Epdat 4: Ayuda de Regresón logístca. Octubre 014. ÍNDICE Conceptos generales El modelo logístco Cocente de verosmltudes Varables dummy Ajuste del modelo Caldad del ajuste Recomendacones generales Manejo del módulo Manejo básco Datos tabulados Opcones adconales Valdacón Predccón Ejemplos Bblografía Anexo 1: Novedades del módulo de regresón logístca Anexo : Fórmulas del módulo de regresón logístca... 35

3 Epdat 4: Ayuda de Regresón logístca. Octubre Conceptos generales Entre los propóstos de muchas nvestgacones epdemológcas se halla el establecmento de las leyes que rgen el desenvolvmento de las enfermedades. El examen se realza típcamente en un marco complejo, donde la coexstenca de factores mutuamente relaconados determna el comportamento de otros. Para sondear o ncluso desentrañar la naturaleza de tales relacones, el nvestgador puede auxlarse, entre otras alternatvas, del análss de regresón. La regresón logístca (RL) es la varante de la regresón que corresponde al caso en que se valora la contrbucón de dferentes factores en la ocurrenca de un evento smple. En general, la RL es adecuada cuando la varable de respuesta (llamémosle Y en lo sucesvo) es poltómca (admte varas categorías de respuesta, tales como MEJORA MUCHO, MEJORA, SE MANTIENE IGUAL, EMPEORA, EMPEORA MUCHO); pero es especalmente útl cuando solo hay dos posbles desenlaces (cuando la varable de respuesta es dcotómca), que es el caso más común. Es lo que ocurre, por ejemplo, en las sguentes stuacones: el pacente hosptalzado muere o sobrevve durante las prmeras 48 horas de su ngreso, el organsmo acepta o no un órgano trasplantado, se produjo o no un ntento sucda antes de los 60 años, etc.. En cada uno de estos ejemplos puede desearse la construccón de un modelo que exprese la probabldad de ocurrenca del evento de que se trate en funcón de un conjunto de varables ndependentes. La varable Y se codfca de certa manera, por ejemplo como 1 s se produce certo desenlace, y como 0 en caso opuesto, de modo que la RL expresa P(Y=1) en funcón de certas varables relevantes a los efectos del problema que se haya planteado. La fnaldad con que se construye ese modelo no es únca; báscamente, hay tres propóstos posbles: que se trate de una mera contrbucón a la descrpcón de certo proceso, que se aplque en la búsqueda de explcacones causales o para la construccón de un modelo para la predccón. La RL es una de las técncas estadístco-nferencales más empleadas en la produccón centífca contemporánea. Surge en la década del 60 con la aparcón del trabajo de Cornfeld, Gordon y Smth [1] sobre el resgo de padecer una enfermedad coronara que consttuye su prmera aplcacón práctca trascendente. Su generalzacón dependía de la solucón que se dera al problema de la estmacón de los coefcentes. El algortmo de Walker-Duncan [] para la obtencón de los estmadores de máxma verosmltud vno a soluconar en parte este problema, pero era de naturaleza tal que el uso de computadoras resultaba mprescndble. De su amplo y crecente empleo han dado cuenta varas revsones. Slva, Pérez y Cuellar [3] consgnan que ésta fue la técnca estadístca más usada entre los artículos publcados por Amercan Journal of Epdemology entre 1986 y 1990 (cas 3 de cada 10 trabajos allí publcados). Levy y Stolte [4] llevaron a cabo un estudo para caracterzar la tendenca en el uso de métodos estadístcos surgdos (entre los 60 y los 70) y que, además, huberan tendo un mpacto consderable en el análss de datos bomédcos; entre ellos fgura la regresón logístca. En PUBMED, base de datos que contene referencas bblográfcas y resúmenes de mles de las connotadas revstas bomédcas de habla nglesa y contene más de mllones de ctacones, se encontró en juno de 013 que el crecmento en el uso de la RL a lo largo de los últmos trenta años ha sdo espectacular: los artículos publcados que hacen mencón al térmno logstc regresson son, para sete años selecconados, como muestra la Tabla 1:

4 Epdat 4: Ayuda de Regresón logístca. Octubre 014. Tabla 1. Número de artículos de PUBMED que emplearon la expresón logstc regresson para años selecconados. Año Número de artículos Como se lustra más adelante, una de las razones que confere especal nterés a la regresón logístca en el marco epdemológco es que con ella se pueden controlar varas varables potencalmente confusoras (de cualquer naturaleza) a la vez. Este rasgo es especalmente atractvo en el marco observaconal, pues en el de los ensayos clíncos, tal control lo ejerce la aleatorzacón, elemento naplcable en los estudos de cohorte o de casos y controles. Hasta que el uso de la RL se generalzó (gracas a las computadoras personales), el recurso al que se podía apelar era la realzacón de análss estratfcados de las asocacones entre posbles causas y efectos, un procedmento artesanal y sumamente lmtado del que ahora puede prescndrse por entero El modelo logístco El problema que resuelve la regresón logístca es expresar la probabldad de certo desenlace (Y=1) en funcón de r varables X 1, X X r las cuales pueden ser de cualquer naturaleza (contnuas, dscretas, dcotómcas, ordnales o nomnales, aunque en este últmo caso han de manejarse a través de varables dummy, como se explca debajo). Concretamente, el resultado fundamental del programa consste en hallar los coefcentes β 0, β 1 β r, que mejor se ajustan a la sguente representacón funconal: P Y 1) 1 exp 1 X r X r donde exp(.) representa la funcón exponencal Cocente de verosmltudes Para que un modelo sea consderado adecuado, éste debe atrbur una alta probabldad de que se produzca el desenlace de nterés a aquellos sujetos para los cuales, efectvamente, se tene Y=1 y vceversa. Por tanto, una medda razonable para valorar el grado en que el modelo arroja resultados coherentes con los datos usados para su construccón sería el producto de todas las probabldades (predchas por el modelo) de que los n sujetos de la muestra empleada para su construccón tengan la condcón que realmente tenen. S se llama p a la probabldad estmada por el modelo de que el -ésmo sujeto tenga certa condcón, y tenemos que d ndvduos tenen la condcón, se puede computar la expresón sguente: V p p p 1 p 1 p... p 1... d d 1 d 1 n donde los prmeros d factores corresponden a sujetos con la condcón y los restantes n-d a los que no la tenen. La magntud V un número sempre mayor que 0- es conocda como la verosmltud del modelo. A un modelo completamente extoso, el cual atrbuya una probabldad de tener la condcón

5 Epdat 4: Ayuda de Regresón logístca. Octubre 014. gual a 1 a cada sujeto que realmente la tenga y de 0 a cada sujeto lbre de ella, correspondería una verosmltud máxma de 1; por el contraro, un modelo defcente tendría una verosmltud pequeña, cercana a 0. En consecuenca, la proxmdad de la verosmltud a 1 expresa cuán efcente ha sdo el ajuste realzado para modelar la realdad [5]. Debdo a que la funcón de verosmltud mde la plausbldad de un modelo de regresón logístca, no debe sorprender que para valorar su capacdad predctva sea central la consderacón de la verosmltud; es decr, de la magntud V antes ntroducda. Concretamente, se suele emplear la expresón: L lnv A esta transformacón se le conoce como lejanía del modelo (devance en nglés). Nótese que, sendo V<1, su logartmo sempre será negatvo; de modo que la lejanía L sempre será un número postvo. El grado de ajuste de un modelo será mejor cuanto más próxma a 1 es la verosmltud y, en consecuenca, cuanto más se aproxma a cero la lejanía. Sempre que se ajusta un modelo, el algortmo de la regresón logístca computa dos lejanías: la que corresponde propamente al modelo que se ha ajustado (L), y la que corresponde al modelo nulo (L 0) que es aquel en que no se ha ncorporado nnguna varable ndependente. La lejanía del modelo nulo es más grande que la de cualquer modelo amplado. Esto es razonable, debdo a que se trata de un modelo mucho menos sofstcado (que no ncorpora nformacón alguna de posbles varables explcatvas ) y debe necesaramente tener una ncapacdad predctva mayor. La dferenca entre estas lejanías mde el aporte que hacen las varables ncorporadas al modelo. Es decr, para valorar dcho aporte se puede calcular el cocente o razón de verosmltudes: V0 CV L0 L ln V0 ln V ln 0 ln V V V CV es un estadístco de gran relevanca, ya que tene una nterpretacón clara y debdo a que se conoce que se dstrbuye J-cuadrado con r grados de lbertad, donde r es el número de varables presentes en el modelo amplado. En general, esta razón de verosmltudes es útl para determnar s hay una dferenca sgnfcatva entre nclur en el modelo todas las varables y no nclur nnguna; o, dcho de otro modo: RV srve para valorar s las varables X 1, X X r tomadas en conjunto, contrbuyen efectvamente a "explcar" las modfcacones que se producen en P(Y=1). Tambén es útl porque permte valorar el aporte atrbuble a certo conjunto de varables adconadas a las de un prmer ajuste. En efecto, s se ajusta un modelo que produce certo valor CV 1 y se ajusta otro al que se agregaron h varables, el cual produce un cocente CV, entonces CV -CV 1 se dstrbuye J-cuadrado con h grados de lbertad, lo cual permte evaluar s la adcón de las h varables hace un aporte sgnfcatvo.

6 Epdat 4: Ayuda de Regresón logístca. Octubre Varables dummy Las varables explcatvas de tpo nomnal deben ser ncludas en el modelo señalando que tenen esa condcón. Se trata de varables que no son numércas (v.g. estado cvl o raza) o que, aunque los valores que contene aparezcan como números, son en realdad códgos o se queren manejar como tales (por ejemplo, s se asgna el valor 1 para ndcar que se trata de un sujeto soltero, el valor para un dvorcado, etc.). Supongamos que la varable en cuestón tene k clases o categorías (donde k ). Epdat 4 construye automátcamente k-1 varables dummy para manejar esta stuacón. Brevemente dcho, el sentdo de las varables dummy es el sguente: supóngase que certa varable es nomnal (raza, relgón profesada, grupo sanguíneo, etc.) y consta de k categorías; se crean entonces k-1 varables dcotómcas, que son las llamadas varables dummy asocadas a esta varable nomnal y que se denotarán por Z 1, Z,..., Z k-1. A cada categoría o clase de la varable nomnal le corresponde un conjunto de valores de los Z con el cual se dentfca dcha clase. La manera más usual de defnr estas k-1 varables es la sguente: s el sujeto pertenece a la prmera categoría, entonces las k-1varables dummy valen 0: se tene Z 1= Z =...= Z k-1=0; s el sujeto se halla en la segunda categoría, entonces Z 1=1 y las restantes valen 0; Z vale 1 solo para aquellos ndvduos que están en la tercera categoría, en cuyo caso las otras varables asumen el valor 0, y así sucesvamente hasta llegar a la últma categoría, para la cual Z k-1 es la únca que vale 1. Para más detalles, véase Slva [6]. Por ejemplo, s la varable nomnal de nterés es el grupo sanguíneo, la cual tene k = 4 categorías (sangre tpo A, tpo AB y tpo B y tpo O), entonces se tendrían los sguentes valores de las 3 varables dummy para cada grupo sanguíneo: Varable nomnal (grupo sanguíneo) Z 1 Z Z 3 A AB B O En cualquer caso, s se ajusta un modelo que ncluya una varable nomnal con k clases, esta será susttuda por las k-1 varables dummy, y a cada una de ellas corresponderá su respectvo coefcente. A estos efectos, Epdat ordenará las categorías alfabétcamente Ajuste del modelo Caldad del ajuste Sempre que se quere obtener un modelo de regresón, de cualquer tpo, una precaucón mportante a los efectos de sacar conclusones es la de corroborar que este modelo se ajusta efectvamente a los datos usados. La RL no es una excepcón. Es ben conocdo que, en el contexto de la regresón lneal múltple, se suele emplear el llamado coefcente de determnacón (R ) para cuantfcar medante una únca medda, con cotas nterpretables, el grado de explcacón de la varabldad de la varable de respuesta consegudo con el modelo por parte de las varables ndependentes. Varas sugerencas se han hecho para obtener algo smlar en el marco de la RL. Sn embargo, no hay una opnón

7 Epdat 4: Ayuda de Regresón logístca. Octubre 014. unánme sobre cuál podría ser la mejor. Epdat 4 ha ncorporado una, preferda por Mttlböck y Schemper [7] (quenes examnan 1 posbles medcones) a la que se denomna aquí, análogamente, coefcente de determnacón. R es un número que se halla necesaramente entre 0 y 1. Alcanza el valor 1 cuando el vatcno es perfecto (esto quere decr, que R alcanzaría el valor máxmo solo s el modelo atrbuyera probabldad 1 a aquellos sujetos de la muestra que efectvamente tuveron el evento, y valores guales a 0 a quenes no lo tuveron) y R se aproxma a 0 en la medda que las probabldades atrbudas por el modelo dsten más, respectvamente, de 1 y 0. Otros ndcadores que se han sugerdo con la msma fnaldad son el Coefcente de Cox y Snell y el Coefcente de Nagelkerke, los cuales son, en certo sentdo, varacones del prmero. Epdat 4 ofrece los tres ndcadores como salda regular. Cabe advertr, no obstante, que estos coefcentes no mden la bondad del ajuste (un concepto dferente al de varabldad explcada por el modelo ), la cual debe valorarse a través de las pruebas específcamente dseñadas con ese fn (en partcular, la prueba de Hosmer y Lemeshow [8]). Epdat 4 permte evaluar la caldad del ajuste del modelo estmado medante dcha prueba. El estadístco que ellos proponen se calcula a través de varos grupos empleando los decles de las probabldades predchas por el modelo, y comparando las frecuencas observadas en dchos grupos con las esperadas. S ben Epdat 4 realza una prueba de bondad de ajuste (PBA) formal en esta stuacón, procede recordar (véase Slva [9], epígrafe 6.6.1) que todos los modelos son mperfectos, aunque muchos de ellos resultan, no obstante, útles. Consecuentemente, resulta un poco absurdo que se consdere útl un modelo por el solo hecho de que no se ha poddo demostrar que es mperfecto o consderarlo nútl por el hecho de que tal mperfeccón se ha puesto de manfesto. S la hpótess nula afrma, como ocurre con las PBA, que los datos sguen certa dstrbucón, entonces sensu strctu dcha hpótess sempre es falsa; y por lo tanto se rechazará nexorablemente s la muestra es sufcentemente grande. A dferenca de lo que ocurre con otras pruebas de hpótess, en el caso de las PBA, el rechazo de la hpótess nula no es el desenlace deseado. De tal suerte, la mejor manera de consegur lo que se desea sería adoptar la absurda medda cautelar de no tomar una muestra demasado grande. Y vceversa, con una muestra sufcentemente grande, es altamente probable que consgamos rechazar la hpótess (aunque este es un problema presente en todas las pruebas de sgnfcacón). Sntetzando, el empleo de un test formal como el de Hosmer-Lemeshow, es cuestonable. Algunos autores sugeren smplemente nspecconar de manera nformal los valores esperados y los observados y, s las dferencas no son muy notables, admtr que el modelo es adecuado. En los modelos múltples puede ser nteresante ncorporar la nteraccón entre dos varables predctoras. Esto procede cuando se sospecha o se sabe que la nfluenca de una varable sobre la respuesta puede ser dferente en funcón de los valores que tome otra varable tambén ncluda en el modelo. Epdat 4 tene la lmtacón de no contemplar la posbldad de defnr nteraccones de forma automátca, pero esto se puede consegur por parte del usuaro defnendo prevamente el producto de las dos varables cuya nteraccón se desea nclur en el modelo como una varable predctora más. Véase Ejemplo 1. Naturalmente, esta dea puede extenderse a más varables; podrían ncorporarse térmnos que nvolucren a tres o más de ellas, pero esto es sumamente nusual.

8 Epdat 4: Ayuda de Regresón logístca. Octubre Recomendacones generales - Las varables explcatvas deben tener una relacón monótona con la probabldad del evento que se estuda. Vale decr, cuando el valor de una varable ndependente crece, la probabldad del desenlace ha de aumentar o de dsmnur (es decr, no ha de pasar de una tendenca a la opuesta en algún punto del recorrdo de la varable ndependente). - Las varables ndependentes nvolucradas en el modelo no deben estar muy correlaconadas entre sí. S la correlacón entre dos varables es alta, entonces los resultados de la RL son poco confables. Concretamente, los errores estándares se ncrementan ndebdamente y puede ocurrr, ncluso, que el proceso teratvo para la estmacón no converja. - Debe recordarse que el conjunto de varables dummy consttuye un todo ndsoluble con el cual se suple a una varable nomnal. Cualquer decsón que se adopte o valoracón que se haga concerne al conjunto íntegro (por ejemplo, s una de las varables dummy es sgnfcatva, entonces toda la varable nomnal lo es). - Es muy mportante dstngur entre un contexto explcatvo y uno predctvo. Debe tenerse en cuenta, en este caso, que una varable puede tener valor predctvo aunque no sea parte del mecansmo causal que produce el fenómeno en estudo. - En lo posble ha de procurarse que haya en la base al menos 10 sujetos con cada una de las respuestas posbles para la varable ndependente Manejo del módulo Manejo básco La entrada de la nformacón está conformada por una matrz con n flas (tamaño de la muestra) y r+1 columnas. Una de ellas ha de contener los datos correspondentes a una varable dependente (o de respuesta) dcotómca. Las restantes r columnas recogen la nformacón para respectvas varables ndependentes (tambén llamadas de entrada, explcatvas o predctoras dependendo del contexto). El usuaro ha de ndcar, para cada una de estas últmas s han de tratarse como numércas o como categórcas; en este últmo caso, Epdat 4 las manejará a través de la construccón de varables dummy. Las que estén en el prmer caso no pueden contener valores que no sean números. Las dcotómcas, naturalmente, son un caso partcular de las categórcas (poltómcas con dos categorías). Ya en ese punto, el programa puede proceder a producr el modelo estmado. Como en el resto de Epdat 4, el usuaro puede defnr un fltro para trabajar con un subconjunto de la muestra defndo por las condcones que mponga, basadas en restrccones para las varables que contenga el archvo que fue proveído Datos tabulados Ocasonalmente, algunos elementos de la muestra contenen exactamente la msma nformacón (un msmo perfl de entrada y un msmo desenlace). Dcho de otro modo, no necesaramente todas las flas de la matrz tenen que ser dferentes. En tal caso, la nformacón de entrada en el programa puede colocarse compactada (tabulada). Para ello debe crearse una varable numérca (que solo admtrá números enteros mayores que 0) que contenga la frecuenca de cada una de las flas dferentes. El usuaro ha de marcar la opcón

9 Epdat 4: Ayuda de Regresón logístca. Octubre 014. Tabla de frecuencas y declarar luego cuál es la varable que contene las frecuencas (véanse Ejemplos y 3) Opcones adconales Adconalmente, el usuaro puede solctar que Epdat 4 realce un test de bondad de ajuste y que calcule (y exhba) la curva ROC asocada. El usuaro tene dos opcones adconales: a) Pedr que se realce una valdacón del modelo. b) Aplcar el modelo a un conjunto de perfles para las varables de entrada Estas dos opcones se explcan a contnuacón Valdacón Como es ben conocdo, los modelos nunca consttuyen una fnaldad en sí msma. Todo modelo procura representar una realdad general, usando para ello nformacón específca que provene de ella. Para que su aplcacón sea fructuosa en otro contexto, sn embargo, el modelo debe ser valdado con datos procedentes de ese otro contexto. El acto de corroborar que tene este mérto (o sea, que hace las predccones que se supone que hace) se conoce como valdacón del modelo. Para ello se procede en esenca del modo sguente: a) Se construye el modelo usando una Muestra1 de tamaño n 1. b) Se busca una Muestra, ndependente de la prmera, de tamaño n, de la que tenemos toda la nformacón (tanto los datos de entrada X 1, X X r, como el valor de Y para cada uno de sus elementos). c) Se aplca el modelo menconado en a) a cada vector X 1, X X r de la Muestra y se obtenen n valores de Pˆ. d) Se valora el grado en que los n valores de Pˆ obtendos se parecen a los respectvos valores de Y. Nota: Ocasonalmente se nca el proceso con una muestra de tamaño n = n 1 + n. La Muestra1 resulta de una subseleccón smple aleatora de tamaño n 1 tomada de la muestra ncal, y la valdacón se realza usando la submuestra complementara. S la valdacón es extosa, entonces suele conformarse el modelo defntvo usando la muestra total. Tal procedmento, sn embargo, puede ser en certa medda objetado, pues, aunque la valdacón no se hace con la propa muestra creada para la confeccón del modelo, cabe esperar que el proceso sea favorecdo por el hecho de que ambas muestras serán parecdas. En cualquer caso, para realzar la valdacón ha de proveerse una nueva base de datos. El programa aplca el modelo que se acaba de construr a cada uno de los sujetos de dcha base. Con los verdaderos desenlaces acaecdos a ellos y con las estmacones resultantes de la aplcacón menconada, se aplca la prueba de bondad de ajuste de Hosmer y Lemeshow y luego se estma el número esperado de casos con la condcón medante la suma de las probabldades obtendas. La comparacón de los valores esperados bajo el modelo que se valda y los resultados objetvamente producdos, tanto en un caso como en el otro, permte conformar un juco sobre la valdez del modelo.

10 Epdat 4: Ayuda de Regresón logístca. Octubre 014. Nota cautelar: Cabe advertr que la segunda base de datos tene que contener todas las varables empleadas en la elaboracón ncal del modelo que se quere valdar. Por otra parte, puede ocurrr lo sguente: en la prmera base hay una varable declarada nomnal y en la segunda tambén comparece dcha varable, pero en esta últma aparece al menos un caso para el cual dcha varable adopta certo valor que no estaba presente en nnguno de los casos ncludos en la base orgnal (por ejemplo, en la prmera se tene el estado cvl y los sujetos que contene son casados, solteros o dvorcados, pero no hay nngún vudo; mentras que en la segunda base s aparece al menos un vudo). En esa stuacón, al realzarse la valdacón, Epdat elmna de la segunda base todos los casos donde se presente esta sngulardad (en el ejemplo, prescndrá de las flas en las que se declare que el sujeto es vudo) Predccón Conceptos generales Una vez construdo el modelo, se puede solctar a Epdat 4 la estmacón de probabldades correspondentes a un conjunto dado de perfles de entrada. El usuaro ha de proveer una matrz de datos. Todas las varables ndependentes presentes en el modelo ajustado han de fgurar en esta matrz. Para cada uno de los perfles ncludos, Epdat 4 no solo realza una estmacón puntual sno que computa un ntervalo de confanza, empleando para ello la técnca bootstrap. Típcamente, en la segunda matrz se ncluyen algunos perfles que el usuaro consdera que son teórca o práctcamente relevantes (Véanse ejemplos 1, y 4). Sn embargo, la dmensón de la matrz ntroducda para la predccón no tene restrccones. S el número de flas (perfles) supera a 0, Epdat no presentará las estmacones en la pantalla de salda sno que, drectamente, solo las envará a un archvo para que sea salvado por el usuaro. Nota cautelar: Procede advertr que la segunda base de datos ha de contener todas las varables empleadas para la construccón ncal del modelo. Además, puede ocurrr que en la prmera base haya alguna varable declarada como categórca, tambén presente en la segunda, pero con la sngulardad de que en esta últma aparece al menos un caso para el cual dcha varable tene una condcón no presente en nnguno de los casos ncludos en la base ncal (por ejemplo, en la prmera se tene que en la varable RELIGIÓN aparecen sujetos católcos, protestantes o musulmanes, pero no hay nngún sujeto ateo; mentras que en la segunda base s aparece al menos un ateo). En esa stuacón, al realzarse la predccón Epdat elmna de la segunda base todos los casos donde se presente esta sngulardad (es decr, todas las flas correspondentes a ndvduos ateos) Teorema de Bayes y predccón Supongamos que se tene una probabldad P a pror de que determnada condcón morbosa E esté presente en un sujeto (llamaremos O=1-P a su complemento, la probabldad de que esté sano, E ), y que se cuenta con una prueba dagnóstca T que puede arrojar dos resultados (postvo T+ y negatvo T-). Medante el Teorema de Bayes se puede computar cuál es la probabldad a posteror de estar enfermo en cada uno de los dos casos. Para ello han de conocerse dos parámetros nherentes a la prueba: la sensbldad y la especfcdad. El prmero mde la capacdad de la

11 Epdat 4: Ayuda de Regresón logístca. Octubre 014. prueba para detectar a un sujeto enfermo; expresa cuán "sensble" es la prueba ante la presenca de la enfermedad y vene defndo por la probabldad condconal = P(T E). La segunda se defne a través de la probabldad condconal = P(T E), la cual mde cuán específca es la prueba dagnóstca en el sentdo sguente: cuanto mayor sea, menor será su complemento P(T E) ;o sea, menor es la probabldad de que declare como enfermos a sujetos que no sufren esta enfermedad. Lo que resulta deseable en este contexto es que, s el resultado de la prueba es postvo, la probabldad de que el sujeto esté efectvamente enfermo sea muy alta y, análogamente, que sea elevada la de que el ndvduo esté sano, supuesto que la prueba arroja un resultado negatvo. En térmnos formales, lo deal es que sean muy altos los valores P(E T ) y P( E T ) que son probabldades condconales a las que se les denomna valores predctvos de la prueba. Aplcando el Teorema de Bayes se obtenen entonces el valor predctvo postvo y el valor predctvo negatvo medante las sguentes fórmulas, respectvamente: P(E T+)= y + (1- ) P( E T )= + (1- ) Cuando el valor se obtene a través de la RL, se dan las condcones para estmar por este conducto con más precsón la probabldad de que el sujeto esté sano y la de que esté enfermo, combnando este resultado con lo que pudera arrojar una prueba dagnóstca adconal (véase Ejemplo 4). Cuando se trabaja con la predccón sempre se agregan 3 columnas (el valor estmado de P y sus respectvos límtes de confanza), pero s se marca que sí se queren valores predctvos (el supuesto por defecto es que no), entonces se agregarían 9 columnas en total debdo a que se estman 3 parámetros y para cada uno de ellos, los dos límtes del ntervalo de confanza Predccón con muestras no representatvas Al emplear la RL, como ocurre en rgor con cualquer otra técnca estadístca, se debe ser cauteloso. S ben el modelo no tene restrccones en cuanto a la dstrbucón de las varables ndependentes (eso es lo que hace posble, por certo, que se pueda emplear con datos tabulados; véase Seccón 11.5.), para que el análss tenga sentdo pleno, debe aplcarse con fnes predctvos solo en los estudos prospectvos, cuando se tenga certeza de que los acontecmentos regstrados por las varables ndependentes ocurreron antes que los desenlaces. Análogamente, se sobrentende que la muestra que ha sdo objeto del segumento en este tpo de estudos es representatva de la poblacón de procedenca. Hay en prncpo dos stuacones en que el modelo obtendo no se puede aplcar drectamente para hacer cómputos de la probabldad (es decr, para hacer la predccón) correspondente a un perfl dado. En ambos casos debdo a que la muestra empleada no se puede consderar representatva de la poblacón. La prmera concerne a los estudos retrospectvos (estudos de casos y controles). Típcamente, el número de casos (para los cuales Y=1) es mucho mayor que el de casos con ese desenlace en la poblacón. Por ejemplo, puede ocurrr que la tasa de prevalenca o ncdenca de dcho problema sea, dgamos, gual al 4% del total, mentras que para hacer el estudo se han tomado tantos casos como controles (es decr, la fraccón en la muestra es de un 50%). La segunda stuacón se da cuando el modelo predctvo se ha obtendo en determnado contexto (certo país o certo hosptal) y luego se quere aplcar a otro contexto, donde las condcones (por ejemplo, tecnológcas, ambentales o demográfcas) son otras.

12 Epdat 4: Ayuda de Regresón logístca. Octubre 014. En ambos casos, es necesaro hacer correccones que permtan emplear el modelo orgnalmente obtendo. La stuacón típca es la sguente. Llamemos Modelo 1 al que se obtuvo orgnalmente y Modelo al que se debe aplcar. Este segundo modelo hace uso de las estmacones que el prmero arrojó para los r coefcentes correspondentes a las varables ncludas: β 1, β β r pero debe corregr el valor del coefcente ndependente β 0. Concretamente, habría que obtener un coefcente β 0 * medante la fórmula: * 1 f 0 0 ln f1 donde f 1 es la tasa en el entorno donde se hzo el estudo y f es la tasa f de aquel en el cual se quere aplcar. Por ejemplo, s se ha hecho un ajuste para la probabldad de que un sujeto quemado muera antes de egresar del hosptal (véase ejemplo 1) en un enclave donde el 15% de los pacentes mueren, y se quere aplcar en otro donde esto ocurre con el 35% de los pacentes (quzás debdo a que en el prmero se tenen recursos terapéutcos mucho más avanzados), y s el coefcente ndependente resultante del ajuste fue β 0=-9,488; entonces, para aplcarlo en el segundo enclave hay que emplear β 0 *=-9,488-ln(0,15 0,65/0,35)=-9,008. S el estudo se realzó usando el método de casos y controles donde se tomaron tantos casos como controles, se tendría f 1=0,5. Para calcular probabldades en la poblacón donde, supongamos que muere realmente el 6% de los ngresados, entonces habría que consderar f =0,15 y el coefcente ndependente a emplear sería: = β 0 *=-9,488-ln(0,5 0,94/0,06)=-11, Curva ROC En un contexto predctvo, con frecuenca se desea selecconar el mejor modelo entre todos los posbles. El área bajo la curva ROC puede ayudar, por ser una vía para comparar dferentes modelos, y por ofrecer una medda de las respectvas capacdades predctvas que ostentan. Cuanto mayor sea esa área, más efcente es el modelo. Para un modelo concreto, la curva ROC se construye del modo que se expone a contnuacón. S fjamos un punto de corte, un valor cualquera entre 0 y 1, podemos clasfcar las n probabldades predchas por el modelo en una tabla de : por una parte se tenen las que están por debajo o por arrba de dcho punto y, por otra, las que corresponden a sujetos que presentan el evento (respuesta Y=1) y las que corresponden a quenes no lo presentan (respuesta Y=0). Desde esta perspectva, puede consderarse el modelo de regresón logístca como un medo para defnr una prueba dagnóstca cuanttatva. Así podemos entenderlo s se fja un umbral para hacer el dagnóstco (por ejemplo, dagnostcar enfermo a un sujeto s P(Y=1)>0,8 y declararlo sano en caso contraro) en una stuacón en que se conozcan los verdaderos desenlaces. Usando la tabla antedcha, es posble calcular la sensbldad (porcentaje de sujetos con la condcón que son clasfcados correctamente por el modelo) y la especfcdad (porcentaje de sujetos sn ella que son clasfcados como tales por el modelo). Ahora, s se toman varos puntos de corte o umbrales sucesvamente, se tendrán respectvas parejas de valores de sensbldad y especfcdad. La curva ROC se obtene representando, en un cuadrado de lado 1, los valores de 1-especfcdad en el eje de abscsas frente a sensbldad en el de las ordenadas para todos los puntos de corte consderados. Epdat 4 construye la curva usando cada uno de los valores predchos como puntos de corte, de modo que se tendrán tantos puntos en la curva como tamaño tenga la muestra. La curva empeza en el punto (0,0), que corresponde al punto de corte 1, y termna en (1,1) que se obtene al consderar el 0 como punto de corte. S el modelo tene capacdad predctva nula,

13 Epdat 4: Ayuda de Regresón logístca. Octubre 014. la curva concde con la dagonal prncpal del cuadrado, y el área bajo la curva toma su valor mínmo de 0,5. Por el contraro, un modelo perfecto tene una curva ROC con área 1. Además de la estmacón del área bajo la curva ROC, Epdat 4 ofrece un ntervalo de confanza para esta estmacón Ejemplos Ejemplo 1: Predccón en un servco de caumatología En un servco hosptalaro de quemados se quere construr un modelo predctvo para la muerte de los pacentes que ngresan. Los especalstas han valorado que las sguentes 6 varables de los pacentes puderan tener valor predctvo a los efectos de que sobrevvan (egresen vvos) o mueran (fallezcan en el hosptal): - Edad medda en años (E). - Porcentaje del cuerpo con quemaduras hpodérmcas (Q1). - Porcentaje del cuerpo con quemaduras epdérmcas (Q). - Porcentaje del cuerpo con quemaduras ntermedas (Q3). - Dabetes, dcotómca: 1 o 0 para ndcar que la padece o no, respectvamente (DIA). - Las quemaduras afectan o no la cabeza del pacente: 1 o 0 para ndcar s ocurre o no, respectvamente (CAB) La varable de respuesta se llamará MUERE y puede tomar los valores SI o NO en dependenca de cuál haya sdo el estado del pacente al egresar. Supongamos que se tomaron los últmos egresados en dcho servco para construr el modelo. El lbro en formato Excel nombrado QUEMADOS.XLS contene cnco hojas. En la prmera, llamada MODELO, fguran los perfles y los desenlaces correspondentes (muerte o no) para los ndvduos. En la hoja MODELO-INT se ha agregado a la anteror una varable para valorar la nteraccón de otras dos (véase debajo). En VALID se ncluyeron los otros pacentes (por ejemplo, los anterores a los de la muestra ncal). En la hoja UNIDO se han colocado las dos bases anterores juntas. En la hoja PRED, fnalmente fguran los 8 perfles concretos sguentes, para los cuales se queren estmar las probabldades de muerte: E Q1 Q3 Q DIA CAB Al correr el programa usando la hoja MODELO se obtene lo sguente (nótese que en este caso las varables DIA y CAB se pueden nclur como numércas y como categórcas debdo a que en ambos casos sus valores posbles se han codfcado como números; los resultados serán los msmos):

14 Epdat 4: Ayuda de Regresón logístca. Octubre 014. Resultados con Epdat 4:

15 Epdat 4: Ayuda de Regresón logístca. Octubre 014. Resultados con Epdat 4 (contnuacón):

16 Epdat 4: Ayuda de Regresón logístca. Octubre 014. Supongamos que se quere valorar el posble efecto de la nteraccón de la edad con el porcentaje total de quemaduras. En ese caso, hay que crear una varable adconal formada por el producto del valor de la edad y la suma de Q1, Q y Q3. La hoja llamada MODELO- INT, que se ncluyó en el lbro QUEMADOS.XLSX, ncluye tal varable (con el nombre EDAD-QT). Resultados con Epdat 4: Como se apreca, s se emplea el test de Wald para valorarlo, la nteraccón entre EDAD y QT dsta de ser sgnfcatva (p=0,518), de modo que se pensaría en prncpo que no rge tal nteraccón. Para la valdacón, luego de haber corrdo el programa con la hoja MODELO, se usa la hoja VALID como segunda matrz. Los resultados obtendos son los sguentes:

17 Epdat 4: Ayuda de Regresón logístca. Octubre 014. Más allá de que p es mucho mayor que 0,05 (no hay una dscrepanca sgnfcatva), la tabla anteror permte observar que el número esperado de muertos es muy smlar al esperado (159 y 15) y que las frecuencas observadas y esperadas son certamente muy smlares en la atomzacón que hace el test de Hosmer Lemeshow, el modelo queda claramente valdado. Sendo así, se pueden unr las bases para hacer un ajuste fnal. Al trabajar con la hoja UNIDO, que contene 000 quemados, se obtene: Los coefcentes son muy parecdos; pero los errores estándar con claramente menores que en el caso en que se trabajó solo con las prmeras 1000 observacones, algo coherente con el notable aumento del tamaño muestral.

18 Epdat 4: Ayuda de Regresón logístca. Octubre 014. Obsérvese a contnuacón lo que arroja el test de bondad de ajuste en este caso en que n=000: En este contexto predctvo, la probabldad del suceso para un perfl de entrada dado ha de computarse empleando los coefcentes estmados. Por ejemplo, s se quere saber cuál es la probabldad de que muerte de un pacente, hay que aplcar la fórmula sguente: P muere exp 0 1E Q1 3Q 4Q3 5DIA 6CAB dónde: β 0=-9,316 β 1=0,054 β =0,9 β 3=0,100 β 4=0,151 β 5=1,361 β 6=1,561. S se tratara de un sujeto de 30 años, con 10, 15 y 0% del cuerpo afectado con quemaduras hpodérmcas, epdérmcas e ntermedas respectvamente, las cuales no afectan la cabeza y que no es dabétco, la fórmula arroja: P(muere 1) 0,39. Las estmacones de las probabldades que se obtuveron al usar la hoja PRED (véase arrba) con ese fn, resultan ser:

19 Epdat 4: Ayuda de Regresón logístca. Octubre 014. Obsérvese que Epdat 4 no solo calcula la probabldad de muerte sno tambén los ntervalos de confanza correspondentes. Por ejemplo, para el qunto sujeto, dcha probabldad es, en efecto, gual a 4% (0,39) y ella se halla entre 15 y 36% con confabldad del 95%. NOTA: s el usuaro reproduce este proceso obtendrá ntervalos lgeramente dferentes debdo a que la estmacón se realza medante la técnca boostrap y en cada caso las submuestras que EPIDAT elge para llevarla adelante serán dferentes. Ejemplo : Influenca de un régmen de atencón de cudados de enfermería sobre recuperacón de pacentes con fractura de cadera. Se estuda la nfeccón hosptalara posqurúrgca en pacentes operados de la cadera. Se desea evaluar la efcaca de un nuevo régmen técnco-organzatvo de los cudados de enfermería que se dspensan a estos pacentes. El resultado se mde a través de la varable INFEC (INFEC=1 cuando el pacente se nfecta a lo largo de la prmera semana, INFEC=0 s no se nfecta). Se defne la varable REGIMEN, de naturaleza dcotómca, que vale 0 s el sujeto estuvo ngresado bajo el nuevo régmen y 1 en caso de que haya estado atenddo bajo el régmen convenconal. Se han estudado 80 pacentes de dferentes edades, 36 de los cuales se han ubcado en el régmen expermental y 44 en el régmen convenconal. La expectatva, claro está, es que el nuevo régmen sea mejor y, por tanto, que haya menos casos de nfeccón en este últmo que en el precedente. Los resultados se recogen en la Tabla. Tabla. Dstrbucón de pacentes según régmen de atencón enfermera y condcón respecto de la nfeccón. Infeccón Régmen Sí (1) No (0) Convenconal (1) 37 7 Expermental (0) 14 OR=3,36

20 Epdat 4: Ayuda de Regresón logístca. Octubre 014. S a partr de los datos brutos se estma el efecto del régmen de los cudados de enfermería sobre el hecho de desarrollar una nfeccón, el odds rato resultante es de 3,36 (procedente de computar la llamada razón de productos cruzados [1437]/[7]). Consdérese, además, que se quere evaluar s la edad del pacente (se nombrará EDAD a esta varable) consttuye una varable de confusón en la relacón que pudera exstr entre el régmen organzatvo y el hecho de desarrollar una nfeccón. Está claro que la varable EDAD cumple con los tres crteros convenconalmente admtdos [10] para ser consderada como varable de confusón. Prmero, el resgo de nfeccón aumenta con la edad. Segundo la proporcón de pacentes mayores de 40 años es mayor en el grupo que recbó el régmen de atencón convenconal. Por últmo, el supuesto de que el efecto protector del régmen expermental sobre el hecho de desarrollar una nfeccón se produzca a través de la edad carece de fundamento. Para valorarlo, los datos se dvden en dos categorías de edad (menores o guales, o mayores de 40 años, GRUPO=0 y GRUPO=1, respectvamente, lo que produce la confguracón que recoge la Tabla 3. Los estmados del odds rato en las dos categorías son de,77 y,44 respectvamente. Tabla 3. Dstrbucón de pacentes según régmen de atencón enfermera, condcón respecto de la nfeccón y grupo de edad. Infeccón Sí (1) No (0) Grupo (1) Edad 40 Grupo (0) Edad>40 Régmen convenconal (1) 15 5 Régmen expermental (0) 13 1 Régmen convenconal (1) Régmen expermental (0) 9 OR 1=,77 OR =,44 Un método usual para valorar una confusón consste en comparar de forma drecta el estmado bruto del efecto y el estmado de éste una vez controlado el presunto factor de confusón. Para ello se debe obtener una estmacón del efecto global a partr de los datos estratfcados, medante una meda ponderada de las estmacones de los efectos por estrato. Retomando nuevamente el ejemplo, será posble que el odds rato total de 3,36 refleje, en alguna dmensón, el efecto confusor que pudera tener la edad en la relacón entre el régmen de atencón de enfermería y la nfeccón? Dentro de cada categoría o estrato formado por los dos grupos de edad (40 o menos y mayores de 40) se puede calcular el odds rato como únca medda de la asocacón entre el régmen y la nfeccón. Una medda únca global se obtene, como se ha dcho, medante un promedo ponderado de los odds rato dentro de los estratos. Esto es exactamente lo que provee el odds rato de Mantel Haenszel que, en este caso, como puede corroborarse a través del análss de tablas x estratfcadas, arroja el valor,68. Al usar el submódulo de regresón logístca en esta stuacón hay que preparar una hoja en Excel, que contenga una tabla de contngenca de 3 entradas con 8 celdas, para que el programa la lea automátcamente según la sguente estructura:

21 Epdat 4: Ayuda de Regresón logístca. Octubre 014. INFEC REGIMEN GRUPO FREQ El archvo CADERA.xls que se ncluye en Epdat 4 contene en su prmera hoja (CADERA- GRUPO) la tabla arrba expuesta. Al emplear el programa, el usuaro puede elegr cuántas y cuáles varables ndependentes ncorporar al modelo. A contnuacón se exponen los resultados que se obtenen cuando se pone una sola varable (REGIMEN), y luego los que se producen cuando se adcona la varable GRUPO. Caso en que solo se ncluye la varable REGIMEN como ndependente: Obsérvese que la estmacón global del OR asocado al régmen de cudados es la msma: 3,36 (es el logartmo natural de 1,13).

22 Epdat 4: Ayuda de Regresón logístca. Octubre 014. Caso en que se ncluyen REGIMEN y GRUPO como varables ndependentes: En este ejemplo, se controla el efecto del grupo de edad. La estmacón del OR pasa a ser,68 (lo msmo que arrojara la estratfcacón de Mantel Haenszel). Ahora ben, el manejo que se ha hecho ha sdo a través de datos tabulados. Sn embargo, s tenemos en cuenta que se conocen las edades ndvduales de todos los partcpantes y no solo la composcón por grupos, el control de la edad puede realzarse ncorporando esta edad real al modelo en lugar de usar la opcón de datos tabulados. Usando la segunda hoja de la base CADERA.XLS, llamada CADERA-EDAD, se obtene lo sguente: Nuevamente, se ha controlado el efecto de la edad y ahora el OR pasa a ser,08. Esta estmacón, mucho más refnada (sn la pérdda de nformacón que supuso consderar la edad a nvel dcotómco), sería la más adecuada en este caso en que se cuenta con datos de edad ndvduales. Este ejemplo pone de manfesto que la valoracón sobre el posble papel confusor de un factor se desarrolla de manera ágl. Basta correr el modelo con y sn el factor y comparar los coefcentes de la varable ndependente. En el ejemplo de los operados de la cadera, se compara 3,36 con,08 lo cual permte pensar que sí hay efecto confusor. Sn embargo, lo

23 Epdat 4: Ayuda de Regresón logístca. Octubre 014. verdaderamente relevante es que el REGIMEN de atencón mantene (aunque dsmnudo) su condcón de factor nfluyente en la dsmnucón de las nfeccones. Ejemplo 3: Prevalencas de postvdad a un antcuerpo. Supóngase que se quere modelar (caracterzar epdemológcamente) el modo en que se dstrbuye certo vrus según 4 zonas. Se consdera la varable VIRUS (varable de respuesta: SI y NO) y la varable ZONA (NORTE, SUR, ESTE y OESTE). Estudados sujetos, la dstrbucón según zonas y presenca o no del vrus, fue la sguente: VIRUS ZONA FRECUENCIA NO NORTE 909 NO SUR NO ESTE 99 NO OESTE 56 SI NORTE 38 SI SUR SI ESTE 17 SI OESTE 606 Es fácl convencerse de que las tasas de prevalenca (expresadas como una fraccón y con 3 decmales) son las que aparecen en la Tabla 4. Tabla 4. Prevalencas estmadas de postvdad al vrus para las dferentes zonas geográfcas. Zona Tamaño Número de Tasa de muestral postvos prevalenca Este ,635 Norte ,08 Oeste ,535 Sur ,51 En este punto, y solo a título lustratvo, resulta nteresante encarar esta tarea a través de la RL. El archvo VIRUS.xls, contene una hoja llamada ZONA con una tabla de contngenca con los datos de los sujetos que consttuyen la muestra. Usando la alternatva de Tablas de Frecuenca y declarando la varable ZONA como categórca, Epdat 4.0 crea las sguentes tres varables dummy: ZONA1 ZONA ZONA3 Este Norte Oeste Sur 0 0 1

24 Epdat 4: Ayuda de Regresón logístca. Octubre 014. Epdat 4 ordena alfabétcamente las categorías y toma la prmera como referenca (todas las varables dummy valen 0) y de ahí en adelante sgue asgnando el 1 y los 0 en ese msmo orden, como se ve en la tabla anteror. Con estos datos se genera el sguente modelo: S ahora aplcamos la funcón logístca: 1 PVrus 1 1 exp 0 1ZONA1 ZONA 3ZONA 3 a cada uno de los conjuntos de varables dummy (es decr, para cada zona) obtenemos cas exactamente los msmos valores para las tasas de prevalenca que había arrojado el smple cómputo de la fraccón de postvos (Tabla 3) entre sujetos de la muestra en cada zona. Por ejemplo, para el NORTE (ZONA1=1; ZONA=0; ZONA3=0), se tene: P Vrus 1 1 exp 1 1 ZONA1 1 exp 1 exp 0,55 1, ,08 Como nota fnal, se llama la atencón acerca de cómo en este caso la bondad de ajuste es perfecta:

25 Epdat 4: Ayuda de Regresón logístca. Octubre 014. Un comentaro nteresante en este caso es el sguente. Para aplcar la predccón en este caso, se puede usar la hoja VIRUS-PRED, la cual meramente contene los 4 perfles posbles. El resultado es: Prob. (VIRUS=1) Límte Inf. Límte Sup. 0,635 0,578 0,695 0,07 0,183 0,30 0,535 0,506 0,564 0,51 0,493 0,59 La comparacón de la prmera columna de esta tabla con la últma de la Tabla 4 arroja lo esperado: la RL estma las tasas de la msma manera que cuando se hace la mera dvsón del número de postvos entre el tamaño muestral en cada zona. Pero resulta nteresante, y fácl de corroborar por el lector, que los ntervalos de confanza -construdos a través de la técnca boostrap- concden cas exactamente con los que se obtendrían s se aplca la fórmula clásca para la estmacón de un porcentaje: p 1,96 p1 p/ n : Zona Tasa de prevalenca Intervalo 95% Este 0,6347 0,577 0,69 Norte 0,075 0,184 0,31 Oeste 0,5353 0,506 0,564 Sur 0,513 0,495 0,530 Ejemplo 4: Influenca del tpo de contrato en accdentes laborales. Se tene la hpótess de que aquellos trabajadores que laboran bajo un contrato ndefndo tenden a padecer menos accdentes que aquellos cuyo contrato es de tpo temporal. Tal conjetura se basa en la dea de que quenes están en este últmo caso no exgen (por temor a no ser recontratados) que se cumplan las reglas de segurdad establecdas. Con el propósto de evaluar dcha hpótess, se realza un estudo de cohortes con sujetos, tenen contratos temporales y los tenen ndefndos y para todos los cuales se observó s tuveron o no un accdente en el curso de los sguentes 5 años posterores al nco del estudo. Los resultados fueron: Contrato Accdente Temporal Indefndo Con accdente (1) a=1.44 c=534 Sn accdente (0) b=1.598 d=.86 Obsérvese que el OR es mucho mayor que 1, cas gual a 5. Eso hace pensar que aproxmadamente es 5 veces más pelgroso tener un contrato temporal que uno ndefndo: OR ab cd ,78

26 Epdat 4: Ayuda de Regresón logístca. Octubre 014. S se quere hacer una prueba de sgnfcacón, se obtendrá: obs nad bc b da ca bc d ,0 al cual se asoca un valor de p=0,000, de modo que la asocacón sería altamente sgnfcatva. Ahora ben, puede consderarse probada la hpótess de causaldad? Para avanzar en esa línea, habría que valorar s exsten varables confusoras que puedan controlarse. Un análss del problema conduce a pensar que verosímlmente las personas con más experenca deberían tener menos accdentes y a la vez ser las que con más frecuenca tendrían contratos ndefndos. Algo smlar ocurrría con la categoría laboral (por ejemplo, un arqutecto debe tener menos propensón a accdentarse que un albañl y smultáneamente sería más probable que este últmo tuvera un contrato temporal que el prmero). Esto ocurrría análogamente con la edad y con la escolardad. Obsérvese, por ejemplo, cómo las tasas (%) de accdentados van dsmnuyendo a medda que aumenta la escolardad en la muestra: Escolardad Accdentados Total % ANALFABETO ,6 PRIMARIO , SECUNDARIO ,5 MEDIO ,5 SUPERIOR ,9 Total ,9 La pregunta relevante sería entonces: la probabldad de que se produzca (o no) un accdente es mayor para los temporales que para los ndefndos, ndependentemente del tpo de trabajo, de los años de experenca, de la escolardad y de la edad? A través de la RL, el hecho de que un sujeto tenga o no un accdente se pondrá en funcón de todas estas varables, para poder controlarlas todas a la vez, aparte, claro está, de la varable en estudo (el tpo de contrato). Las varables del modelo serían: - Tpo de contrato CONTRATO (x 1), dcotómca (1.TEMPORAL,.INDEFINIDO). - Tempo de experenca EXPER (x ), cuanttatva (AÑOS). - Edad del sujeto EDAD (x 3), cuanttatva (AÑOS). - Categoría laboral CATEG (x 4), ordnal (codfcada como 1=MANUAL, =TÉCNICO, 3=PROFESIONAL). - Máxma escolardad alcanzada ESCO (x 5), ordnal (codfcada como 1=ANALFABETO, =PRIMARIO, 3=SECUNDARIO, 4=MEDIO, 5=SUPERIOR).

27 Epdat 4: Ayuda de Regresón logístca. Octubre 014. El lbro ACCIDENTES.xls contene todos estos datos para ndvduos de la cohorte. Los prmeros 10 son los sguentes: TRABAJADOR ACCIDENTE CONTRATO EDAD CATEG EXPER ESCO INDEFINIDO TEMPORAL TEMPORAL INDEFINIDO INDEFINIDO INDEFINIDO INDEFINIDO INDEFINIDO INDEFINIDO INDEFINIDO S se corre el modelo ncorporando solo el contrato como varable ndependente, se obtene la msma estmacón del OR que la arrba obtenda:

EXPERIMENTACIÓN COMERCIAL(I)

EXPERIMENTACIÓN COMERCIAL(I) EXPERIMENTACIÓN COMERCIAL(I) En un expermento comercal el nvestgador modfca algún factor (denomnado varable explcatva o ndependente) para observar el efecto de esta modfcacón sobre otro factor (denomnado

Más detalles

Problemas donde intervienen dos o más variables numéricas

Problemas donde intervienen dos o más variables numéricas Análss de Regresón y Correlacón Lneal Problemas donde ntervenen dos o más varables numércas Estudaremos el tpo de relacones que exsten entre ellas, y de que forma se asocan Ejemplos: La presón de una masa

Más detalles

EJERCICIO 1 1. VERDADERO 2. VERDADERO (Esta afirmación no es cierta en el caso del modelo general). 3. En el modelo lineal general

EJERCICIO 1 1. VERDADERO 2. VERDADERO (Esta afirmación no es cierta en el caso del modelo general). 3. En el modelo lineal general PRÁCTICA 6: MODELO DE REGRESIÓN MÚLTIPLE SOLUCIÓN EJERCICIO. VERDADERO. VERDADERO (Esta afrmacón no es certa en el caso del modelo general. 3. En el modelo lneal general Y =X β + ε, explcar la forma que

Más detalles

Relaciones entre variables

Relaciones entre variables Relacones entre varables Las técncas de regresón permten hacer predccones sobre los valores de certa varable Y (dependente), a partr de los de otra (ndependente), entre las que se ntuye que exste una relacón.

Más detalles

CAPÍTULO 5 REGRESIÓN CON VARIABLES CUALITATIVAS

CAPÍTULO 5 REGRESIÓN CON VARIABLES CUALITATIVAS CAPÍTULO 5 REGRESIÓN CON VARIABLES CUALITATIVAS Edgar Acuña Fernández Departamento de Matemátcas Unversdad de Puerto Rco Recnto Unverstaro de Mayagüez Edgar Acuña Analss de Regreson Regresón con varables

Más detalles

Pronósticos. Humberto R. Álvarez A., Ph. D.

Pronósticos. Humberto R. Álvarez A., Ph. D. Pronóstcos Humberto R. Álvarez A., Ph. D. Predccón, Pronóstco y Prospectva Predccón: estmacón de un acontecmento futuro que se basa en consderacones subjetvas, en la habldad, experenca y buen juco de las

Más detalles

Investigación y Técnicas de Mercado. Previsión de Ventas TÉCNICAS CUANTITATIVAS ELEMENTALES DE PREVISIÓN UNIVARIANTE. (IV): Ajustes de Tendencia

Investigación y Técnicas de Mercado. Previsión de Ventas TÉCNICAS CUANTITATIVAS ELEMENTALES DE PREVISIÓN UNIVARIANTE. (IV): Ajustes de Tendencia Investgacón y Técncas de Mercado Prevsón de Ventas TÉCNICAS CUANTITATIVAS ELEMENTALES DE PREVISIÓN UNIVARIANTE. (IV): s de Tendenca Profesor: Ramón Mahía Curso 00-003 I.- Introduccón Hasta el momento,

Más detalles

CARTAS DE CONTROL. Han sido difundidas exitosamente en varios países dentro de una amplia variedad de situaciones para el control del proceso.

CARTAS DE CONTROL. Han sido difundidas exitosamente en varios países dentro de una amplia variedad de situaciones para el control del proceso. CARTAS DE CONTROL Las cartas de control son la herramenta más poderosa para analzar la varacón en la mayoría de los procesos. Han sdo dfunddas extosamente en varos países dentro de una ampla varedad de

Más detalles

Análisis de Regresión y Correlación

Análisis de Regresión y Correlación 1 Análss de Regresón y Correlacón El análss de regresón consste en emplear métodos que permtan determnar la mejor relacón funconal entre dos o más varables concomtantes (o relaconadas). El análss de correlacón

Más detalles

3. VARIABLES ALEATORIAS.

3. VARIABLES ALEATORIAS. 3. VARIABLES ALEATORIAS. Una varable aleatora es una varable que toma valores numércos determnados por el resultado de un epermento aleatoro (no hay que confundr la varable aleatora con sus posbles valores)

Más detalles

PRÁCTICA 16: MODELO DE REGRESIÓN MÚLTIPLE SOLUCIÓN

PRÁCTICA 16: MODELO DE REGRESIÓN MÚLTIPLE SOLUCIÓN PRÁCTICA 6: MODELO DE REGRESIÓN MÚLTIPLE SOLUCIÓN EJERCICIO. VERDADERO. VERDADERO (Esta afrmacón no es certa en el caso del modelo general). 3. En el modelo lneal general Y = X b + e, explcar la forma

Más detalles

Reconocimiento de Locutor basado en Procesamiento de Voz. ProDiVoz Reconocimiento de Locutor 1

Reconocimiento de Locutor basado en Procesamiento de Voz. ProDiVoz Reconocimiento de Locutor 1 Reconocmento de Locutor basado en Procesamento de Voz ProDVoz Reconocmento de Locutor Introduccón Reconocmento de locutor: Proceso de extraccón automátca de nformacón relatva a la dentdad de la persona

Más detalles

Tema 1.3_A La media y la desviación estándar

Tema 1.3_A La media y la desviación estándar Curso 0-03 Grado en Físca Herramentas Computaconales Tema.3_A La meda y la desvacón estándar Dónde estudar el tema.3_a: Capítulo 4. J.R. Taylor, Error Analyss. Unv. cence Books, ausalto, Calforna 997.

Más detalles

Dicha tabla adopta la forma del diagrama de árbol del dibujo. En éste, a cada uno de los sucesos A y A c se les ha asociado los sucesos B y B c.

Dicha tabla adopta la forma del diagrama de árbol del dibujo. En éste, a cada uno de los sucesos A y A c se les ha asociado los sucesos B y B c. Estadístca robablístca 6. Tablas de contngenca y dagramas de árbol. En los problemas de probabldad y en especal en los de probabldad condconada, resulta nteresante y práctco organzar la nformacón en una

Más detalles

MODELOS DE ELECCIÓN BINARIA

MODELOS DE ELECCIÓN BINARIA MODELOS DE ELECCIÓN BINARIA Econometría I UNLP http://www.econometra1.depeco.econo.unlp.edu.ar/ Modelos de Eleccón Bnara: Introduccón Estamos nteresados en la probabldad de ocurrenca de certo evento Podemos

Más detalles

Histogramas: Es un diagrama de barras pero los datos son siempre cuantitativos agrupados en clases o intervalos.

Histogramas: Es un diagrama de barras pero los datos son siempre cuantitativos agrupados en clases o intervalos. ESTADÍSTICA I. Recuerda: Poblacón: Es el conjunto de todos los elementos que cumplen una determnada propedad, que llamamos carácter estadístco. Los elementos de la poblacón se llaman ndvduos. Muestra:

Más detalles

REGRESION Y CORRELACION

REGRESION Y CORRELACION nav Estadístca (complementos) 1 REGRESION Y CORRELACION Fórmulas báscas en la regresón lneal smple Como ejemplo de análss de regresón, descrbremos el caso de Pzzería Armand, cadena de restaurantes de comda

Más detalles

INTRODUCCIÓN. Técnicas estadísticas

INTRODUCCIÓN. Técnicas estadísticas Tema : Estadístca Descrptva Undmensonal ITRODUCCIÓ Fenómeno determnsta: al repetrlo en déntcas condcones se obtene el msmo resultado. (Ejemplo: lómetros recorrdos en un ntervalo de tempo a una velocdad

Más detalles

Correlación y regresión lineal simple

Correlación y regresión lineal simple . Regresón lneal smple Correlacón y regresón lneal smple. Introduccón La correlacón entre dos varables ( e Y) se refere a la relacón exstente entre ellas de tal manera que a determnados valores de se asocan

Más detalles

Vida Util, características de la Fiabilidad e Inviabilidad y distribuciones teóricas en el terreno de la fiabilidad

Vida Util, características de la Fiabilidad e Inviabilidad y distribuciones teóricas en el terreno de la fiabilidad Vda Utl, característcas de la Fabldad e Invabldad y dstrbucones teórcas en el terreno de la fabldad Realzado por: Mgter. Leandro D. Torres Vda Utl Este índce se refere a una vda útl meda nomnal y se puede

Más detalles

Econometría. Ayudantía # 01, Conceptos Generales, Modelo de Regresión. Profesor: Carlos R. Pitta 1

Econometría. Ayudantía # 01, Conceptos Generales, Modelo de Regresión. Profesor: Carlos R. Pitta 1 Escuela de Ingenería Comercal Ayudantía # 01, Conceptos Generales, Modelo de Regresón Profesor: Carlos R. Ptta 1 1 cptta@spm.uach.cl Escuela de Ingenería Comercal Ayudantía 01 Parte 01: Comentes Señale

Más detalles

Métodos específicos de generación de diversas distribuciones discretas

Métodos específicos de generación de diversas distribuciones discretas Tema 3 Métodos específcos de generacón de dversas dstrbucones dscretas 3.1. Dstrbucón de Bernoull Sea X B(p). La funcón de probabldad puntual de X es: P (X = 1) = p P (X = 0) = 1 p Utlzando el método de

Más detalles

TRABAJO 1: Variables Estadísticas Unidimensionales (Tema 1).

TRABAJO 1: Variables Estadísticas Unidimensionales (Tema 1). TRABAJO 1: Varables Estadístcas Undmensonales (Tema 1). Técncas Cuanttatvas I. Curso 2016/2017. APELLIDOS: NOMBRE: GRADO: GRUPO: DNI (o NIE): A: B: C: D: En los enuncados de los ejerccos que sguen aparecen

Más detalles

CÁLCULO DE INCERTIDUMBRE EN MEDIDAS FÍSICAS: MEDIDA DE UNA MASA

CÁLCULO DE INCERTIDUMBRE EN MEDIDAS FÍSICAS: MEDIDA DE UNA MASA CÁLCULO DE INCERTIDUMBRE EN MEDIDAS FÍSICAS: MEDIDA DE UNA MASA Alca Maroto, Rcard Boqué, Jord Ru, F. Xaver Rus Departamento de Químca Analítca y Químca Orgánca Unverstat Rovra Vrgl. Pl. Imperal Tàrraco,

Más detalles

Muestra: son datos de corte transversal correspondientes a 120 familias españolas.

Muestra: son datos de corte transversal correspondientes a 120 familias españolas. Capítulo II: El Modelo Lneal Clásco - Estmacón Aplcacones Informátcas 3. APLICACIONES INFORMÁTICAS Fchero : cp.wf (modelo de regresón smple) Seres: : consumo famlar mensual en mles de pesetas RENTA: renta

Más detalles

2.2 TASA INTERNA DE RETORNO (TIR). Flujo de Caja Netos en el Tiempo

2.2 TASA INTERNA DE RETORNO (TIR). Flujo de Caja Netos en el Tiempo Evaluacón Económca de Proyectos de Inversón 1 ANTECEDENTES GENERALES. La evaluacón se podría defnr, smplemente, como el proceso en el cual se determna el mérto, valor o sgnfcanca de un proyecto. Este proceso

Más detalles

Regresión Binomial Negativa

Regresión Binomial Negativa Regresón Bnomal Negatva Resumen El procedmento Regresón Bnomal Negatva está dseñado para ajustar un modelo de regresón en el cual la varable dependente Y consste de conteos. El modelo de regresón ajustado

Más detalles

Análisis de Weibull. StatFolio de Muestra: Weibull analysis.sgp

Análisis de Weibull. StatFolio de Muestra: Weibull analysis.sgp Análss de Webull Resumen El procedmento del Análss de Webull está dseñado para ajustar una dstrbucón de Webull a un conjunto de n observacones. Es comúnmente usado para analzar datos representando tempos

Más detalles

Modelos unifactoriales de efectos aleatorizados

Modelos unifactoriales de efectos aleatorizados Capítulo 4 Modelos unfactorales de efectos aleatorzados En el modelo de efectos aleatoros, los nveles del factor son una muestra aleatora de una poblacón de nveles. Este modelo surge ante la necesdad de

Más detalles

De factores fijos. Mixto. Con interacción Sin interacción. No equilibrado. Jerarquizado

De factores fijos. Mixto. Con interacción Sin interacción. No equilibrado. Jerarquizado Análss de la varanza con dos factores. Introduccón Hasta ahora se ha vsto el modelo de análss de la varanza con un factor que es una varable cualtatva cuyas categorías srven para clasfcar las meddas de

Más detalles

Apéndice A: Metodología para la evaluación del modelo de pronóstico meteorológico

Apéndice A: Metodología para la evaluación del modelo de pronóstico meteorológico Apéndce A: Metodología para la evaluacón del modelo de pronóstco meteorológco Apéndce A: Metodología para la evaluacón del modelo de pronóstco meteorológco Tabla de contendos Ap.A Apéndce A: Metodología

Más detalles

ENCUESTA ESTRUCTURAL DE TRANSPORTE POR CARRETERA AÑO CONTABLE 2011 INSTITUTO NACIONAL DE ESTADÍSTICAS

ENCUESTA ESTRUCTURAL DE TRANSPORTE POR CARRETERA AÑO CONTABLE 2011 INSTITUTO NACIONAL DE ESTADÍSTICAS METODOLOGÍA ENCUESTA ESTRUCTURAL DE TRANSPORTE POR CARRETERA AÑO CONTABLE 0 INSTITUTO NACIONAL DE ESTADÍSTICAS 03 ÍNDICE I. METODOLOGÍA ENCUESTA ESTRUCTURAL DE TRANSPORTE INTERURBANO DE PASAJEROS POR CARRETERA.

Más detalles

Tema 3. Estadísticos univariados: tendencia central, variabilidad, asimetría y curtosis

Tema 3. Estadísticos univariados: tendencia central, variabilidad, asimetría y curtosis Tema. Estadístcos unvarados: tendenca central, varabldad, asmetría y curtoss 1. MEDIDA DE TEDECIA CETRAL La meda artmétca La medana La moda Comparacón entre las meddas de tendenca central. MEDIDA DE VARIACIÓ

Más detalles

Reconciliación de datos experimentales. MI5022 Análisis y simulación de procesos mineralúgicos

Reconciliación de datos experimentales. MI5022 Análisis y simulación de procesos mineralúgicos Reconclacón de datos expermentales MI5022 Análss y smulacón de procesos mneralúgcos Balances Balances en una celda de flotacón En torno a una celda de flotacón (o un crcuto) se pueden escrbr los sguentes

Más detalles

Medidas de centralización

Medidas de centralización 1 Meddas de centralzacón Meda Datos no agrupados = x X = n = 0 Datos agrupados = x X = n = 0 Medana Ordenamos la varable de menor a mayor. Calculamos la columna de la frecuenca relatva acumulada F. Buscamos

Más detalles

Capitalización y descuento simple

Capitalización y descuento simple Undad 2 Captalzacón y descuento smple 2.1. Captalzacón smple o nterés smple 2.1.1. Magntudes dervadas 2.2. Intereses antcpados 2.3. Cálculo de los ntereses smples. Métodos abrevados 2.3.1. Método de los

Más detalles

Efectos fijos o aleatorios: test de especificación

Efectos fijos o aleatorios: test de especificación Cómo car?: Montero. R (2011): Efectos fjos o aleatoros: test de especfcacón. Documentos de Trabajo en Economía Aplcada. Unversdad de Granada. España Efectos fjos o aleatoros: test de especfcacón Roberto

Más detalles

T. 9 El modelo de regresión lineal

T. 9 El modelo de regresión lineal 1 T. 9 El modelo de regresón lneal 1. Conceptos báscos sobre el análss de regresón lneal. Ajuste de la recta de regresón 3. Bondad de ajuste del modelo de regresón Modelos predctvos o de regresón: la representacón

Más detalles

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio. Tema 9 - Estadístca - Matemátcas B 4º E.S.O. 1 TEMA 9 - ESTADÍSTICA 9.1 DOS RAMAS DE LA ESTADÍSTICA 9.1.1 - INTRODUCCIÓN La estadístca tene por objeto el desarrollo de técncas para el conocmento numérco

Más detalles

Tema 4: Variables aleatorias

Tema 4: Variables aleatorias Estadístca 46 Tema 4: Varables aleatoras El concepto de varable aleatora surge de la necesdad de hacer más manejables matemátcamente los resultados de los expermentos aleatoros, que en muchos casos son

Más detalles

Comparación entre distintos Criterios de decisión (VAN, TIR y PRI) Por: Pablo Lledó

Comparación entre distintos Criterios de decisión (VAN, TIR y PRI) Por: Pablo Lledó Comparacón entre dstntos Crteros de decsón (, TIR y PRI) Por: Pablo Lledó Master of Scence en Evaluacón de Proyectos (Unversty of York) Project Management Professonal (PMP certfed by the PMI) Profesor

Más detalles

LECTURA 07: MEDIDAS DE TENDENCIA CENTRAL (PARTE II) LA MEDIANA Y LA MODA TEMA 17: LA MEDIANA Y LA MODA

LECTURA 07: MEDIDAS DE TENDENCIA CENTRAL (PARTE II) LA MEDIANA Y LA MODA TEMA 17: LA MEDIANA Y LA MODA LECTURA 07: MEDIDAS DE TENDENCIA CENTRAL (PARTE II) LA MEDIANA Y LA MODA TEMA 17: LA MEDIANA Y LA MODA. LA MEDIANA: Es una medda de tendenca central que dvde al total de n observacones debdamente ordenadas

Más detalles

REGRESION LINEAL SIMPLE

REGRESION LINEAL SIMPLE REGREION LINEAL IMPLE Jorge Galbat Resco e dspone de una mustra de observacones formadas por pares de varables: (x 1, y 1 ) (x, y ).. (x n, y n ) A través de esta muestra, se desea estudar la relacón exstente

Más detalles

Organización y resumen de datos cuantitativos

Organización y resumen de datos cuantitativos Organzacón y resumen de datos cuanttatvos Contendos Organzacón de datos cuanttatvos: dagrama de tallos y hojas, tablas de frecuencas. Hstogramas. Polígonos. Ojvas ORGANIZACIÓN Y RESUMEN DE DATOS CUANTITATIVOS

Más detalles

APLICACIÓN DEL ANALISIS INDUSTRIAL EN CARTERAS COLECTIVAS DE VALORES

APLICACIÓN DEL ANALISIS INDUSTRIAL EN CARTERAS COLECTIVAS DE VALORES APLICACIÓN DEL ANALISIS INDUSTRIAL EN CARTERAS COLECTIVAS DE VALORES Documento Preparado para la Cámara de Fondos de Inversón Versón 203 Por Rodrgo Matarrta Venegas 23 de Setembre del 204 2 Análss Industral

Más detalles

TEMA 3. VARIABLE ALEATORIA

TEMA 3. VARIABLE ALEATORIA TEMA 3. VARIABLE ALEATORIA 3.. Introduccón. 3... Dstrbucón de Probabldad de una varable aleatora 3... Funcón de Dstrbucón de una varable aleatora 3.. Varable aleatora dscreta 3... Funcón masa de probabldad

Más detalles

TÉCNICAS AUXILIARES DE LABORATORIO

TÉCNICAS AUXILIARES DE LABORATORIO TÉCNICAS AUXILIARES DE LABORATORIO I.- ERRORES 1.- Introduccón Todas las meddas epermentales venen afectadas de una mprecsón nherente al proceso de medda. Puesto que en éste se trata, báscamente, de comparar

Más detalles

Tema 1: Análisis de datos unidimensionales

Tema 1: Análisis de datos unidimensionales Tema : Análss de datos undmensonales. Varables estadístcas undmensonales. Representacones gráfcas.. Característcas de las dstrbucones de frecuencas undmensonales.. Varables estadístcas undmensonales. Representacones

Más detalles

METODOLOGÍA MUESTRAL ENCUESTA A LAS PEQUEÑAS Y MEDIANAS EMPRESAS

METODOLOGÍA MUESTRAL ENCUESTA A LAS PEQUEÑAS Y MEDIANAS EMPRESAS SUBDIRECCIÓN TÉCNICA DEPARTAMENTO DE INVESTIGACIÓN Y DESARROLLO ÁREA DE ANÁLISIS ESTADÍSTICAS ECONÓMICAS METODOLOGÍA MUESTRAL ENCUESTA A LAS PEQUEÑAS Y MEDIANAS EMPRESAS Santago, Enero de 2008. Departamento

Más detalles

Media es la suma de todas las observaciones dividida por el tamaño de la muestra.

Media es la suma de todas las observaciones dividida por el tamaño de la muestra. Estadístcos Los estadístcos son valores calculados con los datos de una varable cuanttatva y que mden alguna de las característcas de la dstrbucón muestral. Las prncpales característcas son: tendenca central,

Más detalles

1. Lección 7 - Rentas - Valoración (Continuación)

1. Lección 7 - Rentas - Valoración (Continuación) Apuntes: Matemátcas Fnanceras 1. Leccón 7 - Rentas - Valoracón (Contnuacón) 1.1. Valoracón de Rentas: Constantes y Dferdas 1.1.1. Renta Temporal y Pospagable En este caso, el orgen de la renta es un momento

Más detalles

Regresión y correlación simple 113

Regresión y correlación simple 113 Regresón y correlacón smple 113 Captulo X ANALISIS DE REGRESION Y CORRELACION El análss de regresón consste en emplear métodos que permtan determnar la mejor relacón funconal entre dos o más varables concomtantes

Más detalles

Maestría en Administración. Medidas Descriptivas. Formulario e Interpretación. Dr. Francisco Javier Cruz Ariza

Maestría en Administración. Medidas Descriptivas. Formulario e Interpretación. Dr. Francisco Javier Cruz Ariza Maestría en Admnstracón Meddas Descrptvas Formularo e Interpretacón Dr. Francsco Javer Cruz Arza A contnuacón mostramos el foco de atencón de las dstntas meddas que abordaremos en el presente manual. El

Más detalles

Tema 8 - Estadística - Matemáticas CCSSI 1º Bachillerato 1

Tema 8 - Estadística - Matemáticas CCSSI 1º Bachillerato 1 Tema 8 - Estadístca - Matemátcas CCSSI 1º Bachllerato 1 TEMA 8 - ESTADÍSTICA 8.1 NOCIONES GENERALES DE ESTADÍSTICA 8.1.1 INTRODUCCIÓN Objetvo: La estadístca tene por objeto el desarrollo de técncas para

Más detalles

LECTURA 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) LA MEDIA ARITMÉTICA TEMA 15: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION

LECTURA 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) LA MEDIA ARITMÉTICA TEMA 15: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION Unversdad Católca Los Ángeles de Chmbote LECTURA 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) LA MEDIA ARITMÉTICA TEMA 15: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION 1. DEFINICION: Las meddas estadístcas

Más detalles

TEMA 8: PRÉSTAMOS ÍNDICE

TEMA 8: PRÉSTAMOS ÍNDICE TEM 8: PRÉSTMOS ÍNDICE 1. CONCEPTO DE PRÉSTMO: SISTEMS DE MORTIZCIÓN DE PRÉSTMOS... 1 2. NOMENCLTUR PR PRÉSTMOS DE MORTIZCIÓN FRCCIOND... 3 3. CUDRO DE MORTIZCIÓN GENERL... 3 4. MORTIZCIÓN DE PRÉSTMO MEDINTE

Más detalles

Economía de la Empresa: Financiación

Economía de la Empresa: Financiación Economía de la Empresa: Fnancacón Francsco Pérez Hernández Departamento de Fnancacón e Investgacón de la Unversdad Autónoma de Madrd Objetvo del curso: Dentro del contexto de Economía de la Empresa, se

Más detalles

ESTADÍSTICA BIDIMENSIONAL ÍNDICE GENERAL

ESTADÍSTICA BIDIMENSIONAL ÍNDICE GENERAL ESTADÍSTICA BIDIMESIOAL ÍDICE GEERAL 1.-Varable Estadístca Bdmensonal. Tablas de frecuenca... 1.1.- Concepto de varable estadístca bdmensonal. Eemplos.... 1..-Tablas bdmensonales de frecuencas. Tablas

Más detalles

TERMODINÁMICA DEL EQUILIBRIO CAPÍTULO V. EQUILIBRIO DE REACCIÓN QUÍMICA

TERMODINÁMICA DEL EQUILIBRIO CAPÍTULO V. EQUILIBRIO DE REACCIÓN QUÍMICA Ing. Federco G. Salazar Termodnámca del Equlbro TERMODINÁMICA DEL EQUILIBRIO CAPÍTULO V. EQUILIBRIO DE REACCIÓN QUÍMICA Contendo 1. Conversón y Coordenada de Reaccón. 2. Ecuacones Independentes y Regla

Más detalles

CENTRO DE ESTUDIOS ESTADÍSTICOS DE JUSTICIA CONSTITUCIONAL

CENTRO DE ESTUDIOS ESTADÍSTICOS DE JUSTICIA CONSTITUCIONAL CENTRO DE ESTUDIOS ESTADÍSTICOS DE JUSTICIA CONSTITUCIONAL Ajuste de modelo de regresón logístca para la medcón de accón de tutela como factor de congestón de los Trbunales y Juzgados de las Jursdccones

Más detalles

CAPÍTULO 7 ESTIMACIÓN DE PARÁMETROS

CAPÍTULO 7 ESTIMACIÓN DE PARÁMETROS CAPÍTULO 7 ESTIMACIÓN DE PARÁMETROS En los capítulos anterores se han analzado varos modelos usados en la evaluacón de stocks, defnéndose los respectvos parámetros. En las correspondentes fchas de ejerccos

Más detalles

TEMA 1: PROBABILIDAD

TEMA 1: PROBABILIDAD robabldad TEM : ROBBILIDD Índce del tema Índce del tema.. Introduccón 2.2. Defncón de probabldad 3.2.. ropedades nmedatas 3 Ejemplo 7 Ejemplo 2 8 Ejemplo 3 9.3. robabldad condconada 0.3.. Introduccón 0.3.2.

Más detalles

Modelos de elección simple y múltiple. Regresión logit y probit. Modelos multilogit y multiprobit.

Modelos de elección simple y múltiple. Regresión logit y probit. Modelos multilogit y multiprobit. Modelos de eleccón smple y múltple. Regresón logt y probt. Modelos multlogt y multprobt. Sga J.Muro(14/4/2004) 2 Modelos de eleccón dscreta. Modelos de eleccón smple. Modelos de eleccón múltple. Fnal J.Muro(14/4/2004)

Más detalles

TERMODINÁMICA AVANZADA

TERMODINÁMICA AVANZADA TERMODINÁMICA AVANZADA Undad III: Termodnámca del Equlbro Ecuacones para el coefcente de actvdad Funcones de eceso para mezclas multcomponentes 9/7/0 Rafael Gamero Funcones de eceso en mezclas bnaras Epansón

Más detalles

Diseño de la Muestra. Introducción. Tipo de muestreo y estratificación

Diseño de la Muestra. Introducción. Tipo de muestreo y estratificación Dseño de la Muestra A Introduccón Sguendo las orentacones dadas por la Ofcna Estadístca de la Unón Europea (EUROSTAT) se a selecconado una muestra probablístca representatva de la poblacón de los ogares

Más detalles

PROBABILIDAD Y ESTADÍSTICA

PROBABILIDAD Y ESTADÍSTICA PROBABILIDAD Y ESTADÍSTICA 1. S A es un suceso de probabldad 0.3, la probabldad de su suceso contraro es: a) 0. b) 1.0 c) 0.7 (Convocatora juno 006. Eamen tpo H) S A es un suceso, la probabldad de su suceso

Más detalles

La adopción y uso de las TICs en las Microempresas Chilenas

La adopción y uso de las TICs en las Microempresas Chilenas Subdreccón Técnca Depto. Investgacón y Desarrollo Estadístco Subdreccón de Operacones Depto. Comerco y Servcos INFORME METODOLÓGICO DISEÑO MUESTRAL La adopcón y uso de las TICs en las Mcroempresas Clenas

Más detalles

Regresión Lineal Simple y Correlación

Regresión Lineal Simple y Correlación 4 Regresón Lneal Smple y Correlacón 4.1. Fundamentos teórcos 4.1.1. Regresón La regresón es la parte de la estadístca que trata de determnar la posble relacón entre una varable numérca, que suele llamarse

Más detalles

CAPITULO 3.- ANÁLISIS CONJUNTO DE DOS VARIABLES. 3.1 Presentación de los datos. Tablas de doble entrada.

CAPITULO 3.- ANÁLISIS CONJUNTO DE DOS VARIABLES. 3.1 Presentación de los datos. Tablas de doble entrada. Introduccón a la Estadístca Empresaral Capítulo - Análss conjunto de dos varables Jesús ánchez Fernández CAPITULO - AÁLII COJUTO DE DO VARIABLE Presentacón de los datos Tablas de doble entrada En el capítulo

Más detalles

LECTURA N 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) TEMA 14: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION

LECTURA N 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) TEMA 14: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION Unversdad Católca Los Ángeles de Chmbote LECTURA N 06: MEDIDAS DE TENDENCIA CENTRAL (PARTE I) TEMA 4: MEDIDAS ESTADISTICAS: DEFINICION Y CLASIFICACION. DEFINICION Las meddas estadístcas son meddas de resumen

Más detalles

Modelos triangular y parabólico

Modelos triangular y parabólico Modelos trangular y parabólco ClassPad 0 Prof. Jean-Perre Marcallou INTRODUCCIÓN La calculadora CASIO ClassPad 0 dspone de la Aplcacón Prncpal para realzar los cálculos correspondentes a los modelos trangular

Más detalles

Diseño y Análisis de Experimentos en el SPSS 1

Diseño y Análisis de Experimentos en el SPSS 1 Dseño y Análss de Expermentos en el SPSS EJEMPLO. Los sguentes datos muestran las meddas de hemoglobna (gramos por 00 ml) en la sangre de 40 ejemplares de una espece de truchas marrones. Las truchas se

Más detalles

CESMA BUSINESS SCHOOL

CESMA BUSINESS SCHOOL CESMA BUSINESS SCHOOL MATEMÁTICAS FINANCIERAS. TEMA 4 RENTAS y MÉTODOS DE AMORTIZACIÓN Javer Blbao García 1 1.- Introduccón Defncón: Conjunto de captales con vencmentos equdstantes de tempo. Para que exsta

Más detalles

TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE

TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE TEMA III EL ANÁLISIS DE REGRESIÓN LINEAL MÚLTIPLE LECTURA OBLIGATORIA Regresón Lneal Múltple. En Ral, A. y Varela, J. (008). Estadístca Práctca para la Investgacón en Cencas de la Salud. Coruña: Netbblo.

Más detalles

Pruebas Estadísticas de Números Pseudoaleatorios

Pruebas Estadísticas de Números Pseudoaleatorios Pruebas Estadístcas de Números Pseudoaleatoros Prueba de meda Consste en verfcar que los números generados tengan una meda estadístcamente gual a, de esta manera, se analza la sguente hpótess: H 0 : =

Más detalles

Fugacidad. Mezcla de gases ideales

Fugacidad. Mezcla de gases ideales Termodnámca del equlbro Fugacdad. Mezcla de gases deales rofesor: Alí Gabrel Lara 1. Fugacdad 1.1. Fugacdad para gases Antes de abarcar el caso de mezclas de gases, debemos conocer como podemos relaconar

Más detalles

Análisis de error y tratamiento de datos obtenidos en el laboratorio

Análisis de error y tratamiento de datos obtenidos en el laboratorio Análss de error tratamento de datos obtendos en el laboratoro ITRODUCCIÓ Todas las meddas epermentales venen afectadas de una certa mprecsón nevtable debda a las mperfeccones del aparato de medda, o a

Más detalles

OPERACIONES ARMONIZACION DE CRITERIOS EN CALCULO DE PRECIOS Y RENDIMIENTOS

OPERACIONES ARMONIZACION DE CRITERIOS EN CALCULO DE PRECIOS Y RENDIMIENTOS P L V S V LT R A BANCO DE ESPAÑA OPERACIONES Gestón de la Informacón ARMONIZACION DE CRITERIOS EN CALCULO DE PRECIOS Y RENDIMIENTOS El proceso de ntegracón fnancera dervado de la Unón Monetara exge la

Más detalles

EJERCICIOS RESUELTOS TEMA 2

EJERCICIOS RESUELTOS TEMA 2 EJERCICIOS RESUELTOS TEMA.1. La Moda, para el grupo de Varones de la Tabla 1, es: A) 4,5; B) 17; C) 60.. Con los datos de la Tabla 1, la meda en para las Mujeres es: A) gual a la meda para los Varones;

Más detalles

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS FACULTAD DE CIENCIAS MATEMÁTICAS E.A.P. DE..ESTADÍSTICA La fecunddad y su relacón con varables socoeconómcas, demográfcas y educatvas aplcando el Modelo de Regresón

Más detalles

GANTT, PERT y CPM INDICE

GANTT, PERT y CPM INDICE GANTT, PERT y CPM INDICE 1 Antecedentes hstórcos...2 2 Conceptos báscos: actvdad y suceso...2 3 Prelacones entre actvdades...3 4 Cuadro de prelacones y matrz de encadenamento...3 5 Construccón del grafo...4

Más detalles

Una renta fraccionada se caracteriza porque su frecuencia no coincide con la frecuencia de variación del término de dicha renta.

Una renta fraccionada se caracteriza porque su frecuencia no coincide con la frecuencia de variación del término de dicha renta. Rentas Fnanceras. Renta fracconada 6. RETA FRACCIOADA Una renta fracconada se caracterza porque su frecuenca no concde con la frecuenca de varacón del térmno de dcha renta. Las característcas de la renta

Más detalles

FIABILIDAD (V): COMPARACIÓN (NO PARAMÉTRICA) DE MUESTRAS

FIABILIDAD (V): COMPARACIÓN (NO PARAMÉTRICA) DE MUESTRAS FIABILIDAD (V): COMPARACIÓN (NO PARAMÉTRICA) DE MUESTRAS Autores: Ángel A Juan Pérez (ajuanp@uocedu), Rafael García Martín (rgarcamart@uocedu) RELACIÓN CON OTROS MATH-BLOCS Este math-block forma parte

Más detalles

IES Menéndez Tolosa (La Línea) Física y Química - 1º Bach - Gráficas

IES Menéndez Tolosa (La Línea) Física y Química - 1º Bach - Gráficas IES Menéndez Tolosa (La Línea) Físca y Químca - 1º Bach - Gráfcas 1 Indca qué tpo de relacón exste entre las magntudes representadas en la sguente gráfca: La gráfca es una línea recta que no pasa por el

Más detalles

Tratamiento de datos experimentales. Teoría de errores

Tratamiento de datos experimentales. Teoría de errores Tratamento de datos expermentales. Teoría de errores. Apéndce II Tratamento de datos expermentales. Teoría de errores (Fuente: Práctcas de Laboratoro: Físca, Hernández et al., 005) El objetvo de la expermentacón

Más detalles

Tasas de Caducidad. - Guía de Apoyo para la Construcción y Aplicación - Por: Act. Pedro Aguilar Beltrán. paguilar@cnsf.gob.mx

Tasas de Caducidad. - Guía de Apoyo para la Construcción y Aplicación - Por: Act. Pedro Aguilar Beltrán. paguilar@cnsf.gob.mx Tasas de Caducdad - Guía de Apoyo para la Construccón y Aplcacón - Por: Act. Pedro Agular Beltrán pagular@cnsf.gob.m 1. Introduccón La construccón y aplcacón de tasas de caducdad en el cálculo de utldades

Más detalles

ANEXO METODOLOGÍA EVALUACIÓN DE IMPACTO

ANEXO METODOLOGÍA EVALUACIÓN DE IMPACTO GOBIERNO DE CHILE MINISTERIO DE HACIENDA Dreccón de Presupuestos ANEXO METODOLOGÍA EVALUACIÓN DE IMPACTO Dvsón de Control de Gestón Santago, Mayo 2009 CHILE PRESENTACIÓN * El anexo que a contnuacón se

Más detalles

Electricidad y calor

Electricidad y calor Electrcdad y calor Webpage: http://pagnas.sca.uson.mx/qb 2007 Departamento de Físca Unversdad de Sonora Temas 4. Prmera ley de la Termodnámca.. Concepto de Trabajo aplcado a gases.. Trabajo hecho por un

Más detalles

UNIVERSIDAD DE GUADALAJARA, CUCEI DEPARTAMENTO DE ELECTRÓNICA LABORATORIO DE ELECTRÓNICA II

UNIVERSIDAD DE GUADALAJARA, CUCEI DEPARTAMENTO DE ELECTRÓNICA LABORATORIO DE ELECTRÓNICA II UNIVERSIDAD DE GUADALAJARA, CUCEI DEPARTAMENTO DE ELECTRÓNICA LABORATORIO DE ELECTRÓNICA II PRACTICA 11: Crcutos no lneales elementales con el amplfcador operaconal OBJETIVO: El alumno se famlarzará con

Más detalles

Elaboración de Tablas ó Cuadros. La elaboración de tablas o cuadros, facilita el análisis y la presentación de la información.

Elaboración de Tablas ó Cuadros. La elaboración de tablas o cuadros, facilita el análisis y la presentación de la información. Elaboracón de Tablas ó Cuadros La elaboracón de tablas o cuadros, faclta el análss la presentacón de la nformacón. Para elaborar los cuadros, se debe, antes que todo, dentfcar las varables, característcas

Más detalles

8 MECANICA Y FLUIDOS: Calorimetría

8 MECANICA Y FLUIDOS: Calorimetría 8 MECANICA Y FLUIDOS: Calormetría CONTENIDOS Dencones. Capacdad caloríca. Calor especíco. Equlbro térmco. Calormetría. Calorímetro de las mezclas. Marcha del calorímetro. Propagacón de Errores. OBJETIVOS

Más detalles

Electricidad y calor. Un repaso... Temas. 4. Primera ley de la Termodinámica. Webpage: Algunas definiciones

Electricidad y calor. Un repaso... Temas. 4. Primera ley de la Termodinámica. Webpage:  Algunas definiciones Electrcdad y calor Webpage: http://pagnas.sca.uson.mx/qb 2007 Departamento de Físca Unversdad de Sonora Temas 4. Prmera ley de la Termodnámca.. Concepto de Trabajo aplcado a gases.. Trabajo hecho por un

Más detalles

3. Algunos modelos estadísticos

3. Algunos modelos estadísticos 3. Algunos modelos estadístcos Con las herramentas computaconales a nuestra dsposcón, en las sguentes seccones se revsarán algunos de los modelos estadístcos más usados en la práctca y la forma de hacer

Más detalles

4 Contraste de hipótesis en el modelo de regresión múltiple

4 Contraste de hipótesis en el modelo de regresión múltiple 4 Contraste de hpótess en el modelo de regresón múltple Ezequel Urel Unversdad de Valenca Versón: 9-13 4.1 El contraste de hpótess: una panorámca 1 4.1.1 Formulacón de la hpótess nula y de la hpótess alternatva

Más detalles

Maestría en Economía Facultad de Ciencias Económicas Universidad Nacional de La Plata TESIS DE MAESTRIA. ALUMNO Laura Carella. DIRECTOR Alberto Porto

Maestría en Economía Facultad de Ciencias Económicas Universidad Nacional de La Plata TESIS DE MAESTRIA. ALUMNO Laura Carella. DIRECTOR Alberto Porto Maestría en Economía Facultad de Cencas Económcas Unversdad Naconal de La Plata TESIS DE MAESTRIA ALUMNO Laura Carella TITULO Educacón unverstara: medcón del rendmento académco a través de fronteras de

Más detalles

CAPÍTULO 3 METODOLOGÍA. En el siguiente capítulo se presenta al inicio, definiciones de algunos conceptos actuariales

CAPÍTULO 3 METODOLOGÍA. En el siguiente capítulo se presenta al inicio, definiciones de algunos conceptos actuariales CAPÍTULO 3 METODOLOGÍA En el sguente capítulo se presenta al nco, defncones de algunos conceptos actuarales que se utlzan para la elaboracón de las bases técncas del Producto de Salud al gual que la metodología

Más detalles

Oferta de Trabajo Parte 2. Economía Laboral Julio J. Elías LIE - UCEMA

Oferta de Trabajo Parte 2. Economía Laboral Julio J. Elías LIE - UCEMA Oferta de Trabajo Parte 2 Economía Laboral Julo J. Elías LIE - UCEMA Curva de oferta de trabajo ndvdual Consumo Salaro por hora ($) G w=$20 F w=$25 25 Curva de Oferta de Trabajo Indvdual w=$14 20 14 w

Más detalles

Visión moderna del modelo de transporte clásico

Visión moderna del modelo de transporte clásico Vsón moderna del modelo de transporte clásco Zonfcacón y Red Estratégca Datos del Año Base Datos de Planfcacón Para el Año de Dseño Base de Datos año base futuro Generacón de Vajes Demanda Dstrbucón y

Más detalles

UNIVERSIDAD CARLOS III DE MADRID Ingeniería Informática Examen de Investigación Operativa 21 de enero de 2009

UNIVERSIDAD CARLOS III DE MADRID Ingeniería Informática Examen de Investigación Operativa 21 de enero de 2009 UNIVERSIDAD CARLOS III DE MADRID Ingenería Informátca Examen de Investgacón Operatva 2 de enero de 2009 PROBLEMA. (3 puntos) En Murca, junto al río Segura, exsten tres plantas ndustrales: P, P2 y P3. Todas

Más detalles

MATEMÁTICAS para estudiantes de primer curso de facultades y escuelas técnicas

MATEMÁTICAS para estudiantes de primer curso de facultades y escuelas técnicas Unversdad de Cádz Departamento de Matemátcas MATEMÁTICAS para estudantes de prmer curso de facultades y escuelas técncas Tema 13 Dstrbucones bdmensonales. Regresón y correlacón lneal Elaborado por la Profesora

Más detalles