Análisis de supervivencia y análisis multivariado

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Análisis de supervivencia y análisis multivariado"

Transcripción

1 Análisis de supervivencia y análisis multivariado Miguel Ángel Martínez González, Jokin de Irala Estévez NOCIONES DE ANÁLISIS DE SUPERVIVENCIA En este apartado se exponen los principios del estudio formal de factores pronósticos que condicionan la supervivencia de un paciente 1-4. También se puede considerar como resultado la aparición de complicaciones o la curación en vez de la muerte. En este segundo caso lo que se suele estudiar es la supervivencia libre de complicaciones. Por tanto, aunque se le siga denominando análisis de supervivencia, no siempre tiene que ser la muerte el acontecimiento de desenlace. Pero en principio debe tratarse de acontecimientos que, como la muerte, marcan un punto de no retorno. Los procedimientos más habituales requieren además que el desenlace sólo pueda ocurrir una vez como la muerte. Para valorar el pronóstico, en ambas situaciones, suelen aplicarse técnicas estadísticas de análisis de supervivencia 3. La supervivencia incorpora el concepto dinámico del tiempo y es por tanto una variable compuesta de dos elementos: respuesta y tiempo. La respuesta o desenlace de interés no es una cantidad numérica 1, como la presión arterial, ni una cualidad dicotómica como enfermar o no, sino que toma la forma de tiempo transcurrido hasta un suceso (time-to-event), lo que supone utilizar como desenlace o respuesta ( variable 1

2 2 Manual de medicina basada en la evidencia (Capítulo 17) dependiente en la jerga matemática) la combinación de ambas cosas (cualidad + variable numérica). La cualidad corresponde a si se ha producido o no el suceso y es una variable dicotómica (muerte, recidiva, aparición de una complicación o un nuevo síntoma, etc.). La variable numérica indica cuánto tiempo ha tardado en llegarse a ese desenlace. En estas situaciones se deben emplear los llamados métodos de análisis de supervivencia. El tiempo de supervivencia tiene una característica que lo hace inadecuado para otro tipo de análisis estadísticos: la existencia de información truncada o individuos censurados (censored). Se dice que un paciente ofrece una información truncada o es un individuo censurado cuando se acaba el periodo de seguimiento para él, por un motivo distinto del desenlace o resultado que se está estudiando. Por ejemplo, los pacientes que no mueren durante el tiempo de seguimiento que dura el estudio no presentarán el resultado que se está observando, y por tanto se desconocerá cuál es para ellos su tiempo de supervivencia. Serían truncados o censurados tanto los que llegan al final del estudio sin sufrir el desenlace (supervivientes), como los que lo abandonan por su voluntad (abandonos, o pérdidas, lost to follow up) o los retirados por los investigadores (retiradas, withdrawals). Los métodos más habituales (Kaplan Meier, Log Rank, Cox, ver más adelante) asumen que los sujetos que se van del estudio antes de su finalización (censurados) se habrían comportado del mismo modo que los que han sido seguidos hasta el final. A este supuesto básico se le llama censura no informativa 5. Con ello se quiere expresar que saber que han sido censurados no informa adicionalmente respecto a su pronóstico. Desde el punto de vista práctico se requiere asumir que quienes se censuraron precozmente no sean sujetos peculiares. Si no existiese información censurada, es decir, si todos los sujetos fuesen seguidos completamente durante el mismo periodo de tiempo hasta que se produjera su muerte o el acontecimiento que sea, se podrían usar otros métodos más sencillos. En la figura 17 1 Figura Seguimiento de 6 pacientes. Se han observado 3 muertes (pacientes 1, 3 y 6, representados con cruces). Dos pacientes están censurados por seguir vivos al concluirse el estudio (pacientes 2 y 5). Otro (paciente 4) también está censurado, pero porque se perdió después de 4 años de seguimiento.

3 Análisis de supervivencia y análisis multivariado 3 se representa el tiempo de seguimiento de cada paciente por una línea. Hay dos situaciones posibles: aquéllos cuyo periodo de seguimiento acaba porque fallecen (representados por una cruz) o aquellos que están vivos cuando dejan de ser observados (se van del estudio, se trasladan de ciudad, acaban el estudio estando vivos), en estos se representa su final por una señal de visto bueno. Por ejemplo, el primer paciente murió tras haber estado 5 años en el estudio y el último paciente entró tarde y murió a los 3,5 años de entrar en el estudio. A pesar de que el seguimiento de cada paciente suele haberse empezado en fechas de calendario diferentes, debe imaginarse que todos han empezado el estudio en la misma fecha. Esto supone asumir que se trata de pacientes homogéneos en el sentido de que los distintos tiempos de entrada en el estudio no están relacionados con el efecto de interés. Cuadro Preparación de los datos para hacer un análisis de supervivencia PACIENTE TIEMPO ESTAD O 5 1, , La primera columna indica el número de identificación de cada paciente. La segunda, el tiempo durante el cual se le ha obser- vado. La tercera columna indica el estado del paciente al final del seguimiento. Se ha asignado un 1 a los que han fallecido (su tiempo de seguimiento es, por tanto, la duración de su supervivencia) y un 0 a los que seguían vivos al final del segui- miento. Es muy importante que los datos se hayan ordenado según el tiempo de observación en orden ascendente Un supuesto importante en el diseño de estudios de factores pronósticos es que se trate de una cohorte de incepción. Esto supone que todos entrarán en el estudio en el mismo momento de la historia natural de su enfermedad. Si los momentos de entrada en el estudio corresponden a distintas fases de la evolución de la enfermedad se producirá un sesgo en los resultados. Con los pacientes de la figura 17 1, los datos para hacer un análisis de supervivencia serán los que muestra la cuadro La variable estado se ha codificado así: fallecido=1; vivo=0. Es posible así estimar la probabilidad de la supervivencia para un periodo dado. Si existen dos o más grupos también se pueden comparar sus probabilidades de supervivencia. El método más usado es el de Kaplan Meier que no asume que los datos tengan una distribución particular, ni se basa en utilizar parámetros de resumen (media, desviación estándar, etc.). El único supuesto importante que se exige para aplicarlo es que la censura no sea informativa. Aunque ya lo hemos comentado, vale la pena insistir en que este supuesto significa que la probabilidad de ser censurado no sea distinta, según los pacientes presenten un peor o mejor pronóstico. La probabilidad de ser censurado debe ser independiente del efecto de interés. Es decir, no puede aplicarse el método de Kaplan Meier con garantías si se sabe que los que se retiran del estudio antes de que acabe son pacientes

4 4 Manual de medicina basada en la evidencia (Capítulo 17) peculiares, que probablemente tendrán una supervivencia distinta (mejor o peor) de los que son seguidos hasta el final. En el ejemplo de los 6 pacientes antes comentado, si se excluyen los casos de los cuales no se sabe cuánto han tardado en morir, ya que la última información sobre ellos es que seguían vivos Pacientes censurados (pacientes 5, 2 y 4 que se han sombreado); y se consideran sólo aquellos que se sabe cuanto han tardado en morir (pacientes 3, 6 y 1), se podría calcular fácilmente la supervivencia. Si nos olvidásemos de los censurados, podría pensarse que la supervivencia (S) en cada tiempo valdría: A los dos años: ha muerto 1 y sobreviven 2... S 2 = 2/3 = 67 (67%) A los 3,5 años: han muerto 2 y sobrevive 1... S 3,5 = 1/3 = 33 (33%) A los 5 años: han muerto los 3... S 5 = 0/3 = 0 (0%) Pero hacer esto no es correcto, pues supone, por un lado desaprovechar la información que proporcionan los sujetos 5, 2 y 4 y, por otro lado, algo más importante: no es verdad, por ejemplo que a los 3,5 años la supervivencia sea del 33%, ya que los pacientes número 2 y 4 han sobrevivido al menos 4 años. Por tanto, hay que usar un método que incluya en los cálculos a estos pacientes, como el 5, 2 y 4, de los que tenemos una información truncada o censurada. En el método de Kaplan Meier para aprovechar esta información la supervivencia a tiempo t (St) se define como: S t = Π S i n i Donde la letra pi mayúscula (P) es un símbolo análogo al sumatorio (S), pero que significa productorio o multiplicatorio, es decir, en vez de expresar sumar todo quiere decir multiplicar todo ; s i son los supervivientes en el tiempo t i, y n i son los que están a riesgo de fallecer al inicio del tiempo t i. Es el producto de una serie de probabilidades condicionales, y se calcula por multiplicación. La condición es haber llegado vivo hasta el instante inmediatamente anterior a ese tiempo t i. Lo que expresa este estimador de Kaplan Meier no es una única cantidad, sino una función que variará a lo largo del tiempo, por eso se indica como St, donde el subíndice t indica que la supervivencia será distinta de un tiempo a otro. En la cuadro 17 2 se representa, paso a paso cómo se calcula el estimador de Kaplan Meier para los datos del ejemplo. Cualquier análisis de supervivencia se suele acompañar de la respectiva representación gráfica para expresar visualmente cómo va disminuyendo la probabilidad de sobrevivir a medida que pasa el tiempo. Siempre se sitúa el tiempo en el eje de abscisas ( x ) y la estimación del el porcentaje de los que sobreviven en el eje de ordenadas ( y ). Las curvas de supervivencia calculadas con el método de Kaplan Meier son un procedimiento descriptivo: sirven para resumir la historia de una serie de pacientes en cuanto a su riesgo de fallecimiento, o visto en términos positivos, en cuanto a su probabilidad de supervivencia.

5 Análisis de supervivencia y análisis multivariado 5 Cuadro Estimación de la supervivencia por el método de Kaplan-Meier PACIENTE TIEMPO ESTAD O 5 1, /5 = , 5 1 3/4 = = /1 = = 0 Las 3 primeras columnas coinciden con las del cuadro La penúltima columna estima la proporción de pacientes que so- breviven más allá de cada tiempo, pero sólo se cálcula para aquellos tiempos en los que se observa algún fallecimiento. Por ejemplo, hay 5 pacientes a riesgo de fallecer a los 2 años (ni = 4), éstos son los pacientes 3, 6, 4 y 1; de ellos sobrevi- ven 4 (si = 4). El cociente si / ni = 8 estima la probabilidad de sobrevivir 2 o más años. La última columna corresponde al es- timador de Kaplan-Meier y va multimplicando los cocientes si / ni de cada tiempo por el producto previo. Así, podremos decir que la supervivencia acumulada a los 2 años era del 80%, a los 3, 5 años del 60% y a los 5 años del 0% Como muestra la figura 17 para construir una curva de supervivencia se deben dar los siguientes pasos: a. Ordenar ascendentemente los tiempos de supervivencia (o tiempos de observación). b. Hacer una cuadro donde una columna (t i ) corresponda a los tiempos de observación para cada participante y otra al estado de los individuos al finalizar su periodo de seguimiento. c. Calcular para cada periodo de tiempo el cociente entre los que sobreviven y los que están a riesgo de fallecer (s i /n i ). Se crea otra columna para estos cocientes entre quienes sobreviven (s i ) y los que están a riesgo (n i ) de fallecer (son los que entran vivos en ese tiempo). En esta columna sólo hay datos para cuando alguien fallece. Es importante hacer notar que entre los que entran a riesgo de morir (n i ) se incluyen también el individuo o individuos que van a morir en ese periodo, aunque mueran justamente en el inicio del periodo. d. Multiplicar en cada periodo de tiempo los cocientes (s i /n i ) por los de los tiempos anteriores. La supervivencia en ese momento será precisamente este producto. e. Finalmente, siempre es recomendable representarlo gráficamente. Se debe empezar con una supervivencia de 1, que se mantiene hasta que se produce el primer fallecimiento. En ese momento la gráfica da un salto correspondiente al descenso de la supervivencia a partir de ese momento (en el ejemplo pasa a 80). Y así sucesivamente. Cuando el más largo de los tiempos corresponde a alguien que seguía vivo al final del periodo de observación, se deja una línea horizontal al final. Si todos hubieran fallecido (como sucede en el ejemplo) se traza una vertical hasta el punto 0 de supervivencia. En la figura 17 2 se ha presentado la curva que de Kaplan Meier correspondiente a los datos del ejemplo. Se observa en la figura 17 3 que los saltos se dan sólo cuando ocurre alguna muerte, cabría preguntarse entonces: si sólo los pacientes fallecidos provocan un salto en la

6 6 Manual de medicina basada en la evidencia (Capítulo 17) 1,0,9,8,7,6 Supervivencia acumulada,5,4,3,2, TIEMPO (AÑOS) Figura Curva de Kaplan-Meier representando la supervivencia acumulada durante el seguimiento de 6 pacientes. Puede observarse que, como es lógico, sólo hay cambios en la supervivencia cuando muere algún paciente. Se han observado 3 muertes (a los 3,5 y 5 años). Los otros 3 pacientes están censurados. curva cómo influyen los individuos que no fallecen (censurados) en las estimaciones de la supervivencia? La respuesta es que cada dato censurado influye disminuyendo el denominador de los cocientes si/ni, con lo que, aunque un individuo truncado no provoque un salto, sí provoca una mayor magnitud en el tamaño del siguiente salto. En la cuadro 17 3 hay otro ejemplo con su solución. Se ha representado la curva de Kaplan-Meíer de este segundo ejemplo en la figura TIEMPO Cuadro Cálculos para obtener la estimación de Kaplan-Meier ESTAD O s i n i s Π i n i /10 = /8 = = /4 = = /3 = = /2 = = Supervivencia acumulada 1,0,9,8,7,6,5,4,3,2, A Fi 17 3 K l M i t ió Figura Kaplan-Meier: representación gráfica

7 Análisis de supervivencia y análisis multivariado 7 Para comparar dos o más curvas de supervivencia se usan diversas pruebas estadísticas de contraste de hipótesis. La más empleada es el test del Log Rank. Su hipótesis nula es que las supervivencias de los grupos que se comparan (2 o más) son las mismas. Aunque lo que está realmente indicado para comparar la supervivencia de diferentes grupos de pacientes será habitualmente el test del log-rank, en medicina, en cambio, se ha hecho práctica común (pero no por eso acertada) comparar la supervivencia usando como referencia un punto común en el tiempo. Por ejemplo, para comparar dos tratamientos o dos series, se tiende a usar como medida de resultado cuál es la supervivencia de los pacientes a los 5 años. Pero esto es básicamente incorrecto. Dos situaciones muy distintas pueden dar lugar a los mismos resultados de supervivencia a 5 años como se ve en la figura 17 4, donde los grupos A y tienen exactamente una supervivencia del 50% a los 5 años. Sin embargo, se observa claramente que los pacientes del grupo B tienen una peor supervivencia desde el principio del estudio. Figura Curvas de Kaplan-Meier representando la supervivencia acumulada de dos grupos de pacientes (A y B). Aunque la supervivencia del grupo A es mejor durante el seguimiento, al final se igualan las curvas a los 5 años. Si sólo se comparasen los porcentajes de supervivencia en un punto el tiempo (a los 5 años) se estaría desperdiciando mucha información y se llegaría a la conclusión equivocada de que el pronóstico de los dos grupos es idéntico. El test del log-rank tiene en cuenta todos los puntos en el tiempo para comparar la supervivencia de ambos grupos. Lo que hay que hacer en cambio para comparar dos o más curvas de supervivencia es usar diversos tests específicamente diseñados para ello y que tienen en cuenta toda la historia de seguimiento de los pacientes en vez de considerar sólo un punto en el tiempo, es decir detectan diferencias persistentes a lo largo del tiempo en la supervivencia.

8 8 Manual de medicina basada en la evidencia (Capítulo 17) Cuando el evento de resultado es poco frecuente o si las curvas son aproximadamente paralelas (no se cruzan) el log-rank es el método más indicado. También se le conoce como test de Mantel y Haenszel. Cuando las curvas se cruzan (al principio hay mejor supervivencia en un grupo y luego en el otro), entonces puede estar indicado el uso de otro test de comparación de curvas de supervivencia que se llama de Wilcoxon (o también de Breslow). Un tercer test que se emplea con menos frecuencia es el de Tarone Ware. En estos tests se hace una ponderación y se le da distinto peso a las diferencias según ocurran más precoz o más tardíamente a lo largo del seguimiento. En resumen, puede decirse que estos tests tienen las siguientes características comunes: Hipótesis nula (H 0 ): las supervivencias de los grupos que se comparan (2 ó más) es la misma. Hipótesis alternativa (H 1 ): al menos uno de los grupos tiene una supervivencia diferente. Estadístico utilizado: jicuadrado con k-1 grados de libertad, siendo k el número de grupos (nº de curvas que se comparan). ERROR ESTÁNDAR E INTERVALOS DE CONFIANZA PARA LA SUPERVIVENCIA Si se desea calcular un intervalo de confianza para la estimación de la supervivencia a un determinado tiempo se puede realizar a partir del error estándar de cada estimación de la supervivencia acumulada. Este error estándar para cada tiempo (EE St ) es el producto de la supervivencia estimada para ese tiempo por la raíz de la suma de los cocientes entre el número de fallecidos en cada momento y el producto de supervivientes y pacientes a riesgo en ese tiempo 3. Es decir, Así, para la supervivencia acumulada a 2 años que aparece en la cuadro 17 3, su error estándar se calcularía multiplicando la supervivencia estimada (68) por la suma de los cocientes entre fallecidos y el producto de totales por supervivientes sumando los del tiempo previo (1/(10 9)) y los de ese tiempo (2/(8x6)). Es decir, el error estándar valdría EE S2 =68 [(1/90)+(2/48)] 5 = 16. En cambio, para la supervivencia al año, EE S1 =9 (1/90) 5 = 095. Para los 5 años, EE S1 = 19. Una aproximación poco fina pero conservadora para estimar los intervalos de confianza al 95% será aplicar la siguiente expresión: IC 95% S t = Superv t ± 1,96 EE (1,96 es el valor z de la normal para un error alfa bilateral del 5%)

9 Análisis de supervivencia y análisis multivariado 9 Por ejemplo, si en el listado de SPSS vemos la salida que aparece en las tres primeras columnas de la cuadro 17 4 (corresponden a los datos del ejemplo de la cuadro 17 3), las estimaciones de supervivencia con sus límites de confianza serían las presentadas en las dos últimas columnas de la tabla. Cuadro Método desaconsejabl e para estimar de la supervivenciar los intervalos de confianza TIEMPO S UPERVIVENCI A IC 95% , Con los datos del cuadro 17 3 se han calculado los errores estándar y la estimación de los intervalos de confianza al 95% para la supervivencia. Las 2 primeras columnas coinciden con la primera y la última del cuadro 17 3, la tercera columna recoge los errores estándar (son los que suelen presentar los programas de software convencionales, como SPSS) y las dos últimas el in- tervalo de confianza calculado simplemente al restar y sumar 1, 96 veces el error estándar a cada estimación de la superviven- c ia. como puede vers e, hay límites de confianza que exceden de 1 y otros que son negativos, lo cual es absurdo. En el cuadr o 17 5 se presentan las estimaciones más adecuadas, libres de este problema. Pero, el método simplista de sumar y restar 1,96 veces el error estándar a la supervivencia estimada es desaconsejable porque proporciona intervalos de confianza que son negativos y otros que exceden de 1, lo cual es absurdo. Se puede usar otra expresión más adecuada 3, calculando un error estándar transformado (EE t ). Método recomendable para estimar los intervalos de confianza de la Supervivencia EE t = EE 1 t = (ln 2 1 (ln 5063 ) n [] i S ) n s [ ] IC95% = 5063 i i s i = EXP( ± 1,96 54) IC 95% S t = S t EXP (± 1, 96EE t ) Donde ln significa logaritmo natural (neperiano) y EXP supone elevar a la cantidad correspondiente el número e, base de los logaritmos naturales. Así, para la supervivencia a 5 años del ejemplo anterior (S 5 = 5063), el intervalo de confianza al 95% sería: =

10 10 Manual de medicina basada en la evidencia (Capítulo 17) En la cuadro 17 5 se recogen los intervalos de confianza para cada tiempo, así calculados. Puede apreciarse que los intervalos de confianza son más estrechos y además nunca son inferiores a 0 ni superiores a 1. Cuadro Con los mismos datos de los dos cuadros anteriores se han calculado los errores estándar transformados (EEt) y la estimación de los intervalos de confianza al 95% para la supervivencia donde ya se calculan con la expresión adecuada para que no sobrepasen nunca la unidad o el 0. Este método es el más aconsejable Método recomendable para estimar los intervalos de confianza de la supervivencia TIEMPO EE = 2 1 [] i i S UPERVIVENCI A t IC 95% (ln S ) nisi n s Puede programarse una hoja de cálculo (p. ej., en Microsoft Excel) para obtener intervalos de confianza al 95% de la supervivencia a partir del output convencional que proporciona un paquete estadístico de análisis de supervivencia. Se indican a continuación las órdenes que deben dársele a la hoja de cálculo 5. Si se ha introducido el valor de la supervivencia en la casilla A2 y su error estándar convencional (el que aparece por ejemplo en SPSS en la casilla B2), deberá indicarse C2 = (((B2/A2)^2) * (1/(LN(A2))^2))^5 D2 = (A2)^EXP(1,96*C2) E2 = A2^EXP(-1,96*C2) Devolverá el error estándar transformado Devolverá el límite inferior de confianza al 95% Devolverá el límite superior de confianza al 95% Puede encontrarse un programa en Excel ya preparado en la siguiente dirección de internet > docencia > bioestadística ANÁLISIS MULTIVARIADO En la medicina basada en la evidencia resulta útil aplicar modelos multivariantes para intentar explicar un fenómeno, teniendo en consideración varias variables simultáneamen-

11 Análisis de supervivencia y análisis multivariado 11 te o para realizar predicciones. Por ejemplo, puede resultar de interés conocer qué factores pronósticos influyen en la supervivencia de los pacientes con infarto de miocardio, o si la supervivencia de los pacientes con un determinado tumor se ve afectada por diversos tratamientos (quimioterapia, radioterapia) u otros factores, como por ejemplo, el estado psicológico del paciente. En general, la aplicación de una técnica de análisis multivariante significa que se tienen en cuenta simultáneamente muchas variables en el análisis de los datos. La principal ventaja que ofrecen estas técnicas, es que permiten controlar de modo eficiente muchos factores de confusión al mismo tiempo cuando se trata de estudiar asociaciones potencialmente causales entre una determinada exposición y un efecto o desenlace. Ésta ha sido y sigue siendo su principal aplicación en la investigación médica en las últimas 3 décadas. El ajuste multivariante supone la aplicación de un modelo matemático que hace más comparables a los grupos de individuos expuestos y no expuestos, evitando la distorsión que supondría que, por ejemplo, los expuestos fuesen de mayor edad o se encontrasen con mayor frecuencia sometidos a otros factores pronósticos distintos del que se está estudiando. Así se consigue que la comparación de interés quede depurada de otros factores y se pueda apreciar mejor cuál es su efecto verdaderamente independiente. Hay muchos procedimientos y técnicas de ajuste multivariante. Los más utilizados se suelen basar en un modelo de regresión. El más simple es la regresión lineal. REGRESIÓN MÚLTIPLE Se emplea cuando se desea estudiar como influyen varios factores (o variables independientes) en una sola variable de respuesta (la variable dependiente o desenlace), que ha de ser en este caso una variable cuantitativa numérica, como por ejemplo la talla o el peso. La ecuación de la regresión lineal simple es la ecuación de una recta; éste es el modelo matemático más sencillo: y = a + bx Donde y es la variable dependiente o desenlace, mientras que x es la variable independiente o factor predictor. A la constante a se le llama ordenada en el origen y al coeficiente b, se le llama pendiente de la recta. Pero esta ecuación se puede generalizar para el caso en que haya más de una variable independiente. Supongamos que haya 3 variables independientes o factores predictores: x 1, x 2, x 3. Podría construirse la ecuación: y = a + b 1 x 1 + b 2 x 2 + b 3 x 3 Cada variable independiente x i tiene un coeficiente de regresión propio b i (análogo a la pendiente ). Así como la ecuación simple de una recta se puede concebir imaginariamente en un plano de dos dimensiones, la ecuación multivariante con 3 predictores independientes no es imaginable, ya que se necesitaría un espacio de 4 dimensiones. Aunque no sea imaginable, sí resulta comprensible e interpretable. El coeficiente b i de cada variable independiente x i se interpretará como el cambio en la variable dependiente ( y ), por unidad de cambio en cada variable independiente (x 1, x 2 o x 3 ) a igualdad de nivel de las otras variables independientes. Por ejemplo, supongamos que la talla (cm) de una muestra de niños se utiliza como variable dependiente (y), intentando predecirla a partir de tres facto-

12 12 Manual de medicina basada en la evidencia (Capítulo 17) res o variables independientes, x 1, x 2 y x 3 que corresponden respectivamente a la edad en años del niño (edad: x 1 ), la talla del padre en cm (TPADRE: x 2 ) y la talla de la madre también en cm (TMADRE: x 3 ) y resulta la siguiente ecuación: y = x x x 3 Talla = (Edad) + 06(Tallapadre) + 07(Tallamadre) La interpretación será que por cada año más de edad que cumple el niño su talla aumenta en 8 cm, independientemente de cuál sea la talla del padre o de la madre. Por cada cm más de altura del padre, el niño tendrá, (sea cual sea su edad y sea cual sea la talla de su madre) 06 cm más de altura. Y por cada cm más de altura de la madre, el niño será 07 cm más alto, independientemente de cuál sea la altura de su padre y cuál sea su edad. Es posible también introducir variables categóricas en el modelo tales como el sexo del niño. Para ello introduciríamos en el modelo otra nueva variable (sexo= x 4 ), con dos códigos: varón = 1 y mujer = 0. Generalmente se le da el valor 0 a aquella categoría en la que se espera un nivel menor o basal. Cómo las niñas suelen tener una menor talla que los niños se les da en este ejemplo el valor 0. Un ejemplo del modelo que se obtendría al ajustar así una regresión múltiple sería el siguiente: y = x 1 +8x 2 Talla = (Sexo) +8(Edad) En realidad tenemos 2 ecuaciones de regresión, una para los niños: talla = (Sexo) + 8(Edad) = (Edad) = (Edad) y otra para las niñas: talla = (Sexo) + 8(Edad) = (Edad) = (Edad) En resumen, la regresión múltiple se usa cuando se valoran diversos predictores de un resultado o desenlace que tiene carácter cuantitativo. Es decir, se usa cuando la variable dependiente es cuantitativa (tensión arterial, índice de masa corporal, glucemia, etc.). Es deseable que la variable cuantitativa que se usa como resultado siga una distribución aproximadamente normal (gaussiana). REGRESIÓN LOGÍSTICA Los modelos matemáticos derivados de la regresión múltiple son muy útiles en epidemiología, pues desempeñan un papel importante en el control de los sesgos de confusión, pero se basan en una serie de supuestos cuyo cumplimiento no siempre es fácil comprobar. Por ejemplo, no siempre existe una relación lineal entre la variable de exposición (variable independiente, x ) y la variable de respuesta (variable dependiente, y ). Cuando lo que se desea conocer es cómo una serie de factores influyen en una variable binaria o

13 Análisis de supervivencia y análisis multivariado 13 dicotómica, es decir con dos posibilidades, como por ejemplo estar sano o enfermo, responder a un tratamiento o no responder, etc. en vez de utilizar la regresión lineal, se va a utilizar la regresión logística. En este caso, al ser dicotómica la respuesta o resultado, se hablaría de regresión logística binaria. La regresión logística se usará, por tanto, cuando se valoran diversos predictores de un resultado o desenlace que tiene carácter dicotómico. Por ejemplo cuando se intentan valorar las variables que pueden predecir la aparición de diabetes. El coeficiente b i de cada uno de los predictores utilizado como exponente del número e, base de los logaritmos naturales, equivale a la odds ratio (OR), como se explica a continuación. La función logística es aquélla que halla, para cada individuo, según los valores de un factor predictor (x), la probabilidad (p) de que presente el efecto o desenlace estudiado. La expresión de la función logística es: Con una manipulación algebraica de esta ecuación, tomando logaritmos neperianos (ln), se obtiene una función llamada logit y hace que se parezca a la regresión lineal: ln (p/1-p) = a + bx Esta expresión, en efecto, es muy similar a la sencilla ecuación de la recta. El único cambio es que se ha sustituido la variable dependiente ( y ) por otra expresión. Ahora la variable dependiente es el logaritmo neperiano (ln) de la probabilidad (p) de que ocurra un suceso, dividido por la probabilidad de que no ocurra (1 p). A ln (p/1-p) se le llama el logit. Es decir: logit = ln (p/1-p) Debemos decir que lo que hay dentro del paréntesis (p/1-p) corresponde al concepto de odds. A este cociente se le llama en inglés odds y en español se ha querido traducir por ventaja. Una odds es la probabilidad (p) dividida por el complementario de la probabilidad (1-p). Podremos afirmar por tanto que p odds = 1 p logit = ln (p/1-p) = ln (odds) = a + bx Es más fácil calcular una odds que definirla. Si en un estudio que incluye a 250 pacientes obesos, 50 de ellos han desarrollado después diabetes, la odds de desarrollar diabetes se calcularía dividiendo 50 entre 200 (odds =1/4). También puede expresarse como una odds = 1:4 y se interpreta como que apareció un diabético por cada 4 no-diabéticos.

14 14 Manual de medicina basada en la evidencia (Capítulo 17) P (diabetes) 50 / ODDS = = = = P (no diabetes) 200 / Un segundo ejemplo: si en una muestra de 100 individuos que padecieron un infarto, 75 quedan sin secuelas, la proporción (p) de individuos sin secuelas es 75 o el 75%. En cambio, la odds de quedar sin secuelas será: 75/25 = 3. Para transformar una odds en una proporción se divide la odds por (1 + odds): odds p = 1+ odds 1 4 En el ejemplo de los que quedan sin secuelas en el infarto p = 3 /(1+3) = 75. Y en el ejemplo de los diabéticos p = 25 / (1+ 25) = 2. Cuando se dividen dos odds, resulta una razón de odds u odds ratio 6. La traducción más lógica es razón de odds o razón de ventajas. Pero el término odds ratio, que es cada vez más utilizado en la literatura médica, ha recibido diversas traducciones al castellano: razón de oportunidades, razón de momios, razón de posibilidades, oportunidad relativa, razón de probabilidades o razón de productos cruzados. Una buena opción que sirve para evitar confusiones y va siendo mayoritaria es incorporar directamente el término inglés y decir siempre odds ratio (abreviadamente, OR), lo mismo que con otros términos originalmente ingleses, pero que ya son de uso habitual en castellano. Qué es, por tanto, una odds ratio? Puede verse con el siguiente ejemplo. Supongamos que en un estudio de intervención para que diabéticos fumadores dejaran de fumar, se consiguió el abandono del tabaco en 25 de los 147 asignados a la intervención especial y en sólo 3 de los 133 asignados al grupo control 7. La cuadro 17 6 recoge los resultados. Cuadro Resultadode un estudio de intervención sobre 280 diabéticos fumadores CEDE NO CEDE INTERVENCIÓN CONTROL Odds de cede en grupo Intervención = 25/122 = 205 Odds de cede en grupo Control = 3/130 = 023 Odds Ratio (OR) = odds INTERV / oddscontro L 205/ 023 = = 8, 88 Or = razón producto cruzado = De ellos, 147 fueron asignados aleatoriamente al grupo de intervención y de 130 al grupo dejaron de fumar 28, 25 de ellos en el grupo de intervención y 3 en el grupo control = 8, 88 control. En total

15 Análisis de supervivencia y análisis multivariado 15 Como puede apreciarse en la cuadro 17 6, la odds ratio (OR) es simplemente el cociente entre las odds del resultado, en este caso, el resultado es dejar de fumar. También puede calcularse la odds ratio mediante el cociente de los productos cruzados de la tabla 2x2 (figura 17 5). El resultado (OR = 8,88) significa que para la intervención se ha observado una efectividad que casi 9 veces mayor que para el grupo control. Figura La odds ratio (OR) se calcula en un tabla 2 2 mediante la rzón de los productos cruzados. Nos hemos detenido en explicar el concepto de odds ratio (OR) porque esta medida de asociación es el fruto más interesante que se suele obtener habitualmente al hacer una regresión logística. Calcular la OR mediante regresión logística aporta la ventaja de que se puede ajustar esta medida por otras variables que también pudiesen influir en el resultado (p. ej., en el caso anterior podría pensarse que es más fácil que respondan bien a una intervención los diabéticos con mayor nivel educativo y debería plantearse la cuestión de si el nivel educativo medio del grupo de intervención y del grupo control eran similares). A esas otras variables se les llama «factores de confusión» y se pueden controlar o «ajustar por ellos» mediante un modelo de regresión logística 8-9. En efecto, volviendo a la regresión logística, la ecuación antes vista ln (p/1-p) = a + bx se puede extender a situaciones multivariables, donde en vez de un solo factor predictor (x), <NI>haya una serie de predictores (x 1, x 2,...x p ): que podría escribirse también así: ln (p/1-p) = a + b 1 x 1 + b 2 x b p x p ln (p/1-p) = a + b 1 x 1 + b 2 x b p x p

16 16 Manual de medicina basada en la evidencia (Capítulo 17) La transformación logarítmica es necesaria para adaptarse a un fenómeno como la probabilidad, cuyos límites teóricos son tan estrechos como 0 y 1. En cambio, los límites teóricos de ln (odds) son desde infinito hasta +infinito. La interpretación de la regresión logística es bastante directa, ya que cada coeficiente de regresión b i expresa el logaritmo neperiano de la odds ratio (OR) de que ocurra un fenómeno por unidad de cambio del factor predictor (variable independiente, x i ). Tomando antilogaritmos, tendríamos: b i = ln (OR) OR = antilog(b i ) Esto hace a la regresión logística un procedimiento muy útil para construir modelos matemáticos que ajusten por factores de confusión, ya que sus resultados son interpretables como odds ratios estimadas en el supuesto de que los demás factores incluidos en el modelo (los otros predictores: x 2, x 3,...x p ) fuesen exactamente iguales para los individuos de los grupos que se comparan. Por este motivo, la regresión logística es muy utilizada, cada vez más, tanto en epidemiología de factores de riesgo como en epidemiología clínica, ya que libera a las estimaciones de la presencia de confusores indeseados 8. Por ejemplo, si a los datos de la cuadro 17 6 le aplicamos una regresión logística univariante, utilizando como variable dependiente (resultado) el cese del tabaco y como variable independiente la intervención, un programa convencional (SPSS) encontraría los resultados recogidos en la cuadro Cuadro Resultados ofrecidos por un programa convencional (SPSS) para una regresión logística binaria B E.T. Wald g l S ig. Expo(B) Paso INTERV 183, , 000 8, a Constante -3, 768, , 665 1, 000, 023 La variable dependiente (respuesta) es el cese del hábito tabáquico. La variable independiente es la intervención ( INTERV ). La odds ratio viene expresada por Exp(B) La salida de ordenador presenta el coeficiente b que vale 183, su error estándar (E.T.), un test estadístico (test de Wald) y el valor de la odds ratio (Exp(B)). Esta odds ratio es

17 Análisis de supervivencia y análisis multivariado 17 equivalente a la calculada a mano. Sin embargo, podemos pedirle al ordenador que ajuste la estimación de la odds ratio por otras variables potencialmente confusoras, por ejemplo, la edad y el sexo, entonces los resultados serían los presentados en la cuadro Ahora puede afirmarse que a igualdad de sexo y edad, la intervención tiene una odds ratio de 9,3 para lograr el cese del tabaco. Esto es lo que significa que se haya ajustado. Se ajusta por una variable cuando se introduce esa variable en el modelo. Con este ejemplo, se aprecia que resulta interesante la regresión logística porque puede servir para estimar la fuerza de la asociación de cada factor con el desenlace de una manera independiente. La estimación independiente quiere decir que se han controlado otros factores (se ha liberado a la odds ratio de esos factores de confusión). Cuadro Regresión logística B E.T. Wald g l S ig. Expo(B) Paso INTERV 228, , 000 9, a SEXO, 228, 614, 138 1, 710 1, 257 EDAD, 025, , 107 1, 026 Constante -5, 496 1, , 723 1, 000, 004 La variable dependiente sigue el cese del tabaco. Ahora se han añadido dos nuevas variables independientes (sexo: 1 = hombre; 2 = mujer) y edad (en años). La odds ratio (9, 278) de la intervención ahora estaría ajustada por edad y sexo. Se aprecia que es más probable el cese en mujeres (OR = 1, 026) para cada año adicional de edad a justad a. Si se desea saber cuál es la odds ratio para una diferencia de edad de 10 años, se multiplicaría por 10 el coeficiente de la edad (025) y se elevaría el número e a la cantidad resultante. Por cada 10 años más de edad aumentaría en un 28,4% la odds de dejar el tabaco, independientemente de que el paciente hubiera sido sometido o no a la intervención y de su sexo. Esto significa que estamos comparando dos sujetos que están en el mismo grupo (ya sea el grupo de intervención o el de control) y que son del mismo sexo, pero que se llevan 10 años de diferencia. Entonces es más probable que el mayor de ellos sea el que deje de fumar. Pero esta ventaja con la edad no resulta estadísticamente significativa, ya que el valor p para la edad en el test de Wald fue de 107. De todos modos, siempre estamos ante el paradigma de la estadística, porque comparamos un efecto con un error 4-5, y habría que considerar que las estimaciones de odds ratios nunca son perfectas y existe una amplia variabilidad individual, que en principio es aleatoria. No se pueden establecer predicciones individuales, pero los modelos son útiles para saber cuál será la respuesta promedio en un grupo suficientemente numeroso de pacientes. Para medir la fuerza del efecto de la intervención se utiliza la /odds ratio 6. Lo más interesante es que el efecto favorable de la intervención se da a igualdad de nivel de

18 18 Manual de medicina basada en la evidencia (Capítulo 17) edad y sexo. Es decir, de modo independiente de la edad y sexo. El modelo está ajustado por edad y sexo 9. Cada predictor independiente (x i ) que se introduzca en el modelo supone un ajuste y un control del sesgo de confusión que ese predictor podría provocar. Al igual que en la regresión lineal múltiple, es posible introducir variables independientes (x i ) categóricas o dicotómicas en los modelos (el sexo en nuestro caso). También es posible incluir como variables independientes, variables cualitativas con varias categorías, como estado civil (soltero, casado, viudo, etc.). Pero ello requeriría la creación de una serie de variables artificiales también conocidas como variables indicadoras o variables dummy. La regresión logística se emplea habitualmente en uno de los diseños epidemiológicos mas utilizados: los estudios de casos y controles 8. Sin embargo en los de estudios de casos y controles emparejados no se debe aplicar la regresión logística convencional, sino que se ha de utilizar un tipo especial de regresión logística: la regresión logística condicional Los resultados obtenidos en la cuadro 17 7 deberían presentarse en un trabajo de investigación de manera resumida, indicando simplemente cuál es la estimación de la odds ratio ajustada (y quizá también sin ajustar o «cruda) para cada variable y cuál es su intervalo de confianza, habitualmente calculado al 95%. Los paquetes estadísticos suelen tener opciones para pedir los intervalos de confianza. Se calculan así: LA REGRESIÓN DE COX (PROPORTIONAL HAZARDS MODEL) En 1972 Cox publicó un articulo, Regression models and life tables (Modelos de regresión y tablas de vida) que se ha convertido en un auténtico bestseller, ya que es uno de los artículos más citados en la bibliografía científica Se utiliza la regresión de Cox (proportional hazards model), cuando la variable dependiente esté relacionada con la supervivencia de los individuos y se desee averiguar simultáneamente el efecto independiente una serie de factores sobre esta supervivencia. Por ejemplo, si se deseara saber en qué medida el trasplante de hígado mejora la supervivencia de los pacientes con hepatocarcinoma y simultáneamente se desea valorar el efecto del estadio tumoral y de otros factores (sexo, edad, etc.) sobre la supervivencia de los pacientes, se empleará la regresión de Coxe: 12. Téngase en cuenta que no se trata sólo de saber el efecto sobre la supervivencia después de un tiempo determinado de seguimiento (p. ej., la supervivencia a los 5 años), sino de valorar cuál es el efecto sobre la función de supervivencia a lo largo de todo el periodo de observación de los pacientes, sea cual sea el punto temporal que se elija para la comparación. Si sólo interesase estudiar el efecto sobre la supervivencia en un punto del tiempo (p. ej., a los 5 años), entonces bastaría con un análisis de regresión logística, porque la variable de respuesta sería dicotómica (sí sobreviven o no sobreviven). Sólo la regresión de Cox permite afirmar que una supervivencia más ventajosa puede ser atribuida a un determinado tratamiento, porque, por ejemplo, comprueba que a igualdad de edad, sexo, estadio tumoral, etc., los pacientes que fueron tratados con transplante hepático sobrevivieron más en cualquier punto posible dentro del seguimiento que ha existido en el estudio. A este procedimiento multivariable de tener en

19 Análisis de supervivencia y análisis multivariado 19 cuenta los niveles de todos los demás factores y poder asegurar que un efecto pertenece realmente a una determinada variable y no a los otros factores, se le denomina ajustar por esos otros factores como hemos visto en la regresión logística. La ecuación de la regresión de Cox es: Donde lambda dependiente del tiempo, l t como se recoge en la figura 17 7, es la tasa (en inglés hazard) de fallecer más allá del instante t (es decir, la tasa instantánea de fallecer). En lo demás, todo es bastante parecido al análisis de regresión logística. La tasa se diferencia del riesgo en que la tasa expresa la rapidez con la cual se enferma (fallecimientos por unidad de tiempo), mientras que el riesgo sólo es una proporción y no tiene en cuenta más que el número de sujetos inicialmente a riesgo de fallecer. El hazard es una tasa instantánea, que conceptualmente corresponde a una duración de tiempo infinitesimal. Se demuestra que para un factor pronóstico dicotómico x i cuyo valor sea 1 para los expuestos a ese factor y 0 para los no expuestos, la razón de hazards (hazard ratio, HR) será: Esta medida de asociación aunque se expresa por algunos como un riesgo relativo y se interpreta como tal (razón de proporciones) es en realidad una hazard ratio, y se asemeja más a la razón de densidades de incidencia (RDI, razón de tasas) que a la razón de incidencias acumuladas (razón de proporciones o riesgo relativo). Una hazard ratio de 2 significa, en realidad, que se multiplica por 2 la rapidez con la cual fallecen los sujetos que están expuestos al factor pronóstico que se estudia. Un hazard ratio de 1, significa que el efecto del factor es nulo: no es un factor que afecte al pronóstico. Un hazard ratio de 5 significa que esa exposición en vez de asociarse a un mal pronóstico, lo mejora, ya que reduce la velocidad de ocurrencia de fallecimientos a la mitad. Si la exposición fuese cuantitativa habría que elevar el número e al coeficiente correspondiente (b i ), pero multiplicando antes el coeficiente por el incremento en unidades de la variable independiente cuyo hazard ratio queramos estimar, tal como se podía hacer en el ejemplo de regresión logística con la edad para calcular una odds ratio. Cuando se emplea el modelo de regresión de Cox, se asume que la razón de tasas (hazard ratio) es constante a lo largo del tiempo. Hay métodos para verificar si es cierta esta suposición y también hay técnicas que permiten trabajar con modelos de riesgo no proporcionales cuya descripción y análisis superan los objetivos de este texto. POTENCIA ESTADÍSTICA Y TAMAÑO MUESTRAL La expresión para calcular aproximadamente el número necesario de eventos 3 que deben observarse en un análisis de supervivencia es

20 20 Manual de medicina basada en la evidencia (Capítulo 17) Donde: 4(z n = α / 2 + [ ln(hr) ] 2 n: número de eventos que deben observarse z ±/2 = valor de la distribución normal para el error alfa deseado (a 2 colas) z ² = valor de la distribución normal para el error beta deseado (a 1 cola) HR = hazard ratio (equivalente al riesgo relativo, responde a la pregunta cuántas veces esperamos que sea superior el evento en un grupo que en otro?) z β ) 2 Así, para un riesgo relativo de 1,5, con un error alfa de 05 (z=1,96) y un error beta de 2 (potencia del 80%, z=84), necesitaríamos observar 256 eventos. 4(1,96 + 1,28) 256 = [ ln(1,5) ] 2 En la siguiente cuadro y figura se representan diversos supuestos, con el número necesario de eventos que se deben observar. 2 P otencia = 90% 80% 60% HR 1, , , , , , , ,

Modelos de regresión: lineal simple y regresión logística

Modelos de regresión: lineal simple y regresión logística 14 Modelos de regresión: lineal simple y regresión logística Irene Moral Peláez 14.1. Introducción Cuando se quiere evaluar la relación entre una variable que suscita especial interés (variable dependiente

Más detalles

Confusión e interacción (1): Qué son, qué suponen y cómo manejarlas en el análisis estratificado

Confusión e interacción (1): Qué son, qué suponen y cómo manejarlas en el análisis estratificado DocuWeb FABIS Dot. Núm 0702007 Confusión e interacción (1): Qué son, qué suponen y cómo manejarlas en el análisis estratificado Aguayo Canela, Mariano Hospital Universitario Virgen Macarena. Sevilla Resumen

Más detalles

Cómo hacer paso a paso un Análisis de Supervivencia con SPSS para Windows.

Cómo hacer paso a paso un Análisis de Supervivencia con SPSS para Windows. DOCUWEB FABIS Dot. Núm 0702006 Cómo hacer paso a paso un Análisis de Supervivencia con SPSS para Windows. Aguayo Canela M, Lora Monge E Servicio de Medicina Interna. Hospital Universitario Virgen Macarena.

Más detalles

Relación entre variables cuantitativas

Relación entre variables cuantitativas Investigación: Relación entre variables cuantitativas 1/8 Relación entre variables cuantitativas Pita Fernández S., Pértega Díaz S. Unidad de Epidemiología Clínica y Bioestadística. Complexo Hospitalario

Más detalles

Capítulo 3. Análisis de Regresión Simple. 1. Introducción. Capítulo 3

Capítulo 3. Análisis de Regresión Simple. 1. Introducción. Capítulo 3 Capítulo 3 1. Introducción El análisis de regresión lineal, en general, nos permite obtener una función lineal de una o más variables independientes o predictoras (X1, X2,... XK) a partir de la cual explicar

Más detalles

MEDIDAS DE RESULTADOS DE LOS ENSAYOS CLÍNICOS

MEDIDAS DE RESULTADOS DE LOS ENSAYOS CLÍNICOS MEDIDAS DE RESULTADOS DE LOS ENSAYOS CLÍNICOS María Dolores Vega Coca Especialista en Farmacia Hospitalaria Agencia de Evaluación de Tecnologías Sanitarias de Andalucía (AETSA) Jornada previa de apoyo

Más detalles

Representación gráfica en el Análisis de Datos

Representación gráfica en el Análisis de Datos Investigación: Representación gráfica en el análisis de datos 1/11 Representación gráfica en el Análisis de Datos Pértega Díaz S., Pita Fernández S. Unidad de Epidemiología Clínica y Bioestadística. Complexo

Más detalles

1 Ejemplo de análisis descriptivo de un conjunto de datos

1 Ejemplo de análisis descriptivo de un conjunto de datos 1 Ejemplo de análisis descriptivo de un conjunto de datos 1.1 Introducción En este ejemplo se analiza un conjunto de datos utilizando herramientas de estadística descriptiva. El objetivo es repasar algunos

Más detalles

Comparación de proporciones

Comparación de proporciones 11 Comparación de proporciones Neus Canal Díaz 11.1. Introducción En la investigación biomédica se encuentran con frecuencia datos o variables de tipo cualitativo (nominal u ordinal), mediante las cuales

Más detalles

I1.1 Estudios observacionales IISESIÓN DISEÑO O DE ESTUDIOS EN INVESTIGACIÓN N MÉDICA DESCRIPTIVA CURSO DE. 1.2 Estudios experimentales

I1.1 Estudios observacionales IISESIÓN DISEÑO O DE ESTUDIOS EN INVESTIGACIÓN N MÉDICA DESCRIPTIVA CURSO DE. 1.2 Estudios experimentales 1 2 3 4 5 6 ESQUEMA DEL CURSO ESTADÍSTICA BÁSICA DISEÑO DE EXPERIMENTOS CURSO DE ESTADÍSTICA STICA BÁSICAB ESTADÍSTICA DESCRIPTIVA TIPOS DE VARIABLES MEDIDAS DE POSICIÓN CENTRAL Y DE DISPERSIÓN TABLAS

Más detalles

INTRODUCCIÓN A LA EPIDEMIOLOGIA

INTRODUCCIÓN A LA EPIDEMIOLOGIA INTRODUCCIÓN A LA EPIDEMIOLOGIA FUENTES DE ERROR EN LA INVESTIGACION EPIDEMIOLOGICA: ROL DE LOS FACTORES CONFUNDIDORES OBJETIVOS DE LA CLASE: 1. Definir las alternativas que llevan a conclusiones erróneas

Más detalles

(.$263*7.5"4+%#,"8..9$ $.$ - -. 7.# "4< $ 8 $ 7 "% @

(.$263*7.54+%#,8..9$ $.$ - -. 7.# 4< $ 8 $ 7 % @ !"#$%!& ' ($ 2 ))!"#$%& '$()!& *($$+%( & * $!" "!,"($"$ -(.$!- ""& +%./$$&,-,$,". - %#,"0# $!01 "23(.4 $4$"" ($" $ -.#!/ ". " " ($ "$%$(.$2.3!- - *.5.+%$!"$,"$ (.$263*7.5"4+%#,"8..9$ $.$ - $,"768$"%$,"$%$!":7#;

Más detalles

Análisis de supervivencia

Análisis de supervivencia 16 Análisis de supervivencia Ágata Carreño Serra 16.1. Introducción En variados estudios nuestro objetivo consiste en estimar el tiempo transcurrido hasta un suceso en concreto, dependiendo de otras variables

Más detalles

Cómo obtener un Modelo de Regresión Logística Binaria con SPSS

Cómo obtener un Modelo de Regresión Logística Binaria con SPSS Universitat de de Barcelona. Institut de de Ciències de de l Educació Cómo obtener un Modelo de Regresión Logística Binaria con SPSS Vanesa Berlanga-Silvente y Ruth Vilà-Baños Fecha de presentación:

Más detalles

T. 5 Inferencia estadística acerca de la relación entre variables

T. 5 Inferencia estadística acerca de la relación entre variables T. 5 Inferencia estadística acerca de la relación entre variables 1. El caso de dos variables categóricas 2. El caso de una variable categórica y una variable cuantitativa 3. El caso de dos variables cuantitativas

Más detalles

Nure Investigación Nº 63 Marzo - Abril 2013. Lectura crítica de un artículo científico V: La valoración de la relevancia clínica

Nure Investigación Nº 63 Marzo - Abril 2013. Lectura crítica de un artículo científico V: La valoración de la relevancia clínica Nure Investigación Nº 63 Marzo - Abril 2013 Lectura crítica de un artículo científico V: La valoración de la relevancia clínica Critical reading of a scientific paper V: Assessing the clinical significance

Más detalles

Curso/Tutorial: Estadística Aplicada en la Investigación Biomédica

Curso/Tutorial: Estadística Aplicada en la Investigación Biomédica Curso/Tutorial: Estadística Aplicada en la Investigación Biomédica Nombre del curso Modalidad Duración Intensidad Certificado Dirigido a Estadística Aplicada en la Investigación Biomédica Virtual 16 sesiones

Más detalles

TABLAS DE CONTINGENCIA (CROSS-TAB): BUSCANDO RELACIONES DE DEPENDENCIA ENTRE VARIABLES CATEGÓRICAS 1

TABLAS DE CONTINGENCIA (CROSS-TAB): BUSCANDO RELACIONES DE DEPENDENCIA ENTRE VARIABLES CATEGÓRICAS 1 TABLAS DE CONTINGENCIA (CROSS-TAB): BUSCANDO RELACIONES DE DEPENDENCIA ENTRE VARIABLES CATEGÓRICAS 1 rafael.dearce@uam.es El objeto de las tablas de contingencia es extraer información de cruce entre dos

Más detalles

Capítulo X. Regresión Logística

Capítulo X. Regresión Logística Capítulo Regresión Logística Conceptos y definiciones Es un modelo clásico de regresión lineal simple o múltiple, pero donde la variale dependiente es inaria o dicotómica. 3 5 4 ÉITO FRACASO Es decir,

Más detalles

UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL

UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL UNIDAD 4: MEDIDAS DE TENDENCIA CENTRAL Objetivo terminal: Calcular e interpretar medidas de tendencia central para un conjunto de datos estadísticos. Objetivos específicos: 1. Mencionar las características

Más detalles

Empresarial y Financiero

Empresarial y Financiero Curso de Excel Empresarial y Financiero SESIÓN : REGRESIÓN Rosa Rodríguez Relación con el Mercado Descargue de yahoo.com los Datos de precio ajustado de cierre de las acciones de General Electric (GE),

Más detalles

Técnicas de regresión: Regresión Lineal Múltiple

Técnicas de regresión: Regresión Lineal Múltiple Investigación: Técnicas de regresión: regresión lineal múltiple 1/1 Técnicas de regresión: Regresión Lineal Múltiple Pértega Díaz S., Pita Fernández S. Unidad de Epidemiología Clínica y Bioestadística.

Más detalles

Capítulo 15. Análisis de varianza factorial El procedimiento Modelo lineal general: Univariante

Capítulo 15. Análisis de varianza factorial El procedimiento Modelo lineal general: Univariante Capítulo 15 Análisis de varianza factorial El procedimiento Modelo lineal general: Univariante Los modelos factoriales de análisis de varianza (factorial = más de un factor) sirven para evaluar el efecto

Más detalles

Conceptos básicos de estadística para clínicos

Conceptos básicos de estadística para clínicos Conceptos básicos de estadística para clínicos Víctor Abraira A Coruña. Noviembre 2008 Programa Valor p : qué significa? Aleatorización Pruebas de hipótesis para variables continuas Pruebas de hipótesis

Más detalles

Puede considerarse un caso especial de l análisis de regresión en donde la variable dependiente es dicotómica («Sí» [1] o «No» [0])

Puede considerarse un caso especial de l análisis de regresión en donde la variable dependiente es dicotómica («Sí» [1] o «No» [0]) Regresión logística Puede considerarse un caso especial de l análisis de regresión en donde la variable dependiente es dicotómica («Sí» [1] o «No» [0]) Se trata de calcular la probabilidad en la que una

Más detalles

MODELO PREDICTIVO DE RIESGO DE MOROSIDAD PARA CRÉDITOS BANCARIOS USANDO DATOS SIMULADOS

MODELO PREDICTIVO DE RIESGO DE MOROSIDAD PARA CRÉDITOS BANCARIOS USANDO DATOS SIMULADOS INVESTIGACIÓN MODELO PREDICTIVO DE RIESGO DE MOROSIDAD PARA CRÉDITOS BANCARIOS USANDO DATOS SIMULADOS CLAUDIO ALFREDO LÓPEZ MIRANDA Un problema grave en las instituciones de crédito son los préstamos no

Más detalles

Capítulo 12. Análisis de variables categóricas: El procedimiento Tablas de contingencia. Tablas de contingencia

Capítulo 12. Análisis de variables categóricas: El procedimiento Tablas de contingencia. Tablas de contingencia Capítulo 12 Análisis de variables categóricas: El procedimiento Tablas de contingencia En las ciencias sociales, de la salud y del comportamiento es muy frecuente encontrarse con variables categóricas.

Más detalles

Fundamentos de Biología Aplicada I Estadística Curso 2011-2012 Práctica 6: Regresión Logística I

Fundamentos de Biología Aplicada I Estadística Curso 2011-2012 Práctica 6: Regresión Logística I Fundamentos de Biología Aplicada I Estadística Curso 2011-2012 Índice 1. Objetivos de la práctica 2 2. Estimación de un modelo de regresión logística con SPSS 2 2.1. Ajuste de un modelo de regresión logística.............................

Más detalles

Validez y Fiabilidad

Validez y Fiabilidad Curso de introducción a la metodología de la investigación (II) Validez y Fiabilidad Laura Martínez García Centre Cochrane Iberoamericano 9 de Febrero de 2011 Guión Validez interna Validez externa Precisión

Más detalles

Estudio de la Duración de los Casos Civiles Presentados en los Juzgados de Argentina, Utilizando Análisis de Supervivencia. Una primera aproximación.

Estudio de la Duración de los Casos Civiles Presentados en los Juzgados de Argentina, Utilizando Análisis de Supervivencia. Una primera aproximación. Estudio de la Duración de los Casos Civiles Presentados en los Juzgados de Argentina, Utilizando Análisis de Supervivencia. Una primera aproximación. Juan Luis Peñaloza Figueroa Sección Departamental de

Más detalles

Capítulo 18 Análisis de regresión lineal El procedimiento Regresión lineal

Capítulo 18 Análisis de regresión lineal El procedimiento Regresión lineal Capítulo 18 Análisis de regresión lineal El procedimiento Regresión lineal Introducción El análisis de regresión lineal es una técnica estadística utilizada para estudiar la relación entre variables. Se

Más detalles

Curso DE Fundamentos de Diseño y Estadística

Curso DE Fundamentos de Diseño y Estadística www.metodo.uab.cat Estudios de postgrado en Metodología de la investigación en Ciencias de la Salud Curso DE Fundamentos de Diseño y Estadística Contenidos UD 1 Descripción de datos cuantitativos 1 Conceptos

Más detalles

Estudio de casos y controles sobre factores de riesgo en el cáncer colorrectal

Estudio de casos y controles sobre factores de riesgo en el cáncer colorrectal Estudio de casos y controles sobre factores de riesgo en el cáncer colorrectal Objetivos del estudio Estimar el riesgo de padecer cáncer colorrectal asociado a una serie de variables Población Casos Controles

Más detalles

TRATAMIENTO DE BASES DE DATOS CON INFORMACIÓN FALTANTE SEGÚN ANÁLISIS DE LAS PÉRDIDAS CON SPSS

TRATAMIENTO DE BASES DE DATOS CON INFORMACIÓN FALTANTE SEGÚN ANÁLISIS DE LAS PÉRDIDAS CON SPSS Badler, Clara E. Alsina, Sara M. 1 Puigsubirá, Cristina B. 1 Vitelleschi, María S. 1 Instituto de Investigaciones Teóricas y Aplicadas de la Escuela de Estadística (IITAE) TRATAMIENTO DE BASES DE DATOS

Más detalles

Departamento de Salud Pública Facultad de Medicina UNAM

Departamento de Salud Pública Facultad de Medicina UNAM NORMALIDAD Departamento de Salud Pública Facultad de Medicina UNAM Dra. Laura Moreno Altamirano Normalidad Son los valores de determinada medición en un grupo de individuos normales de una población definida.

Más detalles

Introducción al cálculo del tamaño muestral. Por favor, Tamaño muestral. Talleres virtuales para investigadores

Introducción al cálculo del tamaño muestral. Por favor, Tamaño muestral. Talleres virtuales para investigadores Talleres virtuales para investigadores Introducción al cálculo del tamaño muestral Marta Roqué Barcelona, 15/10/010 Organización Panamericana de la Salud Red Cochrane Iberoamericana Por favor, Tamaño muestral

Más detalles

Servicio de Medicina Interna. Hospital Universitario Virgen Macarena. Sevilla

Servicio de Medicina Interna. Hospital Universitario Virgen Macarena. Sevilla DOCUWEB FABIS Dot. úm 0702005 Cómo realizar paso a paso un contraste de hipótesis con SPSS para Windows: (III) Relación o asociación y análisis de la dependencia (o no) entre dos variables cuantitativas.

Más detalles

ANÁLISIS DESCRIPTIVO DE FUNCIONES Y GRÁFICAS

ANÁLISIS DESCRIPTIVO DE FUNCIONES Y GRÁFICAS ANÁLISIS DESCRIPTIVO DE FUNCIONES Y GRÁFICAS INTRODUCCIÓN La noción actual de función comienza a gestarse en el siglo XIV, cuando empiezan a preocuparse de medir y representar las variaciones de ciertas

Más detalles

TEMA 4: Variables binarias

TEMA 4: Variables binarias TEMA 4: Variables binarias Econometría I M. Angeles Carnero Departamento de Fundamentos del Análisis Económico Curso 2011-12 Econometría I (UA) Tema 4: Variables binarias Curso 2011-12 1 / 51 Variables

Más detalles

Universidad del CEMA Prof. José P Dapena Métodos Cuantitativos V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA. 5.1 Introducción

Universidad del CEMA Prof. José P Dapena Métodos Cuantitativos V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA. 5.1 Introducción V - ESTIMACION PUNTUAL E INTERVALOS DE CONFIANZA 5.1 Introducción En este capítulo nos ocuparemos de la estimación de caracteristicas de la población a partir de datos. Las caracteristicas poblacionales

Más detalles

GUIÓN TEMA 4. VARIABLES BINARIAS 4.1. Variables binarias

GUIÓN TEMA 4. VARIABLES BINARIAS 4.1. Variables binarias ECONOMETRIA I. Departamento de Fundamentos del Análisis Económico Universidad de Alicante. Curso 2011/12 GUIÓN TEMA 4. VARIABLES BINARIAS 4.1. Variables binarias Bibliografía apartados : Greene, 8.2 A.F.Gallastegui:

Más detalles

Pablo Martínez-Camblor Subdirección de Salud de Guipuzcoa, Donosti.

Pablo Martínez-Camblor Subdirección de Salud de Guipuzcoa, Donosti. Métodos Estadísticos sticos para Diagnósticos MédicosM Barcelona, uno de marzo de 2008 Pablo Martínez-Camblor Subdirección de Salud de Guipuzcoa, Donosti. MODULO: Diseño de proyectos y análisis estadístico

Más detalles

Cómo hacer una Regresión Logística con SPSS paso a paso. (I)

Cómo hacer una Regresión Logística con SPSS paso a paso. (I) DOCUWEB FABIS Dot. Núm 070202 Cómo hacer una Regresión Logística con SPSS paso a paso. (I) Aguayo Canela, Mariano. Servicio de Medicina Interna. Hospital Universitario Virgen Macarena. Sevilla Resumen

Más detalles

Las técnicas muestrales, los métodos prospectivos y el diseño de estadísticas en desarrollo local

Las técnicas muestrales, los métodos prospectivos y el diseño de estadísticas en desarrollo local 21 Las técnicas muestrales, los métodos prospectivos y el diseño de estadísticas en desarrollo local Victoria Jiménez González Introducción La Estadística es considerada actualmente una herramienta indispensable

Más detalles

Introducción. Estadística 1. 1. Introducción

Introducción. Estadística 1. 1. Introducción 1 1. Introducción Introducción En este tema trataremos de los conceptos básicos de la estadística, también aprenderemos a realizar las representaciones gráficas y a analizarlas. La estadística estudia

Más detalles

Tests de hipótesis estadísticas

Tests de hipótesis estadísticas Tests de hipótesis estadísticas Test de hipótesis sobre la media de una población. Introducción con un ejemplo. Los tests de hipótesis estadísticas se emplean para muchos problemas, en particular para

Más detalles

Capítulo 18. Análisis de regresión lineal: El procedimiento Regresión lineal. Introducción

Capítulo 18. Análisis de regresión lineal: El procedimiento Regresión lineal. Introducción Capítulo 18 Análisis de regresión lineal: El procedimiento Regresión lineal Introducción El análisis de regresión lineal es una técnica estadística utilizada para estudiar la relación entre variables.

Más detalles

Función exponencial y Logaritmos

Función exponencial y Logaritmos Eje temático: Álgebra y funciones Contenidos: Función exponencial y Logaritmos Nivel: 4 Medio Función exponencial y Logaritmos 1. Funciones exponenciales Existen numerosos fenómenos que se rigen por leyes

Más detalles

Métodos y Diseños utilizados en Psicología

Métodos y Diseños utilizados en Psicología Métodos y Diseños utilizados en Psicología El presente documento pretende realizar una introducción al método científico utilizado en Psicología para recoger información acerca de situaciones o aspectos

Más detalles

SESIÓN PRÁCTICA 6: CONTRASTES DE HIPÓTESIS PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas

SESIÓN PRÁCTICA 6: CONTRASTES DE HIPÓTESIS PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas SESIÓN PRÁCTICA 6: CONTRASTES DE HIPÓTESIS PROBABILIDAD Y ESTADÍSTICA PROF. Esther González Sánchez Departamento de Informática y Sistemas Facultad de Informática Universidad de Las Palmas de Gran Canaria

Más detalles

Universidad de Málaga

Universidad de Málaga 5 técnicas estadísticas 1.- T-Student calcio.sav 2.- ANOVA lectura.sav 3.- Regresión Múltiple empleados.sav 4.- 2 Chi-Cuadrado empleados.sav 5.- Regresión Logística pena de muerte.sav 1.- T-STUDENT VARIABLE:

Más detalles

Técnicas de análisis para el uso de resultados de encuestas y estudios aplicados al VIH/sida. Por: Prof. Elena del C. Coba

Técnicas de análisis para el uso de resultados de encuestas y estudios aplicados al VIH/sida. Por: Prof. Elena del C. Coba Técnicas de análisis para el uso de resultados de encuestas y estudios aplicados al VIH/sida Por: Prof. Elena del C. Coba Encuestas y estudios aplicados al VIH/sida Definir la fuente de los datos: Datos

Más detalles

Statgraphics Centurión

Statgraphics Centurión Facultad de Ciencias Económicas y Empresariales. Universidad de Valladolid 1 Statgraphics Centurión I.- Nociones básicas El paquete Statgraphics Centurión es un programa para el análisis estadístico que

Más detalles

Gráfico de Dispersión de Notas en la Prueba 1 versus Notas en la Prueba Final Acumulativa de un curso de 25 alumnos de Estadística en la UTAL

Gráfico de Dispersión de Notas en la Prueba 1 versus Notas en la Prueba Final Acumulativa de un curso de 25 alumnos de Estadística en la UTAL 0. Describiendo relaciones entre dos variables A menudo nos va a interesar describir la relación o asociación entre dos variables. Como siempre la metodología va a depender del tipo de variable que queremos

Más detalles

Capítulo 14. Análisis de varianza de un factor: El procedimiento ANOVA de un factor

Capítulo 14. Análisis de varianza de un factor: El procedimiento ANOVA de un factor Capítulo 14 Análisis de varianza de un factor: El procedimiento ANOVA de un factor El análisis de varianza (ANOVA) de un factor sirve para comparar varios grupos en una variable cuantitativa. Se trata,

Más detalles

Capítulo 17 Análisis de correlación lineal: Los procedimientos Correlaciones bivariadas y Correlaciones parciales

Capítulo 17 Análisis de correlación lineal: Los procedimientos Correlaciones bivariadas y Correlaciones parciales Capítulo 17 Análisis de correlación lineal: Los procedimientos Correlaciones bivariadas y Correlaciones parciales Cuando se analizan datos, el interés del analista suele centrarse en dos grandes objetivos:

Más detalles

TEMARIO DETALLADO DE LOS MODULOS VIRTUALES:

TEMARIO DETALLADO DE LOS MODULOS VIRTUALES: TEMARIO DETALLADO DE LOS MODULOS VIRTUALES: Módulo 1: Introducción a la epidemiología 1. Qué es la epidemiología? Definiciones y tipos de epidemiología: 2. Breve historia de la epidemiología del cáncer

Más detalles

Seguimiento a largo plazo de una cohorte de enfermos con TB. Factores asociados a recaída y a muerte en Barcelona ciudad

Seguimiento a largo plazo de una cohorte de enfermos con TB. Factores asociados a recaída y a muerte en Barcelona ciudad XI Taller Internacional sobre Tuberculosis. UiTB- 2007 Seguimiento a largo plazo de una cohorte de enfermos con TB. Factores asociados a recaída y a muerte en Barcelona ciudad Servei d Epidemiologia. Agència

Más detalles

Edith Alarcón Matutti César Gutiérrez Villafuerte

Edith Alarcón Matutti César Gutiérrez Villafuerte Edith Alarcón Matutti César Gutiérrez Villafuerte Paso 1 Concebir la idea a investigar Paso 2 Plantear el problema de investigación: Objetivos Preguntas Justificación y viabilidad Paso 3 Elaborar el MARCO

Más detalles

CONTROL Y MEJORA DE UN PROCESO. GRÁFICOS DE CONTROL. CONTROL ESTADÍSTICO DE PROCESOS. SPC

CONTROL Y MEJORA DE UN PROCESO. GRÁFICOS DE CONTROL. CONTROL ESTADÍSTICO DE PROCESOS. SPC CONTROL Y MEJORA DE UN PROCESO. GRÁFICOS DE CONTROL. CONTROL ESTADÍSTICO DE PROCESOS. SPC 1. INTRODUCCIÓN. Mientras el Dr. Walter Shewhart de los Laboratorios Bell estudiaba datos de procesos en la década

Más detalles

Funciones lineales. Objetivos. Antes de empezar. 1.Función de proporcionalidad directa pág. 170 Definición Representación gráfica

Funciones lineales. Objetivos. Antes de empezar. 1.Función de proporcionalidad directa pág. 170 Definición Representación gráfica 10 Funciones lineales Objetivos En esta quincena aprenderás a: Identificar problemas en los que intervienen magnitudes directamente proporcionales. Calcular la función que relaciona a esas magnitudes a

Más detalles

Anexo 12-a. Plantillas de lectura crítica del SIGN

Anexo 12-a. Plantillas de lectura crítica del SIGN Anexo 12-a. Plantillas de lectura crítica del SIGN Plantilla de Lectura crítica nº 1: Ensayo clínico aleatorizado (ECA) Identificación del estudio (Referencia bibliográfica del estudio, formato Vancouver)

Más detalles

TEMA 5 Variables ficticias

TEMA 5 Variables ficticias TEMA 5 Variables ficticias Cómo describir información cualitativa Muchas veces en el modelo de regresión aparecen factores cualitativos (sexo, raza, estado civil,.). En estos casos la información relevante

Más detalles

Cómo aplicar las pruebas paramétricas bivariadas t de Student y ANOVA en SPSS. Caso práctico.

Cómo aplicar las pruebas paramétricas bivariadas t de Student y ANOVA en SPSS. Caso práctico. Universitat de de Barcelona. Institut de de Ciències de de l Educació Cómo aplicar las pruebas paramétricas bivariadas t de Student y ANOVA en SPSS. Caso práctico. María José Rubio

Más detalles

Dependencia lineal de vectores y sus aplicaciones a la resolución de sistemas de ecuaciones lineales y de problemas geométricos.

Dependencia lineal de vectores y sus aplicaciones a la resolución de sistemas de ecuaciones lineales y de problemas geométricos. Dependencia lineal de vectores y sus aplicaciones a la resolución de sistemas de ecuaciones lineales y de problemas geométricos. Prof. D. Miguel Ángel García Hoyo. Septiembre de 2011 Dependencia lineal

Más detalles

Estimación de una probabilidad

Estimación de una probabilidad Estimación de una probabilidad Introducción En general, la probabilidad de un suceso es desconocida y debe estimarse a partir de una muestra representativa. Para ello, deberemos conocer el procedimiento

Más detalles

Modelos de elección binaria

Modelos de elección binaria Modelos de elección binaria Prof.: Begoña Álvarez García Econometría II 2007-2008 Estamos interesados en la ocurrencia o no-ocurrencia de un cierto evento (ej: participación en el mercado laboral; inversión

Más detalles

Matemáticas. 1 o ESO. David J. Tarifa García. info@esobachilleratouniversidad.com.es

Matemáticas. 1 o ESO. David J. Tarifa García. info@esobachilleratouniversidad.com.es Matemáticas 1 o ESO David J. Tarifa García info@esobachilleratouniversidad.com.es 1 Matemáticas - 1 o ESO 2 Índice 1 Tema 1. Los números naturales 6 1.1 Suma de números naturales................................

Más detalles

Botella-Rocamora, P.; Alacreu-García, M.; Martínez-Beneito, M.A.;

Botella-Rocamora, P.; Alacreu-García, M.; Martínez-Beneito, M.A.; Inferencia estadística (intervalos de confianza y p-valor). Comparación de dos poblaciones (test t de comparación de medias, comparación de dos proporciones, comparación de dos varianzas). Botella-Rocamora,

Más detalles

Estudios de cohortes. Capítulo 13. Miguel Ángel Teus Guezala

Estudios de cohortes. Capítulo 13. Miguel Ángel Teus Guezala Capítulo 13 Estudios de cohortes Miguel Ángel Teus Guezala 1. Concepto y características 2. Fortalezas y debilidades de los estudios de cohorte a) selección de los pacientes b) Medición de la exposición

Más detalles

Diseños en Investigación Clínica

Diseños en Investigación Clínica Diseños en Investigación Clínica Este módulo ha sido desarrollado como componente de las actividades de la Iniciativa Panamericana en Bioética; programa apoyado por el Grant del Centro Internacional Fogarty,

Más detalles

todas especialidades Soluciones de las hojas de problemas

todas especialidades Soluciones de las hojas de problemas Universidad Politécnica de Cartagena Dpto. Matemática Aplicada y Estadística Ingeniería Técnica Industrial Métodos estadísticos de la ingeniería Métodos estadísticos de la ingeniería Ingeniería Técnica

Más detalles

Regresión lineal múltiple

Regresión lineal múltiple . egresión lineal múltiple egresión lineal múltiple. Introducción. En el tema anterior estudiamos la correlación entre dos variables y las predicciones que pueden hacerse de una de ellas a partir del conocimiento

Más detalles

FUNCIONES DE UNA VARIABLE Julián de la Horra Departamento de Matemáticas U.A.M.

FUNCIONES DE UNA VARIABLE Julián de la Horra Departamento de Matemáticas U.A.M. FUNCIONES DE UNA VARIABLE Julián de la Horra Departamento de Matemáticas U.A.M. 1 Introducción Una de las primeras necesidades que surgen en las Ciencias Experimentales es la de poder expresar los valores

Más detalles

UNED. DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS [TEMA 8] Análisis de Regresión Lineal Simple y Múltiple

UNED. DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS [TEMA 8] Análisis de Regresión Lineal Simple y Múltiple 011 UNED DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS [TEMA 8] Análisis de Regresión Lineal Simple y Múltiple 1 Índice 8.1 Introducción... 3 8. Objetivos... 4 8.3 Análisis de Regresión Simple... 4 8.3.1

Más detalles

UNED. [TEMA 3] Análisis de datos para diseños de dos grupos. Muestras independientes.

UNED. [TEMA 3] Análisis de datos para diseños de dos grupos. Muestras independientes. 2009 UNED [TEMA 3] Análisis de datos para diseños de dos grupos. Muestras independientes. 1 ÍNDICE 3.1 Introducción 3.2 Objetivos 3.3 Muestras independientes o relacionadas 3.4 Contraste de hipótesis sobre

Más detalles

Mónica López Ratón BIOSTATECH, Advice, Training & Innovation in Biostatistics, S.L. Octubre 2012. monica.lopez.raton@usc.es

Mónica López Ratón BIOSTATECH, Advice, Training & Innovation in Biostatistics, S.L. Octubre 2012. monica.lopez.raton@usc.es Mónica López Ratón BIOSTATECH, Advice, Training & Innovation in Biostatistics, S.L. Octubre 01 monica.lopez.raton@usc.es Tablas de contingencia y tests asociados Índice 1. Datos categóricos. Tablas de

Más detalles

ASOCIACIÓN LINEAL ENTRE VARIABLES CUANTITATIVAS: la correlación de Pearson

ASOCIACIÓN LINEAL ENTRE VARIABLES CUANTITATIVAS: la correlación de Pearson ASOCIACIÓN LINEAL ENTRE VARIABLES CUANTITATIVAS: la correlación de Pearson 3datos 2011 Análisis BIVARIADO de variables cuantitativas OBJETIVO DETERMINAR 1º) si existe alguna relación entre las variables;

Más detalles

Inteligencia emocional y éxito académico. Hay relación entre ellas?

Inteligencia emocional y éxito académico. Hay relación entre ellas? Inteligencia emocional y éxito académico Hay relación entre ellas? Índice Introducción..2 Fundamento del estudio.2 Instrumentos de medida.3 Selección de la muestra.7 Análisis General por cursos...7 Por

Más detalles

Límites. Definición de derivada.

Límites. Definición de derivada. Capítulo 4 Límites. Definición de derivada. 4.1. Límites e indeterminaciones Hemos visto en el capítulo anterior que para resolver el problema de la recta tangente tenemos que enfrentarnos a expresiones

Más detalles

Covarianza y coeficiente de correlación

Covarianza y coeficiente de correlación Covarianza y coeficiente de correlación Cuando analizábamos las variables unidimensionales considerábamos, entre otras medidas importantes, la media y la varianza. Ahora hemos visto que estas medidas también

Más detalles

Aplicación de los modelos de credit scoring para instituciones microfinacieras.

Aplicación de los modelos de credit scoring para instituciones microfinacieras. Econ. Reynaldo Uscamaita Huillca Aplicación de los modelos de credit scoring para instituciones microfinacieras. OBJETIVO Proporcionar al ejecutivo del sistema financiero un modelo solido que permita tomar

Más detalles

Análisis de la Varianza de un Factor

Análisis de la Varianza de un Factor Práctica de Estadística con Statgraphics Análisis de la Varianza de un Factor Fundamentos teóricos El Análisis de la Varianza con un Factor es una técnica estadística de contraste de hipótesis, cuyo propósito

Más detalles

Ejercicio de estadística para 3º de la ESO

Ejercicio de estadística para 3º de la ESO Ejercicio de estadística para 3º de la ESO Unibelia La estadística es una disciplina técnica que se apoya en las matemáticas y que tiene como objetivo la interpretación de la realidad de una población

Más detalles

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso 2008-2009

DIPLOMADO EN RELACIONES LABORALES Estadística Asistida por Ordenador Curso 2008-2009 Índice general 6. Regresión Múltiple 3 6.1. Descomposición de la variabilidad y contrastes de hipótesis................. 4 6.2. Coeficiente de determinación.................................. 5 6.3. Hipótesis

Más detalles

Tema 3: El modelo de regresión lineal múltiple

Tema 3: El modelo de regresión lineal múltiple Econometría 1 curso 2009-2010 Tema 3: El modelo de regresión lineal múltiple Genaro Sucarrat (Departamento de Economía, UC3M) http://www.eco.uc3m.es/sucarrat/ Recordamos: El modelo de regresión lineal

Más detalles

Medidas de concordancia: el índice de Kappa

Medidas de concordancia: el índice de Kappa Investigación: Medidas de concordancia: el índice de Kappa 1/5 Medidas de concordancia: el índice de Kappa Autores: López de Ullibarri Galparsoro I, Pita Fernández, S. Unidad de Epidemiología Clínica y

Más detalles

EXPERIENCIA DIDÁCTICA DE FÍSICA PARA DETERMINAR LA CONSTANTE ELÁSTICA DE UN MUELLE

EXPERIENCIA DIDÁCTICA DE FÍSICA PARA DETERMINAR LA CONSTANTE ELÁSTICA DE UN MUELLE EXPERIENCIA DIDÁCTICA DE FÍSICA PARA DETERMINAR LA CONSTANTE ELÁSTICA DE UN MUELLE AUTORÍA MARÍA FRANCISCA OJEDA EGEA TEMÁTICA EXPERIMENTO FÍSICA Y QUÍMICA, APLICACIÓN MÉTODO CIENTÍFICO ETAPA EDUCACIÓN

Más detalles

NT8. El Valor en Riesgo (VaR)

NT8. El Valor en Riesgo (VaR) NT8. El Valor en Riesgo (VaR) Introducción VaR son las siglas de Valor en el Riesgo (Value at Risk) y fue desarrollado por la división RiskMetric de JP Morgan en 1994. es una manera de medir el riesgo

Más detalles

FUNCIONES 1. DEFINICION DOMINIO Y RANGO

FUNCIONES 1. DEFINICION DOMINIO Y RANGO 1. DEFINICION DOMINIO Y RANGO FUNCIONES Antes de definir función, uno de los conceptos fundamentales y de mayor importancia de todas las matemáticas, plantearemos algunos ejercicios que nos eran de utilidad

Más detalles

Equipo Docente de Fundamentos Físicos de la Informática. Dpto.I.I.E.C.-U.N.E.D. Curso 2001/2002.

Equipo Docente de Fundamentos Físicos de la Informática. Dpto.I.I.E.C.-U.N.E.D. Curso 2001/2002. TEMA 11. FENÓMENOS TRANSITORIOS. 11 Fenómenos transitorios. Introducción. 11.1. Evolución temporal del estado de un circuito. 11.2. Circuitos de primer y segundo orden. 11.3. Circuitos RL y RC en régimen

Más detalles

MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN

MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN Suponga que le pedimos a un grupo de estudiantes de la asignatura de estadística que registren su peso en kilogramos. Con los datos del peso de los estudiantes

Más detalles

www.fundibeq.org Además se recomienda su uso como herramienta de trabajo dentro de las actividades habituales de planificación y control.

www.fundibeq.org Además se recomienda su uso como herramienta de trabajo dentro de las actividades habituales de planificación y control. ESTUDIOS DE CAPACIDAD POTENCIAL DE CALIDAD 1.- INTRODUCCIÓN Este documento proporciona las pautas para la realización e interpretación de una de las herramientas fundamentales para el control y la planificación

Más detalles

Conceptos básicos de las medidas y los indicadores de la Epidemiología

Conceptos básicos de las medidas y los indicadores de la Epidemiología Mediciones de los problemas de salud Conceptos básicos de las medidas y los indicadores de la Epidemiología Marcela Cárcamo I. Depto. Salud Pública y Epidemiología Epidemiología Estudio de la distribución

Más detalles

TEMA II: ÁLGEBRA DE CONMUTACIÓN

TEMA II: ÁLGEBRA DE CONMUTACIÓN TEMA II: ÁLGEBRA DE CONMUTACIÓN En este capítulo veremos los métodos matemáticos que se disponen para las operaciones relacionadas con los circuitos digitales, así como las funciones más básicas de la

Más detalles

7 Cuestiones estadísticas básicas.

7 Cuestiones estadísticas básicas. 7 Cuestiones estadísticas básicas. Domingo Pérez Flores 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN MEDICINA. 2. LA ESTADÍSTICA EN LA LECTURA CRÍTICA DE LA LITERATURA. 2.1.Muestreo. 3.INTERVALO DE

Más detalles

33 El interés compuesto y la amortización de préstamos.

33 El interés compuesto y la amortización de préstamos. 33 El interés compuesto y la amortización de préstamos. 33.0 El interés compuesto. 33.0.0 Concepto. 33.0.02 Valor actualizado de un capital. 33.0.03 Tiempo equivalente. 33.02 Amortización de préstamos.

Más detalles

Metodología de Investigación en Odontología.

Metodología de Investigación en Odontología. Avanzamos contigo Metodología de Investigación en Odontología. Directora: Dra. Elena Figuero Madrid & Oviedo Octubre 2014-Abril 2015 Dirigido a Periodoncistas, Odontólogos, Estomatólogos y Otros profesionales

Más detalles

TABLAS DINAMICAS DE MORTALIDAD Y SUPERVIVENCIA

TABLAS DINAMICAS DE MORTALIDAD Y SUPERVIVENCIA TABLAS DINAMICAS DE MORTALIDAD Y SUPERVIVENCIA Ana Debón 1 Ramón Sala 2 Universitat de Valencia Resumen: Es una realidad que la esperanza de vida está aumentando en todos los países desarrollados. Así

Más detalles

UN MODELO PARA LA PREDICCIÓN DE RECIDIVA DE PACIENTES OPERADOS DE CÁNCER DE MAMA (CMO) BASADO EN REDES NEURONALES

UN MODELO PARA LA PREDICCIÓN DE RECIDIVA DE PACIENTES OPERADOS DE CÁNCER DE MAMA (CMO) BASADO EN REDES NEURONALES UN MODELO PARA LA PREDICCIÓN DE RECIDIVA DE PACIENTES OPERADOS DE CÁNCER DE MAMA (CMO) BASADO EN REDES NEURONALES José Alejandro Chiri Aguirre RESUMEN La predicción de recidiva en pacientes que han sido

Más detalles