Conceptos básicos de estadística para clínicos Víctor Abraira A Coruña. Noviembre 2008
Programa Valor p : qué significa? Aleatorización Pruebas de hipótesis para variables continuas Pruebas de hipótesis para variables categóricas Tiempo hasta un evento V.Abraira 2
Valor p V.Abraira 3
Qué son? Reducción relativa del riesgo (RRR) Intervalo de confianza (CI) Valor p la probabilidad de encontrar una diferencia en las proporciones de recurrencia de ictus como la que se ha encontrado, o mayor, en la hipótesis, llamada hipótesis nula, de que el tratamiento no tenga efecto. V.Abraira 4
Ejemplo: La dama y las tazas de té Supóngase que una dama asegura que es capaz de distinguir entre dos formas de preparar el té Experimento: se preparan 8 tazas, 4 de cada tipo, la dama lo sabe, y se le presentan al azar H 0 : la dama no distingue Resultado: Señala todas correctamente. C 8;4 =70 p=1/70= 0,014 V.Abraira 5
Ejemplo: La dama y las tazas de té Si se hubieran preparado 4 tazas; 2 y 2 C 4;2 =6 p=1/6= 0,17 No sería un experimento que aportara suficiente carga contra H 0 aunque acertara todas Notar que el cálculo de p depende del diseño V.Abraira 6
Ejemplo: La dama y las tazas de té Si la dama no supiera cuantas tazas se preparan de cada tipo, sólo que hay, o puede haber, de los dos tipos. La variable número de aciertos en H 0 es Bin(n=8,p=0,5) p æö 8 8 0 = f(8) = ( 0,5)( 0,5) = 0, 0039 ç çè8 ø V.Abraira 7
Críticas El valor p depende sobre todo del tamaño muestral. Ver SEMERGEN 2002; 28:374-5 El formalismo de los contrastes de hipótesis no contempla la información proveniente de otros estudios. El procedimiento garantiza a la larga una frecuencia preestablecida de decisiones correctas, pero no dice nada sobre la verdad o falsedad de cada hipótesis concreta. V.Abraira 8
Alternativas Hacer estimaciones con IC Misma base conceptual Feinstein AR. P-values and confidence intervals: two sides of the same unsatisfactory coin. J Clin Epidemiol 1998; 51:355-360. Abraira V. Estimación: intervalos de confianza. SEMERGEN 2002; 28:84-85. Alternativa Bayesiana Abraira V. Inferencia estadística bayesiana. SEMERGEN 2005; 31:18-20. V.Abraira 9
Aleatorización Dos conceptos: Muestra aleatoria (afecta a toda la inferencia). Es necesaria para: muestra sea representativa cuantificar incertidumbre muestreo Asignación aleatoria de tratamientos (afecta a los EECC). Necesaria para igualar el pronóstico de los pacientes. V.Abraira 10
Muestra aleatoria Aquella en que todos sus elementos tienen la misma probabilidad y cada uno está independientemente de los demás. Cada muestra es independiente de las demás y con la misma probabilidad. En la práctica rara vez se dispone de muestras aleatorias, por la tanto la situación habitual es V.Abraira 11
Muestra aleatoria V.Abraira 12
Diseño ensayo clínico Tratamiento experimental grupo 1 Resultado Muestra pacientes grupo 2 Resultado Tratamiento control V.Abraira 13
Cómo se calcula la p? PROGRESS V.Abraira 14
Cómo se calcula la p? Gran variedad de métodos (los llamados tests estadísticos) dependiendo de la hipótesis, del diseño, del tipo de variables, etc. Un amplio grupo son aquellos en que la hipótesis es la asociación entre dos variables: Ambas categóricas Una categórica y otra continuas Tiempo a un evento Ambas continuas V.Abraira 15
Dos variables categóricas BMJ 2000;321:329-333 Lancet 2001;358:1033-1041 V.Abraira 16
Contrastes sobre diferencia de proporciones H 0 : p 1 =p 2 =p 0 El estadístico para el contraste es (si se puede aproximar a la normal) Z = pˆ pˆ1- pˆ2 : æ1 1 ö (1- pˆ ) + ç èn n ø 0 0 1 2 Nor(0, 1) O, equivalentemente, la prueba jicuadrado O la prueba de Fisher si no se puede aproximar a la normal V.Abraira 17
Ejemplo Resultados del ensayo del BMJ: Z = 200 participantes en cada grupo; 52 con éxito en el grupo tratado y 18 en el placebo p ˆ = 0 pˆ pˆ - 0 0 pˆ 1 2 æ1 1 ö (1- pˆ ) ç + çèn n ø 70 400 Z 1 2 52 18 pˆ1= ; pˆ1= ; pˆ0 =?? 200 200 0,26-0,09 = = 4,474 æ 1 1 ö 0,175 0,825 ç + çè 200 200 ø p = 0,0000038 V.Abraira 18
Una categórica y otra continua V.Abraira 19
Estadísticos para los contrastes sobre diferencias de medias H 0 : µ 1 =µ 2 Los estadísticos para el contraste son (si las variables son normales) Varianzas conocidas Varianzas desconocidas iguales Z = desiguales V.Abraira ( X - X ) s n 1 2 2 2 1 s 2 + n 1 2 T = T = S : Nor(0, 1) ( X - X ) p ( X - X ) S n 1 2 2 2 1 S2 + 1 2 1 2 1 1 + n n 1 2 n : : t n t n + n - 1 2 2 20
En el ejemplo T 2,7-3 = = - 2 2 0,1 + 0,1 2,12 p = 0,017 V.Abraira 21
Tiempo al evento V.Abraira 22
Por qué distinto? Problemas con la medición: F E D C B A Desconocido en Pérdidas No eventos (evento competitivo) Censuras 0 2 4 6 8 10 12 300 250 Frecuencia 200 150 En general, no normal 100 50 0 0 50 100 150 200 V.Abraira 23 tiempo en dialisis en meses
Cómo se resume? La variable tiempo de espera, usando la información parcial de las censuras, se resume mediante: la función de supervivencia S(t) V.Abraira 24
Función de supervivencia 0.00 0.25 0.50 0.75 1.00 Kaplan-Meier survival estimate 0 100 200 300 analysis time S(t) es la probabilidad de que, en un individuo, el evento ocurra en un tiempo igual o mayor que t (si el evento es muerte, sobreviva al menos t). P.e. S(100) es la probabilidad de que un individuo sobreviva 100 ó más meses. V.Abraira 25
Puntos críticos El método asume que las pérdidas son al azar (no tienen información). Tiempo de seguimiento. Lo mide: Mediana de seguimiento (más habitual) Mediana de pérdidas V.Abraira 26
Estabilidad de la gráfica Las gráficas de K-M deberían incluir algún índice de la precisión de las 1,0,9 estimaciones:,8 Intervalos de confianza,3,2 Tablas de individuos en riesgo Survival propability,7,6,5,4,1 0,0 0 20 40 60 80 II 100 1A I 120 Months I 185 173 132 69 20 1 II 74 62 40 19 5 Eje tiempo hasta el 10% de los individuos Pocock, Clayton, Altman. Lancet 2002: 359:1686-89 V.Abraira 27
A modo de resumen VARIABLE INDEPENDIENTE (X) Categórica Categórica VARIABLE DEPENDIENTE (Y) Cuantitativa Cuantitativa Tiempo al evento (2 categorías) (más de (No Normal) (Normal) 2 categorías) Categórica (2 categorías) Categórica (más de 2 categorías) Comparación 2 proporciones o Chi-cuadrado o Fisher Chi-cuadrado Chi-cuadrado Mann-Whitney Kruskall-Wallis Comparación 2 medias - t de Student/ ANOVA Kaplan-Meier y log rank Cuantitativa Regresión logística Correlación Spearman Correlación Pearson/ Regresión lineal Regresión Cox V.Abraira 28