Fundamentos estadísticos del ensayo clínico, Interpretación de resultados. M José Escudero Barea. Gerente Dpto. Gestión de Datos y Estadística. Grupo Español de Investigación en Cáncer de Mama (GEICAM).
INDICE 0-INTRODUCCIÓN 1- CONCEPTOS ESTADÍSTICOS 2- Fase II 3- Fase III Prueba de hipótesis α y β p-valor Intervalo de confianza Aleatorización Objetivo Respuesta Regresión Logística Binaria. Análisis de supervivencia Modelo de regresión de Cox
1- Introducción MÉTODOS ESTADÍSTICOS: Proporcionan reglas para decidir si el beneficio es real o es debido al azar. Cuantifican la magnitud del efecto. Valoran la precisión de los resultados Deben estar definidos en el protocolo antes de la realización del Ensayo clínico. Cualquier modificación debe introducirse como una enmienda al protocolo.
1- Conceptos estadísticos Prueba de hipótesis Prueba de HIPOTESIS: Establecer la veracidad o no de una hipótesis a partir de los datos que nos ofrece una muestra. H 0 : Hipótesis nula. H 1 : Hipótesis alternativa. Hipótesis bilaterales H 0 : p A =p B H 1 : p A p B Hipótesis unilaterales H 0 : p A p B H 1 : p A > p B
1- Conceptos estadísticos α y β Se realiza el estudio y, basándonos en los datos, se toma una decisión. H 0 cierta Verdad H 0 falsa Decisión Rechazar H 0 Error Tipo I (α) Correcto Aceptar H 0 Correcto Error Tipo II (β) α : Nivel de significación (error tipo I) (Falso positivo): α = p (rechazar H 0 H 0 cierta) Estándar: 0,05 Conservador: 0,01. Si el tto es muy tóxico y se quiere tener mas evidencia de efectividad. 1-β : Potencia (error tipo II) (Falso negativo) β = p (aceptar H 0 H 0 falsa) Potencia = 1- β = p (rechazar H 0 H 0 falsa) Estándar : 0,80 (β=0,20)
1- Conceptos estadísticos p-valor p-valor: Indicador de la credibilidad de la hipótesis nula. Con los datos que tenemos podemos asumir la H 0 como cierta? -Se calcula una estimación con nuestra muestra. -Se calcula la probabilidad de obtener en la distribución de nuestra población, según la H 0, una estimación como la obtenida con nuestra muestra. -El valor p nos muestra la probabilidad de haber obtenido el resultado que hemos obtenido si la H0 es cierta. -z 0 0 z 0 Si p<0,05 = Nivel de significación(α) Hay una gran discrepancia entre los datos del estudio y la H 0, por lo tanto rechazamos la H 0. Si p>0,05 = Nivel de significación(α) Hay una pequeña discrepancia entre los datos del estudio y la H 0 que podría ser explicada por el azar. No rechazamos la H 0.
1- Conceptos estadísticos Intervalo de Confianza Población Muestra De esta muestra se estima un parámetro (media, mediana..) Es necesario además de la estimación puntual indicar una estimación por intervalo, como el intervalo de confianza. IC 1-α de π: (p ± e) IC al 95%: Lo que nos indica es que a la larga, el 95% de los Intervalos así construidos contienen el valor del parámetro en estudio. El IC depende de: La estimación puntual. Tamaño muestral ( tamaño muestral amplitud del IC) El nivel de confianza (95% y 99%)
2- Fase II La fase de un estudio determina en gran parte los objetivos, los tipos de datos que se deben seleccionar para alcanzar esos objetivos y los tipos de análisis a realizar. Fase II: Proporciona información preliminar sobre la eficacia y la seguridad del producto. 30 100 pac Se estudia si el nuevo tratamiento es al menos tan eficaz como los existentes. Objetivos: Toxicidad y primeros datos de eficacia Fase II / III: Se comienza con un Fase II randomizado, dónde se elimina la peor pauta y posteriormente se pasa a un Fase III Brazo A Brazo B Brazo C Fase II se determinó que la peor pauta era el Brazo C Brazo A Brazo B
2- Fase II Fase II con un brazo Variable objetivo: Respuesta al tratamiento. Diseño: Diseño de dos pasos (Two-Stage Design). Fase I: 5/17 Fase II: 14/41 RESULTADO: Si estamos estudiando la pcr y tenemos 20 pacientes respondedoras de 41, obtendremos la probabilidad de respuesta estimada expresada: pcr = 0.49 ; IC 95%: (0.33, 0.64)
3- Fase III Fase III: Evalúan la eficacia y seguridad del tratamiento experimental intentando reproducir las condiciones de uso habituales y considerando las alternativas terapeúticas disponibles. >100 pac Aleatorizados/Comparativos. Objetivos: Eficacia (SG/ SLE / SLP)
3 - Fase III Aleatorización Randomizados/Aleatorizados La aleatorización se define como el que todos los individuos tengan la misma probabilidad (p) de entrar al grupo tratamiento y la misma probabilidad (1-p) de pertenecer al grupo control. El objetivo central del proceso de aleatorización es conseguir que todos los factores se distribuyan por igual en los grupos de estudio, y que la única diferencia entre los grupos que se comparan sea el tratamiento. Estratificación: Se utiliza cuando se quieren eliminar factores determinantes que influyen en la respuesta a la intervención.
3 - Fase III Objetivo Respuesta
3 - Fase III Objetivo Respuesta OBJETIVO: Comparar la respuesta entre 2 tratamientos. Se intenta decidir si la H 0 : p A = p B es falsa. Sabemos que la muestra son 124 mujeres y las respuestas son 31 en el brazo A y 39 en el brazo B. De manera global la tasa de respuestas es: 70/124=0.565. Si H 0 cierta 0.565 deberían ser la proporción de respuestas en el brazo A y en el B. Por tanto esperaríamos 34 y 36 respuestas respectivamente en los brazos A y B RESULTADO: p-valor=0,3>0,05 No existe suficiente evidencia para rechazar la H0.
3- Fase III- Regresión logística binaria Análisis de Regresión logística binaria: El análisis de regresión logística binaria se utiliza para estudiar la relación entre una variable dependiente binaria (Y=Respuesta) y varias variables independientes (x 1, x 2,., x k ). EJEMPLO: Se quiere estudiar si el tipo de tratamiento (A /B), el tipo histológico y el estadio, influyen sobre la Respuesta completa patológica. Análisis univariante. Análisis multivariante Obtención del modelo. Significativas en el análisis univariante. Clínicamente relevantes. RESULTADOS: e β1 : OR: El factor por el cual se multiplica la odds de la respuesta de Y cuando la variable predictora X 1 se incrementa en 1 unidad. e β1 = e 0,95 =2.6, IC 95% (1.3-5.1) Los sujetos que reciben B respecto a aquellos que reciben A presentan un incremento estadísticamente significativo de prc por no contener su IC al 1. (Multiplican la odds de recaída por 2.6). Con una confianza del 95% los pac que reciben B tienen una probabilidad de pcr que como mínimo es 1,3 veces superior a la de los pac del brazo B.
3 - Fase III Análisis de Supervivencia ANÁLISIS DE SUPERVIVENCIA: Conjunto de técnicas estadísticas, apropiadas para estudios en los que cada sujeto es seguido durante un periodo de tiempo y se registra el intervalo de tiempo desde el inicio del estudio hasta el final del seguimiento o hasta el evento. Duración variable del seguimiento Datos censurados: Aquellos sujetos que salen del estudio sin haber sufrido el evento. OBJETIVO: Comparación de tiempos de supervivencia. DFS, OS. Implica seguimiento.
3 - Fase III Análisis de Supervivencia DATOS CENSURADOS. Sujetos 5 4 3 2 1 2005 2006 2007 2008 2009 2010 2011 Duración del estudio Tiempo de seguimiento de un paciente. Estado EVENTO CENSURA
3 - Fase III Análisis de Supervivencia La curva de supervivencia permite describir la evolución de un grupo de sujetos mediante la representación gráfica de las proporciones de supervivencia para diferentes intervalos. Las curvas de supervivencia representan la probabilidad de sobrevivir (no progresar) más allá de un tiempo x (eje horizontal). Ejemplo: Para las pacientes del brazo de FEC la probabilidad de sobrevivir un tiempo mayor de 60 meses es 0,72, mientras que para las del brazo FEC + P es 0,78
3 - Fase III Análisis de Supervivencia No. at risk: Nº de sujetos que han estado en riesgo en promedio en ese intervalo. p=0,0057, como es menor de 0,05 nos indica que la supervivencia del grupo FEC es peor que la del grupo FEC+P. Prueba log-rank.
Fase III- Análisis de Supervivencia Función de riesgo y HR FUNCIÓN DE RIESGO (HAZARD FUNCTION): Probabilidad condicionada por unidad de tiempo que tiene un sujeto de fallecer (tener el evento) en un instante t si había sobrevivido hasta el instante anterior. Tasa media de incidencias de evento en un intervalo. Ejemplo: h(t) =0,0376 La tasa media de recidivas durante el 2º año es de 0,0376 recidivas por paciente y mes, entre los pacientes que han superado el primer año. HAZARD RATIO (HR): Razón de riesgos de tener un evento en un grupo A respecto a un grupo B (control). HR=1 (o el IC contiene el 1): El riesgo es similar en ambos grupos. HR<1 (o el IC menor que 1): A tiene un efecto protector. El grupo B tiene mas riesgo de evento. HR>1 (o el IC mayor que 1): B tiene un efecto protector. El grupo A tiene mas riesgo de evento. Ejemplo: HR = 5,6 (IC 95%: 2,3 A 13,7) Los pacientes que han recibido el tratamiento A tienen un riesgo de evento (recaída / muerte) 5,6 veces superior al de las pacientes tratadas con el tratamiento B (IC 95%: 2,3 A 13,7).
Fase III- Análisis de Supervivencia Modelo de Regresión de Cox Extensión de los métodos de supervivencia. La Regresión de Cox pretende detectar alguna relación entre el riesgo de que se produzca un determinado evento (muerte, progresión, ) y una o varias variables independientes o explicativas. (Ej: Los pacientes con ganglios afectos seguramente vivirán menos tiempo que aquellos que no lo tienen)
Fase III- Análisis de Supervivencia Modelo de Regresión de Cox EJEMPLO: GEICAM 9906- FEC vs FEC + TAXOL, Se realiza un análisis de regresión de Cox para detectar la relación entre varias variables independientes y el riesgo de recaída. Análisis univariante. Variable N p -valor Tratamiento Rama A: FEC x 6 0,006 Rama B: FEC x 4 + TAXOL Her2 (FISH) Positivo Negativo Estado de los receptores hormonales (CRD) Positivos Negativos Fenotipo Basal Sí No Número de ganglios axilares 1-3 ganglios >3 ganglios Estado menopaúsico Premenopaúsica Postmenopaúsica 630 614 188 738 1014 226 88 785 776 468 676 568 < 0,0001 < 0,0001 0,248 < 0.0001 0,801 Se incluyen todas las variables en el modelo menos el estado menopaúsico.
Fase III- Análisis de Supervivencia Modelo de Regresión de Cox EJEMPLO (Continuación) Análisis multivariante (Backward, Forward). Variable Wald Sig Exp (B) IC 95 % Tratamiento Rama A: FEC x 6 Rama B: FEC x 4 + TAXOL Her2-neu Positivo Negativo Estado de los receptores hormonales (CRD) Positivos Negativos Número de ganglios axilares 1-3 ganglios >3 ganglios Ref 6.200 9.695 Ref 13.251 Ref Ref 19.589 1 (referencia) 0.013 0.728 0.567 0.935 0.002 1 (referencia) < 0.0001 1 (referencia) 1.559 1.179 2.062 0.593 0.448 0.786 1 (referencia) < 0.0001 1.750 1.366 2.242 La rama FEC x 4 + Taxol multiplica el riesgo de recaída por 0.7 respecto a la rama FEC x 6. IC 95 % (0.6-0.9) La rama FEC x 6 multiplica el riesgo de recaída por 1.4 respecto a la rama FEC x 4 + Taxol. IC 95 % (1.1-1.7)
MUCHAS GRACIAS POR SU ATENCIÓN!!!