Diagnósticos regresión de Cox Víctor Abraira Unidad de Bioestadística Clínica. IRYCIS 1 Diagnósticos de regresión Se trata de evaluar lo adecuado del modelo. Hay tres aspectos: Asunciones Bondad de ajuste Validez del modelo La única asunción del modelo es el modelo mismo: riesgo proporcional l( (modelo multiplicativo), que se puede evaluar gráfica o estadísticamente 2 1
Evaluación gráfica Evaluación visual: observar si las gráficas de riesgo, h(t) ó H(t), son proporcionales para los distintos valores de la variable, o más fácil, si sus logaritmos son paralelos Este procedimiento sólo es posible para variables categóricas 3 Unidad de Bioestadística Clínica 4 2
Gráfica ln H(t) o ln[ ln(s(t))] ln[-ln(survival Probability)] ln[-ln(survival Probability)] -2-1 0 1-3 -2-1 0 1 2-3 2 0 20 40 60 80 analysis time trata = 1 trata = 2 Si se cumpliera la asunción deberían ser paralelas Suele ser más fácil verlo poniendo el tiempo en escala logarítmica analysis time trata = 1 trata = 2 20 40 60 80 5 Evaluación estadística del riesgo proporcional Incluir en el modelo un variable de interacción con el tiempo, si fuera significativa indicaría que elhr varía con el tiempo, por tanto no se cumple la asunción. Si así fuera, podría dejarse en el modelo, aunque complica su interpretación: los HR son distintos para cada tiempo. Tanto este test como la gráfica evalúan cada variable por separado, o cada variable dadas las otras. 6 3
Evaluación estadística del riesgo proporcional ------------------------------------------------------------------------------ _t Haz. Ratio Std. Err. z P> z [95% Conf. Interval] -------------+---------------------------------------------------------------- main trata 1.613769.3617755 2.13 0.033 1.039965 2.504172 -------------+---------------------------------------------------------------- tvc trata 1.013164.0141347 0.94 0.349.9858357 1.04125 ------------------------------------------------------------------------------ Note: variables in tvc equation interacted with _t Unidad de Bioestadística Clínica 7 Evaluación del riesgo proporcional Con el archivo Caovario.dta evaluar la asunción de riesgo proporcional de las variables grado, ascitis, figo, mediante el método gráfico. Evaluar la asunción de riesgo proporcional estadísticamente para grado, ascitis, figo y edad. 8 4
Bondad de ajuste Test basado en el logaritmo del cociente de la verosimilitud. En modelos predictivos: Calibración: grado en que la supervivencia predicha coincide con la observada. Discriminación,, grado en que el modelo distingue entre individuos de mayor y menor riesgo. 9 Calibración Se crea un índice pronóstico (IP) a partir del modelo: IP = 1 x 1 +... + k x k Se divide la muestra en grupos de riesgo aplicando al IP puntos de corte por n ciles de pacientes con evento. Se estiman las curvas K M para los grupos (supervivencia i observada) y se comparan con las predichas por el modelo para los valores medios del IP en los grupos. 10 5
Unidad de Bioestadística Clínica 11 Se buscan puntos de corte Statistics > Summaries, tables, and tests > Summary and descriptive statistics > Centiles with CIs statistics > Centiles with CIs. centile ip if estpac==1, centile(20 80) -- Binom. Interp. -- Variable Obs Percentile Centile [95% Conf. Interval] -------------+------------------------------------------------------------- ip 209 20 3.335693 3.22944 3.509878 Unidad 80 de Bioestadística 4.506013 Clínica 4.406452 4.657173 12 6
Se crean los grupos gen grupo=1 if ip<=3.336 replace grupo=2 if ip>3.335 & ip<=4.506 replace grupo=3 if ip>4.506 replace grupo=. if ip==. tab grupo estpac estado del paciente grupo muerto vivo Total -----------+----------------------+---------- 1 41 580 621 2 126 477 603 3 42 61 103 -----------+----------------------+---------- Total 209 1,118 1,327 0.50 0.75 1.00 0.00 0.25 0 Kaplan-Meier survival estimates 0 100 200 300 analysis time grupo = 1 grupo = 2 grupo = 3 Unidad de Bioestadística Clínica 13 Comparando con lo predicho por el modelo 1 Survival.25.5.75 Cox proportional hazards regression.00 0.25 0.50 0.75 1 Kaplan-Meier survival estimates bysort grupo: sum ip stcox ip, nohr stcurve, survival /// at1( ip=2.63 ) /// at2( ip=3.86 ) /// at3( ip=4.88 ) /// ylabel(0(.25)1) 0 0 100 200 300 analysis time 0.00 0 100 200 300 analysis time ip=2.63 ip=4.88 ip=3.86 grupo = 1 grupo = 2 grupo = 3 Unidad de Bioestadística Clínica 14 7
Discriminación Hay un estadístico propuesto (Altman, Royston Statist. Med. 2000; 19:453 473) 473), muyintuitivoaunque poco usado: el índice de separación PSEP, definido como la diferencia entre la probabilidad de supervivencia entre los grupos de peor y mejor pronóstico, en un tiempo relevante. 0.75 1.00 0.00 0.25 0.50 Kaplan-Meier survival estimates 0 100 200 300 analysis time grupo = 1 grupo = 2 grupo = 3 PSEP 15 Discriminación Otros estadísticos más establecidos: Índice C, medida de concordancia, proporción de todos los pares en los que predicciones y eventos son concordantes 1 discriminación perfecta 0.5, discriminación próxima al azar D de Sommer s D=2*C 1 1 discriminación perfecta 0, discriminación próxima al azar Unidad de Bioestadística Clínica 16 8
Discriminación Statistics > Postestimation > Reports and statistics ttiti. estat concordance failure _d: estpac == 1 analysis time _t: tpopac Harrell's C concordance statistic Number of subjects (N) = 1319 Number of comparison pairs (P) = 149833 Number of orderings as expected (E) = 104938 Number of tied predictions (T) = 0 Harrell's C = (E + T/2) / P =.7004 Somers' D =.4007 Unidad de Bioestadística Clínica 17 Práctica Con archivo curso_supervivencia y evento muerte Evaluar asunción riesgoproporcional gráficamentepara Gtrata, nta y sexo receptor. Evaluar asunción riesgo proporcional estadísticamente para nta y sexo receptor. Ajustar un modelo predictivo, usando como modelo máximo nta, tpodial, sexorec, edadr, complmed y complqi. Evaluar la bondad de ajuste (calibración y discriminación) del modelo final. Lo mismo para pérdida del injerto 18 9
Ca Ovario.dta Ajustar un modelo predictivo, usando como modelo máximo edad, d figo, grado, histol, ascitis y eresidual Evaluar bondad de ajuste Unidad de Bioestadística Clínica 19 Diagnósticos de regresión Se trata de evaluar lo adecuado del modelo. H t t Hay tres aspectos: Asunciones Bondad de ajuste Validez del modelo 20 10
Validez del modelo se comporta igual en otras muestras extraídas de la misma población (reproducibilidad) y/o de otras similares (transportabilidad)? Otra muestra (externa) Partir la muestra en dos (no al azar) (interna) Técnicas de re muestreo (jackknife o bootstrap) (interna). 21 Validez Modelos estimativos: se ajusta el modelo en el grupo de trabajo, luego se hace la estimacióndel efecto en el de validación y se comparan los Hazard Ratio. Si son muy distintos indicaría que el modelo no tiene validez externa. 22 11
Validez Modelos predictivos: se ajusta el modelo en el grupo de trabajo; se aplica (se genera el IP) en el de validación y se evalúa su calibración y discriminación. En Stata stcox edadr tpodial diashosp if vali==0 predict ip, xb El IP se genera para todos los casos con el modelo generado con el grupo de trabajo 23 Validez: Calibración Se calcula el coeficiente de reducción ( shrinkage ) ( shrinkage ) El índice pronostico (IP) se introduce en un modelo de Cox univariante en el grupo de validación y su coeficiente se denomina coeficiente de shrinkage. Este coeficiente, en la mayor parte de los casos es menor que 1, es el factor que calibra lb los coeficientes del modelo. 24 12
Validez: Calibración. stcox ip if vali==1, nohr Cox regression -- Breslow method for ties No. of subjects = 434 Number of obs = 434 No. of failures = 24 Time at risk = 12335.26667 LR chi2(1) = 18.19 Log likelihood = -121.20958 Prob > chi2 = 0.0000 ------------------------------------------------------------------------------ _t Coef. Std. Err. z P> z [95% Conf. Interval] -------------+---------------------------------------------------------------- ip 1.043601.2321717 4.49 0.000.5885525 1.498649 Coef. shrinkage. 25 Discriminación Índice C. estat concordance failure _d: estpac == 1 analysis time _t: tpopac Harrell's C concordance statistic Number of subjects (N) = 434 Number of comparison pairs (P) = 6575 Number of orderings as expected (E) = 4895 Number of tied predictions (T) = 0 Harrell's C = (E + T/2) / P =.7445 Somers' D =.489 Unidad de Bioestadística Clínica 26 13
Práctica Con archivo curso_supervivencia y evento muerte Ajustar un modelo predictivo, usando como modelo máximo nta, tpodial, sexorec, edadr, complmed y complqi. Validar el modelo final. Lo mismo para pérdida del injerto Notas: cómo partir el archivo? Mejor no al azar BMJ 2009, 338:b605 Garantizando mínimo 100 eventos en el grupo de validación (Harrell, pág 92). A efectos del ejercicio seleccionar los nº de casos <300 como grupo validación 27 Ca. ovario Plantear un modelo predictivo con los pacientes con eclinico i =1 y validarlo l en los pacientes con eclinico=0 Modelo máximo i.grado i.eresidual i.ps ascitis i.figo edad Unidad de Bioestadística Clínica 28 14