Diagnósticos regresión

Documentos relacionados
Objetivos del análisis de supervivencia

Curso online de Supervivencia y Regresión Lineal, Logística y de Cox 2018

Odds = = e. UD1: El modelo de regresión logística 1. 1 e

El modelo de azar proporcional: la regresión de Cox

Solución Taller No. 5 Econometría II Prof. Bernal

Modelación estadística: La regresión lineal simple

Métodos estadísticos en estudios de supervivencia

EJERCICIOS CAPITULO 9. GUJARATI-PORTER (2010)

TEMA V ANÁLISIS DE REGRESIÓN LOGÍSTICA

Lectura crítica de ensayos clínicos. V. Abraira Unidad de Bioestadística Clínica Mayo 2014

Presentación de la tercera edición Autores

Modelo 1: MCO, usando las observaciones 1994: :03 (T = 218) Variable dependiente: INFLACION

Prácticas de Fiabilidad

Análisis Estadístico. Dra. Adela Del Carpio Rivera Doctor En Medicina

Funciones de Regresión No Lineales (SW Cap. 6)

TEMA VI ANÁLISIS DE SUPERVIVENCIA

Análisis multivariantes

Fundamentos estadísticos del ensayo clínico, Interpretación de resultados. M José Escudero Barea. Gerente Dpto. Gestión de Datos y Estadística.

Universidad Central del Este UCE Facultad de Ciencias de la Salud Escuela de Medicina

MODELO VAR ARGENTINA

Javier Roca Pardiñas Prof. Titular de Universidade Dpto. Estatística e I.O. Universidade de Vigo

Ejercicio 1 (20 puntos)

Sesión 8 - Modelos con datos de conteo

Departamento de Medicina Preventiva y Salud Publica e Historia de la Ciencia. Universidad Complutense de Madrid. SPSS para windows.

EVALUACIÓN DE IMPACTOS EN HIDROCARBUROS, MEDIANTE LA ECONOMETRÍA. M.Sc. Carlos I. Palomares Palomares Gerente de Operaciones GPSAC

Heterocedasticidad en modelos de regresión ordinal con R

INTRODUCCION AL ECONOMETRIC VIEWS. Aquí se introduce la frecuencia y las fechas de comienzo y final de los datos.

. gen princ=(faminc-ww*whrs)/ probit lfp wa kl6 k618 we princ

Modelo de Regresión Lineal Múltiple. Normalidad. Dr. Víctor Aguirre Torres ITAM

Análisis de supervivencia: el estimador de Kaplan-Meier. Miguel Rodríguez Barranco Granada, 27 de marzo de 2017

... *Elasticidad ingreso del gasto en electricidad (Modelo Restringido). reg lviv ling

Una metodología para manejar variables

Econometría I (LADE). Curso 2001/2002 PRÁCTICA 08

EVALUACIÓN N DE LA VALIDEZ DE PRUEBAS DIAGNÓSTICAS

Modelo de Regresión Lineal Múltiple. Multicolinealidad. Dr. Víctor Aguirre Torres ITAM

EPIDEMIOLOGÍA. 5. Historia natural de la enfermedad: Formas de establecer el pronóstico.

Análisis Estadístico

Introducción a la Econometría Capítulo 4

Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple

Instituto Nacional de Cardiología Ignacio Chávez Departamento de Rehabilitación Cardiaca

Sección Teórica. , cuya información se presenta a continuación. Completar las celdas necesarias para responder a las preguntas 1 a 5.

Estimación de una función de gasto en alimentos

SOLUCIÓN PROPUESTA. Es de notar que dadao que los datos provienen de un corte transversal, valores de bondad de ajuste resultan ser bajos.

UNIVERSIDAD NACIONAL DE TRUJILLO ESCUELA PROFESIONAL DE ECONOMÍA APUNTES DE CLASE

Análisis estadístico de los factores de riesgo que influyen en la enfermedad Angina de Pecho. Flores Manrique, Luz CAPÍTULO IV ANALISIS DE LOS DATOS

Análisis de la Quiebra Empresarial de Pequeñas y Medianas Empresas en Ecuador ( ). Una aplicación del Modelo de Duración de Cox (1972).

Investigación sobre pruebas diagnósticas II (repetibilidad)

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 11) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

Ciencia UANL Universidad Autónoma de Nuevo León ISSN (Versión impresa): MÉXICO

Estimación de la elasticidad de la curva de salarios en Bolivia

Cálculo del tamaño muestral para la determinación de factores pronósticos

Universidad de la República, Facultad de Ciencias Económicas y Administración.

FIABILIDAD (VI): TESTS DE VIDA ACELERADA

Examen Final. Class Level Information Class Levels Values trat Number of Observations Used 15

Índice General de Ventas en Grandes Almacenes y su logaritmo

07 Estimación puntual e introducción a la estadística inferencial

Derivación y Validación de un Conjunto de Funciones de Riesgo Cardiovascular : El Estudio FRESCO


Errores de especificación. Series simuladas

ANALISIS DE REGRESIÓN Y CORRELACIÓN LINEAL

Facultad de Medicina Título: Utilidad clínica de la tabla 2x2

Paola Adanari Ortega-Ceballos, M. en C., Macías- Carrillo Claudia, M. en C, García-Díaz Francisco Javier, LF, María Alejandra Terrazas- Meraz, Dr

ESTADÍSTICA APLICADA A LA EDUCACIÓN (Tema 11) Asignatura de Formación Básica (FB) de 1º curso, común a los Grado en Educación Social y en Pedagogía

Modelos de elección discreta Aplicaciones en ordenador

Análisis Probit. StatFolio de Ejemplo: probit.sgp

Métodos cuantitativos de las ciencias sociales aplicados a los estudios urbanos y regionales André Lemelin

Varianza del error no constante: heteroscedasticidad. Fortino Vela Peón Universidad Autónoma Metropolitana

GESTION DE CALIDAD EN EL LABORATORIO CLINICO: PRUEBAS CUALITATIVAS. Dr. Daniel Bustos

Análisis de sensibilidad:

Introducción a la regresión ordinal

Conceptos básicos de estadística para clínicos

Transcripción:

Diagnósticos regresión de Cox Víctor Abraira Unidad de Bioestadística Clínica. IRYCIS 1 Diagnósticos de regresión Se trata de evaluar lo adecuado del modelo. Hay tres aspectos: Asunciones Bondad de ajuste Validez del modelo La única asunción del modelo es el modelo mismo: riesgo proporcional l( (modelo multiplicativo), que se puede evaluar gráfica o estadísticamente 2 1

Evaluación gráfica Evaluación visual: observar si las gráficas de riesgo, h(t) ó H(t), son proporcionales para los distintos valores de la variable, o más fácil, si sus logaritmos son paralelos Este procedimiento sólo es posible para variables categóricas 3 Unidad de Bioestadística Clínica 4 2

Gráfica ln H(t) o ln[ ln(s(t))] ln[-ln(survival Probability)] ln[-ln(survival Probability)] -2-1 0 1-3 -2-1 0 1 2-3 2 0 20 40 60 80 analysis time trata = 1 trata = 2 Si se cumpliera la asunción deberían ser paralelas Suele ser más fácil verlo poniendo el tiempo en escala logarítmica analysis time trata = 1 trata = 2 20 40 60 80 5 Evaluación estadística del riesgo proporcional Incluir en el modelo un variable de interacción con el tiempo, si fuera significativa indicaría que elhr varía con el tiempo, por tanto no se cumple la asunción. Si así fuera, podría dejarse en el modelo, aunque complica su interpretación: los HR son distintos para cada tiempo. Tanto este test como la gráfica evalúan cada variable por separado, o cada variable dadas las otras. 6 3

Evaluación estadística del riesgo proporcional ------------------------------------------------------------------------------ _t Haz. Ratio Std. Err. z P> z [95% Conf. Interval] -------------+---------------------------------------------------------------- main trata 1.613769.3617755 2.13 0.033 1.039965 2.504172 -------------+---------------------------------------------------------------- tvc trata 1.013164.0141347 0.94 0.349.9858357 1.04125 ------------------------------------------------------------------------------ Note: variables in tvc equation interacted with _t Unidad de Bioestadística Clínica 7 Evaluación del riesgo proporcional Con el archivo Caovario.dta evaluar la asunción de riesgo proporcional de las variables grado, ascitis, figo, mediante el método gráfico. Evaluar la asunción de riesgo proporcional estadísticamente para grado, ascitis, figo y edad. 8 4

Bondad de ajuste Test basado en el logaritmo del cociente de la verosimilitud. En modelos predictivos: Calibración: grado en que la supervivencia predicha coincide con la observada. Discriminación,, grado en que el modelo distingue entre individuos de mayor y menor riesgo. 9 Calibración Se crea un índice pronóstico (IP) a partir del modelo: IP = 1 x 1 +... + k x k Se divide la muestra en grupos de riesgo aplicando al IP puntos de corte por n ciles de pacientes con evento. Se estiman las curvas K M para los grupos (supervivencia i observada) y se comparan con las predichas por el modelo para los valores medios del IP en los grupos. 10 5

Unidad de Bioestadística Clínica 11 Se buscan puntos de corte Statistics > Summaries, tables, and tests > Summary and descriptive statistics > Centiles with CIs statistics > Centiles with CIs. centile ip if estpac==1, centile(20 80) -- Binom. Interp. -- Variable Obs Percentile Centile [95% Conf. Interval] -------------+------------------------------------------------------------- ip 209 20 3.335693 3.22944 3.509878 Unidad 80 de Bioestadística 4.506013 Clínica 4.406452 4.657173 12 6

Se crean los grupos gen grupo=1 if ip<=3.336 replace grupo=2 if ip>3.335 & ip<=4.506 replace grupo=3 if ip>4.506 replace grupo=. if ip==. tab grupo estpac estado del paciente grupo muerto vivo Total -----------+----------------------+---------- 1 41 580 621 2 126 477 603 3 42 61 103 -----------+----------------------+---------- Total 209 1,118 1,327 0.50 0.75 1.00 0.00 0.25 0 Kaplan-Meier survival estimates 0 100 200 300 analysis time grupo = 1 grupo = 2 grupo = 3 Unidad de Bioestadística Clínica 13 Comparando con lo predicho por el modelo 1 Survival.25.5.75 Cox proportional hazards regression.00 0.25 0.50 0.75 1 Kaplan-Meier survival estimates bysort grupo: sum ip stcox ip, nohr stcurve, survival /// at1( ip=2.63 ) /// at2( ip=3.86 ) /// at3( ip=4.88 ) /// ylabel(0(.25)1) 0 0 100 200 300 analysis time 0.00 0 100 200 300 analysis time ip=2.63 ip=4.88 ip=3.86 grupo = 1 grupo = 2 grupo = 3 Unidad de Bioestadística Clínica 14 7

Discriminación Hay un estadístico propuesto (Altman, Royston Statist. Med. 2000; 19:453 473) 473), muyintuitivoaunque poco usado: el índice de separación PSEP, definido como la diferencia entre la probabilidad de supervivencia entre los grupos de peor y mejor pronóstico, en un tiempo relevante. 0.75 1.00 0.00 0.25 0.50 Kaplan-Meier survival estimates 0 100 200 300 analysis time grupo = 1 grupo = 2 grupo = 3 PSEP 15 Discriminación Otros estadísticos más establecidos: Índice C, medida de concordancia, proporción de todos los pares en los que predicciones y eventos son concordantes 1 discriminación perfecta 0.5, discriminación próxima al azar D de Sommer s D=2*C 1 1 discriminación perfecta 0, discriminación próxima al azar Unidad de Bioestadística Clínica 16 8

Discriminación Statistics > Postestimation > Reports and statistics ttiti. estat concordance failure _d: estpac == 1 analysis time _t: tpopac Harrell's C concordance statistic Number of subjects (N) = 1319 Number of comparison pairs (P) = 149833 Number of orderings as expected (E) = 104938 Number of tied predictions (T) = 0 Harrell's C = (E + T/2) / P =.7004 Somers' D =.4007 Unidad de Bioestadística Clínica 17 Práctica Con archivo curso_supervivencia y evento muerte Evaluar asunción riesgoproporcional gráficamentepara Gtrata, nta y sexo receptor. Evaluar asunción riesgo proporcional estadísticamente para nta y sexo receptor. Ajustar un modelo predictivo, usando como modelo máximo nta, tpodial, sexorec, edadr, complmed y complqi. Evaluar la bondad de ajuste (calibración y discriminación) del modelo final. Lo mismo para pérdida del injerto 18 9

Ca Ovario.dta Ajustar un modelo predictivo, usando como modelo máximo edad, d figo, grado, histol, ascitis y eresidual Evaluar bondad de ajuste Unidad de Bioestadística Clínica 19 Diagnósticos de regresión Se trata de evaluar lo adecuado del modelo. H t t Hay tres aspectos: Asunciones Bondad de ajuste Validez del modelo 20 10

Validez del modelo se comporta igual en otras muestras extraídas de la misma población (reproducibilidad) y/o de otras similares (transportabilidad)? Otra muestra (externa) Partir la muestra en dos (no al azar) (interna) Técnicas de re muestreo (jackknife o bootstrap) (interna). 21 Validez Modelos estimativos: se ajusta el modelo en el grupo de trabajo, luego se hace la estimacióndel efecto en el de validación y se comparan los Hazard Ratio. Si son muy distintos indicaría que el modelo no tiene validez externa. 22 11

Validez Modelos predictivos: se ajusta el modelo en el grupo de trabajo; se aplica (se genera el IP) en el de validación y se evalúa su calibración y discriminación. En Stata stcox edadr tpodial diashosp if vali==0 predict ip, xb El IP se genera para todos los casos con el modelo generado con el grupo de trabajo 23 Validez: Calibración Se calcula el coeficiente de reducción ( shrinkage ) ( shrinkage ) El índice pronostico (IP) se introduce en un modelo de Cox univariante en el grupo de validación y su coeficiente se denomina coeficiente de shrinkage. Este coeficiente, en la mayor parte de los casos es menor que 1, es el factor que calibra lb los coeficientes del modelo. 24 12

Validez: Calibración. stcox ip if vali==1, nohr Cox regression -- Breslow method for ties No. of subjects = 434 Number of obs = 434 No. of failures = 24 Time at risk = 12335.26667 LR chi2(1) = 18.19 Log likelihood = -121.20958 Prob > chi2 = 0.0000 ------------------------------------------------------------------------------ _t Coef. Std. Err. z P> z [95% Conf. Interval] -------------+---------------------------------------------------------------- ip 1.043601.2321717 4.49 0.000.5885525 1.498649 Coef. shrinkage. 25 Discriminación Índice C. estat concordance failure _d: estpac == 1 analysis time _t: tpopac Harrell's C concordance statistic Number of subjects (N) = 434 Number of comparison pairs (P) = 6575 Number of orderings as expected (E) = 4895 Number of tied predictions (T) = 0 Harrell's C = (E + T/2) / P =.7445 Somers' D =.489 Unidad de Bioestadística Clínica 26 13

Práctica Con archivo curso_supervivencia y evento muerte Ajustar un modelo predictivo, usando como modelo máximo nta, tpodial, sexorec, edadr, complmed y complqi. Validar el modelo final. Lo mismo para pérdida del injerto Notas: cómo partir el archivo? Mejor no al azar BMJ 2009, 338:b605 Garantizando mínimo 100 eventos en el grupo de validación (Harrell, pág 92). A efectos del ejercicio seleccionar los nº de casos <300 como grupo validación 27 Ca. ovario Plantear un modelo predictivo con los pacientes con eclinico i =1 y validarlo l en los pacientes con eclinico=0 Modelo máximo i.grado i.eresidual i.ps ascitis i.figo edad Unidad de Bioestadística Clínica 28 14