es un vector de p covariables correspondientes al mismo individuo i, i

Documentos relacionados
es un vector de p covariables correspondientes al mismo individuo i, i 1,,n.

CAPÍTULO 4 MARCO TEÓRICO

CURSO INTERNACIONAL: CONSTRUCCIÓN DE ESCENARIOS ECONÓMICOS Y ECONOMETRÍA AVANZADA. Instructor: Horacio Catalán Alonso

) para toda permutación (p p 1 p

Riesgos Proporcionales de Cox

Regresión de Datos de Vida

Problema: Existe relación entre el estado nutricional y el rendimiento académico de estudiantes de enseñanza básica?

Figura 1

Análisis de Weibull. StatFolio de Muestra: Weibull analysis.sgp

1 EY ( ) o de E( Y u ) que hace que g E ( Y ) sea lineal. Por ejemplo,

H 0 : La distribución poblacional es uniforme H 1 : La distribución poblacional no es uniforme

TEMA 7. ANÁLISIS DE SUPERVIVENCIA

Ejemplo: Consumo - Ingreso. Ingreso. Consumo. Población 60 familias

FE DE ERRATAS Y AÑADIDOS AL LIBRO FUNDAMENTOS DE LAS TÉCNICAS MULTIVARIANTES (Ximénez & San Martín, 2004)

Tema 3: Procedimientos de Constrastación y Selección de Modelos

EJERCICIO 1 1. VERDADERO 2. VERDADERO (Esta afirmación no es cierta en el caso del modelo general). 3. En el modelo lineal general

3. Algunos modelos estadísticos

( ) MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO ( mas ) y Y. N n. S y. MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO ( mas )

El Impacto de las Remesas en el PIB y el Consumo en México, 2015

Nos interesa asignar probabilidades a valores numéricos obtenidos a partir de fenómenos aleatorios, es decir a variables aleatorias.

PUBLICACIONES DE 4º CURSO

Análisis de la varianza de un factor

Instituto Tecnológico Superior del Sur del Estado de Yucatán EGRESIÓN LINEAL REGRESI. 10 kg. 10 cm

Modelos lineales Regresión simple y múl3ple

AJUSTE DE LA CURVA DE PROBABILIDAD DEL ESCURRIMIENTO MEDIO HIPERANUAL ANUAL SEGÚN LA TEORÍA S B JOHNSON.

Inferencia en Regresión Lineal Simple

Aspectos fundamentales en el análisis de asociación

e i para construir el modelo econométrico que se escribe a continuación:

truncación inferior en el punto a=25 es igual a El grado de truncación es del

Análisis de la varianza de un factor

Operadores por Regiones

Tema 4: Variables aleatorias

ANEXO A: Método de Interpolación de Cokriging Colocado

Capítulo 2: ANALISIS EXPLORATORIO de DATOS Estadística Computacional 1º Semestre 2003

Estadísticos muéstrales

Un estimado de intervalo o intervalo de confianza ( IC

para cualquier a y b, entonces f(x) es la función de densidad de probabilidad de la variable aleatoria continua X.

Medidas de Variabilidad

3 - VARIABLES ALEATORIAS

17/02/2015. Ángel Serrano Sánchez de León

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS. Estimación de Kaplan Meier Bootstrap de la curva de supervivencia

Especialista en Estadística y Docencia Universitaria REGRESION LINEAL MULTIPLE

FISICOQUÍMICA FARMACÉUTICA (0108) UNIDAD 1. CONCEPTOS BÁSICOS DE CINÉTICA QUÍMICA

Modelo Lineal Múltiple. Clase 03. Profesor: Carlos R. Pitta. ICPM050, Econometría. Universidad Austral de Chile Escuela de Ingeniería Comercial

PROBABILIDAD Y ESTADÍSTICA

MODELOS DE ELECCIÓN BINARIA

MUESTREO EN POBLACIONES FINITAS

Tema 7: Regresión Logística p. 1/1

Tema 6. Estadística descriptiva bivariable con variables numéricas

VII. Solución numérica de ecuaciones diferenciales

USOS Y EXTENSIONES DEL MODELO LINEAL CON K VARIABLES

Algunas aplicaciones del test del signo

CAPÍTULO IV. MEDICIÓN. De acuerdo con Székely (2005), existe dentro del período información

Variables Aleatorias

Examen Final de Econometría Grado

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 19 de Septiembre de :30 horas. Pregunta 19 A B C En Blanco

Reconocimiento de Locutor basado en Procesamiento de Voz. ProDiVoz Reconocimiento de Locutor 1

Matemáticas II. Segundo Curso, Grado en Ingeniería Electrónica Industrial y Automática Grado en Ingeniería Eléctrica. 17 de febrero de

COLEGIO INGLÉS MEDIDAS DE DISPERSIÓN

Solución de los Ejercicios de Práctica # 1. Econometría 1 Prof. R. Bernal

Econometría de corte transversal. Pablo Lavado Centro de Investigación de la Universidad del Pacífico

Variables Aleatorias

CAPÍTULO X ESTADÍSTICA APLICADA A LA HIDROLOGIA

Problemas donde intervienen dos o más variables numéricas

SEMANA 13. CLASE 14. MARTES 20/09/16

PyE_ EF2_TIPO1_

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 17 de Mayo de :00 horas

SEGUNDA PARTE RENTAS FINANCIERAS

Probabilidad Grupo 23 Semestre Segundo examen parcial

Tema 1:Descripción de una variable. Tema 1:Descripción de una variable. 1.1 El método estadístico. 1.1 El método estadístico. Describir el problema

Análisis de supervivencia

UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS AGRARIAS Y FORESTALES. CURSO: Modelos Lineales Generalizados Aplicados a las Ciencias Biológicas

TEMA 14. ESCALAMIENTO CONJUNTO. INTRODUCCIÓN A LA TEORÍA DE LA RESPUESTA A LOS ITEMS (TRI)

Guía para el Trabajo Práctico N 5. Métodos Estadísticos en Hidrología

Tablas de Vida (Intervalos)

PRÁCTICA 16: MODELO DE REGRESIÓN MÚLTIPLE SOLUCIÓN

Vida Util, características de la Fiabilidad e Inviabilidad y distribuciones teóricas en el terreno de la fiabilidad

MODELOS PARA DATOS DE RECUENTO

EXAMEN FINAL DE ECONOMETRIA, 3º CURSO (GRADOS EN ECO y ADE) 6 de Junio de :00 horas. Pregunta 19 A B C En Blanco. Pregunta 18 A B C En Blanco

Estimación no lineal del estado y los parámetros

Estadísticos muéstrales

Reconciliación de datos experimentales. MI5022 Análisis y simulación de procesos mineralúgicos

Lo que nos interesa en el análisis de varianza de una vía es extender el test t para dos muestras independientes, para comparar más de dos muestras.

Relaciones entre variables

TEMA 4. Modelos para Datos Censurados y de Selección Muestral.

Mª Dolores del Campo Maldonado. Tel: :

Variable aleatoria: definiciones básicas

1.Variables ficticias en el modelo de regresión: ejemplos.

Análisis de Resultados con Errores

Estimación de incertidumbres en calibración de Osciladores

Tema 1: Estadística Descriptiva Unidimensional

CAPITULO 3º SOLUCIÓN ECUACIÓN DE ESTADO- 01. Ing. Diego A. Patiño G. M.Sc, Ph.D.

Comparación de Tasas. Ejemplo StatFolio: comparerates.sgp

INTRODUCCIÓN. Técnicas estadísticas

CAPÍTULO 5 REGRESIÓN CON VARIABLES CUALITATIVAS

Estadística con R. Modelo Probabilístico Lineal

Transcripción:

5. Modelos de regresón En el análss de tempos de falla, es común suponer que el resgo de presentar la falla está en funcón de una sere de covarables o varables explcatvas nherentes a cada ndvduo. Es decr, la poblacón bajo estudo no es homogénea y es necesaro reconocer las dferencas entre los ndvduos como parte del análss. Exsten varos modelos que ncorporan varables explcatvas para el análss de tempos de falla. Estos modelos se conocen como modelos de regresón de supervvenca. Los prncpales modelos son dos: Modelo de vda acelerada y modelo de resgos proporconales. 5.1 Modelos de vda acelerada Sea T el tempo de falla del ndvduo y suponga que X ' = ( X,X, K, X ) es un vector de p covarables correspondentes al msmo ndvduo, =1,,n. 1 2 p El modelo de vda acelerada se puede defnr en térmnos de la v.a. T o en térmnos de la funcón de resgo h (t). En térmnos de la v.a., el modelo de vda acelerada se defne como T T = ϕ ( x, θ) 86 Curso: Análss de Supervvenca

donde ' = ( θ θ ) θ K en un vector de dmensón p de coefcentes de 1, regresón, ( ) p ϕ, es una funcón que lga las covarables con el tempo de fallo y T es un tempo de fallo base. Se puede observar que el modelo de vda acelerada especfca que el efecto de la covarable es multplcatvo en t. Es decr, la covarable altera la tasa en la que un ndvduo envejece o rejuvenece en el tempo. Un ndvduo con tempo de fallo t bajo x =, tendría un tempo de fallo ( x ) t ϕ,θ bajo x. La funcón ( ) ϕ, tene por lo general una forma paramétrca y debe satsfacer la condcón ϕ (, θ) = 1. La forma más común es ' θ ( θ) = x, e ϕ x. Nota que para que se satsfaga la condcón el vector de covarables no debe de nclur constante. De manera alternatva, el modelo de vda acelerada se puede ver como un modelo de regresón log-lneal,.e., donde = E( log ) log T = µ µ T y = log T µ dstrbucón ndependente de x. x ' θ+ ε ε es una v.a. con meda cero y Las mplcacones del modelo de vda acelerada en las funcones de resgo y de supervvenca son las sguentes. Sea h (t), f (t) y S (t) las funcones de 87 Curso: Análss de Supervvenca

resgo, densdad y de supervvenca, respectvamente, para el tempo base T. Entonces, hacendo el cambo de varable, la funcón de densdad para el tempo T es f x' θ x' θ ( t) e f ( e t) =. Integrando la funcón de densdad de t a, la funcón de supervvenca es Fnalmente ala funcón de resgo es h S x' ( t) S ( e θ t) =. x' θ x ' θ ( t) e h ( e t) =. S h (t) tene una forma paramétrca específca, el modelo de vda acelerada en completamente paramétrco, en cambo, s h (t) se deja sn especfcar, el modelo es semparamétrco y se requeren de procesos de nferenca específcos para este caso. Por lo general, el modelo de vda acelerado, se consdera completamente paramétrco especfcando la dstrbucón de los errores medante un membro de la famla de log-localzacón y escala. Recordemos que s T es una varable de tempo de falla y Y=logT es una v.a. con dstrbucón de localzacón y escala, entonces T tene una dstrbucón de log-localzacón-escala. Es decr, sea Y una v.a. con dstrbucón con soporte en los reales con meda cero y varanza uno. Entonces Y = a + by tene una funcón de supervvenca S y a b * ( y a,b) = S *, 88 Curso: Análss de Supervvenca

y Y T = e tenen funcón de supervvenca S tomamos a = a( x ) = µ x ' θ S log t a b * ( ta,b) = S en la especfcacón anteror obtenemos el modelo de vda acelerada con ε = by una v.a. con meda cero y varanza b 2. S a( x ) > 1, el efecto del vector de covarables es desacelerar el tempo, mentras que s a( x ) < 1, el efecto es de acelerar el tempo. Consderemos algunos casos específcos del modelo de vda acelerada completamente paramétrco. 89 Curso: Análss de Supervvenca

o T Webull (o valor extremo para Y =logt ). Como dstrbucón de log * z localzacón y escala, este modelo se obtene cuando S ( z) exp( ) =. Es e este caso la funcón de supervvenca para T de vda acelerada es S 1 /b a /b 1/b µ /b ' /b ( ) ( ) ( x θ t exp t e = exp t e e ) =. La funcón de resgo acumulado es de la forma H 1/b a / b ( t) logs ( t) = t e =. Fnalmente dervando obtenemos la funcón de resgo 1 1 =. b b 1/b 1 a /b x' θ/b µ /b 1/b 1 ( t) t e = e e t h Por otro lado, partendo de la dstrbucón de resgo Webull base h α 1 ( t) λα x' θ x ' θ = y tomando h ( t) e h ( e t) t resgo de vda acelerada obtenemos S tomamos α = b 1 y = como en la defncón del αx ' θ α 1 ( t) e λαt h pero con parametrzacones dferentes. =. e µ λ = /b llegamos a la msma expresón anteror, o Notemos que para el modelo Webull de vda acelerada el efecto de las covarables no afecta drectamente el tempo, sno que representa úncamente un efecto multplcatvo constante sobre la funcón de resgo base,.e., con θ * = αθ. * x' ( t) e θ h ( t) h =, 9 Curso: Análss de Supervvenca

o T log-logístco (o logístco para Y =logt ). Como dstrbucón de log * z localzacón y escala, este modelo se obtene cuando S ( z) 1 ( 1 + ) funcón de supervvenca para T de vda acelerada es S = 1 1 + t e. ( t) 1 /b a / b =. La e Hacendo álgebra obtenemos que la funcón de resgo para T es h 1 1/b 1 a /b b t e =. 1+ t e ( t) 1/b a / b Alternatvamente, s partmos de la funcón de resgo log-logístca base α 1 α ( t) = αλt ( 1+ λt ) h obtenemos que la funcón de resgo para T es S tomamos α = b 1 y h e αx ' θ α 1 ( t) = αx ' θ α 1+ λe pero con parametrzacones dferentes. αλt t. e µ λ = /b obtenemos la msma expresón anteror, La nferenca para este tpo de modelos de vda acelerada paramétrcos se hace por máxma verosmltud, como en el caso de los modelos de log localzacón y escala. Sean ( t, δ, x ), =1,,n un conjunto de observacones ndependentes, que ncluyen los tempos de fallo o de censura, ndcador de censura por la derecha y conjunto de varables explcatvas. Sea log ( T ) a + blog( T ) =, con a = µ x' θ un modelo de vda acelerada. Es recomendable que las varables explcatvas estén centradas en cero para mejorar la 91 Curso: Análss de Supervvenca

nterpretacón del ntercepto. La funcón de verosmltud para ( µ,,b) es de la forma L n δ 1 δ 1 * log t µ + x' θ * logt µ + x' θ µ = f S. = 1 b b b (, θ,b) θ La forma de la verosmltud anteror depende de la eleccón partcular de S *, ya sea valor extremo, logístco o normal. En cualquer caso los estmadores se obtenen numércamente. Estmacón por ntervalo de los parámetros y pruebas de hpótess se obtene con teoría asntótca usando la aproxmacón normal asntótca para los EMV s o la dstrbucón asntótca j-cuadrada para menos dos veces el logartmo de la estadístca cocente de verosmltudes generalzado. El comando survreg de la lbrería survval del paquete R obtene estos estmadores para las dstntas opcones de famlas S *. Además de estmar los parámetros del modelo de vda acelerada, es de nterés la estmacón de los cuantles. Sea y p ( x) el cuantl de orden p del logartmo de un tempo de fallo con vector de covarables x, entonces, * 1 donde w S ( 1 p) p p ( x) a( x) bwp y = +, = es el cuantl de orden p de una varable Y. El estmador puntual máxmo verosíml es ŷ p( x) â( x) + wp = bˆ y estmacón por ntervalo se puede hacer suponendo normaldad asntótca. 92 Curso: Análss de Supervvenca

Los modelos de vda acelerada son partcularmente útles cuando los tempos de fallo de dferentes ndvduos varían en órdenes de magntud. Es decr, en escala logarítmca de los tempos de fallo, las funcones de densdad y de supervvenca de los ndvduos tenen la msma forma, pero están separados por una dstanca a a. En aplcacones de confabldad en ngenería, los tempos de falla son acelerados por calentamento, voltaje u otro tpo de estrés. j EJEMPLO: Tempos de supervvenca de leucema. Fegl & Zelen (1965) estudqaron datos de tempos de supevvenca de 33 pacentes con leucema. Los tempos de supervvenca están dados en semanas desde el dagnóstco y adconalmente hay dos covarables: conteo de glóbulos blancos (WBC) al momento del dagnóstco y un ndcador sobre las característcas de los glóbulos blancos, (AG=1) postvo o (AG=) negatvo. Los datos se presentan más abajo. Gráfcas de dagnóstco ncal son logt vs. wbc ó log(wbc) y gráfcas de caja y brazos para la logt y cada valor de la covarable AG. 93 Curso: Análss de Supervvenca

EJEMPLO: Falla de fludo de aslamento. Nelson (1972) presenta los resultados de un expermento en donde especímenes de certo fludo de aslamento fueron sujetos a estrés de voltaje constante con dstntos nveles. Se regstró el tempo de falla de cada espécmen. En partcular se desea estmar la dstrbucón de falla a un voltaje normal de 2 kv. Gráfcas de dagnóstco sugerdas para el modelo Webull son { logŝ ( t) } log vs. logt, para j=1,,7 los sete dstntos nveles de voltaje. j Adconalmente, para verfcar la relacón lneal con la varable explcatva se sugere grafcar logt vs. log(voltaje). 94 Curso: Análss de Supervvenca

5.2 Modelos de resgos proporconales El modelo de resgos proporconales fue ntroducdo por Cox (1972) y ha sdo el modelo más utlzado en análss de tempos de fallo en presenca de covarables. Este modelo tambén es conocdo como modelo de regresón de resgos multplcatvos. Sea T el tempo de falla del ndvduo y suponga que X ' = ( X,X, K, X ) es un vector de p covarables correspondentes al msmo ndvduo, =1,,n. 1 2 p El modelo de resgos proporconales se defnó orgnalmente en térmnos de la funcón de resgo de la sguente manera ( t) = ϕ( x, θ) h ( t) h. 95 Curso: Análss de Supervvenca

donde ' = ( θ θ ) θ K en un vector de dmensón p de coefcentes de 1, regresón, ( ) p ϕ, es una funcón que lga las covarables con el tempo de fallo y h es una funcón de resgo base. La funcón ϕ (, ) debe satsfacer la condcón ϕ (, θ) = 1 ' θ común es ϕ( θ) = x x, e ntercepto.. La forma más. La condcón anteror supone que x no contene Usando la funcón lga anteror, en escala logarítmca, el cocente de la funcón de resgo del ndvduo con respecto al resgo base es h log h ( t) ( t) = x' θ, el cual tene forma lneal en los parámetros. El nombre de resgos proporconales se debe al hecho de que el cocente de las funcones de resgo de dos ndvduos, dgamos y j, h h ( t) ( t) = e ( x x j )θ ' (resgo relatvo) es una constante en el tempo cuyo valor depende de la dferenca en los valores de las covarables de los dos ndvduos. En partcular, s x 1 =1 y x 1j = representan tratamento y placebo respectvamente, y todas las 1 demás covarables se mantenen constante, entonces e θ es el resgo de presentar la falla con el tratamento relatvo a presentar la falla con placebo. 96 Curso: Análss de Supervvenca

El modelo de resgos proporconales mplca que las funcones de supervvenca y de densdad para el ndvduo son, respectvamente donde ( t) exp{ H ( t) } S ( t) h ( u) = t du S exp ( ) { ( )} ( x' t = S t θ), y x ' ( ) θ exp = ( ){ ( )} ( x ' θ) t e h t S t f, = es la funcón de supervvenca base y H es la funcón de resgo acumulado base. Una consecuenca del supuesto de proporconaldad entre los resgos de dos ndvduos con covarables x y x j, es que las funcones de resgo no se ntersectan y una debe de estar completamente por arrba de la otra. Lo msmo ocurre con las funcones de supervvenca. Este comportamento se puede observar en la sguente gráfca 97 Curso: Análss de Supervvenca

Cuando h se especfca de manera paramétrca, el modelo de resgos proporconales es completamente paramétrco, mentras que s h se deja sn especfcar, el modelo se converte en semparamétrco. A dferenca del modelo de vda acelerada, el caso semparamétrco en el modelo de resgos proporconales es el más común en las aplcacones. Una característca del modelo de resgos proporconales es que s S (t) es membro de una famla paramétrca específca, por lo general S (t) no es membro de la msma famla. Veamos algunos ejemplos del modelo de resgos proporconales completamente paramétrcos. α 1 o Resgo base Webull: Sea h ( t) λα =, entonces la funcón de resgo t para un ndvduo con covarables x es ' 1 ( ) x α t = e θ λαt h x θ Lo que mplca que T ( α λ ', e ) Webull. S comparamos este modelo de resgos proporconales Webull con el modelo de vda acelerada Webull nos damos cuenta que se trata del msmo modelo, pero con dstnto vector de parámetros θ * = αθ. El modelo Webull es el únco modelo paramétrco que es a la vez de vda acelerada y de resgos proporconales. 98 Curso: Análss de Supervvenca

α 1 α o Resgo base log-logístco: Sea h ( t) = αλt ( 1+ λt ) de resgo para un ndvduo con covarables x es h, entonces la funcón x ' θ α 1 α ( t) = e αλt ( 1 + λt ). Esta nueva funcón de resgo no pertenece a la msma famla. o Resgo base log-normal: Sea ( t) = 1 Φ( ( log t µ ) σ) funcón de supervvenca para un ndvduo con covarables x es S exp ( ) { (( ) )} ( x' t = 1 Φ logt µ σ θ) S., entonces la La forma analítca de S (t) no es smple pero se puede manpular numércamente. o Resgo base gamma: Sea ( t) = 1 Ig( λt, β) supervvenca para el ndvduo con covarables x es S exp ( ) { ( )} ( x' t = 1 Ig λt, β θ ) S., entonces la funcón de La nferenca para los modelos de resgos proporconales paramétrcos se hace por máxma verosmltud. Sean ( t, δ, x ), =1,,n un conjunto de observacones ndependentes, que ncluyen los tempos de fallo o de censura, ndcador de censura por la derecha y conjunto de varables explcatvas. Sean h ( t α,λ) y ( t α,λ) las funcones de resgo base y de supervvenca base parametrzadas por (α,λ). La funcón de verosmltud para ( θ α, λ), es de la forma S 99 Curso: Análss de Supervvenca

L n { } S ( t α, λ) x' θ (, α, λ) = e h ( t α, λ) = 1 δ exp ( x' θ) θ. La forma explcta de la funcón de verosmltud anteror depende de la eleccón de h. En cualquer caso, los EMV s se obtenen numércamente e nferencas para los parámetros más allá de estmacón puntual se basan en resultados asntótcos. ESTIMACIÓN SEMIPARAMÉTRICA DEL MODELO DE RIESGOS PROPORCIONALES El modelo de resgos proporconales semparamétrco surge cuando la funcón de resgo base h (t) se consdera como un parámetro desconocdo. En este caso es necesaro hacer nferenca para ( h ( t) ) θ., El parámetro de nterés más mportante del modelo es θ y h (t) es consderado parámetro de rudo. En presenca de parámetros de rudo exsten dos técncas muy útles de nferenca: la verosmltud parcal, ntroducda por Cox (1972, 1975) y la verosmltud margnal (Kalflesch & Sprott, 197). Suponga que los datos conssten de un vector de observacones T = ( T, K, ) de la densdad f ( tθ,η) 1 T n, donde θ es el vector de parámetros de nterés y η es un parámetro de rudo, por lo general de dmensón nfnta o muy grande, como es el caso de la funcón de resgo base en nuestro modelo de resgos proporconales. 1 Curso: Análss de Supervvenca

Suponga ahora que los datos T son transformados en un conjunto de varables ( j) B ( B 1, K,B j ) ( ) ( ) ( m, B m ) A K de forma uno a uno, y sean 1,B1, Am, Bm A ( j) ( A, K,A ) = y =. Suponga que la funcón de densdad conjunta de A se puede escrbr como el producto de una verosmltud margnal y otra condconal ( m) ( m) ( tθ, η) = f b a ( m ) (, θ, η) f a ( θ) f. El segundo factor de la expresón anteror es llamado verosmltud margnal, e ncluso en modelo complcados, no dependerá de η y puede ser usada para realzar nferencas sobre θ. Noten que el prmer factor por lo general depende de θ y de η, por lo que parte de la nformacón se perderá al usar úncamente el segundo factor. 1 j Un segundo enfoque para estmar θ es el descomponer la densdad conjunta de ( ) ( ) ( m, B m ) A como m m ( j) ( j 1) ( j, θ, η) f( aj b,a, θ) ( j 1) ( j 1) ( t θ, η) = f b b,a f. j= 1 El segundo térmno es llamado verosmltud parcal. Nuevamente observamos que parte de la nformacón de los datos sobre θ se perderá s úncamente se usa el segundo térmno. j= 1 Sean t( 1) < t(2) < Lt(D ) los tempos de fallo observados de manera exacta ordenados. Sea x (j) la covarable asocada al ndvduo cuyo tempo de fallo es (j) t. Defnmos el conjunto de resgo R( ) t (j) como el conjunto de 11 Curso: Análss de Supervvenca

todos los ndvduos que están en resgo justo antes de t (j). Sn entrar en detalles, s A j especfca la nformacón de los ndvduos que fallan y B j la nformacón de las censuras y de las covarables en [ t( j 1), t(j) ), se puede demostrar que la verosmltud parcal para θ es ( t(j) ) h ( t ) D h(j) pl ( θ) =. j = 1 R ( t ) (j) Expresando esta verosmltud parcal en térmnos de las covarables y la funcón de resgo base, tenemos (j) ( x ' θ) D exp (j) pl ( θ) =, j = 1 ( ) exp( x θ) R t ' la cual no depende de h (t). Vale la pena notar que el numerador depende sólo de la nformacón del ndvduo que falla, mentras que el denomnador usa nformacón de todos los ndvduos que aún no han expermentado el fallo, ncluyendo aquellos que se censurarán después. (j) Esta verosmltud parcal es tratada como cualquer otra verosmltud. Se saca logartmo, se derva, se guala a cero y se obtenen los estmadores máxmo verosímles parcales de θ. Recuerden que como θ es un vector de dmensón p, se tendrán que obtener p dervadas parcales y se tendrán que resolver p ecuacones smultáneas. La mayoría de los paquetes estadístcos obtenen estos estmadores de manera numérca medante el uso de algortmos de Newton-Raphson. 12 Curso: Análss de Supervvenca

Pruebas de hpótess e ntervalos de confanza para θ se pueden obtener notando que θˆ el estmador máxmo verosíml parcal tene una dstrbucón asntótca normal con meda θ y matrz de varanzas y covaranzas estmadas I ( θ ˆ) 1 H :.. La prueba de hpótess más común para θ = θ se basa en la normaldad asntótca y es llamada prueba de ' Wald. La estadístca de prueba es W ( θ ˆ θ ) I ( θˆ )( θˆ θ ) = tal que s H es verdadera y para un tamaño de muestra grande.. 2 W χ (p) Otras estadístcas de prueba se basan en menos dos veces el cocente de verosmltudes parcales generalzado, cuya dstrbucón asntótca es una j-cuadrada con p grados de lbertad. Vale la pena notar que en presenca de empates (múltples ndvduos con el msmo tempo de falla), es necesaro hacer un ajuste a la verosmltud parcal que reconozca la naturaleza dscreta de las observacones. S las funcones base son tambén de nterés, es posble estmar H (t) y S (t). Breslow (1974) propuso un estmador para la funcón de resgo acumulado generalzando el estmador de Nelson-Aalen. Este estmador se justfca medante procesos de conteo. La forma del estmador es: δ Ĥ ( t) = θ, n x :t t j 'ˆ Y ( ) j= 1 j t e 13 Curso: Análss de Supervvenca

donde Y ( t) I ( t t) = es una v.a. ndcadora. Cuando θ ˆ = este estmador. se reduce al estmador Nelson-Aalen. Fnalmente, usando la relacón contnua entre las funcones de resgo acumulado y la de supervvenca { } ( t) exp Ĥ ( t) Ŝ =. Cuando θ ˆ =, este estmador no se reduce al estmador Kaplan-Meer, sno al estmador conocdo como Flemng-Harrngton. Es posble obtener ntervalos de confanza para os estmadores anterores calculando el error estándar y usando normaldad asntótca. Vale la pena menconar que el modelo de resgos proporconales, como lo propuso orgnalmente Cox, permte la ncorporacón de covarables dependentes del tempo. Es decr, varables explcatvas cuyo valor va cambando conforme avanza el tempo de supervvenca. EJEMPLO. Tempos de remsón. Los sguentes datos conssten en tempos de remsón para 4 pacentes con leucema asgnados aleatoramente a los tratamentos A o B. EJEMPLO. Pacentes con cáncer de mama. Se desarrolló un estudo para determnar s los pacentes orgnalmente clasfcados como nodo lnfátco negatvo se podían clasfcar de una mejor manera medante un 14 Curso: Análss de Supervvenca

nuevo procedmento. 45 pacentes con un mínmo de 1 años de segumento fueron selecconados. De los 45, 9 fueron nmunoperoxdasa postvo y los restante 36 fueron negatvos. Se regstraron los tempos de supervvenca, desde el dagnóstco, en meses. 5.3 Valdacón de supuestos y ajuste del modelo AJUSTE DEL MODELO. Una vez que un modelo de regresón de supervvenca ha sdo ajustado, es necesaro valdar los supuestos del modelo a la luz de los datos y verfcar sensbldad de las conclusones en cambos en los modelos o los datos. Hay varas formas de hacer esta valdacón: 1. Medante las gráfcas empírcas de de ajuste usando el estmador KM de la funcón de supervvenca. 2. Expansón del modelo agregando más parámetros que representen modfcacones a las especfcacones actuales. La necesdad de un 15 Curso: Análss de Supervvenca

parámetro extra se puede valdar medante pruebas de hpótess. Por ejemplo: o Agregando más covarables, o nteraccones de las covarables actuales o térmnos no lneales. o Permtr que el parámetro b en un modelo de vda acelerado sea funcón de x. o Permtr nteraccones de las covarables con el tempo medante la nclusón de covarables dependentes del tempo (en el modelo de resgos proporconales). o Expandr la famla base S * parámetros. a que sea más general con más ANÁLISIS DE RESIDUOS. Es común en análss de regresón hacer un análss de resduos para valdacón de los supuestos del modelo. S un modelo de regresón es ajustado a varables ndependentes ( t, δ, x ) entonces los resduos ê = g ( t,x, θˆ ), =1,,n, deben de tener certas propedades s el modelo es correcto, como ndependenca con la msma dstrbucón. o Modelo de vda acelerada. En este caso nuestros parámetros de nterés µ. S ( ˆ,bˆ ) son (,,b) θ defndos como µ ˆ θ denotan los EMV s entonces los resduos 16 Curso: Análss de Supervvenca

con logt â z =, =1,..,n bˆ â = µ ˆ x ' θˆ deberían de parecer una m.a. de S *. Nótese que estos resduos sólo exsten para observacones exactas. Par el caso de observacones censuradas se sugere hacer una correccón z adj = δ ẑ + ( 1 δ ) E( Z Z ẑ ) donde Z es una v.a. con funcón de supervvenca S *. Gráfcas de z o z adj vs. covarables deberían de mostrar un patrón constante. Gráfcas de z o adj z vs. â apoyarían el supuesto del parámetro b constante. Fnalmente gráfcas de probabldad de z o apoyarían el supuesto paramétrco. adj * z con respecto a la dstrbucón base S o Modelo de resgos proporconales (y otros modelos de regresón). Una forma genérca de defnr los resduos es ê = g ( t,x, θˆ ) e = F( T x,θ) o e = S( T x,θ). Por ejemplo, tenen una dstrbucón U(,1). Una transformacón equvalente que es muy útl en análss de supervvenca es e = H( T x,θ). Dado que H( T x, θ ) = logs( T x, θ), los e s obtendos con la funcón de resgo acumulado son v.a. s ndependentes con dstrbucón Exp(1). Defnr los resduos ajustados para datos censurados es smple s vemos que Exp( 1) e entonces E( e e ê ) = ê 1 >, por lo + tanto ( x, θ) ê = Ĥ T ˆ adj y ê ê + 1 δ =. 17 Curso: Análss de Supervvenca

ˆ 'ˆ Ĥ para el modelo de resgos proporconales, x θ Nótese que ( t x, θ) = Ĥ ( t) e con Ĥ ( t) el estmador de Breslow. Los resduos ê son llamados resduos de Cox-Snell. Para verfcar que una muestra de resduos ê sguen una dstrbucón Exp(1), se calcula la funcón de resgo acumulada empírca (estmador Nelson-Aalen) de los resduos y se compara con la funcón de resgo acumulado de un modelo Exp(1) que es H ( t) = t. Por lo tanto s el modelo de resgos proporconales ajusta los datos, la gráfca del estmador Nelson-Aalen de los resduos debe de ser una línea recta que pasa por el orgen. 18 Curso: Análss de Supervvenca

5.4 Comparacón de curvas de supervvenca En análss de supervvenca es de nterés probar s dos tratamentos dan lugar a curvas de supervvenca dstntas. S la dferenca entre tratamentos está parametrzada por un modelo de regresón semparamétrco, probar la dferenca entre curvas de supervvenca es quvalente a realzar una prueba de hpótess sobre el parámetro que cuantfca la dferenca. En un contexto general, fuera de modelos paramétrcos, es de nterés probar H : S1( t) = S2 ( t), o equvalentemente H :h1( t) h2( t) =. De manera ntroductora, supongamos que un ndvduo puede presentar su evento de fallo dentro de certa ventana de tempo t (fja). En este caso, podemos dvdr a los ndvduos de ambas poblacones en aquellos que presentaron su evento de fallo en un momento anteror o gual a t y aquellos que no. Esta nformacón se puede representar en una tabla de contngenca: Num. Fallas Num. No fallas Pob. 1 a b n 1 Pob. 2 c d n 2 m 1 m 2 n 19 Curso: Análss de Supervvenca

o Sea p 1 =P(falla Pob. 1) y p 2 =P(falla Pob. 1). La hpótess de nterés se puede escrbr como H :p1 = p2. o Prueba exacta de Fsher: Sea A la v.a. que da lugar a la observacón a de la celda (1,1). Consderando m 1, m 2, n 1, n 2 cantdades fjas, bajo H, A tenen una dstrbucón hpergeométrca de la sguente forma: n1 n2 ( ) a m1 a P A = a =, n m1 con meda y varanza dadas por E n m n 1 1 ( A) = y ( A) Podemos defnr la estadístca de prueba n1n2m1m2 Var =. 2 n ( A) ( A) a E W = Var, 2 ( n 1) la cual bajo H tene una dstrbucón asntótca 2 sería RR { w > χ } =. (1), α χ 2 (1). La regón de rechazo o Prueba de log-rangos. Sean t 1,t 2,,t k, k n 1 +n 2 los k tempos de fallo observados para la muestra combnada de las dos poblacones. Suponga que para cada t j, j=1,,k obtenemos valores n 1j, n 2j, m 1j y m 2j. Entonces para probar la hpótess :p1j p2j estadístca W de la sguente manera: H = para j=1,,k, construmos la 11 Curso: Análss de Supervvenca

W = k ( aj E( A j) ) j= 1 k j= 1 Var ( A ) Aunque los componentes de la suma no sean ndependentes, bajo H, W tene una dstrbucón asntótca 2 { w > χ } (1), α χ 2 (1) j 2.. La regón de rechazo es RR =. La estadístca W es tambén conocda como estadístca Mantel-Haenszel (1959). o Exste una versón más general de la prueba para comparar curvas de supervvenca que permte ponderar la contrbucón de cada observacón. La estadístca de prueba es Z = k j= 1 dj W( t j) { dj1 Yj1( Y )} j 2 Yj1 Yj1 Yj dj ( ) ( 1 )( ) k W t j= 1 j Yj Yj Y 1 donde d j1 y d j2 son el número de fallos en el tempo t j de la muestra combnada, Y j1 y Y j2 son el número de ndvduos en resgo al tempo t j, para las poblacones 1 y 2 respectvamente; d j = dj1 + dj2 ; Y j = Yj1 + Yj2. d j, La estadístca Z, bajo H, tene una dstrbucón asntótca normal estándar. Con esta estadístca es posble hacer pruebas de una sola cola para probar que una curva de supervvenca es mayor a otra, o de dos colas para probar dferencas en cualquer sentdo. 111 Curso: Análss de Supervvenca

Opcones para la funcón de ponderacón son: W( t j ) = 1 con la que se obtene la prueba de log-rangos, W ( t j ) = Yj con la que se obtene una generalzacón de la prueba de Mann-Whtney-Wlcoxon. o Esta prueba se puede calcular en R con la lbrería survval medante el comando survdff. 112 Curso: Análss de Supervvenca