1. Funciones básicas y distribuciones

Documentos relacionados

1. Funciones básicas y distribuciones

PROBABILIDAD Y ESTADÍSTICA. Sesión 5 (En esta sesión abracamos hasta tema 5.8)

TEMA II: DISTRIBUCIONES RELACIONADAS CON LA NORMAL

Probabilidad y Estadística

Distribución de Probabilidad Normal

Estadística Avanzada y Análisis de Datos

DISTRIBUCIONES DE PROBABILIDAD (RESUMEN)

3. VARIABLES ALEATORIAS

1. Conocimientos previos. 1 Funciones exponenciales y logarítmicas.

Profr. Efraín Soto Apolinar. La función racional

FUNCIONES DE UNA VARIABLE Julián de la Horra Departamento de Matemáticas U.A.M.

Repaso de Matemáticas

Fiabilidad. I) Introducción. II) Modelos estadísticos utilizados en fiabilidad. III) Métodos descriptivos para el ajuste de datos.

2. CURVAS PLANAS, ECUACIONES PARAMÉTRICAS Y COORDENADAS POLARES

Importancia de la Demografía

UNIDAD 3: ANALICEMOS LA FUNCION EXPONENCIAL Y LOGARITMICA.

ESTADÍSTICA INFERENCIAL

Técnicas Cuantitativas para el Management y los Negocios I

Distribuciones Dis de Probabilidad Pr Contínuas Jhon Jairo Jair Pa P dilla a Aguilar, Aguilar PhD. PhD

DISTRIBUCIONES DE PROBABILIDAD

Test de Kolmogorov-Smirnov

Propiedades en una muestra aleatoria

Tema 5: Principales Distribuciones de Probabilidad

Demostración de la Transformada de Laplace

Pruebas de bondad de ajuste

Y = ßo + ß1X + ε. La función de regresión lineal simple es expresado como:

2. Probabilidad y. variable aleatoria. Curso Estadística Probabilidad. Probabilidad y variable aleatoria

Autor: Antonio Rivero Cuesta, Tutor C.A. Palma de Mallorca

DOCUMENTO 3: DISTRIBUCIÓN DE PROBABILIDAD DE V. A. CONTINUA: LA DISTRIBUCIÓN NORMAL

Probabilidades. 11 de noviembre de Felipe Bravo Márquez

Teoría de la decisión Estadística

1 Introducción Distribución exponencial Distribución Weibull Distribuciones Gamma y k-erlang... 10

MATE Dr. Pedro Vásquez UPRM. P. Vásquez (UPRM) Conferencia 1 / 77

Dr. Mauro Gutierrez Martinez Dr. Christiam Gonzales Chávez

LIMITE. Si f(x)= x 2 -x 6 = (x 3) (x + 2) = x + 3 x + 2 x + 2

Funciones especiales

EJERCICIOS RESUELTOS TEMA 7

Unidad III Variables Aleatorias Unidimensionales

Profesor: Rafa González Jiménez. Instituto Santa Eulalia ÍNDICE

4. Medidas de tendencia central

5. Al simplificar. expresión se obtiene:

Prueba de hipótesis. 1. Considerando lo anterior específica: a. La variable de estudio: b. La población: c. El parámetro. d. Estimador puntual:

SESIÓN 5 RELACIÓN ENTRE LOS VALORES NUMÉRICOS

D.2 ANÁLISIS ESTADÍSTICO DE LAS TEMPERATURAS DE VERANO

Estudio de funciones mediante límites y derivadas

La Estadística en el Mantenimiento y Reemplazo Óptimo en el Control de Calidad

3. Resolver triángulos rectángulos utilizando las definiciones de las razones trigonométricas.

Muestreo y Distribuciones muestrales. 51 SOLUCIONES

Distribución Normal Curva Normal distribución gaussiana

( x) ( ) Modelos No Lineales. µ β β β

UNA COMPARACIÓN DE LOS MODELOS POISSON Y BINOMIAL NEGATIVA CON STATA: UN EJERCICIO DIDÁCTICO

MODELO DE RESPUESTAS Objetivos del 1 al 9

Funciones: raíz cuadrada, potencia, exponencial y logaritmo

Estadística Computacional. M. González

SESIÓN 4 EL PROBLEMA DE LA RECTA TANGENTE, CÁLCULO DE LÍMITES, CONTINUIDAD Y DISCONTINUIDAD

INSTITUTO TECNOLÓGICO DE APIZACO TEORÍA DE CONJUNTOS CONJUNTOS Y TÉCNICAS DE CONTEO

ÍNDICE CAPITULO UNO CAPITULO DOS. Pág.

x R F (x) := P (X 1 (, x]) = P ({e Ω : X(e) x}) = P (X x) salvo que en este caso esta función es siempre una función continua.

Valor absoluto de un número real. Potencias de exponente racional. Logaritmos. Logaritmos decimales y neperianos. Propiedades y operaciones.

José A. Jiménez Nieto

Ejemplo Traza la gráfica de los puntos: ( 5, 4), (3, 2), ( 2, 0), ( 1, 3), (0, 4) y (5, 1) en el plano cartesiano.

Gráficas de las funciones racionales

Cuaderno de Actividades 4º ESO

Probabilidad. Distribuciones binomial y normal

Formulario y Tablas de Probabilidad para los Cursos de Probabilidad, Inferencia Estadística y Econometría

Estadistica II Tema 1. Inferencia sobre una población. Curso 2009/10

Explorando la ecuación de la recta pendiente intercepto

Curso Propedéutico de Cálculo Sesión 2: Límites y Continuidad

Modelo EOQ con Demanda Incierta. Teoría de Inventarios Modelo Probabilísticos. Demanda durante el Lead Time 18/04/2009

TEMA 1: NÚMEROS REALES

Intervalos de Confianza para dos muestras

Funciones exponenciales y logarítmicas

PLANIFICACIÓN UNIDAD 5 MATEMÁTICA IV MEDIO BICENTENARIO. CMO Aprendizajes esperados Indicador Habilidad Contenido Clases

TEMA 2: DERIVADA DE UNA FUNCIÓN

RESUMEN DE SUCESIONES. Definición: Una sucesión es un conjunto ordenado de números reales:

La simulación implica construir una replica de algún sistema real y usarlo bajo condiciones de prueba

Interrogación (25 Ptos.) Conteste verbalmente las siguientes preguntas :

2º BACHILLERATO MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II FICHA TEMA 6.- FUNCIONES. LÍMITES Y CONTINUIDAD PROFESOR: RAFAEL NÚÑEZ

Unidad Temática 5 Estimación de parámetros: medias, varianzas y proporciones

El supermercado XYZ desea conocer el comportamiento del mismo en una sola hora de un día típico de trabajo.

CONCEPTOS BÁSICOS DE PROBABILIDAD Y ESTADÍSTICA

Matemáticas Febrero 2013 Modelo A

FUNCIONES CUADRÁTICAS. PARÁBOLAS

Tema 11: Intervalos de confianza.

Pruebas de Bondad de Ajuste

Números Reales. 87 ejercicios para practicar con soluciones. 1 Ordena de menor a mayor las siguientes fracciones: y

RIESGO Y RENDIMIENTO RIESGO Y RENDIMIENTO RIESGO Y RENDIMIENTO RIESGO Y RENDIMIENTO RIESGO Y RENDIMIENTO RIESGO Y RENDIMIENTO. M.Sc. Roberto Solé M.

6. ESTIMACIÓN DE PARÁMETROS

Tema 1. Cálculo diferencial

TEMA 4: CONTRASTES DE HIPÓTESIS. CONCEPTOS BÁSICOS

Funciones Exponenciales y Logarítmicas

CONCEPTOS FUNDAMENTALES

LA DISTRIBUCIÓN NORMAL

Modelos de probabilidad

TEMA 4: DERIVADAS. En símbolos, la pendiente de la curva en P = lim Q P (pendiente de P Q).

7. Distribución normal

Unidad II Teoría del consumidor y del Productor

Distribuciones de Probabilidad, Binomial& Otros (Cap. 5) Math. 298 Prof. Gaspar Torres Rivera

Tema 5. Muestreo y distribuciones muestrales

Transcripción:

1. Funciones básicas y distribuciones 1.1 Definición de tiempos de falla Qué es el análisis de supervivencia?. Es el análisis estadístico de datos de tiempo a la ocurrencia de un evento (time to event data), o mejor dicho tiempo entre la ocurrencia de dos eventos, inicio y fin. Por lo general estos tiempos se conocen como tiempos de vida, tiempos de supervivencia o tiempos de falla, dependiendo de la aplicación. Las posibles aplicaciones del análisis de supervivencia son: o Biomédicas: tiempos de recuperación de un paciente, tiempos de vida de pacientes con cierta enfermedad, tiempo en que aparece un tumor, tiempo de recaída de una enfermedad, etc. o Industriales: duración de aparatos electrónicos hasta que presentan la primera falla, duración de un billete, etc. o Financieros y económicos: períodos de desempleo, pérdida económica entre dos eventos, etc. Independientemente de las unidades de medición del tiempo (discretas o continuas). Los datos de tiempo a la ocurrencia de un evento son 1

realización de de variables aleatorias no negativas. En este sentido el análisis de supervivencia se puede entender como el análisis de variables aleatorias no negativas. Los tiempos de falla, o de vida, deben de estar determinados de manera precisa. Es decir, necesitamos definir un evento de origen, una escala de medición y un evento de fin para cada individuo. El evento de origen no necesita ocurrir en el mismo tiempo calendario para todos los individuos. Ejemplos: o En ensayos clínicos, el evento de origen puede ser la entrada del paciente al estudio y el evento de fin puede ser la recuperación o a muerte. o En aplicaciones industriales, el evento de origen puede ser el momento de creación del billete o el momento en el que sale a circulación, y el evento de fin puede ser el momento en el que llega al banco central como deteriorado, o el momento en el que se decide destruir. o La escala de medición por lo general es el tiempo real, aunque también se puede considerar como el tiempo de operación de un sistema, o el kilometraje de un auto. Algo que caracteriza al análisis de supervivencia de otros análisis estadísticos es la presencia de información parcial. Es decir, en algunos 2

casos no se conocerá de manera exacta el valor observado de la variable de interés T, sino que solo se tendrá cierta información parcial. La información parcial se clasifica en dos tipos: censura y truncamiento. A su vez estos dos tipos pueden ocurrir por la derecha o por la izquierda. 1.2 Ejemplos de datos de supervivencia A continuación se presentan algunos ejemplos de datos de supervivencia. Estos ejemplos fueron obtenidos de Klein & Moeshberger (1997). EJEMPLO 1: Duración de remisión de un ensayo clínico para leucemia aguda. Resultados de un ensayo clínico en donde se quería compara la efectividad de la droga 6-MP versus placebo en 42 niños con leucemia aguda. El evento de inicio es remisión parcial de la enfermedad después de haber sido tratados con la droga prednisone. El evento de fin es recaída o muerte. La escala de medición es tiempo calendario en meses. Algunos individuos no presentaron el evento de fin al término del estudio. Estos casos son marcados con un + y son llamados censurados por la derecha. Más adelante los veremos con detalle. 3

EJEMPLO 2: Transplante de médula ósea en pacientes con leucemia. Transplante de médula es un procedimiento estándar en pacientes con leucemia aguda. La recuperación después del transplante es un proceso complejo. La prognosis para la recuperación puede depender de factores que se conocen al momento del transplante, como edad y sexo del paciente y donador, etapa de la enfermedad inicial, tiempo entre el diagnóstico y el transplante, etc. La prognosis final depende de cómo evoluciona el paciente después del transplante. Puede generar aversión o 4

rechazo de la medula transplantada (GVHD), que el conteo de plaquetas se vuelva normal o desarrollar infecciones, etc. El transplante se considera fracaso cuando el paciente recae o muere. 5

6

EJEMPLO 3: Tiempos de muerte de adultos mayores residentes de un asilo. Channing House es una casa de retiro en California. Datos con las edades de muerte de 462 individuos (97 hombres y 365 mujeres) que estuvieron en la residencia durante el periodo de enero de 1964 y julio de 1975. Se reportó la edad a la muerte o al momento en que se salían del asilo (en meses) y la edad a la que los individuos entraron al asilo. Estos datos son un ejemplo de truncamiento por la izquierda que más adelante veremos con detalle. Un individuo tiene que sobrevivir lo suficiente para estar en edad de entrar al asilo. Individuos que mueren previamente a la edad de retiro son excluidos del estudio. EJEMPLO 4. Tiempo al primer uso de marihuana. En este estudio a 191 estudiantes de preparatoria se les preguntó: Cuál fue la primera vez que probaste la marihuana?. Las respuestas fueron, la edad exacta a la que la probaron, nunca la he probado, y la probé pero no recuerdo cuando 7

fue la primera vez. En este último caso tenemos una censura por la izquierda. El evento de interés ha ocurrido en algún momento previo a la edad actual del estudiante!. EJEMPLO 5. Tiempo a desarrollar sida. Se reportan datos con tiempos de infección y de inducción para 258 adultos y 37 niños que fueron infectados con el virus del VIH y desarrollaron sida antes del 30 de junio de 1986. Los datos consisten de los tiempos (en años) desde que adultos fueron infectados por el virus por transfusión de sangre contaminada, y el tiempo de espera hasta el desarrollo de sida. Para la población pediátrica, los niños fueron infectados en útero o al nacer. El tiempo base de medición es el 1 de abril de 1978. 8

En este estudio, sólo los individuos que han desarrollado sida antes del término del estudio son considerados. Individuos que no han desarrollado sida no son incluidos en el estudio. Este tipo de datos es llamado truncados por la derecha y más adelante los veremos con detalle. 9

1.3 La función de supervivencia y la función de riesgo Como se mencionó anteriormente, el análisis de supervivencia es el estudio de variables aleatorias no negativas. Sea T una v. a. no negativa que puede ser discreta o continua. De los cursos de probabilidad recordamos que toda variable aleatoria T es caracterizada por su función de densidad f(t) o por su función de distribución (acumulada) F(t). Dependiendo si T es una variable aleatoria discreta o continua tenemos la siguiente relación entre f(t) y F(t) F ( t) = P( T t) = t f(u)du, u= 0 f(u), sit es v.a.continua sites v.a.discreta 0, t y de manera inversa, d ( ) ( ) F t, sites v.a.continua f t = dt, F( t) F( t ), sit es v.a.discreta donde F ( t ) es un límite por la izquierda definido como F ( t ) = limf( t u) u 0. En análisis de supervivencia existen otras funciones más útiles y más interpretables que las funciones de densidad y de distribución. Estas son 10

la función de supervivencia, denotada por S(t), y las funciones de riesgo (tasa o intensidad y acumulada), denotadas por h(t) y H(t) respectivamente. FUNCIÓN DE SUPERVIVENCIA. La función de supervivencia S(t) es la función más importante para describir el comportamiento de tiempos de falla y se define como la probabilidad de que un individuo sobreviva más allá del tiempo t, es decir, la probabilidad de que un individuo presente su evento de fin en un tiempo posterior a t. En notación matemática tenemos, S ( t) P( T > t) = 1 F( t) =. Cómo se interpreta una función de supervivencia?. Como presentar el evento de fin no es algo necesariamente bueno, es preferible tener una probabilidad mayor de que el evento de fin ocurra posterior al tiempo t. Las funciones de supervivencia pueden diferir en forma, pero todas mantienen las mismas propiedades básicas: i. Son monótonas no crecientes, ii. iguales a uno al tiempo cero y tienden a cero cuando el tiempo tiende a infinito. La tasa de decaimiento de las funciones de supervivencia varía de acuerdo al riesgo de presentar el evento de fin. Eventos más riesgosos presentan una tasa de decaimiento mayor. 11

A continuación presentamos una figura con ejemplos de funciones de supervivencia: La función de riesgo es una función fundamental en análisis de supervivencia. Se le conoce también como la tasa de falla condicional en análisis de confiabilidad, tasa de mortalidad en demografía o función de intensidad en procesos estocásticos. 12

Como el tratamiento y la interpretación de la función de densidad es distinto dependiendo si la v. a. T es discreta o continua, definiremos la función de riesgo por separado en los casos discreto y continuo. FUNCIÓN DE RIESGO DISCRETA. Sea T una v. a. discreta con soporte en {,u,k} u 2 1. La función de riesgo discreta se define como la probabilidad condicional de presentar el evento de fin en el tiempo t, dado que se ha sobrevivido al tiempo t. Se denota por h(t). En notación matemática, h ( t) P( T = t T t) =. o Sea h k la función de riesgo en el tiempo u k, la cual se puede obtener a través de la función de densidad y de la función de supervivencia como h k ( T = uk ) ( T u ) k f( uk ) ( u ) P = h( uk ) = =, P S k 1 o Como la función de densidad se expresa en términos de la función de supervivencia como entonces por lo tanto f ( u ) S( u ) S( u ) k h k =, k 1 S( uk ) ( u ) = 1, S S( uk ) ( ) k 1 S ( t) = = 1 hk. { k : u t} S uk. 1 { k : u t} k k k ( ) 13

o De la misma manera, la función de densidad en términos de la función de riesgo se obtiene como ( uj) = hj ( 1 hk ) f. { k< j} En demografía, la función de riesgo se interpreta como la probabilidad de morir en el momento t dado que se llegó vivo al tiempo t. Las funciones de riesgo discretas no tienen ninguna restricción más que ser no negativas. Las formas que presentan son variadas. A continuación se presentan algunos ejemplos: 14

FUNCIÓN DE RIESGO ACUMULADO DISCRETA. La función de riesgo acumulado discreta es simplemente la acumulación de la función de riesgo hasta el momento t y se denota por H(t). En notación matemática, H ( t) = hk. { k : u t} Existe una definición alternativa de la función de riesgo acumulado discreta, la cual obedece a la relación que prevalece en el caso continuo. Esta es: ( t) = log( 1 h ) H k. { k : u t} k k En cualquiera de las dos definiciones, las funciones de riesgo acumulado discretas son funciones monótonas no decrecientes. FUNCIÓN DE RIESGO CONTINUA. Sea T una v. a. continua con soporte en [0, ). La función de riesgo continua se define como la tasa instantánea de fallo al tiempo t, dado que se ha sobrevivido al tiempo t. Se denota por h(t) al igual que en el caso discreto. En notación matemática, h 1 ε la cual puede ser expresada como ( t) lim P( t < T t + ε T t) h ( t) o Al observar que f( t) S' ( t) =, ε 0 F lim = ε 0 = entonces ( t + ε) F( t) ε S( t) f = S ( t) ( t) 15

al integrar ambos lados tenemos h d dt ( t) = logs( t) log S t = 0 ( t) h( u) finalmente, como S(0)=1 obtenemos que S t = 0 ( t) exp h( u) du du o La función de densidad en términos de la función de riesgo se expresa como t f ( t) = h( t) exp h( u) du. 0 La expresión h ( t)ε se pude ver como la probabilidad aproximada de que un individuo de edad t experimente el evento de fin en el siguiente instante. Al igual que en el caso discreto, hay muchas formas para la función de riesgo. La única restricción es que sea no negativa. o Una función de riesgo creciente implica un envejecimiento natural. o Una función de riesgo decreciente es menos común pero indica un rejuvenecimiento. o Más comúnmente son las funciones de riesgo en forma de tina de baño que representan el riesgo de mortalidad en poblaciones que se siguen desde el nacimiento. 16

o Una función de riesgo en forma de montaña representaría el comportamiento del riesgo de muerte por enfermedad después de un tratamiento. A continuación se muestran algunos ejemplos: 17

FUNCIÓN DE RIESGO ACUMULADO CONTINUA. La función de riesgo acumulado continua es la integral hasta el momento t de la función de riesgo se denota por H(t). En notación matemática, t H ( t) = h( u) du. 0 Esta función está relacionada con la función de supervivencia por S ( t) = exp{ H( t) }. Si S ( ) = 0, entonces ( ) = H. 18

Nota: Existe una formulación general de las funciones de supervivencia y riesgo que engloba a los dos casos continuo y discreto. Para ello se requiere de conocer integrales de Reimann-Stieltjes y de las integralesproducto. 1.4 Algunos parámetros poblacionales Debido a la presencia de información parcial en el Análisis de Supervivencia, es conveniente definir algunos parámetros de interés en términos de la función de supervivencia. MEDIA: ( T) = u f( u ) = S( u ) µ = E, k= 1 si T es variable aleatoria discreta, y k k k= 1 ( T) = t f( t) dt = S( t) µ = E dt, 0 si T es variable aleatoria continua. En ambos casos, la última igualdad se puede obtener con un cambio de variable. 0 k VARIANZA: σ 2 = Var ( T) = 2 u S( u ) S( u ) k= 1 k k k= 1 k 2 19

si T es una v.a. discreta, y σ Si t es una v.a. continua. 2 = Var ( T) = 2 t S( t) dt S( t) 0 0 dt 2, CUANTILES DE ORDEN p: El cuantil o percentil de orden p de la variable aleatoria T, t p es tal que Si T es v.a. continua, t p satisface F( t p ) p y ( t ) 1 p S p ( t ) 1 p S p =.. En particular, el tiempo de vida mediano es t 0.5 tal que ( t ) 0. 5 S. 5 0 =. VIDA MEDIA RESIDUAL: La vida media residual es un cuarto parámetro que resulta de interés en análisis de supervivencia. Para individuos de edad x, este parámetro mide la esperanza de vida que les queda. Se define como, vmr ( x) E( T x T > x) ( t x) f( t) ( x) dt ( t) x x = = =. S S S ( x) dt Ejemplos: 20

1.5 Algunos modelos paramétricos Existen varias familias de modelos paramétricos que se usan para el análisis de tiempos de fallo. Algunos de estos modelos son populares porque representan de manera adecuada el comportamiento aleatorio de los fenómenos y otros porque sus parámetros tienen una interpretación simple. 21

Dentro de las familias univariadas más importantes están: exponencial, Weibull, log-normal, log-logistic y gamma. Alguna veces existe información acerca del proceso de envejecimiento o del proceso de fallo en la población que sugiere una distribución en particular, aunque por lo general esta información es muy específica como para acotar a una sola familia de modelos. La motivación para usar un modelo en particular es, por lo general, empírica. Por ejemplo, si se ha demostrado que un modelo describe satisfactoriamente el comportamiento de los tiempos de fallo en poblaciones similares a la que se está estudiando. 1) FAMILIA EXPONENCIAL. Debido a su importancia histórica, a su simplicidad matemática y a sus propiedades importantes, se presenta primero el modelo exponencial. o Función de riesgo: Se caracteriza por tener una función de riesgo constante. o Función de supervivencia: o Función de densidad: ( t) = λ h, t 0, λ>0 f S λt ( t) e =, t 0 λt ( t) λe =, t 0 22

o Propiedad de pérdida de memoria: ( T t + x T > t) = P( T x) P > >, i.e., no hay desgaste. Esta es una consecuencia directa de la función de riesgo constante. o Parámetros: E ( T), Var( T) = c.v.( T) = 1 2 E = 1 λ ( T x T > x) = E( T) t p 1 = log λ ( 1 p) 1 λ 1 = λ Aunque la distribución exponencial ha sido históricamente muy popular, la función de riesgo constante es muy restrictiva en aplicaciones en salud e industria. 23

2) FAMILIA WEIBULL. La distribución Weibull es quizás el modelo más utilizado para tiempos de fallo. Se usa tanto para modelar tiempos de duración de piezas manufacturadas como para modelar tiempos de aparición de tumores en medicina. o Función de riesgo: h α 1 ( t) λαt =, t 0, α, λ>0 α es un parámetro de forma y λ es un parámetro de escala o Función de supervivencia: o Función de densidad: o Parámetros: f S α ( t) = exp( λt ) α ( t) = λαexp( λt ), t 0, t 0 2 2 α [ ] λ 1 α E ( T) = Γ( 1 + 1 α) λ, ( T) = Γ( 1 + 2 α) { Γ( 1 + 1 α) } donde Γ ( α) = ( α 1) Γ( α 1) Var, t si p 1 = log λ 1 β = λ α ( 1 p) 1 α, entonces β es el cuantil de orden 0.632 independientemente del valor de α. En ingeniería β es llamado la vida característica de la distribución. El modelo Weibull es suficientemente flexible para acomodar funciones de riesgo crecientes (α>1), decrecientes (α<1), o constantes (α=1). 24

3) FAMILIA LOG-NORMAL. La distribución log-normal ha sido popular en el modelado de tiempos de fallo debido a su relación con el modelo normal. El tiempo de vida T se dice que sigue una distribución log-normal, si Y=log(T) se distribuye normal con parámetros µ y σ 2. Haciendo el cambio de variable obtenemos la distribución log-normal. Y T = e 25

o Función de densidad: 2 2 1 2 1 1 log t µ f ( t) = ( 2πσ ) t exp, t 0, µ R, σ 2 >0 2 σ donde µ y σ 2 son la media y la varianza de Y=log(T). La función de supervivencia y de riesgo dependen de Φ(t), la función de distribución normal estándar. o Función de supervivencia: o Función de riesgo: o Parámetros: E t S log t µ σ ( t) = 1 Φ ( t) f( t) S( t) h =, t 0, t 0 2 2 2 ( T) = exp( µ + σ 2), Var( T) { exp( σ ) 1} exp( 2µ + σ ) exp( µ + σ ) p z p =, =, donde z p es el percentil de orden p de una variable normal estándar. En particular µ t 0. 5 = e. La función de riesgo del modelo log-normal es en forma de montaña, toma el valor de cero al tiempo t=0, crece hasta alcanzar un valor máximo y luego decrece a cero conforme t. Este modelo es criticado porque es decreciente para valores grandes de t, lo que pareciera improbable en algunas situaciones. Este comportamiento ocurre cuando la población es una mezcla de individuos que tienden a tener tiempos de vida cortos y largos, 26

respectivamente. Por ejemplo, tiempo de supervivencia después de un tratamiento para algunos pacientes de cáncer, donde las personas que son curadas se convierten en sobrevivientes de periodo largo. Otro ejemplo es la duración de los matrimonios, donde después de cierto número de años, el riesgo de disolución del matrimonio por divorcio decrece. A continuación presentamos algunos comportamientos de la función de riesgo. 27

4) FAMILIA LOG-LOGÍSTICA. Una variable aleatoria T se dice que tiene una distribución log-logística, si su logaritmo Y=logT sigue una distribución logística. La distribución logística se parece mucho a la normal, con soporte en todos los reales, pero con expresiones más sencillas. La función de densidad logística es, f y exp µ σ =, <y< y µ σ 1 + exp σ ( y) 2 o Función de densidad: Haciendo el cambio de variable obtenemos la función de densidad log-logística Y T = e, con = 1 σ > 0 f ( t) α 1 αλt =, t 0 α ( 1+ λt ) 2 α y = exp ( µ σ) > 0 o Función de supervivencia: λ. o Función de riesgo: S 1 1 + λt ( t) = α, t 0 o Parámetros: E 1 α 1 1 ( T) = λ Γ( 1+ α ) Γ( 1 α ) h αλt α 1 ( t) = α 1+ λt, t 0 28

Var = λ 1 α π α csc π α, si α>1 2 α 2 ( T) = λ Γ( 1 + 2 α) Γ( 1 2 α) E ( T) = λ 2 α 2π 2π 2 csc E α α ( T), si α>2 1 α p t p =. λ( 1 p) El numerador de la función de riesgo es igual a la función de riesgo Weibull, pero el denominador causa que la función de riesgo cambie de forma. La función de riesgo es monótona decreciente para α 1, y para α>1 la función de riesgo crece inicialmente hasta alcanzar un máximo en el 1 tiempo {( α ) λ} α 1 y luego decrece a cero conforme t. Esta distribución es similar al modelo Weibull y exponencial por sus expresiones simples para h(t) y S(t). Su función de riesgo es similar a la de la log-normal, excepto en el extremo de la cola derecha, pero su ventaja es la simplicidad de su función de riesgo h(t) y de su función de supervivencia S(t). A continuación presentamos algunos comportamientos de la función de riesgo. 29

5) FAMILIA GAMMA. El modelo gamma tiene propiedades similares al modelo Weibull, sin embargo no es tan fácilmente tratable matemáticamente. o Función de densidad: f ( t) = β λ Γ β ( ) t β 1 exp ( λt), t 0, λ, β > 0 30

β es un parámetro de forma y λ es un parámetro de escala. La función de supervivencia y la función de riesgo no tienen una forma analítica explícita y dependen de la función gamma incompleta Ig o Función de supervivencia: o Función de riesgo: o Parámetros: β λ β λ E ( T) =, Var( T) = 2 ( t, β) S 1 = Γ β t ( ) β 1 u e ( t) = 1 Ig( λt, β) 0 ( t) ( t) f h ( t) =, t 0 S u du, t 0 Al igual que el modelo Weibull, el modelo gamma incluyen al modelo exponencial como caso particular (β=1), se aproxima a una distribución normal cuando β y coincide con una distribución Ji-cuadrada con ν=2β grados de libertad cuando β es un entero y λ=1/2. La función de riesgo es monótona creciente para β>1, con h ( 0) = 0 y h ( t) λ. Es monótona decreciente cuando β<1, con ( 0) = t ( t) λ h. t Cuando β>1, la moda de la distribución es = ( β 1) λ t. h y El modelo gamma no es tan usado para modelar tiempos de fallo como los modelos Weibull, log-normal y log-logístico, sin embargo sí ajusta algunos comportamiento de manera adecuada. 31

A continuación presentamos algunos comportamientos de la función de riesgo. 6) OTRAS FAMILIAS. Existen muchos otros modelos paramétricos que se utilizan para representar el comportamiento de tiempos de fallo. Algunos de estos son: 32

o Distribución gama generalizada: para α, β, λ >0. f ( t) β ( ) α ( λ ) αλ αβ 1 = t exp t Γ β ( t) = 1 Ig( λt α, β) S, Esta distribución se reduce al modelo exponencial cuando α = β = 1, al modelo Weibull cuando β = 1, al gamma cuando α = 1, y tiende a una log-normal cuando β. Se usa para bondad de ajuste. o Más familias se pueden encontrar en el siguiente cuadro resumen de Klein & Moeshberger (1997): Comentarios finales: o En el modelo exponencial se cumple que H( t) λt =. Entonces, de manera empírica podemos verificar el ajuste a una exponencial graficando H(t) vs. t. La gráfica debe de ser una línea recta que pasa por el origen con pendiente λ. α o En el modelo Weibull se cumple que H ( t) = λt. De igual manera, podemos verificar el ajuste a una Weibull graficando logh(t) vs. logt. La gráfica debe de ser una línea recta con perndiente α y ordenada al origen logλ. 33

o Todas las distribuciones aquí presentadas pueden ser modificadas para que incluyan un parámetro de umbral o tiempo de garantía γ. Este parámetro es un tiempo γ 0 antes del cual un individuo no puede presentar el evento de fin. Esto se hace definiendo un nuevo tiempo T '= T + γ, donde T 0 sigue cualquiera de las distribuciones anteriores. 34