Chequeo empírico del estimador cópula gráfico para riesgos competitivos dependientes

Documentos relacionados

b. Universidad Nacional-Sede Medellín

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

Robusticidad de los Diseños D-óptimos a la Elección. de los Valores Locales para el Modelo Logístico

Análisis matemático de la función de Nelson y Siegel

Teoría de la decisión

Teorema Central del Límite (1)

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico

Tema 8: Contraste de hipótesis

Determinación del tamaño de muestra (para una sola muestra)

ESTADÍSTICA. Tema 4 Regresión lineal simple

Contrastes de Hipótesis paramétricos y no-paramétricos.

Estimación por intervalo del parámetro de la distribución de Poisson con una sola observación

3. ANÁLISIS DE DATOS DE PRECIPITACIÓN.

INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016

INDICE. Prólogo a la Segunda Edición

INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)

Análisis de datos Categóricos

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

ESTIMACIÓN DE LOS COMPONENTES DE LA VARIACIÓN DE UN SISTEMA DE MEDICIÓN, USANDO EL RANGO. Resumen

INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos

Tema 9: Contraste de hipótesis.

Regresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A

Técnicas de Investigación Social

1. La Distribución Normal

Tema 6. Variables aleatorias continuas

(a) Calculate a point estimate of the mean pull-off force of all connectors in the population. State which estimator you used and why.

Aplicación del orden de mayorización a un problema de producción-inventario. An aplication of majorization order on a production-inventory problem

Carta de control CEV X para distribuciones Weibull con datos censurados

Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR

JUEGO DE BASKETBALL. Repaso de Distribuciones de Probabilidad Discretas y Continuas

Generación de tiempos de falla dependientes Weibull bivariados usando cópulas

Contrastes de hipótesis. 1: Ideas generales

Métodos estadísticos en estudios de supervivencia

ACTIVIDAD 2: La distribución Normal

EL PRINCIPIO DE MÁXIMA VEROSIMILITUD (LIKELIHOOD)

Generación de variables aleatorias continuas Método de la transformada inversa

6.4. APLICACIÓN DE REDES NEURONALES EN EL CÁLCULO DE LA TASA DE CONTORNEAMIENTOS Velocidad de retorno del rayo con distribución uniforme

Cálculo de Probabilidades II Preguntas Tema 1

Aplicación del modelo de frontera estocástica de producción para analizar la eficiencia técnica de la industria eléctrica en México

6.- APLICACIÓN DE FEMA-273 Y ANÁLISIS MODAL PUSHOVER.

Elementos para la estimación de una tabla de mortalidad de inválidos

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

INFERENCIA ESTADISTICA

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

METODOLOGÍA DE MUESTREO PARA REPORTE DE TENDENCIAS 4o BÁSICO Y 2o MEDIO SIMCE 2010

Estadísticas Elemental Tema 3: Describir la relación entre dos variables: Correlación y regresión 3.1-1

III Verano de Probabilidad y Estadística Curso de Procesos de Poisson (Víctor Pérez Abreu) Lista de Ejercicios

ANÁLISIS DE FRECUENCIA (CURVAS INTENSIDAD DURACIÓN - FRECUENCIA) Y RIESGO HIDROLÓGICO

Cómo llevar a cabo un trabajo empírico

Prof. Eliana Guzmán U. Semestre A-2015

Tema 5. Contraste de hipótesis (I)

CAPÍTULO 2. SOLUCIÓN DE ECUACIONES DE UNA VARIABLE

EJERCICIOS RESUELTOS DE INTEGRAL DEFINIDA

Tabla de Test de Hipótesis ( Caso: Una muestra ) A. Test para µ con σ 2 conocida: Suponga que X 1, X 2,, X n, es una m.a.(n) desde N( µ, σ 2 )

NORMALIDAD ASINTÓTICA PARA LOS E-GINI. Pablo Martínez Camblor RESUMEN

Diseño de Bloques al azar. Diseño de experimentos p. 1/25

PROYECCIÓN DE LA EVOLUCIÓN DE LAS EMISIONES DE GASES DE EFECTO INVERNADERO EN EL SECTOR ENERGÍA AÑOS

Conceptos del contraste de hipótesis

4. NÚMEROS PSEUDOALEATORIOS.

ANALISIS DE FRECUENCIA EN HIDROLOGIA JULIAN DAVID ROJO HERNANDEZ

1. Caso no lineal: ajuste de una función potencial

4.1 Análisis bivariado de asociaciones

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón

Método de cuadrados mínimos

Medidas de tendencia central y dispersión

Distribuciones de Probabilidad

Estadística Aplicada

DEPARTAMENTO DE MATEMÁTICAS. IES GALLICUM

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

Unidad Temática 3: Probabilidad y Variables Aleatorias

Algunas Distribuciones Continuas de Probabilidad. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

EJERCICIOS RESUELTOS DE ESTADÍSTICA II

Contrastes de hipótesis paramétricos

Objetivo: Comprender la diferencia entre valor esperado, varianza y desviación estándar. Poner en práctica el teorema de Chebyshev

Métodos Matemáticos 2 Ecuaciones Diferenciales de Orden Superior

478 Índice alfabético

CAPÍTULO 4 TÉCNICA PERT

Métodos de Pareo FN1. Fernanda Ruiz Nuñez Noviembre, 2006 Buenos Aires

CAPÍTULO 4 RECOPILACIÓN DE DATOS Y CÁLCULO DEL VPN. En el presente capítulo se presenta lo que es la recopilación de los datos que se tomarán

RESUMEN DE ALGUNOS CONCEPTOS ESTADÍSTICOS ELEMENTALES Y NOTACIÓN EMPLEADA EN EL CURSO

Modelos y análisis para datos de degradación

Economía Aplicada. ¾Es importante el tamaño de la clase? Un experimento controlado

PROGRAMA ACADEMICO Ingeniería Industrial

MODULO VIII. Semana 1 ASPECTOS DE EVALUACIÓN FINANCIERA, ECONÓMICA, SOCIAL Y AMBIENTAL.

EJERCICIOS RESUELTOS DE ESTADÍSTICA II

T4. Modelos con variables cualitativas

TEMA 3: Contrastes de Hipótesis en el MRL

Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple

Análisis de estudios de cohortes en Ciencias de la P005/10. Salud (modelos regresión de Poisson y de Cox)

CORRELACIÓN Y REGRESIÓN. Juan José Hernández Ocaña

Carrera: EMM Participantes Representante de las academias de ingeniería Electromecánica de los Institutos Tecnológicos.

TEMA 8. GEOMETRÍA ANALÍTICA.

Construcción de Gráficas en forma manual y con programados

ESTADÍSTICA DESCRIPTIVA

Prácticas de Fiabilidad

Z i

Método de Análisis del Riesgo (Estudio del Calibrador Atributos)

Distribución Chi (o Ji) cuadrada (χ( 2 )

Transcripción:

Chequeo empírico del estimador cópula gráfico para riesgos competitivos dependientes María Carolina Paz Sabogal a, Sergio Yáñez Canal b Email: mcpazs@unal.edu.co a. Estudiante de Postgrado. Maestría en Ciencias Estadística. Universidad Nacional de Colombia-Sede Medellín b. Profesor Asociado. Universidad Nacional de Colombia-Sede Medellín Resumen En un modelo de riesgos competitivos dependientes es imposible determinar las distribuciones marginales y la distribución conjunta a partir solamente de los datos de riesgos competitivos. Esta situación se conoce como el problema de identificabilidad. Zheng & Klein proponen el estimador cópula gráfico como solución al problema de identificabilidad para dos riesgos competitivos. Para ello asumen una estructura de dependencia usando una cópula para la distribución conjunta entre los tiempos de falla y su parámetro de dependencia conocido. En este trabajo se realiza un chequeo empírico del fun- 1

cionamiento de este estimador, realizando una comparación entre la función de sobrevivencia y las funciones de distribución marginales verdaderas, con las estimadas por el algoritmo cópula gráfico. Estas comparaciones se realizan vía simulación. Palabras Clave: Estimador cópula gráfico, Riesgos competitivos, Cópulas, Identificabilidad, Error cuadrático medio. Empirical check of the copula graphic estimator for dependent competing risks María Carolina Paz Sabogal a, Sergio Yáñez Canal b Email: mcpazs@unal.edu.co a. Statistics Master Student. Universidad Nacional de Colombia, Sede Medellín b. Associate Professor. Universidad Nacional de Colombia, Sede Medellín Abstract In a dependent competing risks model is impossible to determine the marginal distributions and the joint distribution from the competing risks data alone. This is known as the identifiability problem. Zheng & Klein propose the copula graphic estimator as a solution to the identifiability problem for two competing risks. For 2

that, they assume a dependence structure using a copula for the joint distribution of failure times and its dependence parameter known. In this paper we make an empirical check of this estimator and compare the true marginal distribution functions and survival function with those estimated with the copula graphic estimator. These comparisons are performed via simulation. Keywords: Copula graphic estimator, Competing risks, Copulas, Identifiability, Mean square error. 1. Introducción El tiempo de falla de un sistema con dos modos de falla puede ser modelado como un sistema en serie o un modelo de riesgos competitivos. Cada unidad tiene un tiempo potencial de falla. El tiempo de falla observado es el mínimo de esos tiempos potenciales individuales. En riesgos competitivos bajo el supuesto de independencia entre los tiempos de falla, los datos observados proporcionan información suficiente para determinar de manera única los funciones de sobreviviencia marginal. Sin embargo, el supuesto de independencia no siempre se cumple. Cuando existe dependencia entre los tiempos de falla, queda imposible identificar las distribuciones marginales y la distribución conjunta a partir solamente de los datos de riesgos competitivos. El estimador cópula gráfico propuesto por [6], resuelve el problema de identificabilidad para dos riesgos competitivos dependientes. Para ello utilizan cópulas como una función no paramétrica que captura la dependencia entre dos variables aleatorias. El problema de identificabilidad es resuelto bajo el supuesto que la cópula y su parámetro de asociación son conocidos y con los datos de riesgos com- 3

petitivos disponibles. El objetivo de este trabajo es realizar un chequeo empírico del funcionamiento de este estimador, realizando una comparación entre la función de sobrevivencia y las funciones de distribución marginales verdaderas, con las estimadas por el algoritmo cópula gráfico. Estas comparaciones se realizan vía simulación, analizando gráficos de probabilidad y calculando el error cuadrático medio. 2. Riesgos competitivos El tiempo de falla de un sistema con dos modos de falla puede ser modelado como un sistema en serie o un modelo de riesgos competitivos, como se ilustra en la figura 1. Cada unidad tiene un tiempo potencial de falla. El tiempo de falla observado es el mínimo de esos tiempos potenciales individuales. Figura 1: Sistema con dos componentes en serie Los datos en riesgos competitivos son presentados como una variable aleatoria bivariada de la forma (T, δ), donde T es el tiempo mínimo de falla T = mín(x, Y ) y δ es una variable discreta, δ toma el valor de 0 cuando la observación es censurada, 1 cuando la falla se presenta por el primer modo de falla y 2 cuando la falla se presenta por el segundo modo de falla. Para estudiar el modelo de riesgos competitivos es necesario definir algunos. 4

2.1. Conceptos fundamentales La función de subdistribución o función de incidencia acumulada (FIA), para el modo de falla i, i = 1, 2, está dada por: G i (t) = P (T t, δ = i) (1) La función de distribución total es la probabilidad que un evento de cualquier tipo ocurra en o antes del tiempo t, es decir, es igual a la suma de las FIA para los dos tipos de eventos, así F (t) = P (T t) = 2 P (T t, δ = i) = i=1 2 G i (t) (2) i=1 Nótese que cuando no hay riesgos competitivos la función de distribución total se encuentra en el intervalo [0,1]. En contraste, en presencia de riesgos competitivos la función de subdistribución sólo puede tomar valores hasta P (δ = i) debido a que lím G i(t) = P (δ = i) (3) t Por lo tanto, la función G i (t) no es una función de distribución propia. La función de subsobrevivencia es la probabilidad de que el modo de falla i no ocurra antes del tiempo t G i (t) = P (T > t, δ = i) (4) 5

La función de subdensidad para el modo de falla i y T continuo, se define como g i (t) = dg i(t) dt = dg i(t) dt (5) 2.2. Problema de identificabilidad Un problema de interés en riesgos competitivos es identificar las distribuciones marginales de las variables a partir de los datos de riesgos competitivos. Cuando los tiempos de falla potenciales son independientes las distribuciones marginales son identificables y corresponden a las funciones de distribución. Si este supuesto no se cumple, no es posible identificar las distribuciones marginales y la distribución conjunta de los tiempos potenciales a partir únicamente de los datos obtenidos en riesgos competitivos, es decir, existen muchas funciones de distribución conjuntas diferentes que comparten las mismas funciones de subdistribución, esto es el problema de identificabilidad. Existen distintas soluciones al problema de identificabilidad cuando se tienen datos de la forma (T, δ) y se hace necesario identificar el modelo conjunto F (x, y), entre ellas se encuentran: 1. Asumir independencia. 2. Asumir una estructura de dependencia conocida usando una cópula específica para la distribución conjunta de los modos de falla. Zheng & Klein proponen el estimador cópula gráfico. 3. Especificar un modelo paramétrico. 6

3. Estimador cópula gráfico El estimador cópula gráfico propuesto por [6], es un estimador no paramétrico para las distribuciones marginales, el cual resuelve el problema de identificabilidad. Para ello utilizan cópulas como una función no paramétrica que captura la dependencia entre dos variables aleatorias. El problema de identificabilidad es resuelto bajo el supuesto que la cópula entre X y Y y su parámetro de asociación son conocidos y con los datos de riesgos competitivos disponibles. A continuación se presentan los detalles de la construcción del estimador cópula gráfico. Suponga que se tiene, en el contexto de riesgos competitivos, una muestra de tamaño n de tiempos de vida, donde T j = mín(x j, Y j ). Si F 1 (t) y F 2 (t) son las distribuciones marginales de X y Y respectivamente, entonces para cualquier cópula se tiene, ver figura 2, µ c (A t ) = P (X > t, Y > t) (6) µ c (B t ) = P (X t, X < Y ) (7) donde A t = {(x, y) : F 1 (t) < x 1, F 2 (t) < y 1} B t = { (x, y) : 0 < x F 1 (t), F 2 F 1 1 < y 1 } En su artículo Zheng & Klein prueban que estas dos relaciones (6) y (7) determinan de manera única a F 1 (t) y F 2 (t). Por lo tanto se pueden encontrar estimadores ˆF 1 (t) 7

Figura 2: Relación entre F 1 (t) y F 2 (t) en el cuadrado unitario. y ˆF 2 (t) para F 1 (t) y F 2 (t) respectivamente, que preservan estas relaciones sobre una rejilla seleccionada de m puntos distintos de falla o censura 0 < t 1 < t 2 <... < t m < máx{t j, j = 1,...n}. Para la construcción del estimador cópula gráfico se define Adicionalmente, sean { Â t = (x, y) : ˆF 1 (t) < x 1, ˆF } 2 (t) < y 1 { ˆB t = (x, y) : 0 < x ˆF 1 (t), ˆF } 1 2 ˆF 1 (t) < y 1 est.p (X > t, Y > t) = 1 n 1(Tj > t) est.p (X t, X < Y ) = 1 n 1(Tj t, δ = 1) las estimaciones empíricas de P (X > t, Y > t) y P (X t, X < Y ) respectivamente. Donde 1 denota una función indicadora. 8

F 1 (t i ) y F 2 (t i ) son las soluciones simultáneas de (8) y (9), siendo F 1 y F 2 líneas rectas en cada intervalo (t i, t i+1 ). µ c (Ât ) est.p (X > t i, Y > t i ) = 0 (8) µ c ( ˆBt ) est.p (X t i, X < Y ) = 0 (9) El estimador cópula gráfico es de máxima verosimilitud y además bajo condiciones de independencia, coincide con el estimador Kaplan Meier (ver [6]). El algoritmo cópula gráfico pra la construcción de F 1 y F 2, basado en un algoritmo de bisección para encontrar raíces, se puede ver en datalle en Zheng & Klein (1995). 4. Chequeo del Estimador Cópula Gráfico Se realiza una comparación entre las funciones de distribución marginales de X y Y reales con las funciones de distribución marginales estimadas mediante el algoritmo cópula gráfico. También se compara la función de sobrevivencia conjunta de la Weibull bivariada con la estimada por medio de este estimador. Las comparaciones se realizan vía simulación utilizando el gráfico de probabilidad Weibull y el error cuadrático medio. 9

4.1. Comparación entre las funciones de distribución marginales verdaderas y las estimadas por el algoritmo cópula gráfico La comparación se realiza vía simulación de la siguiente manera: 1. La función de sobrevivencia conjunta de la Weibull bivariada esta dada por [ ( S(t 1, t 2 ) = exp t1 η 1 ) β1 /(1 τ) + ( t2 η 2 ) β2 /(1 τ) ] (1 τ) 0 τ < 1 (10) donde (β i, η i ), i = 1, 2 corresponden al parámetro de forma y de escala respectivamente de cada una de las funciones de distribución marginales X y Y, τ es el parámetro de dependencia y las distribuciones marginales son Weibull. Esta forma corresponde a la cópula de Gumbel-Hougaard de manera que para simular se hace a partir de ella utilizando el paquete cópula de R. 2. Los casos de tiempos de falla Weibull considerados, se diferencian entre sí, de acuerdo a la forma de la función hazard de los tiempos de falla. Cuando el parámetro β < 1, la tasa de falla es decreciente, cuando β > 1, la tasa de falla es creciente y cuando β = 1 la tasa de falla es constante.. Los parámetros de escala de la distribución Weibull bivariada se fijan η 1 = η 2 = 1, ya que el parámetro de dependencia, no depende del parámetro de escala (ver [3]). Los casos de tiempos Weibull a estudiar son: Tiempos de falla con parámetros de forma β i iguales. Modo de falla 10

con tasa de falla creciente vs. Modo de falla con tasa de falla creciente: β 1 = 2 y β 2 = 2. Tiempos de falla con parámetros de forma β i diferentes. Modo de falla con tasa de falla creciente vs. Modo de falla con tasa de falla constante:β 1 = 0,5 y β 2 = 1. 3. Asociados a cada uno de los dos escenarios de tiempos de falla Weibull expuestos anteriormente, hay 4 situaciones diferentes de acuerdo al parámetro de dependencia τ de Kendall, que toma los siguientes valores τ = 0,2, 0,5, 0,8, 0,9. Se considera además dos tamaños de muestra n = 50 y n = 200 de tiempos bivariados Weibull. 4. El chequeo procede de la siguiente manera: se analizan gráficos de probabilidad Weibull para la función de distribución marginal de X y Y, para determinar la bondad de ajuste a la distribución Weibull. Si el estimador cópula gráfico es correcto, es de esperar que se ajuste a una Weibull ya que las marginales de un distribución Weibull bivariada son Weibull univariadas (β i, η i ), i = 1, 2. Junto a los gráficos de probabilidad Weibull, se analizan gráficas donde se muestra la función de distribución marginal estimada por el algoritmo cópula gráfico y la función de distribución marginal verdadera. A continuación se realiza un análisis de bondad de ajuste para la función de distribución marginal de X. La figura 3 corresponde a un gráfico de probabilidad Weibull que permite comparar la función de distribución marginal de X estimada por el algoritmo cópula gráfico, con parámetros β 1 = 2, η 1 = 1 para un nivel de dependencia τ = 0,8 y la función de distribución marginal verdadera para los 11

tamaños de muestra n = 50 y n = 200, en el que se observa el buen ajuste que tiene la función de distribución marginal estimada por el algoritmo cópula gráfico a la distribución marginal real, mejorando el ajuste cuando el tamaño de muestra es mayor. β 1 = 2, η 1 = 1, n = 50 β 1 = 2, η 1 = 1, n = 200 0.99 0.98 0.95 0.9 F_Est F_ver 0.99 0.98 0.95 0.9 F_Est F_ver 0.8 0.7 0.6 0.5 0.4 0.8 0.7 0.6 0.5 0.4 Proporcion 0.3 0.2 0.1 Proporcion 0.3 0.2 0.1 0.05 0.04 0.03 0.05 0.04 0.03 0.02 0.02 0.01 0.01 0.251 0.422 0.688 1.09 0.049 0.227 0.56 1.45 Tiempo Tiempo Figura 3: Gráfico de probabilidad Weibull para la función de distribución marginal de X, β 1 = 2, η 1 = 1, τ = 0,8 para n = 50 y n = 200. La figura 4 compara la función de distribución marginal de X estimada por el algoritmo cópula gráfico y la función de distribución marginal verdadera. Esta gráfica permite afirmar el buen ajuste que tiene la marginal estimada a la función de distribución real, lo que también se observó con el gráfico de probabilidad Weibull. Este es un resultado de esperar, que se ajuste a una distribución Weibull, ya que las marginales de un distribución Weibull bivariada son Weibull univariadas (β i, η i ). 12

β 1 = 2, η 1 = 1, n = 50 β 1 = 2, η 1 = 1, n = 200 Proporción 0.0 0.2 0.4 0.6 0.8 1.0 F_Est F_ver Proporción 0.0 0.2 0.4 0.6 0.8 1.0 F_Est F_ver 0.5 1.0 1.5 0.0 0.5 1.0 1.5 Figura 4: Comparación entre la función de distribución marginal estimada y la función de distribución marginal verdadera para n = 50 y n = 200. 4.2. Comparación entre la función de sobrevivencia verdadera y la estimada por el algoritmo cópula gráfico Se comparan los percentiles t p, con p = 0,25, 0,50, 0,75, de la función de sobrevivencia conjunta de la Weibull bivariada verdadera definida en (10) denotada por S(t p ), con la función de sobrevivencia conjunta estimada mediante el algoritmo cópula gráfico Ŝ(t p) copula. A continuación se presenta un esquema general que permite realizar esta comparación vía simulación. 1. Para cada uno de los escenarios descritos en la subsección 4.1 se calcula la 13

función de sobrevivencia conjunta de la Weibull bivariada verdadera S(t p ) en los percentiles t p, con p = 0,25, 0,50, 0,75. 2. En los percentiles t p se encuentra la función de sobrevivencia conjunta estimada mediante el algoritmo cópula gráfico. Esta función está definida como { ( ) 1 α 1 ( ) } 1 α 1 1/α 1 Ŝ(t) copula = 1 F + 1 1 F 1 (11) 2 donde F 1 y F 2 son las estimaciones de las distribuciones marginales de X y Y, encontradas a partir del estimador cópula gráfico y α es el parámetro de dependencia de la cópula que mide el grado de asociación entre los tiempos de falla X y Y (ver [5]). Este parámetro se relaciona con el coeficiente τ de Kendall, de la siguiente manera τ = 1 α 1 Para encontrar los valores de Ŝ(t p) copula, se calcula inicialmente el cuantil correspondiente para los tiempos mínimos en cada una de las probabilidades p = 0,25, 0,50, 0,75 y finalmente se encuentra el valor aproximado de la función de la sobrevivencia estimada en cada uno de los cuantiles. Para realizar la comparación de la función de sobrevivencia estimada por el algoritmo cópula gráfico con la función de sobrevivencia verdadera, se generan N =1000 muestras independientes para cada uno de los escenarios de simulación planteados. Para realizar esta estimación se lleva a cabo la siguiente metodología 14

Se generan muestras de tamaño n = 50 y n = 200 de tiempos bivariados Weibull, como se explicó en la subsección 4.1. En cada una de las muestras de tiempos bivariados Weibull obtenidos se encuentra el mín {T 1, T 2 }. Se estima la función de sobrevivencia mediante la ecuación (11) para cada uno de los casos de interés. 3. El chequeo procede de la siguiente manera a. Se realiza un gráfico de probabilidad Weibull para comparar la función de sobrevivencia conjunta de la Weibull bivariada verdadera y la función de sobrevivencia estimada mediante el algoritmo cópula gráfico, lo que permite tener una idea visual de cercanía entre estas dos funciones. b. Se calcula el error cuadrático medio (ECM) entre la función de sobrevivencia verdadera S(t p ) y la función de sobrevivencia estimada Ŝ(t p ) copula en cada uno de los percentiles mencionados anteriormente. ECM(Ŝ(t p) copula ) = 1 N N 2 (Ŝ(tp ) copula S(t p )) j=1 El análisis presentado a continuación corresponde a los resultados obtenidos para el caso del tamaño de muestra n = 200. En el cuadro 1 se muestra el error cuadrático medio para la función de sobrevivencia conjunta de la Weibull bivariada estimada en cada uno de los percentiles t p, encontrándose que el valor de la función de sobrevivencia estimada mediante el algoritmo cópula gráfico está muy cercano a valor de la función de sobrevivencia conjunta verdadera. Es decir las estimaciones son buenas. 15

Cuadro 1: Error cuadrático medio para la función de sobrevivencia conjunta de la Weibull bivariada estimada en los percentiles t p, con p = 0,25, 0,50, 0,75 para n = 200. Modelo p = 0,25 p = 0,50 p = 0,75 β 1 = 2, β 2 = 2, η 1 = 1, η 2 = 1, τ = 0,2 0.01226050 0.01177581 0.01058943 β 1 = 2, β 2 = 2, η 1 = 1, η 2 = 1, τ = 0,5 0.01204265 0.01111511 0.00623636 β 1 = 2, β 2 = 2, η 1 = 1, η 2 = 1, τ = 0,8 0.00703448 0.01032255 0.00473743 β 1 = 2, β 2 = 2, η 1 = 1, η 2 = 1, τ = 0,9 0.00839402 0.00926500 0.00392679 β 1 = 2,5, β 2 = 2, η 1 = 1, η 2 = 1, τ = 0,2 0.00986765 0.01375890 0.01045919 β 1 = 2,5, β 2 = 2, η 1 = 1, η 2 = 1, τ = 0,5 0.00756503 0.01324732 0.00703953 β 1 = 2,5, β 2 = 2, η 1 = 1, η 2 = 1, τ = 0,8 0.00842015 0.01268851 0.00453430 β 1 = 2,5, β 2 = 2, η 1 = 1, η 2 = 1, τ = 0,9 0.00506055 0.01358307 0.00447026 La figura 5 muestra la función de sobrevivencia conjunta Weibull bivariada verdadera y la función de sobrevivecia estimada mediante el algoritmo cópula gráfico, correspondiente a tiempos de falla Weibull con parámetros de forma iguales. La linea recta corresponde a S(t p ) que en el gráfico se denota por S-ver y la línea punteada hace referencia a Ŝ(t p) copula denotada por S-Est. Este gráfico muestra que la función de sobrevivencia estimada tiene una buena aproximación a la función de sobrevivencia real para este tamaño de muestra n = 200, para un nivel de dependencia τ = 0,8. 16

β 1 = 2, β 2 = 2, η 1 = 1, η 2 = 1, τ = 0.8 Proporción 0.9999 0.98 0.95 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.05 0.04 0.03 0.02 S_Ver S_Est 0.01 0.034 0.263 0.37 0.525 0.715 1.113 2.014 Tiempo Figura 5: Gráfico de probabilidad Weibull para la distribución de sobrevivencia conjunta con parámetros β 1 = 2, β 2 = 2, η 1 = 1, η 2 = 1 y parámetro de dependencia τ = 0,8, estimada por el algoritmo cópula gráfico, para un tamaño de muestra n = 200. 17

5. Conclusiones Se realizó un chequeo empírico del estimador cópula gráfico. Los gráficos de probabilidad Weibull y el error cuadrático medio permiten afirmar que el cópula gráfico logra estimar de manera muy buena las funciones de distribución marginales verdaderas y la función de sobrevivencia conjunta. 6. Trabajo Futuro En el caso de un modelo con más de dos riesgos competitivos dependientes, se propone como trabajo futuro extender el estimador cópula gráfico implementando el método de combinación de riesgo ( risk pooling method ) propuesto por Lo & Wilke (2010) cuando la cópula es Arquimediana, con el objetivo de estimar las funciones de distribución marginales y la función de sobrevivencia conjunta. Referencias [1] C.Genest, and J. Mackay.(1986). The joy of copulas: Bivariate distributions with uniform marginals. The American Statistician 40(4) :280-283. [2] S.Lo, and R.A. Wilke.(2010). A copula model for dependet competing risks. Journal of the Royal Statistical Society 59 (2) :259-376. [3] J.Lu, and G. Bhattacharyya.(1990). Some new constructions of bivariate Weibull models. Annals of the Institute of Statistical Mathematics 42 (3) :543-559. 18

[4] M.Pintilie.(2006). Competing Risks: A Practical Perspective.John Wiley & Sons. [5] S.Yáñez, H.A. Brango, C.M. Lopera, and M.C. Jaramillo.(2011). Comparación entre riesgos competitivos vía estimador cópula gráfico. Revista Colombiana de Estadística 34 (2) :231-248. [6] M.Zheng, and J.P.Klein. (1995). Estimates of marginal survival for dependent competing risks based on an assumed copula. Biometrika 82(1) :12-38. 19