Modelación de los tiempos de supervivencia en pacientes con leucemia

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Modelación de los tiempos de supervivencia en pacientes con leucemia"

Transcripción

1 Tlamati Sabiduría, Volumen 7 Número Especial 2 (2016) 4 Encuentro de Jóvenes Investigadores CONACYT Acapulco, Guerrero 21, 21 y 23 de septiembre 2016 Memorias Modelación de los tiempos de supervivencia en pacientes con leucemia Eduardo Pérez Castro (Becario) Unidad Académica de Matemáticas de la UAGro Programa Delfín laloperezcastro@gmail.com Área en la que participa: I Físico-Matemáticas y ciencias de la tierra Dra. Angélica Hernández Quintero (Asesor) Profesor-Investigador del Departamento de Estadística de la Universidad Autónoma de Aguascalientes angelica.hernandez.q@gmail.com Resumen Se realizó un análisis estadístico para analizar los tiempos de supervivencia en pacientes con leucemia de los Estados Unidos. Se estudió los registros de la base SEER la cual comprende información entre los años El objetivo fue analizar si las variables raza, sexo, grado del cáncer y grupos de edad influyen en los tiempos de supervivencia de los pacientes. El análisis incluye estimaciones de la función de supervivencia por el estimador KaplanMeier, comparación de las curvas de supervivencia mediante el test de log-rank, ajustes de modelos paramétricos y obtención del mejor modelo semiparamétrico de riesgos proporcionales (Modelo de Cox). El análisis estadístico se realizó en el software R y se utilizó un nivel de significancia del 5% para obtener las conclusiones correspondientes. Como resultado del análisis se encontró que, si existe diferencia en los tiempos de supervivencia respecto a las variables, sexo, grado del cáncer y grupos de edad, siendo los hombres los que tienen menor supervivencia con respecto a las mujeres. Con respecto a la variable grado, los pacientes con grado I son los que sobreviven más tiempo con respecto a los otros grados. Finalmente, para la variable grupo de edad los pacientes con edad entre 0-15 años son los que sobreviven más tiempo. Los modelos más adecuados para ajustar los tiempos de supervivencia fueron el modelo log-normal, log-logístico y el modelo Gompertz, y el modelo de riesgos proporcionales de Cox se ajusta mejor con las variables explicativas sexo, edad y grado del cáncer. Palabras Clave:Análisis de supervivencia, estimador Kaplan-Meier, modelos paramétricos, modelo de Cox, leucemia.

2 Introducción 4 Encuentro de Jóvenes Investigadores CONACYT Acapulco, Guerrero 21, 22 y 23 de septiembre 2016 La leucemia es un cáncer de las células sanguíneas, la mayoría de las células de la sangre se forman en la médula ósea. En el caso de la leucemia, las células sanguíneas inmaduras se vuelven cancerosas. Estas células no funcionan como deberían y congestionan a las células sanguíneas sanas en la médula ósea. La leucemia, es el segundo cáncer de la sangre más común después del linfoma. De acuerdo a los últimos reportes del Instituto Nacional del Cáncer de los Estados Unidos (NCI, por sus siglas en ingles), este año, se calcula que se diagnosticará de Leucemia Mieloide Aguda (AML) a 19,950 personas de todas las edades (11,130 hombres, y 8,820 mujeres) en los Estados Unidos. Se calcula que este año se producirán 10,430 muertes (5,950 hombres, y 4,480 mujeres) por AML. En las ciencias de la salud como la medicina, interesa saber qué factores influyen en función del tiempo, en la ocurrencia de un determinado acontecimiento como es la muerte. En este artículo se aplicó la Teoría del Análisis de Supervivencia, analizando una base de datos con registros de pacientes con leucemia de los Estados Unidos (base SEER, [4]). Para ello, se estudia el tiempo que transcurre desde el primer diagnóstico de cáncer de leucemia y la muerte del paciente. Materiales y Métodos Elementos dela Teoría del Análisis de Supervivencia El análisis de supervivencia tiene como objeto de estudio el tiempo de seguimiento hasta la ocurrencia de un evento de interés y cobra vital importancia cuando existen observaciones censuradas [2]. Existen varios tipos de censuras: por la derecha, por la izquierda y por intervalos, para más detalle ver [1]. Para este análisis, trabajaremos con la censura más común, la censura aleatoria por la derecha, la cual es definida cuando sólo se sabe que el individuo siguió vivo hasta cierto tiempo, y no se tiene información del paciente entonces su tiempo de ocurrencia es mayor que el tiempo de censura (el último tiempo en que se le vio con vida). Definiciones básicas En esta sección se explicarán las definiciones más importantes en la literatura del Análisis de Supervivencia, las cuales fueron tomadas de [1]. Función de supervivencia y fuerza de mortalidad Defínase T como el tiempo de supervivencia de un individuo, el cual es una variable aleatoria continua y positiva que se encuentra asociada con el tiempo que transcurre desde el tiempo de origen hasta la ocurrencia del evento.supóngase que la variable aleatoria T tiene una función de distribución, F T (t) y una función de densidad f T (t).la función de distribución de T está definida por:

3 Tlamati Sabiduría Volumen 7 Número Especial 2 (2016) t F T (t) = P[T t] = f(u)du, 0 que representa la probabilidad de que el evento de interés ocurra antes del tiempo t. La función de supervivencia se define como la probabilidad de que el evento ocurra después de un tiempo t, es decir: S T (t) = P[T > t] = 1 F T (t) (1) Otra interpretación de (1) es que representa la proporción de individuos que continúa con vida al tiempo t. La función de supervivencia es una función monótona decreciente con respecto al tiempo y presenta las siguientes propiedades: S T (t) = 1, t = 0, S T (t) = 0, t. La fuerza de mortalidad, representa la tasa instantánea de mortalidad para un individuo que sobrevive al tiempo t y se define de la siguiente manera. λ T (t) = lim [P[t T < t + t T t] ] = f(t) t 0 S(t) La función anterior también es denominada tasa de mortalidad, tasa instantánea de muerte, función de riesgo. Dicha función puede ser creciente, decreciente, constante, o ser combinación de las anteriores. Cabe mencionar que la fuerza de mortalidad no es una probabilidad, es una función del tiempo. Una función es fuerza de mortalidad si y solo si satisfacen las siguientes propiedades: 1. λ T (x) 0, x, 2. λ T (x)dx = 0 Estimador de Kaplan y Meier El estimador Kaplan Meier es un estimador no paramétrico de la función de supervivencia, su construcción es de la siguiente manera: supóngase que existen n individuos en la muestra con tiempos de supervivencia t 1,, t n, respectivamente. Algunas de estas observaciones pueden ser censuradas por la derecha y es posible que existan observaciones con el mismo tiempo de supervivencia. Supóngase además que existen r tiempos de muerte distintos con r n. La manera de obtener el estimador Kaplan Meier es la siguiente, primero se ordenan los distintos tiempos de muerte en forma ascendente, t 1,, t n, el j-ésimo tiempo de muerte ordenado t

4 4 Encuentro de Jóvenes Investigadores CONACYT Acapulco, Guerrero 21, 22 y 23 de septiembre 2016 se denotará por t (j) paraj = 1,, r. Éstos r tiempos definen los intervalos de tiempo [0, t (1) ), [t (1), t (2) ),, [ t (r 1), t (r) ) donde [t (j), t (j+1) ) denotará al j-ésimo intervalo. Defínase n j : el número de individuos que se encuentran con vida justo antes del tiempo t (j) incluyendo los que están por morir en este tiempo. d j : el número de muertes al tiempo t (j), note que 0 d j n j. Por lo tanto, el estimador de Kaplan-Meier de la función de supervivencia está dado por: Test de log-rank S K M (t) = ( n i d i ) n i j i=1 t [t (j), t (j+1) ) Conocido también en la literatura como test de Mantel y Haenszel, es una prueba no paramétrica que permite estudiar la comparación de tiempos de supervivencia entre dos grupos, su construcción se basa en considerar los tiempos de supervivencia entre dos grupos por separados. Denótese por Grupo I y Grupo II a los dos grupos respectivamente, y por t 1, t 2,, t r a los r tiempos de muerte distintos y ordenados de forma ascendente registrados en ambos grupos. Para cadat j se denota pord 1j, d 2j, n 1j y n 2j, como el número de muertes registradas al tiempot j y como el número de individuos en riesgo de morir justo antes del tiempot j, del Grupo I y del Grupo II, respectivamente. Por tanto, se tiene un total ded j = d 1j + d 2j muertes y un total den j = n 1j + n 2j individuos en riesgo al instantet j. Toda esta información puede ser capturada en una tabla de contingencia de tamaño 2 2, la tabla de contingencia correspondiente al instantet j queda definida como se muestra en la tabla siguiente. Grupo No. de muertes al instante t j No. de sobrevivientes después de t j No. de individuos en riesgo justo antes de t j I d 1j n 1j d 1j n 1j II d 2j n 2j d 2j n 2j Total d j n j d j n j La hipótesis nula correspondientes es,h 0 : S Grupo I (t) = S Grupo II (t),. La idea para contrastar está hipótesis nula es considerar las discrepancias entre el número de muertes en cada grupo con respecto al número de muertes esperado bajo la hipótesis nulah 0, para cada instante de tiempot j, j = 1,, r. En general si se tienen K grupos, la hipótesis nula se define la hipótesis nula como: H 0 : S Grupo I (t) = S Grupo II (t) = S Grupo III (t) = = S Grupo K (t) y a la hipótesis alternativa de la siguiente manera: H a : S Grupo i (t) S Grupo j (t), para algún i j. En ambos casos se rechaza H 0 si el valor p α, donde α denota el nivel de significancia.

5 Tlamati Sabiduría Volumen 7 Número Especial 2 (2016) Modelos paramétricos comunes En este apartado se muestran los modelos paramétricos más utilizados en la teoría del Análisis de Supervivencia (ver tabla 1), para más detalle consultar [1]. Distribución Función de riesgoh(t) Función de supervivencias(t) Función de densidadf(t) Exponencial γ > 0 t 0 Weibull α, γ > 0 t 0 Log-normal μ R, σ > 0 t 0 Log-logístico α, γ > 0 t 0 Gompertz θ, α > 0 t 0 γ exp[ γt] γexp[ γt] αγ(γt) α 1 exp( γα α ) αγt α 1 exp{ (γα) α } f(t) S(t) 1 Φ ( In(t) μ ) σ φ( In (t) μ αγt α 1 1 αγt α γt α 1 + γt α [1 + γt α ] 2 θe αt exp [ θ α (1 eαt )] θe αt exp [ θ α (1 eαt )] Tabla 1: Función de riesgo, función de supervivencia y función de densidad de modelos paramétricos del análisis de supervivencia más utilizados. La estimación de parámetros se realiza a través del método de máxima verosimilitud, donde la función de verosimilitud para n observaciones independientes es, L n (θ) = n i=1 {f(y i )} i {S(Y i )} 1 i, donde i = 1(T C) denota el indicador de censura, C es la variable aleatoria asociada a la censura y Y = min(t i, C i ). Modelo de Cox El modelo de Cox (1972) es el modelo de regresión más usado para datos de supervivencia en el área de la medicina. En el modelo de Cox, el riesgo para el i-ésimo individuo se define mediante la siguiente expresión: t σ ) λ(t; Z i (t)) = λ 0 (t)e βʼz i (t) (2) donde Z i (t) es el vector de covariables para i-ésimo individuo en el tiempo t. El modelo (2) se denomina un modelo semiparamétrico debido a que incluye una parte paramétrica y otra parte no paramétrica. La parte paramétrica es r i (t) = e βʼz i (t), es llamada puntaje de riesgo (risk escores), y β es llamado el vector de parámetros de regresión.

6 4 Encuentro de Jóvenes Investigadores CONACYT Acapulco, Guerrero 21, 22 y 23 de septiembre 2016 La parte no paramétrica es λ 0 (t) que es llamada función de riesgo base, es una función arbitraria y no especificada. El modelo de regresión Cox se llama también modelo de riesgos proporcionales debido a que el cociente entre el riesgo para dos sujetos con el mismo vector de covariables es constante en el tiempo, es decir: METODOLOGÍA λ(t; Z i (t)) λ (t; Z j (t)) = λ 0(t)eβʼZi(t) eβʼzi(t) λ 0 (t)e = βʼz j (t) e βʼz j (t) La finalidad de este estudio es modelar los tiempos de supervivencia en pacientes con leucemia, los cuales solo han presentado una sola vez la enfermedad. Se realizó un estudio longitudinal a una base de datos proporcionada porthesurveillance, Epidemiology, and EndResults (SEER) del Instituto Nacional del Cáncer de los Estados Unidos, la cual comprende registros de pacientes entre los años 1972 y 2012, constituida por 367,088 registros y 134 variables. La base de datos que se analizó considera todos los registros de los pacientes de las áreas geográficas que se muestran en la Figura 1. De los registros de la base SEER se eliminaron los pacientes sin información suficiente y con 2 o más recurrencias del cáncer. Figura 1: Área geográfica SEER Las variables consideradas para este estudio fueron: Variable Edad Raza Sexo del paciente Descripción Edad del paciente en años al diagnóstico de la enfermedad, en nuestro caso se clasificaron en 5 grupos. 1: 0-15 años, 2:16-30 años, 3:31-45 años, 4: años, 5: 60 años y más 1: raza blanca, 2: raza negra 1: hombres, 2: mujeres

7 Tlamati Sabiduría Volumen 7 Número Especial 2 (2016) Grado de diferenciación del cáncer Grado I Diferenciado, Grado II Moderadamente diferenciado Grado III Poco diferenciado Grado IV Indiferenciado. Tabla 2: Variables de estudio Los datos fueron procesados y analizados a través de R commander versión utilizando la paquetería survival. Se predefinió un valor de significanciaα = El análisis de supervivencia se realizó mediante estadística no paramétrica, a través del estimador Kaplan Meier para calcular la probabilidad de supervivencia y graficar las curvas. Posteriormente, las curvas de supervivencia fueron comparadas mediante el test Log-Rank, se ajustaron los modelos paramétricos más comunes en el análisis de supervivencia (exponencial, log-normal, Weibull, log-logístico, Gompertz) y para el ajuste del modelo de Cox, las variables de tipo cualitativo se transformaron en variables de tipo dummy, una vez transformadas las variables, se ajustó el modelo con el método de eliminación hacia atrás y validando los supuestos. Resultados La base final consistió en 18,095 registros de pacientes, con la cual se procedió a realizar el análisis respecto a cada una de las variables de interés: raza, sexo, grado y grupo de edad. I.- Raza La distribución de registros respecto a la variable raza se muestra en la tabla 3. Blanca Raza Negra Tabla 3: Distribución por raza Estimación de las curvas de supervivencia vía Kaplan-Meier para la variable raza Primeramente, se realizaron las curvas de supervivencia para ver el comportamiento de los tiempos de supervivencia encada raza. En el gráfico 2 puede observarse que la curva de supervivencia de los pacientes de raza blanca (Raza I) está por debajo de la curva de los pacientes de raza negra(raza II) a partir de los años de supervivencia, lo cual indicaría que los pacientes de raza blanca son los que sobreviven menos al cáncer de leucemia. Las curvas generadas fueron comparadas mediante el test de Log-Rank y como el valor p valor = > 0.05 se concluyó que las curvas de supervivencia son estadísticamente iguales. Funcion de supervivencia por raza Probabilidad de supervivencia RAZA I RAZA II Meses de supervivencia

8 4 Encuentro de Jóvenes Investigadores CONACYT Acapulco, Guerrero 21, 22 y 23 de septiembre 2016 Gráfico 2: Curvas de supervivencia por razas Algunos de los valores obtenidos del estimador Kaplan Meier con su respectivo intervalo de confianza y error estándar para el caso de la raza blanca puede verse en la tabla 4. Tabla 4: Resúmenes estadísticos para la variable raza blanca La tabla 4 incluye la siguiente información: time número de meses de seguimiento n. risk número de individuos en riesgo antes del tiempo n.event número de muertos al tiempo Survival probabilidad de que un individuo sobreviva por un número de meses mayor al tiempo std. err error estándar de la supervivencia lower95% CI límite de confianza inferior del 95% para la supervivencia upper 95% CI límite de confianza superior del 95% para la supervivencia La tabla 4 presenta los valores de la función de supervivencia utilizando el estimador Kaplan-Meier. Se observa que a los años la probabilidad de sobrevivir es de 0.80 y para los años es de Además, también puede verse que el 75% de los pacientes con leucemia sobrevive aproximadamente hasta los 1.25 años y el 50% logra sobrevivir hasta 7.5 años, el 27%

9 Tlamati Sabiduría Volumen 7 Número Especial 2 (2016) sobrevive más de años. El tiempo de supervivencia media para los pacientes de raza blanca se ubicó en años con un error estándar de 0.15 años. En lo que respecta a la raza negra se comprobó a través del test de log-rank, que no existe diferencia estadística con la curva de supervivencia de la raza blanca, por lo tanto se puede concluir que la raza no influye estadísticamente en la supervivencia de los pacientes. II.- SEXO La distribución de registros para la variable género se muestran en la tabla siguiente Sexo Masculino Femenino Tabla 5: Distribución por sexo Se generaron las curvas de supervivencia utilizando el estimador Kaplan-Meier, gráfico 3.Puede observarse que las mujeres sobreviven más tiempo que los hombres, las curvas a través de log-rank fueron comparadas y como p valor < 0.05, las curvasson estadísticamente diferentes, por lo tanto el sexo es un factor para la supervivencia en pacientes con leucemia. Funcion de supervivencia por sexo Probabilidad de supervivencia MASCULINO FEMENINO Meses de supervivencia Grafico 3: Curvas de supervivencia por sexo De los valores obtenidos con el estimador Kaplan Meier se obtuvo que 75% de los pacientes del sexo masculino con leucemia sobrevive hasta 1.25 años y el 26% sobrevive más de años. El tiempo de supervivencia media se ubicó en 6.25 años con un error estándar de 0.20 años.

10 4 Encuentro de Jóvenes Investigadores CONACYT Acapulco, Guerrero 21, 22 y 23 de septiembre 2016 Para el sexo femenino, se observó que 75% de los pacientes con leucemia sobrevive hasta 1.66 años, el 50% sobrevive hasta 8.083, el 29% sobrevive más de años. El tiempo de supervivencia media se ubicó en 8 años con un error estándar de años. Con este análisis se concluye que los pacientes del sexo femenino sobreviven más tiempo que los pacientes del sexo masculino. III.-GRADOS La distribución de los registros de los pacientes por grados del cáncer se muestra en la tabla siguiente Grado del cáncer Grado I Grado II Grado III Grado IV Tabla 6: Distribución por grado del cáncer Las curvas de supervivencia para cada grado obtenidas a través del estimador Kaplan- Meier se muestra en la Gráfico 4. Del gráfico 4 se observan que las curvas de los pacientes con grado I y II son los que tienen más probabilidades de supervivencia. Grafica 4: Curvas de supervivencia por grado del cáncer Las curvas de supervivencia mediante el test de log Rank fueron comparadas, donde se encontró que las curvas de supervivencia de los pacientes con grado de cáncer I y II son estadísticamente iguales con p valor = 0.272, en cambio los demás pares de curvas (I y III, I y IV,, III y IV) son estadísticamente distintas con p valor = 0.

11 Tlamati Sabiduría Volumen 7 Número Especial 2 (2016) En la tabla 7 se muestran los cuartiles para los cuales, los pacientes han experimentado la muerte, respecto a los distintos grados. Por ejemplo, para el grado I el 25% de los pacientes han fallecido antes de los 3.58 años una vez diagnosticado el cáncer, el 50% ha fallecido antes de los años y el 75% ha fallecido antes de los Grado 25% 50% 75% Media de supervivencia(e.e) I (0.33 años) II (0.38 años) III (0.19 años) IV (0.38 años) Tabla 7: Resumen estadístico para el tiempo de supervivencia (años), cuartiles, media y error estándar de la media (e.e) IV.-GRUPOS DE EDAD La distribución de los registros de los pacientes por grupos de edad se muestra en la tabla 8, y las curvas de supervivencia vía Kaplan Meierson presentadas en el gráfico 5. Del gráfico 5 se observa que los pacientes con mayor probabilidad de supervivencia son los de 0-15 años y años, en cambio los que tienen menor supervivencia son los pacientes de 61 años en adelante. Grupos de edad 0-15 años años y más Tabla 8: Distribución por grupos de edad Funcion de supervivencia por grupos de edad Probabilidad de supervivencia I II III IV V Meses de supervivencia Grafico 5: Curvas de supervivencia por grupos de edad A través Log-Rank se hizo la comparación de las curvas de supervivencia, donde se encontró que las curvas de supervivencia de los grupos de edad I - II y III - II son estadísticamente iguales con p valor = y p valor = calculados respectivamente, en cambio los demás pares de grupos de edad son estadísticamente diferentes con p valor < 0.05 calculado.

12 4 Encuentro de Jóvenes Investigadores CONACYT Acapulco, Guerrero 21, 22 y 23 de septiembre 2016 En la tabla 9 se muestran los cuartiles en el cual los pacientes han experimentado la muerte, respecto a los distintos grupos de edad. Por ejemplo, para el grupo de edad de años el 25% de los pacientes han fallecido antes de los 2.75 años una vez diagnosticado el cáncer, el 50% ha fallecido antes de los 10 años. Obsérvese que existen grupos de edad en los que no se han alcanzado estos valores. Grupo de edad 25% 50% 75% Media de supervivencia (e.e) 0-15 años (0.94 años) años (0.68 años) años (0.40 años) años (0.27 años) 61 años y más (0.19 años) Tabla 9: Resumen estadístico para el tiempo de supervivencia (años), cuartiles, media y error estándar de la media (e.e) Selección de modelos paramétricos Si se asume que la variable aleatoria T, que cuantifica el tiempo desde el origen hasta la ocurrencia de un evento sigue una determinada distribución se puede cuantificar las probabilidades de sobrevivir a un determinado tiempo t. Anteriormente, se definieron los modelos paramétricos más usados en la literatura del análisis de supervivencia. Con los datos de estudio se ajustaron los modelos para cada clasificación mencionada anteriormente, la tabla 10 muestra los estimadores de los parámetros para cada modelo y en el gráfico 6 se muestra las curvas de supervivencia para cada modelo ajustado para cada variable de estudio. Visualmente, el mejor modelo paramétrico para ajustar los datos será aquel cuya curva de supervivencia se parezca más al estimador Kaplan Meier o el que presente una relación lineal. Ajuste de modelos paramétricos Modelo Exponencial Modelo Weibull S^ t Kaplan-Meier exponencial Weibull log-normal log-logísitco Gompertz tiempo(meses) S^ t 1 1 S^ t 1 1 S^ t t Modelo Log-normal log t Modelo gamma S^ t log log S^ t S^ t 1 1 S^ t log t Modelo log-logísitico log t Modelo gamma t t 1 3

13 Tlamati Sabiduría Volumen 7 Número Especial 2 (2016) Gráfico 6: Ajustes del modelo paramétrico generaly linealización de modelos Categoría Modelos o modelo que Parámetros estimados mejor se ajusta General Modelo log-logístico Modelo Gompertz σ = 2.16 ; μ = 4.56 γ = 0.78 ; α = ρ 1 = 0.010; ρ 2 = Raza blanca Modelo log-logístico Modelo Gompertz σ = 2.16 ; μ = 4.55 γ = 0.78 ; α = ρ 1 = 0.010; ρ 2 = Raza negra Modelo Gompertz ρ 1 = 0.010; ρ 2 = Sexo masculino Modelo log-logístico Modelo Gompertz σ = 2.14 ; μ = 4.44 γ = 0.79 ; α = ρ 1 = 0.011; ρ 2 = Sexo femenino Pacientes con grado de cáncer I Modelo log-logístico Modelo log-logístico Modelo Gompertz σ = 2.17 ; μ = 4.69 γ = 0.78 ; α = σ = 1.89 ; μ = 4.93 γ = 0.95 ; α = ρ 1 = 0.005; ρ 2 = Pacientes con grado de cáncer II Modelo Gompertz ρ 1 = 0.009; ρ 2 = Pacientes con grado de cáncer III Modelo Gompertz ρ 1 = 0.01; ρ 2 = σ = 2.08 ; μ = 4.43 Pacientes con grado de cáncer IV Modelo Gompertz ρ 1 = 0.032; ρ 2 = Pacientes con edad entre 0-15 Modelo Gompertz ρ 1 = 0.034; ρ 2 = años Pacientes con edad entre años Modelo Gompertz ρ 1 = 0.02; ρ 2 = σ = 3.06; μ = 5.45 Pacientes con edad entre años Pacientes con edad entre años Pacientes con edad de 61 años en adelante Modelo log-logístico Modelo Gompertz σ = 2.45; μ = 5.13 γ = 0.69 ; α = ρ 1 = 0.007; ρ 2 = σ = 2.07; μ = 4.90 Modelo Weibull γ = 0.67; α = Tabla 10: Ajustes de modelos paramétricos Ajuste del modelo de riesgos proporcionales de Cox El modelo de Cox que mejor se ajusta para los datos de registros de pacientes con leucemia se puede ver en la tabla 11 siguiente. Tabla 11: Estimación de parámetros del modelo de Cox

14 4 Encuentro de Jóvenes Investigadores CONACYT Acapulco, Guerrero 21, 22 y 23 de septiembre 2016 Observamos que el modelo es significativo para las variables pronósticos (sexo, edad, grado), para un 5% de nivel de significancia, debido a que los p-valores calculados son menores que Para el test de puntaje, test de razón de verosimilitud y el test de Wald se obtuvo un p valor de 0.00, por lo cual concluimos que el modelo es significativo por cualquiera de los tres criterios.en el gráfico 6, puede verse que el estimador Kaplan-Meier está por encima por el gráfico del ajuste del modelo comparacion de Cox. del ajuste del modelo de Cox con el estimad de K-M Supervivencia Ajuste por Cox Estimador de KM Meses Gráfico 6: Comparación del ajuste del modelo de Cox y estimador de Kaplan Meier En la tabla 11, puede verse que el exponencial de coeficiente estimado para la edad (V4), es de Así por cada año que aumenta la edad del paciente, el riesgo de morir por leucemia es de veces la edad menor. Por ser una variable continua, la interpretación puede hacerse, para un periodo distinto de tamaño utilizando a (cβ ), en vez de β, donde c es el número de años contenidos en el período. Por ejemplo, si tomamos períodos de 15 años el riesgo de morir por leucemia es 1.11 = exp( ) veces la edad de la menor. La interpretación para el sexo (V15), es análoga a la de la edad, para el exponencial del coeficiente estimado fue de 0.82, para en este caso la interpretación es de la siguiente manera, los hombres tienen 0.82 veces riesgo de morir que las mujeres. Lospacientes del grado II (V16), tienen 2.53 de riesgo de morir que los pacientes del grado I, para los del grado III (V17) tiene 2.38 riesgo de morir más que los pacientes del grado I y los pacientes del grado IV(V18),tienen 1.80 riesgo de morirmás que los pacientes del grado I. Discusión y conclusiones Sin lugar a dudad el Análisis de supervivencia constituye una herramienta poderosa para el análisis de datos en ciencias de la salud como la medicina, pero sin embargo puede ser aplicada

15 Tlamati Sabiduría Volumen 7 Número Especial 2 (2016) en otras disciplinas en donde se quiera determinar las funciones del tiempo transcurrido desde un instante de inicio del seguimiento de un conjunto de individuos hasta la ocurrencia de un evento de interés. El presente trabajo incluye el ajuste y selección de modelos paramétricos para cada categoría mencionada anteriormente, pero aún falta quedarnos con el mejor modelo que se adecue a los datos, esto sería un trabajo a futuro, buscar una metodología estadística que seleccione el mejor. Se concluye que el modelo de Cox que se presenta es adecuado ya que cumple con los supuestos, los cuales fueron validados mediante los criterios de test de puntaje, test de razón de verosimilitud y el test de Wald, aunque también se puede validar mediante pruebas visuales, residuos martingalas, residuos Schoenfeld. El sexo, la edad y el grado son factores pronósticos para la leucemia, en cambio la raza no lo es. El análisis se hizo a través de R commander, pero también se puede hacer en otros softwares como SPSS, STATA, S-PLUS por mencionar algunos. Agradecimientos Agradezco al Programa Delfín y a la Universidad Autónoma de Guerrero por otorgarme la beca y así realizar mi primer verano de investigación científica, también quiero agradecer infinitamente a la Dra. Angélica Hernández Quintero del departamento de estadística de la Universidad Autónoma de Aguascalientes por haberme aceptado en su proyecto de investigación, me llevo la satisfacción de haber aumentado las ganas por querer aprender y descubrir más acerca de esta maravillosa ciencia que lleva por nombre ESTADISTÍSTICA y sobre todo agradecer a esos maestros que con paciencia y entusiasmo enseñan lo teórico y práctico de esta misma. Referencias [1] Hernández, A. (2012). Introducción a la inferencia estadística para datos de supervivencia. México: Editorial académica española. [2]Borges, Rafael E. (2005). Análisis de supervivencia aplicado a diálisis peritoneal (DPA). Revista Colombiana de Estadística, 28: pp [3] Instituto Nacional del Cáncer (NationalCancerInstitute, NCI): Lo que usted necesita saber sobre: Leucemia: Disponible en: [4] (S/a). (S/f).NATIONAL CANCER INSTITUTE: Survillance, Epidemiology, and End Results Program. Extraído de [5] R Development Core Team (2015). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN , URL

Estadística Computacional. M. González

Estadística Computacional. M. González Estadística Computacional M. González Facultad de Medicina. Universidad de Extremadura M. González (UEx) Estadística Computacional 1 / 23 Índice Modelos Lineales Generalizados Bioensayos: Modelos Dosis-Respuesta

Más detalles

El modelo aditivo de Aalen. Una alternativa al modelo de riesgos proporcionales

El modelo aditivo de Aalen. Una alternativa al modelo de riesgos proporcionales El modelo aditivo de Aalen. Una alternativa al modelo de riesgos proporcionales Director: Klaus Langohr Co-directora: Guadalupe Gómez Melis 9 de septiembre de 2016 El modelo aditivo de Aalen. Una alternativa

Más detalles

Taréa Completa. 2.- Se define una función de supervivencia por: a) f (36), b) h (50), c) H (75), d) E(T ),

Taréa Completa. 2.- Se define una función de supervivencia por: a) f (36), b) h (50), c) H (75), d) E(T ), Taréa Completa 1.- Sea T 1, T 2,..., T n variales aleatorias independientes de tiempos de supervivencia con distribución Weibull: f (t) = λγ (λt) γ 1 exp { (λt) γ } Cuando λ = 1, y γ 1, γ 2,..., γ n. Escriba

Más detalles

Análisis de supervivencia: el estimador de Kaplan-Meier. Miguel Rodríguez Barranco Granada, 27 de marzo de 2017

Análisis de supervivencia: el estimador de Kaplan-Meier. Miguel Rodríguez Barranco Granada, 27 de marzo de 2017 Análisis de supervivencia: el estimador de Kaplan-Meier Miguel Rodríguez Barranco Granada, 27 de marzo de 2017 INTRODUCCIÓN Survival analysis Time-to-event data analysis Lifetime data analysis Reliability

Más detalles

Análisis estadístico de los factores de riesgo que influyen en la enfermedad Angina de Pecho. Flores Manrique, Luz CAPÍTULO IV ANALISIS DE LOS DATOS

Análisis estadístico de los factores de riesgo que influyen en la enfermedad Angina de Pecho. Flores Manrique, Luz CAPÍTULO IV ANALISIS DE LOS DATOS CAPÍTULO IV ANALISIS DE LOS DATOS 4.1 DESCRIPCIÓN DE LOS DATOS Como ya se mencionó anteriormente, el tamaño de la población con la que se está trabajando es de 149 observaciones, 69 de ellas presentan

Más detalles

Indicaciones de trasplante de células hematopoyéticas

Indicaciones de trasplante de células hematopoyéticas Resultados Se obtuvieron en total los datos de 285 pacientes trasplantados entre el periodo de 1993 y 2012, de los cuales fueron 155 alogénicos y 130 autólogos. En la Gráfica 1 se muestra el porcentaje

Más detalles

Definición Una hipótesis es una afirmación acerca de un parámetro.

Definición Una hipótesis es una afirmación acerca de un parámetro. Capítulo 8 Prueba de hipótesis Existen dos áreas de interés en el proceso de inferencia estadística: la estimación puntual y las pruebas de hipótesis. En este capítulo se presentan algunos métodos para

Más detalles

Simulación y evaluación de la confiabilidad de un proceso de sistema de producción

Simulación y evaluación de la confiabilidad de un proceso de sistema de producción Simulación y evaluación de la confiabilidad de un proceso de sistema de producción Jorge Loor Quevedo 1, Fernando Sandoya 2 1 Ingeniero en Estadística Informática 2003 2 Director de Tesis. Matemático.

Más detalles

Métodos estadísticos en estudios de supervivencia

Métodos estadísticos en estudios de supervivencia Métodos estadísticos en estudios de supervivencia Belén San José, Elia Pérez y Rosario Madero Sección de Bioestadística. Hospital Universitario La Paz. Madrid. España. bjose.hulp@salud.madrid.org; epefer@gmail.com;

Más detalles

Estrategia de análisis estadístico de los datos. Inferencia Estadística y contraste de hipótesis

Estrategia de análisis estadístico de los datos. Inferencia Estadística y contraste de hipótesis Estrategia de análisis estadístico de los datos. Inferencia Estadística y contraste de hipótesis VDC Prof. Mª JOSÉ PRIETO CASTELLÓ MÉTODOS ESTADÍSTICOS. TÉCNICAS ESTADÍSTICA DESCRIPTIVA TEORÍA DE LA PROBABILIDAD

Más detalles

Algunas Distribuciones Continuas de Probabilidad. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

Algunas Distribuciones Continuas de Probabilidad. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides Algunas Distribuciones Continuas de Probabilidad UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides Introducción El comportamiento de una variable aleatoria queda

Más detalles

TEMA 4 Regresión logística

TEMA 4 Regresión logística TEMA 4 Regresión logística José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Esquema del tema Variable respuesta dicotómica. Ejemplo. El

Más detalles

FIGURA 39. ESQUEMA DE LAS PROBABILIDADES DE TRANSICIÓN ENTRE ESTADOS DE UNA SEMANA A LA SIGUIENTE

FIGURA 39. ESQUEMA DE LAS PROBABILIDADES DE TRANSICIÓN ENTRE ESTADOS DE UNA SEMANA A LA SIGUIENTE RESULTADOS 233 FIGURA 39. ESQUEMA DE LAS PROBABILIDADES DE TRANSICIÓN ENTRE ESTADOS DE UNA SEMANA A LA SIGUIENTE.132.128.872 sin contacto.167 contacto.58 contacto ingreso ambulatorio con centro de día

Más detalles

Regresión Lineal Múltiple

Regresión Lineal Múltiple Unidad 4 Regresión Lineal Múltiple Javier Santibáñez (IIMAS, UNAM) Regresión Semestre 2017-2 1 / 35 Introducción La idea de la regresión lineal múltiple es modelar el valor esperado de la variable respuesta

Más detalles

PUNTOS DE CAMBIO EN LA FUNCIÓN DE RIESGO

PUNTOS DE CAMBIO EN LA FUNCIÓN DE RIESGO PUNTOS DE CAMBIO EN LA FUNCIÓN DE RIESGO Guadalupe Yoanna Arenas Martínez, Francisco Solano Tajonar Sanabria a, Hugo Cruz Suárez a, Fernando Velasco Luna a. a Facultad de Ciencias Fisico Matematicas, BUAP,

Más detalles

ANALISIS DE FRECUENCIA EN HIDROLOGIA JULIAN DAVID ROJO HERNANDEZ

ANALISIS DE FRECUENCIA EN HIDROLOGIA JULIAN DAVID ROJO HERNANDEZ ANALISIS DE FRECUENCIA EN HIDROLOGIA JULIAN DAVID ROJO HERNANDEZ Probabilidad - Período de retorno y riesgo La probabilidad de ocurrencia de un fenómeno en hidrología puede citarse de varias Formas: El

Más detalles

Análisis de Supervivencia. Con R

Análisis de Supervivencia. Con R Análisis de Supervivencia Con R Estudios Longitudinales Con la finalidad de estudiar la distribución de los tiempos de supervivencia de un conjunto de individuos que estan en el estudio Ámbito médico Confiabilidad

Más detalles

Estimación por intervalos

Estimación por intervalos Capítulo 9 Estimación por intervalos 9.1. Introducción En este capítulo se desarrolla la estimación por intervalos donde el proceso de inferencia se realiza de la forma θ C, donde C = Cx) es un conjunto

Más detalles

DIFERENCIAS EN LA UTILIZACIÓN DE LA BIBLIOTECA DEL IIESCA ANTE UN CAMBIO DE INFORMACIÓN

DIFERENCIAS EN LA UTILIZACIÓN DE LA BIBLIOTECA DEL IIESCA ANTE UN CAMBIO DE INFORMACIÓN DIFERENCIAS EN LA UTILIZACIÓN DE LA BIBLIOTECA DEL IIESCA ANTE UN CAMBIO DE INFORMACIÓN Beatriz Meneses A. de Sesma * I. INTRODUCCIÓN En todo centro educativo, es de suma importancia el uso que se haga

Más detalles

Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple

Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple Temas Modelo de regresión lineal múltiple Estimaciones de Mínimos Cuadrados Ordinarios (MCO); estimación puntual y predicción

Más detalles

TEMA VI ANÁLISIS DE SUPERVIVENCIA

TEMA VI ANÁLISIS DE SUPERVIVENCIA TEMA VI ANÁLISIS DE SUPERVIVENCIA LECTURA OBLIGATORIA Análisis de Supervivencia. En Rial, A. y Varela, J. (2008). Estadística Práctica para la Investigación en Ciencias de la Salud. Coruña: Netbiblo. Páginas

Más detalles

ESTADÍSTICA INFERENCIAL

ESTADÍSTICA INFERENCIAL ESTADÍSTICA INFERENCIAL ESTADÍSTICA INFERENCIAL 1 Sesión No. 10 Nombre: Pruebas de hipótesis referentes al valor de la media de la población Contextualización En estadística existen dos métodos para la

Más detalles

Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos

Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos Metodología de la Investigación en Fisioterapia Miguel González Velasco Departamento de Matemáticas. Universidad de Extremadura M.

Más detalles

Análisis de supervivencia bivariado utilizando cópulas

Análisis de supervivencia bivariado utilizando cópulas Análisis de supervivencia bivariado utilizando cópulas Angélica Hernández Quintero IV verano de probabilidad y estadística, CIMAT 6 de julio de 2011 Angélica Hernández () Análisis de supervivencia bivariado

Más detalles

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS. Estimación de Kaplan Meier Bootstrap de la curva de supervivencia

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS. Estimación de Kaplan Meier Bootstrap de la curva de supervivencia UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS FACULTAD DE CIENCIAS MATEMÁTICAS E.A.P. DE..ESTADÍSTICA Estimación de Kaplan Meier Bootstrap de la curva de supervivencia Capítulo3. Estimación de la curva de supervivencia

Más detalles

ESTIMACIÓN Y PRUEBA DE HIPÓTESIS INTERVALOS DE CONFIANZA

ESTIMACIÓN Y PRUEBA DE HIPÓTESIS INTERVALOS DE CONFIANZA www.jmontenegro.wordpress.com UNI ESTIMACIÓN Y PRUEBA DE HIPÓTESIS INTERVALOS DE CONFIANZA PROF. JOHNNY MONTENEGRO MOLINA Objetivos Desarrollar el concepto de estimación de parámetros Explicar qué es una

Más detalles

Pruebas de bondad de ajuste para distribuciones con parámetro de forma

Pruebas de bondad de ajuste para distribuciones con parámetro de forma Pruebas de bondad de ajuste para distribuciones con parámetro de forma José A. Villaseñor Alva Colegio de Postgraduados, México ITESM, Monterrey, N.L. 2 de septiembre de 2011 Conferencia Bimestral de la

Más detalles

MODELOS DE SIMULACIÓN ESTADÍSTICOS CLASE 4: DISTRIBUCIÓN t, CHI-CUADRADA y EXPONENCIAL PROFESOR: OSCAR SAAVEDRA ANDRÉS DURANGO.

MODELOS DE SIMULACIÓN ESTADÍSTICOS CLASE 4: DISTRIBUCIÓN t, CHI-CUADRADA y EXPONENCIAL PROFESOR: OSCAR SAAVEDRA ANDRÉS DURANGO. DISTRIBUCIÓN t Con frecuencia intentamos estimar la media de una población cuando se desconoce la varianza, en estos casos utilizamos la distribución de t de Student. Si el tamaño de la muestra es suficientemente

Más detalles

Fundamentos estadísticos del ensayo clínico, Interpretación de resultados. M José Escudero Barea. Gerente Dpto. Gestión de Datos y Estadística.

Fundamentos estadísticos del ensayo clínico, Interpretación de resultados. M José Escudero Barea. Gerente Dpto. Gestión de Datos y Estadística. Fundamentos estadísticos del ensayo clínico, Interpretación de resultados. M José Escudero Barea. Gerente Dpto. Gestión de Datos y Estadística. Grupo Español de Investigación en Cáncer de Mama (GEICAM).

Más detalles

Determinación del tamaño de muestra (para una sola muestra)

Determinación del tamaño de muestra (para una sola muestra) STATGRAPHICS Rev. 4/5/007 Determinación del tamaño de muestra (para una sola muestra) Este procedimiento determina un tamaño de muestra adecuado para la estimación o la prueba de hipótesis con respecto

Más detalles

CONTRASTE DE HIPÓTESIS

CONTRASTE DE HIPÓTESIS CONTRASTE DE HIPÓTESIS Antonio Morillas A. Morillas: Contraste de hipótesis 1 CONTRASTE DE HIPÓTESIS 1. Introducción 2. Conceptos básicos 3. Región crítica óptima i. Teorema de Neyman-Pearson ii. Región

Más detalles

Guía docente de la asignatura

Guía docente de la asignatura Guía docente de la asignatura Asignatura Materia Análisis de Supervivencia 2- Técnicas Estadísticas Módulo Titulación Grado en Estadística Plan 412 Código 47110 Periodo de impartición C2 Tipo/Carácter

Más detalles

CONTRASTE DE HIPÓTESIS

CONTRASTE DE HIPÓTESIS CONTRASTE DE HIPÓTESIS Antonio Morillas A. Morillas: Contraste de hipótesis 1 CONTRASTE DE HIPÓTESIS 1. Introducción 2. Conceptos básicos 3. Región crítica óptima i. Teorema de Neyman-Pearson ii. Región

Más detalles

El modelo de azar proporcional: la regresión de Cox

El modelo de azar proporcional: la regresión de Cox El modelo de azar proporcional: la regresión de Cox Alfonso Luis Palmer Pol y Jose Maria Losilla Vidal El Análisis de la Supervivencia (Palmer, 1988) engloba una variedad de técnicas estadísticas que permiten

Más detalles

Representaciones gráficas de las distribuciones bidimensionales de frecuencias... 74

Representaciones gráficas de las distribuciones bidimensionales de frecuencias... 74 Índice 1. Introducción al R 15 1.1. Introducción............................. 15 1.2. El editor de objetos R....................... 18 1.3. Datos en R............................. 19 1.3.1. Vectores...........................

Más detalles

Prácticas de Fiabilidad

Prácticas de Fiabilidad Prácticas de Fiabilidad Práctica : Objetivo: En esta práctica se van a ajustar datos censurados. De los tres tipos de censura existentes se va a trabajar con la censura aleatoria, es decir, el proceso

Más detalles

Relación de Problemas. Tema 5

Relación de Problemas. Tema 5 Relación de Problemas. Tema 5. Supongamos que tenemos una muestra aleatoria simple de tamaño n de una v.a. X que sigue una distribución geométrica con función de probabilidad P (X = k) = p( p) k Calcular

Más detalles

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS FACULTAD DE CIENCIAS MATEMÁTICAS E.A.P. DE ESTADÍSTICA Desnutrición crónica estudio de las características, conocimientos y aptitudes de la madre sobre nutrición

Más detalles

Inferencia: Tarea 3. medio número de mujeres media(años ) des. estándar(años) Rural Urbano

Inferencia: Tarea 3. medio número de mujeres media(años ) des. estándar(años) Rural Urbano Inferencia: Tarea 3 1. Un sociólogo registró el número de años cumplidos por una mujer al momento de su primer parto. Se clasificó a las mujeres de acuerdo al medio en que vivían, rural y urbano, y se

Más detalles

Análisis de datos Categóricos

Análisis de datos Categóricos Introducción Universidad Nacional Agraria La Molina 2017-1 Variable cualitativa Variable respuesta cualitativa Variable respuesta y explicativa Variable de conteo y proporción Escalas de medición Una variable

Más detalles

Regresión Lineal Simple y Múltiple Regresión Logística

Regresión Lineal Simple y Múltiple Regresión Logística Regresión Lineal Simple y Múltiple Regresión Logística Miguel González Velasco Departamento de Matemáticas. Universidad de Extremadura MUI en Ciencias de la Salud MUI en Ciencias de la Salud (UEx) Regresión

Más detalles

ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN

ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN CURSO DE BIOESTADÍSTICA BÁSICA Y SPSS ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN Amaia Bilbao González Unidad de Investigación Hospital Universitario Basurto (OSI Bilbao-Basurto)

Más detalles

Unidad 3. Probabilidad. Javier Santibáñez (IIMAS, UNAM) Inferencia Estadística Semestre / 22

Unidad 3. Probabilidad. Javier Santibáñez (IIMAS, UNAM) Inferencia Estadística Semestre / 22 Unidad 3. Probabilidad Javier Santibáñez (IIMAS, UNAM) Inferencia Estadística Semestre 2018-1 1 / 22 Espacios de probabilidad El modelo matemático para estudiar la probabilidad se conoce como espacio de

Más detalles

MODELO DE RESPUESTAS Objetivos 2, 3, 4, 5, 6, 7, Y 8.

MODELO DE RESPUESTAS Objetivos 2, 3, 4, 5, 6, 7, Y 8. UNIVERSIDAD NACIONAL ABIERTA ESTADÍSTICA GENERAL 745) VICERRECTORADO ACADÉMICO INTEGRAL ÁREA DE MATEMÁTICA Fecha: 17/ 01 /009 MODELO DE RESPUESTAS Objetivos, 3, 4, 5, 6, 7, Y 8. OBJ. 1 PTA 1 Una compañía

Más detalles

Programa Educativo: Licenciatura en PROGRAMA DE ESTUDIO

Programa Educativo: Licenciatura en PROGRAMA DE ESTUDIO Programa Educativo: Licenciatura en PROGRAMA DE ESTUDIO Matemáticas Área de Formación : Integral Profesional Horas teóricas: 3 Horas prácticas: 2 Total de Horas: 5 Confiabilidad Total de créditos: 8 Clave:

Más detalles

Inferencia estadística. Hipótesis estadística Errores! y " BC. Nathalia Navarro Trevisan

Inferencia estadística. Hipótesis estadística Errores! y  BC. Nathalia Navarro Trevisan Inferencia estadística Hipótesis estadística Errores! y " BC. Nathalia Navarro Trevisan ESTADISTICA INFERENCIAL Permite obtener información de la población a través de una muestra Generalización de resultados

Más detalles

Elementos de probabilidad e inferencia estadística en el seguro

Elementos de probabilidad e inferencia estadística en el seguro Elementos de probabilidad e inferencia estadística en el seguro Instructor: Act. Erick Mier Moreno. Director general y profesor de AMAT- Applied Mathematics and Actuary Training. Profesor de asignatura

Más detalles

INFERENCIA DE PARÁMETROS EN UNA RED DE REGULACIÓN GENÉTICA

INFERENCIA DE PARÁMETROS EN UNA RED DE REGULACIÓN GENÉTICA INFERENCIA DE PARÁMETROS EN UNA RED DE REGULACIÓN GENÉTICA Brenda Aide Peña Cantu J. Arturo Berrones Santos Edgar Jímenez Peña Francisco Javier Almaguer Martínez Resumen En el presente trabajo se abordan

Más detalles

UNIVERSIDAD DE ANTIOQUIA FACULTAD NACIONAL DE SALUD PÚBLICA Héctor Abad Gómez ldbello@saludpublica.udea.edu.co Facultad Nacional de Salud Pública Héctor Abad Gómez www.leondariobello.com www.ciemonline.info/moodle

Más detalles

Tema 5. Contraste de hipótesis (I)

Tema 5. Contraste de hipótesis (I) Tema 5. Contraste de hipótesis (I) CA UNED de Huelva, "Profesor Dr. José Carlos Vílchez Martín" Introducción Bienvenida Objetivos pedagógicos: Conocer el concepto de hipótesis estadística Conocer y estimar

Más detalles

Licenciatura en Actuaría PROGRAMA DE ESTUDIO. Integral Profesional Horas teóricas: 3 Horas prácticas: 2 Total de Horas: 5 Confiabilidad

Licenciatura en Actuaría PROGRAMA DE ESTUDIO. Integral Profesional Horas teóricas: 3 Horas prácticas: 2 Total de Horas: 5 Confiabilidad PROGRAMA DE ESTUDIO Programa Educativo: Licenciatura en Actuaría Área de Formación : Integral Profesional Horas teóricas: 3 Horas prácticas: 2 Total de Horas: 5 Confiabilidad Total de créditos: 8 Clave:

Más detalles

EPIDEMIOLOGÍA. 5. Historia natural de la enfermedad: Formas de establecer el pronóstico.

EPIDEMIOLOGÍA. 5. Historia natural de la enfermedad: Formas de establecer el pronóstico. EPIDEMIOLOGÍA 5. Historia natural de la enfermedad: Formas de establecer el pronóstico. HISTORIA NATURAL DE LA ENFERMEDAD. HISTORIA NATURAL DE LA ENFERMEDAD Tabla 1. Diferencias entre Factores de Riesgo

Más detalles

1. Modelos para conteos

1. Modelos para conteos 1. Modelos para conteos En esta sección se modelarán conteos, que resultan de diversas situaciones, por ejemplo: el número de accidentes en una carretera, el número de caries que tiene una persona, el

Más detalles

PREGUNTAS TIPO EXAMEN. 1. Cuál de las siguientes medidas es una medida de Centralización?

PREGUNTAS TIPO EXAMEN. 1. Cuál de las siguientes medidas es una medida de Centralización? PREGUNTAS TIPO EXAMEN 1. Cuál de las siguientes medidas es una medida de Centralización? a) La desviación típica d) Ninguna respuesta es correcta 2. Disponemos de una variable aleatoria que recoge el peso

Más detalles

INGENIERO AGRÓNOMO EN PRODUCCIÓN TEMA: ESTIMACION Y PRUEBA DE HIPÓTESIS

INGENIERO AGRÓNOMO EN PRODUCCIÓN TEMA: ESTIMACION Y PRUEBA DE HIPÓTESIS UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO CENTRO UNIVERSITARIO UAEM ZUMPANGO INGENIERO AGRÓNOMO EN PRODUCCIÓN TEMA: ESTIMACION Y PRUEBA DE HIPÓTESIS ELABORÓ: M. EN C. LUIS ENRIQUE KU MOO FECHA: ENERO DE

Más detalles

CAPÍTULO 5. Proyecciones de las Fuentes de Empleo Características Generales del Modelo de Regresión Lineal Múltiple de las Fuentes

CAPÍTULO 5. Proyecciones de las Fuentes de Empleo Características Generales del Modelo de Regresión Lineal Múltiple de las Fuentes CAPÍTULO 5 Proyecciones de las Fuentes de Empleo 5.1. Características Generales del Modelo de Regresión Lineal Múltiple de las Fuentes de Empleo a Nivel Nacional. Para la proyección de las fuentes de empleo

Más detalles

ASIGNATURA: ESTADISTICA II (II-055) Ing. César Torrez https://torrezcesar.wordpress.com

ASIGNATURA: ESTADISTICA II (II-055) Ing. César Torrez https://torrezcesar.wordpress.com ASIGNATURA: ESTADISTICA II (II-055) Ing. César Torrez torrezcat@gmail.com https://torrezcesar.wordpress.com 0416-2299743 Programa de Estadística II UNIDAD IV: REGRESIÓN Y CORRELACIÓN MÚLTIPLE LINEAL TANTO

Más detalles

INDICE Capitulo uno Introducción y estadísticas descriptiva Capitulo dos Conceptos en probabilidad Capitulo tres

INDICE Capitulo uno Introducción y estadísticas descriptiva Capitulo dos Conceptos en probabilidad Capitulo tres INDICE Capitulo uno Introducción y estadísticas descriptiva 1.1. Introducción 1.2. descripción grafica de los datos 3 1.3. medidas numéricas descriptivas 11 Ejercicios 22 Apéndice: sumatorias y otras notaciones

Más detalles

Curso online de Supervivencia y Regresión Lineal, Logística y de Cox 2018

Curso online de Supervivencia y Regresión Lineal, Logística y de Cox 2018 MANUAL DE IDENTIDAD VSUAL CORPORATIVA PROGRAMA: Curso online de Supervivencia y Regresión Lineal, Logística y de Cox 2018 Departamento de Formación Médica Continuada (ICOMEM) SUPERVIVENCIA Y REGRESIÓN

Más detalles

PRUEBA DE BONDAD DE AJUSTE O PRUEBA CHI - CUADRADO

PRUEBA DE BONDAD DE AJUSTE O PRUEBA CHI - CUADRADO O PRUEBA CHI - CUADRADO Hasta ahora se han mencionado formas de probar lo que se puede llamar hipótesis paramétricas con relación a una variable aleatoria, o sea que se ha supuesto que se conoce la ley

Más detalles

PROBABILIDADES Trabajo Práctico 5. 0 si x<0. x3 si 0 x<2 1 si x 2

PROBABILIDADES Trabajo Práctico 5. 0 si x<0. x3 si 0 x<2 1 si x 2 PROBABILIDADES Trabajo Práctico 5 1. Sea X una variable aleatoria con función de distribución acumulada a) Calcular, usando F X, P (X 1) P (0.5 X 1) P (X >1.5) b) Hallar la mediana de esta distribución.

Más detalles

Nota de los autores... vi

Nota de los autores... vi ÍNDICE Nota de los autores... vi 1 Qué es la estadística?... 1 1.1 Introducción... 2 1.2 Por qué se debe estudiar estadística?... 2 1.3 Qué se entiende por estadística?... 4 1.4 Tipos de estadística...

Más detalles

ANÁLISIS DE REGRESIÓN

ANÁLISIS DE REGRESIÓN ANÁLISIS DE REGRESIÓN INTRODUCCIÓN Francis Galtón DEFINICIÓN Análisis de Regresión Es una técnica estadística que se usa para investigar y modelar la relación entre variables. Respuesta Independiente Y

Más detalles

Pruebas de hipótesis estadísticas acerca de los cambios en la incidencia de la pobreza aplicando la metodología preliminar del CTMP

Pruebas de hipótesis estadísticas acerca de los cambios en la incidencia de la pobreza aplicando la metodología preliminar del CTMP Nota Técnica 0/006 Pruebas de hipótesis estadísticas acerca de los cambios en la incidencia de la pobreza aplicando la metodología preliminar del CTMP 000 005 Octubre de 006 Av. Paseo de la Reforma #51,

Más detalles

EVALUACIÓN EN APRENDIZAJE. Eduardo Morales y Jesús González

EVALUACIÓN EN APRENDIZAJE. Eduardo Morales y Jesús González EVALUACIÓN EN APRENDIZAJE Eduardo Morales y Jesús González Significancia Estadística 2 En estadística, se dice que un resultado es estadísticamente significante, cuando no es posible que se presente por

Más detalles

Análisis de datos de supervivencia

Análisis de datos de supervivencia GUIA DIDÁCTICA DEL ALUMNO Análisis de datos de supervivencia Docentes: Dra. Francisca Rius Profesora de Bioestadística Facultad de Medicina Universidad de Málaga GUIA DIDACTICA DEL ALUMNO DATOS GENERALES

Más detalles

Qué hacemos cuando la distribución no es normal? Qué significa ser normal? Qué significa ser normal? 1er. Simposio Metodología Seis Sigma

Qué hacemos cuando la distribución no es normal? Qué significa ser normal? Qué significa ser normal? 1er. Simposio Metodología Seis Sigma er. imposio Metodología eis igma Resumen Qué hacemos cuando la distribución no es normal? Qué significa ser normal? Ejemplos de situaciones normales Ejemplos de situaciones no normales Resumen Implicaciones

Más detalles

Guillermo Ayala Gallego Universidad de Valencia

Guillermo Ayala Gallego Universidad de Valencia GoBack Regresión logística Guillermo Ayala Gallego Universidad de Valencia 4 de febrero de 2009 1 / 22 Puede que sea el procedimiento estadístico más utilizado. Con aplicaciones frecuentes en Medicina

Más detalles

5 Estudios de simulación

5 Estudios de simulación 5 Estudios de simulación El modelado a través de MLG está disponible en muchos de los paquetes estadísticos más conocidos, como Stata, SAS, Limdep, S o R. De estos paquetes quizás sea Limdep (versión 7.0)

Más detalles

Probabilidad para una V.A. Continua. P( a X b) = f ( x)

Probabilidad para una V.A. Continua. P( a X b) = f ( x) Tema 4: Variables Aleatorias Contínuas Prof. Heriberto Figueroa S. Capítulo 4 Variables Aleatorias Continuas y sus Distribuciones de Probabilidad 4.1. Variables Aleatorias Continuas Una variable aleatoria

Más detalles

Tema 10: Introducción a los problemas de Asociación y Correlación

Tema 10: Introducción a los problemas de Asociación y Correlación Tema 10: Introducción a los problemas de Asociación y Correlación Estadística 4 o Curso Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 10: Asociación y Correlación

Más detalles

Estadísticas Pueden ser

Estadísticas Pueden ser Principios Básicos Para iniciar en el curso de Diseño de experimentos, es necesario tener algunos conceptos claros en la parte de probabilidad y estadística. A continuación se presentan los conceptos más

Más detalles

ESTIMACIONES INTERVALOS DE CONFIANZA CON VARIANZA DIFERENTE LI. MIGUEL CANO

ESTIMACIONES INTERVALOS DE CONFIANZA CON VARIANZA DIFERENTE LI. MIGUEL CANO ESTIMACIONES INTERVALOS DE CONFIANZA CON VARIANZA DIFERENTE LI. MIGUEL CANO Varianzas poblacionales desconocidas y distintas Muestras grandes (n 30) Muestras pequeñas (n

Más detalles

Preparación de los datos de entrada

Preparación de los datos de entrada Preparación de los datos de entrada Clase nro. 6 CURSO 2010 Objetivo Modelado de las características estocásticas de los sistemas. Variables aleatorias con su distribución de probabilidad. Por ejemplo:

Más detalles

Análisis Estadístico. Dra. Adela Del Carpio Rivera Doctor En Medicina

Análisis Estadístico. Dra. Adela Del Carpio Rivera Doctor En Medicina Análisis Estadístico Dra. Adela Del Carpio Rivera Doctor En Medicina ANTE LA GRAN CANTIDAD DE INFORMACIÓN Debemos saber discernir entre: Cuál es la información que necesitamos Si el estudio tiene real

Más detalles

Sesión 7 - Modelos de variable censurada y truncada

Sesión 7 - Modelos de variable censurada y truncada Sesión 7 - Modelos de variable censurada y truncada Manuel Barrón 5 de Julio de 2010 1 Mecanismos de censura y truncamiento 1.1 Distribución truncada Una distribución truncada es una parte de una distribución

Más detalles

Análisis de datos Categóricos

Análisis de datos Categóricos Introducción a los Modelos Lineales Generalizados Universidad Nacional Agraria La Molina 2016-1 Introducción Modelos Lineales Generalizados Introducción Componentes Estimación En los capítulos anteriores

Más detalles

Pérdida Esperada. Pérdida Esperada (PE): Valor esperado de pérdida por riesgo crediticio en un horizonte de tiempo determinado.

Pérdida Esperada. Pérdida Esperada (PE): Valor esperado de pérdida por riesgo crediticio en un horizonte de tiempo determinado. Pérdida Esperada Uno de los objetivos de este estudio es construir una función de pérdidas para el portafolio de la cartera de préstamos que ofrece la entidad G&T Continental, basados en el comportamiento

Más detalles

JUEGO DE BASKETBALL. Repaso de Distribuciones de Probabilidad Discretas y Continuas

JUEGO DE BASKETBALL. Repaso de Distribuciones de Probabilidad Discretas y Continuas JUEGO DE BASKETBALL Repaso de Distribuciones de Probabilidad Discretas y Continuas PREGUNTA #1 Qué es una variable aleatoria uniforme discreta? Cómo es su distribución? Qué es una variable aleatoria uniforme

Más detalles

Introducción al Análisis de Supervivencia

Introducción al Análisis de Supervivencia Introducción al Análisis de Supervivencia Introducción En este tema abordamos el estudio del tiempo transcurrido entre dos eventos de interés y de las variables que pueden influir en el mismo. Por ejemplo,

Más detalles

Variables Aleatorias Positivas

Variables Aleatorias Positivas Introducción al ADS Vamos a estudiar Duraciones de Procesos que es algo muy común en muchas ciencias: Duración de un componente (Fiabilidad) Supervivencia de un paciente a un tratamiento (Medicina/farmacología)

Más detalles

ATV - Análisis de Tiempo de Vida

ATV - Análisis de Tiempo de Vida Unidad responsable: Unidad que imparte: Curso: Titulación: Créditos ECTS: 2017 200 - FME - Facultad de Matemáticas y Estadística 715 - EIO - Departamento de Estadística e Investigación Operativa 1004 -

Más detalles

Universidad Autónoma de Sinaloa

Universidad Autónoma de Sinaloa Séptima Edición del Diplomado en Estadística Mc. José V. Jiménez Ramírez Director de la Escuela de Ciencias Fisico-Matemáticas Tel. : 7 16 11 54 vidaljr@uas.uasnet.mx Dr. René Castro Montoya Coordinador

Más detalles

Estadística aplicada al medio ambiente

Estadística aplicada al medio ambiente Estadística aplicada al medio ambiente III. Regresión lineal 3 o de CC. AA. Departamento de Matemáticas Universidad Autónoma de Madrid 2011/12 Planteamiento Modelo Estimación de parámetros Intervalos de

Más detalles

MANTENIMIENTO INDUSTRIAL.

MANTENIMIENTO INDUSTRIAL. REPÚBLICA BOLIVARIANA DE VENEZUELA UNIVERSIDAD ALONSO DE OJEDA FACULTAD DE INGENIERÍA ESCUELA DE INDUSTRIAL MANTENIMIENTO INDUSTRIAL. Realizado por: Ing. Danmelys Perozo UNIDAD II: ESTADÍSTICAS DE FALLAS

Más detalles

Objetivos del análisis de supervivencia

Objetivos del análisis de supervivencia Regresión de Cox Javier Zamora Unidad de Bioestadística Clínica. IRYCIS 1 Objetivos del análisis de supervivencia Estimar e interpretar las curvas de supervivencia i y/o riesgo. Comparar curvas de supervivencia,

Más detalles

GENERACION DE NUMEROS ALEATORIOS Y VARIABLES ALEATORIAS

GENERACION DE NUMEROS ALEATORIOS Y VARIABLES ALEATORIAS GENERACION DE NUMEROS ALEATORIOS Y VARIABLES ALEATORIAS La simulación de eventos se basa en la ocurrencia aleatoria de los mismos, por ello los números aleatorios y las variables aleatorias son de especial

Más detalles

ESTADISTICA INFERENCIAL DR. JORGE ACUÑA A.

ESTADISTICA INFERENCIAL DR. JORGE ACUÑA A. ESTADISTICA INFERENCIAL DR. JORGE ACUÑA A. 1 PROBABILIDAD Probabilidad de un evento es la posibilidad relativa de que este ocurra al realizar el experimento Es la frecuencia de que algo ocurra dividido

Más detalles

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico Formulario. Estadística Administrativa Módulo 1. Introducción al análisis estadístico Histogramas El número de intervalos de clase, k, se elige de tal forma que el valor 2 k sea menor (pero el valor más

Más detalles

Curso de Estadística con R: Nivel Medio

Curso de Estadística con R: Nivel Medio Curso de Estadística con R: Nivel Medio Prof. Vanesa Jordá Departamento de Economía Facultad de Ciencias Económicas y Empresariales Universidad de Cantabria Índice Introducción Contrastes de hipótesis

Más detalles

Parte de las notas tomadas de: Prof. Edgar Acuña UNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYAGUEZ

Parte de las notas tomadas de: Prof. Edgar Acuña  UNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYAGUEZ Estadística stica No Paramétrica Parte de las notas tomadas de: Prof. Edgar Acuña http://math.uprm math.uprm/edu/~edgar UNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYAGUEZ METODOS ESTADISTICOS

Más detalles

Turnover rates in México. Sergio RAMOS LOYA, José Enrique PÉREZ SALVADOR Carlos Fernando LOZANO NATHAL,

Turnover rates in México. Sergio RAMOS LOYA, José Enrique PÉREZ SALVADOR Carlos Fernando LOZANO NATHAL, Turnover rates in México Sergio RAMOS LOYA, José Enrique PÉREZ SALVADOR Carlos Fernando LOZANO NATHAL, Puntos de la Presentación Justificación y Riesgo. Diseño de la investigación. Datos fuente. Resultados.

Más detalles

INGENIERÍA EN MANTENIMIENTO INDUSTRIAL

INGENIERÍA EN MANTENIMIENTO INDUSTRIAL HOJA DE ASIGNATURA CON DESGLOSE DE UNIDADES TEMÁTICAS 1. Nombre de la asignatura Estadística Industrial 2. Competencias Diseñar estrategias de mantenimiento mediante el análisis de factores humanos, tecnológicos,

Más detalles

Análisis de estudios de cohortes en Ciencias de la P005/10. Salud (modelos regresión de Poisson y de Cox)

Análisis de estudios de cohortes en Ciencias de la P005/10. Salud (modelos regresión de Poisson y de Cox) Análisis de estudios de cohortes en Ciencias de la P005/10 Salud (modelos regresión de Poisson y de Cox) Fecha de aprobación de programa: Marzo 2012 Fechas curso: 4 y 5 de Junio de 2012 Horario: Mañana

Más detalles

Métodos Bayesianos (Convocatoria Febrero 2005)

Métodos Bayesianos (Convocatoria Febrero 2005) Dpto. Métodos Cuantitativos en Economía y Gestión Univ. de Las Palmas de G.C. Licenciatura en Economía Cuarto curso Curso 04/05 Métodos Bayesianos (Convocatoria Febrero 005) EJERCICIO 1. El método estándar

Más detalles

ESTIMACION INFERENCIA ESTADISTICA

ESTIMACION INFERENCIA ESTADISTICA P M INFERENCIA ESTADISTICA Desde nuestro punto de vista, el objetivo es expresar, en términos probabilísticos, la incertidumbre de una información relativa a la población obtenida mediante la información

Más detalles

Anejo 2. Cuantificación de la incertidumbre de los modelos utilizados para el análisis del campo de presiones actuante sobre los peldaños

Anejo 2. Cuantificación de la incertidumbre de los modelos utilizados para el análisis del campo de presiones actuante sobre los peldaños Anejo. Cuantificación de la incertidumbre de los modelos utilizados para el análisis del campo de presiones actuante sobre los peldaños Análisis de inferencia sobre los modelos A-3 1. Introducción En

Más detalles

Folleto de Estadísticas. Teoría del 2do Parcial

Folleto de Estadísticas. Teoría del 2do Parcial Folleto de Estadísticas Teoría del 2do Parcial 2012 Variables aleatorias conjuntas continuas: Sean X y Y dos variables aleatorias continuas con ellas se asocia una función denominada función de densidad

Más detalles