Ciencia UANL Universidad Autónoma de Nuevo León ISSN (Versión impresa): MÉXICO

Documentos relacionados
Cálculos de Regresión Logística en R, Caso de una covariable.

Ciencia UANL Universidad Autónoma de Nuevo León ISSN (Versión impresa): MÉXICO

Life is good for only two things, discovering mathematics and teaching mathematics. Siméon Poisson

Redalyc. Mandeville, Peter B.

Dos requisitos para la regresión lineal son que las

Datos binomiales beetles$dosis

> modindepen<-glm(counts~race+believe,family=poisson,data=creencia ) > summary(modindepen)

Redalyc. Disponible en:

3 Ejemplos simples sobre regresión logística

Clasificación supervisada con R

Redalyc. Disponible en:

Mathias Bourel. 2 de octubre de 2016

Clasificación y regresión logística

Tema 28: Diseños experimentales

Experimentación Agrícola Clave: 1669 Créditos: 9

Ciencia UANL Universidad Autónoma de Nuevo León ISSN (Versión impresa): MÉXICO

ATV - Análisis de Tiempo de Vida

Universidad de Puerto Rico Recinto de Río Piedras Facultad de Ciencias Naturales Departamento de Matemáticas

Métodos Descriptivos en Minería de Datos

peso edad grasas Regresión lineal simple Los datos

UNIVERSIDAD DE PUERTO RICO EN HUMACAO DEPARTAMENTO DE BIOLOGÍA PRONTUARIO DEL CURSO DE BIOMETRÍA BIOL Preparado por PROF. IVÁN DÁVILA MARCANO

Práctica 3: Regresión simple con R

> y <- c(19, 57, 29, 63, 29, 49, 27, 53, 23, 47, 33, 66, 47, 55, 23, 50, + 24, 37, 42, 68, 43, 52, 30, 42) > ly <- length( y )

CONTENIDO: Regresión logística con variables cuantitativas y cualitativas

Tema 2: Estadística Bivariante Unidad 1: Correlación y Regresión

Análisis de datos Categóricos

Ajuste de Regresión Lineal Simple

Regresión Lineal. 15 de noviembre de Felipe Bravo Márquez

Media-Lab Prado. Modelos Lineales en para procesar encuestas de Satisfacción. Manuel Pérez Gómez 16/06/2016

Incidencia de la interpretación de frases nominales en la comprensión de textos técnicos escritos en inglés

La evolución del PIB per capita estandarizado en la Unión Europea:

Calculo del tiempo de vida con datos de degradación MC. Manuel Jesús Reyes Méndez (ITCJ) 1, Dr. Manuel A. Rodríguez Medina (ITCJ)

Objetivos del análisis de supervivencia

La distribución de Poisson es de tipo exponencial con parámetro dispersión 1.

Odds = = e. UD1: El modelo de regresión logística 1. 1 e

MODELOS DE REGRESIÓN

Anexo. Modelos de demanda: Reparto Modal

El modelo de azar proporcional: la regresión de Cox

UNIVERSIDAD AUTÓNOMA CHAPINGO DEPARTAMENTO DE ZOOTECNIA POSGRADO EN PRODUCCIÓN ANIMAL PROGRAMA DE MAESTRÍA EN CIENCIAS EN INNOVACIÓN GANADERA

Diagnósticos regresión

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

Regresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A

Aplicación de los algoritmos genéticos para seleccionar el mejor modelo de regresión de Cox

Coordenadas Principales de Matrices de Proximidad (Principal Coordinates of Neighbor Matrices) PCNM

Complementación y ampliación de la currícula de la Maestría 2017 Maestría en Generación y Análisis de Información Estadística

Palabras claves: censura por intervalos, razón de hazards, modelos lineales generalizados

Dr. Fidel Ulin Montejo M.C. Robert Jeffrey Flowers Jarvis Fecha de elaboración: Agosto 2004 Fecha de última actualización: Julio 2010

Economía Aplicada. Modelos con variables dependiente binarias. Departamento de Economía Universidad Carlos III de Madrid

Curs de Modelització Estadística Bàsica amb Deducer. Anabel Blasco Ana Vázquez Anna Espinal Llorenç Badiella Oliver Valero

Evaluación Mediante el Ajuste de Modelos Mixtos del Número de Tallos de Caña de Azúcar

FIABILIDAD (VIII): ANÁLISIS PROBIT (ÉXITO / FRACASO)

Métodos estadísticos en estudios de supervivencia

Análisis Avanzado de de Series Temporales Curso de Macroeconometría Doctorado en Economía (UPV-EHU)

FIABILIDAD (VII): MODELOS DE REGRESIÓN PARA OBSERVACIONES CENSURADAS

Tema 3: Modelos lineales generalizados

1.9. Requisitos mínimos de asistencia a las sesiones presenciales / Minimum attendance requirement

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

Ingeniero Agrónomo Especialista en Suelos

Introducción a la regresión ordinal

Red de Revistas Científicas de América Latina y el Caribe, España y Portugal. Universidad Autónoma del Estado de México.

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO. Facultad de Medicina Veterinaria y Zootecnia. Licenciatura en Medicina Veterinaria y Zootecnia

LAB 13 - Análisis de Covarianza - CLAVE

: Andrea Canals/ Catalina Canals Año Académico : 2017 P R O G R A M A

Análisis de diferentes representaciones en la regresión lineal simple

MODELO PARA EL TALLER DE REGRESION

Modelos lineales generales, generalizados y mixtos en ecología:

Modelo lineal general jerárquico

Estadística II. Carrera: INB Participantes. Representante de las academias de ingeniería industrial de Institutos Tecnológicos.

Desde el artículo previo (capítulo XXI de esta

MI4040 Análisis Estadístico y Geoestadístico de Datos Nombre en Inglés

Estas dos clases. ANOVA I - Conceptos generales - Supuestos - ANOVA de una vía - Transformación de datos - Test a Posteriori - ANOVA de dos vías

Tema 4: Regresión Logística

Espacios Públicos ISSN: Universidad Autónoma del Estado de México México

Tema 4: Otros Métodos de Análisis de Datos Cuantitativos y Cualitativos

Guillermo Ayala Gallego Universidad de Valencia

Scientia Et Technica ISSN: Universidad Tecnológica de Pereira Colombia

UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN FACULTAD DE CIENCIAS BIOLÓGICAS SUBDIRECCIÓN DE POSGRADO

Statisticians, like artists, have the bad habit of falling in love with their models. George Box

Multiple Linear Regression

UNIVERSIDAD AUTÓNOMA DE NAYARIT Área de Ciencias Biológico Agropecuarias y Pesqueras

Regresión ponderada y falta de ajuste

Modelos Psicométricos y de Análisis de Datos en Psicología Aplicada

Diseño de Experimentos

Estadística; 3º CC. AA. Examen final, 23 de enero de 2009

Modelos de suavizado, aditivos y mixtos

Guía docente. Identificación de la asignatura. Profesores. Contextualización. Requisitos

METODOS CUANTITATIVOS APLICADOS

Capítulo X. Regresión Logística

I. Identificadores de la asignatura

Comparación por intervalos

DISEÑOS EXPERIMENTALES

REGRESIÓN LOGÍSTICA BINARIA

MODELOS LINEALES GENERALIZADOS MIXTOS ALGUNOS CASOS PRÁCTICOS. Llorenç Badiella 1 RESUMEN

Robusticidad de los Diseños D-óptimos a la Elección. de los Valores Locales para el Modelo Logístico

240EO011 - Estadística Aplicada

DISPLASIA BRONCOPULMONAR EN PRETÉRMINOS: CLASIFICACIÓN BASADA EN VARIABLES CLÍNICAS A TRAVÉS DE MÉTODOS PARAMÉTRICOS Y NO PARAMÉTRICOS

INSTITUTO POLITÉCNICO NACIONAL SECRETARIA DE INVESTIGACIÓN Y POSGRADO

Parte I. Medidas directas. Uso e interpretación de instrumentos

INFERENCIA DE PARÁMETROS EN UNA RED DE REGULACIÓN GENÉTICA

Estimadores de regresión logística para tratamiento de no respuesta en el caso de cocientes de variables dicotómicas

Transcripción:

Ciencia UANL Universidad Autónoma de Nuevo León rciencia@mail.uanl.mx ISSN (Versión impresa): 1405-9177 MÉXICO 2008 Peter B. Mandeville TEMA 16: LA RAZÓN DE MOMIOS 2. REGRESIÓN LOGÍSTICA Ciencia UANL, enero-marzo, año/vol. XI, número 001 Universidad Autónoma de Nuevo León Monterrey, México pp. 115-118 Red de Revistas Científicas de América Latina y el Caribe, España y Portugal Universidad Autónoma del Estado de México http://redalyc.uaemex.mx

Peter B. Mandeville Tips bioestadísticos Everyone believes in the [normal] law of errors, the experimenters because they think it is a mathematical theorem, the mathematicians because they think it is an experimental fact. Henri Pancaré 1 Tema 16: La razón de momios 2 Regresión Logística Regresión logística es una forma de análisis de regresión que se utiliza cuando la variable de respuesta es binaria, dicótoma. El método se basa en la transformación logística, logit, de una proporción donde es la proporción de los sujetos con la característica. En el conjunto de datos birthwt, es la probabilidad de que una mujer tenga un nacimiento con bajo peso, y es la probabilidad que una mujer no tenga un nacimiento con bajo peso. La cantidad logit(p),, es el logaritmo del momio. Si se tienen dos variables explicativas x 1 y x 2, el modelo de regresión logística es: 2 Si se incrementa en una unidad, mientras se mantiene constante, entonces se incrementa el logit de éxito de β 1 o se incrementa el momio de éxito de exp(β 1 ). 3,4 CIENCIA UANL / VOL. XI, No. 1, ENERO-MARZO 2008 115

TIPS BIOESTADÍSTICOS Los cálculos están efectuados con R 2.6.0. 5 Se sigue utilizando el conjunto de datos birthwt, donde la variable de respuesta es peso al nacer que se clasifica como bajo (menor que 2500 gr) o no bajo (igual o mayor que 2500 gr). Se define el "mejor" modelo al eliminar secuencialmente el término no significativo con la probabilidad mayor, hasta tener un modelo donde todos los términos sean significativos. 4 El modelo final incluye los términos: lwt smoke ht peso de la madre al tener su última menstruación tabaquismo en la madre hipertensión en la madre > library(mass) > data(birthwt) > res <- glm (low~lwt+smoke+ ht,family=binomial,data=birthwt) > summary(res) Call: glm(formula = low ~ lwt + smoke + ht, family = binomial, data = birthwt) Deviance Residuals: Min 1Q Median 3Q Max -1.7067-0.8311-0.6892 1.1550 2.2815 Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) 1.083538 0.834219 1.299 0.19399 lwt -0.018046 0.006565-2.749 0.00598** smoke 0.683910 0.330954 2.066 0.03878* ht 1.822025 0.686039 2.656 0.00791** --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 234.67 on 188 degrees of freedom Residual deviance: 216.86 on 185 degrees of freedom AIC: 224.86 Number of Fisher Scoring iterations:4 Se calculan los límites de confianza para los coeficientes de regresión parcial. > tmp <- confint(res) Waiting for profiling to be done... > tmp[-1,] 2.5 % 97.5 % lwt -0.03179293-0.005906983 smoke 0.03636548 1.337728177 ht 0.51710949 3.264744868 Se calculan las razones de momios, al tomar el antilogaritmo de los coeficientes parciales de regresión. > exp(res$coef[-1]) lwt smoke ht 0.9821154 1.9816101 6.1843679 Y se calculan los límites de confianza de las razones de momios, al tomar el antilogaritmo de los límites de confianza de los coeficientes parciales de regresión. > exp(tmp[-1,]) 2.5 % 97.5 % lwt 0.9687072 0.9941104 smoke 1.0370348 3.8103772 ht 1.6771728 26.1734325 La interpretación depende de la escala de medición de la variable explicativa. Para variables explicativas continuas, el momio (probabilidad) de un nacimiento de bajo peso es 0.98 (límites de confianza a 95% de 0.97 y 0.99) veces que el momio de una mujer que pesa un libra más en su última menstruación, cuando se mantienen las otras variables explicativas constantes. Dado que la razón de momios es menor que 1, puede ser más fácil interpretar el recíproco,, que se interpreta así: si la madre tiene un peso (lwt) 1 libra menos, entonces la probabilidad de tener un nacimiento de bajo peso es 1.0182 veces mayor que si no se gana 1 libra cuando se mantienen las otras variables explicativas constantes. Hay ocasiones en que se requiere de comparar valores. Por ejemplo, cuál es la razón de momios para mujeres con lwt igual a 100, comparado con mujeres con lwt igual a 90? 116 CIENCIA UANL / VOL. XI, No. 1, ENERO-MARZO 2008

PETER B. MANDEVILLE > exp (-0.018046*(100-90)) [1] 0.834886 El momio (probabilidad) de un nacimiento con peso bajo para una mujer que tuvo un lwt de 100 libras es 0.83, comparado con el de una mujer que tuvo un lwt de 90 libras, explicativas constantes. La interpretación en términos del recíproco es: > 1/0.834886 [1] 1.197768 El momio (probabilidad) de un nacimiento con peso bajo es 1.20 veces mayor para una mujer que tuvo lwt de 90 libras que para una mujer que tuvo lwt de 100 libras, cuando se mantienen las otras variables explicativas constantes. Para variables explicativas discretas, la interpretación es distinta. Si la madre fuma, entonces el momio, probabilidad, de un nacimiento de peso bajo es 1.98 veces (límites de confianza a 95% de 1.04 y 3.81) mayor que si la madre no fuma, explicativas constantes. Si la madre tiene hipertensión, entonces el momio (probabilidad) de un nacimiento de peso bajo es 6.1844 veces (límites de confianza a 95% de 1.68 y 26.17) mayor que si la madre no tiene hipertensión, explicativas constantes. Regresión de riesgos proporcionales (regresión de Cox) La razón de riesgos, hazard ratio (HR), es la de dos funciones de riesgo, típicamente es reportada como el efecto estimado del grupo 1 relativo al grupo 2. Como con la razón de momios, si el evento bajo estudio es fallecimiento u otro evento adverso, entonces una razón de riesgo entre cero y la unidad se interpreta como efecto protector, mientras que una razón de riesgo mayor que la unidad se interpreta como efecto dañino. Si el evento bajo estudio es benéfico, la interpretación es invertida. 6 Si la razón de riesgo cumple con el supuesto de riesgos proporcionales, entonces: 7 Como una razón de momios muchas veces es una forma natural para describir un efecto sobre una respuesta binaria, una razón de riesgos es una forma natural para describir un efecto sobre el tiempo de supervivencia. 4 Se utilizó el conjunto de datos VA, Veteran's Administration Lung Cancer Trial. > library(mass) > data(va) > res <- coxph(surv(stime,status)~age+ Karn+factor(cell),data=VA) > summary(res) Call: coxph(formula=surv(stime,status)~age +Karn+factor(cell),data=VA) n= 137 coef exp(coef) se(coef) z p age -0.00603 0.994 0.00905-0.666 5.1e-01 Karn -0.03202 0.968 0.00540-5.924 3.1e-09 factor(cell)2 0.72413 2.063 0.25287 2.864 4.2e-03 factor(cell)3 1.17191 3.228 0.29374 3.990 6.6e-05 factor(cell)4 0.32191 1.380 0.27657 1.164 2.4e-01 exp(coef) exp(-coef) lower.95 upper.95 age 0.994 1.006 0.977 1.012 Karn 0.968 1.033 0.958 0.979 factor(cell)2 2.063 0.485 1.257 3.386 factor(cell)3 3.228 0.310 1.815 5.741 factor(cell)4 1.380 0.725 0.802 2.373 Rsquare= 0.354 (max possible= 0.999 ) Likelihood ratio test= 59.8 on 5 df, p=1.33e-11 Wald test = 60.3 on 5 df, p=1.04e-11 Score (logrank) test = 64 on 5 df, p=1.86e-12 Los antilogaritmos de las razones de riesgo, los límites de confianza y los CIENCIA UANL / VOL. XI, No. 1, ENERO-MARZO 2008 117

TIPS BIOESTADÍSTICOS recíprocos de los antilogaritmos de las razones de riesgo se calculan automáticamente, lo cual simplifica el proceso. Referencias 1. Rand R. Wilcox. (2001). Fundamentals of Modern Statistical Methods: Substantially Improving Power and Accuracy. Springer-Verlag New York, Inc., New York, NY, USA. 2. Douglas G. Altman. (1991). Practical Statistics for Medical Research. Texts in Statistical Science. Chapman & Hall, Ltd., London, UK. 3. Julian J. Faraway. (2006). Extending the Linear Model with R: Generalized Linear, Mixed Effects and Nonparametric Regression Models. Texts in Statistical Science. Chapman & Hall/CRC, Boca Raton, FL, USA. 4. Frank E. Harrell, Jr. (2001). Regression Modeling Strategies: With Applications to Linear Models, Logistic Regression, and Survival Analysis. Springer Series in Statistics. Springer- Verlag New York, Inc., New York, NY, USA. 5. R Development Core Team. (2007). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.r-project.org. 6. Abdelmonem Afifi, Virginia A. Clark y Susanne May. (2004). Computer-Aided Multivariate Analysis. Fourth edition. Chapman & Hall/CRC, Boca Raton, FL, USA. 7. Eric Vittinghoff, David V. Glidden, Stephen C. Shiboski y Charles E. McCulloch. (2005). Regression Methods in Biostatistics: Linear, Logistic, Survival, and Repeated Measures Models. Statistics for Biology and Health. Springer Science+Business Media, Inc., New York, NY, USA. 118 CIENCIA UANL / VOL. XI, No. 1, ENERO-MARZO 2008