Cálculo del tamaño muestral para la determinación de factores pronósticos

Documentos relacionados
CAPÍTULO 4 RECOPILACIÓN DE DATOS Y CÁLCULO DEL VPN. En el presente capítulo se presenta lo que es la recopilación de los datos que se tomarán

Determinación del tamaño muestral para calcular la significación del coeficiente de correlación lineal

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

Teorema Central del Límite (1)

INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016

ANALISIS DE FRECUENCIA EN HIDROLOGIA JULIAN DAVID ROJO HERNANDEZ

Conceptos básicos estadísticos

REGRESIÓN LINEAL SIMPLE, COEFICIENTE DE DETERMINACIÓN Y CORRELACIONES (EJERCICIOS RESUELTOS)

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

ESTADÍSTICA DESCRIPTIVA

Los Ensayos Clínicos (EC) son estudios epidemiológicos caracterizados por ser:

ANEXO 1. CONCEPTOS BÁSICOS. Este anexo contiene información que complementa el entendimiento de la tesis presentada.

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24

UNIDAD 12.- Estadística. Tablas y gráficos (tema12 del libro)

ESTADÍSTICA. Tema 4 Regresión lineal simple

Medidas de frecuencia de enfermedad

Economía Aplicada. ¾Es importante el tamaño de la clase? Un experimento controlado

Econometría de series de tiempo aplicada a macroeconomía y finanzas

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

Tema 1.- Correlación Lineal

Tema 2. Descripción Conjunta de Varias Variables

El conjunto de datos obtenidos en un estudio se pueden describir en base a tres elementos esenciales:

Tercera práctica de REGRESIÓN.

CAPÍTULO 4 TÉCNICA PERT

TEMA VI ANÁLISIS DE SUPERVIVENCIA

Tema 5 Algunas distribuciones importantes

Tema 5. Contraste de hipótesis (I)

ESTADÍSTICA SEMANA 3

CAPITULO III. El propósito de la investigación fue recopilar información actualizada de las Micro

Estadística para la toma de decisiones

Estadística Descriptiva. SESIÓN 11 Medidas de dispersión

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

1º CURSO BIOESTADÍSTICA

VALORACIÓN ECONÓMICA DE LUCRO CESANTE

Otra característica poblacional de interés es la varianza de la población, 2, y su raíz cuadrada, la desviación estándar de la población,. La varianza

MÓDULO 1: GESTIÓN DE CARTERAS

Unidad 12. Anualidades Diferidas

Modelos Para la Toma de Decisiones

DEPARTAMENTO DE MATEMÁTICAS. IES GALLICUM

Cálculo de disipadores de calor.

MÓDULO III. MEDIDAS DE TENDENCIA CENTRAL, DISPERSIÓN Y ASIMETRÍA

Nivel de Satisfacción en los afiliados. Régimen Estatal de Protección Social en Salud Zacatecas

CAPITULO II ANÁLISIS DEL CRECIMIENTO POBLACIONAL Y CALCULO DE CAUDALES DE DISEÑO

MÉTODOS NUMÉRICOS PARA INGENIERÍA ERROR GUIÓN PARA EL TEMA CONCEPTOS BÁSICOS

Multicolinealidad. Universidad de Granada. RSG Incumplimiento de las hipótesis básicas en el modelo lineal uniecuacional múltiple 1 / 17

PROYECTO DE INVESTIGACIÓN

Contrastes de hipótesis paramétricos

Materiales y métodos:

Modelos de PERT/CPM: Probabilístico

SEMINARIO 1: RAZONAMIENTO CLÍNICO Y FIABILIDAD EN LA VALORACIÓN EN FISIOTERAPIA

Percentil q (p q ) Si en este conjunto de valores se quiere encontrar el percentil 20, la solución gráfica es muy simple

MARCO NORMATICO CONTABLE PARA EMPRESAS QUE NO COTIZAN EN EL MERCADO DE VALORES Y QUE NO CAPTAN NI ADMINISTRAN AHORRO DEL PÚBLICO

Indicadores de Gestión

TEMA 8.- NORMAS DE MATRICES Y

INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)

Conceptos Básicos de Inferencia

Representación de números enteros: el convenio exceso Z

Matemáticas 2.º Bachillerato. Intervalos de confianza. Contraste de hipótesis

Análisis de datos Categóricos

Teoría de errores -Hitogramas

1.3.- V A L O R A B S O L U T O

REPÚBLICA DE HONDURAS SECRETARÍA DE OBRAS PÚBLICAS, TRANSPORTE Y VIVIENDA FONDO VIAL BANCO MUNDIAL

Técnicas de validación y experimentación

AJUSTE O ESTANDARIZACION DE TASAS Y CÁLCULO DE LOS AÑOS POTENCIALES DE VIDA PERDIDOS (APVP) 1.- CONDICIONES y TECNICAS PARA EL AJUSTE DE TASAS

MEDIDAS DE TENDENCIA CENTRAL

Matemáticas UNIDAD 5 CONSIDERACIONES METODOLÓGICAS. Material de apoyo para el docente. Preparado por: Héctor Muñoz

DESPLIEGUE DE LA CALIDAD (Quality Function Deployment, QFD)

Micro y Macroeconomía

INFERENCIA ESTADISTICA

Sound Meteorological Environmental Correlation. Información técnica

ENERGÍA Y TRANSFORMACIONES QUÍMICAS. ECUACIONES TERMOQUÍMICAS. MÉTODOS PARA EL CÁLCULO DE CALORES DE 1- ENERGÍA Y TRANSFORMACIONES QUÍMICAS...

FÍSICA Y QUÍMICA 3º ESO. OBJETIVOS, CONTENIDOS Y CRITERIOS DE EVALUACIÓN 1ª Evaluación: Unidad 1. La medida y el método científico.

A. Menéndez Taller CES 15_ Confiabilidad. 15. Confiabilidad

Medición de resistencia por el método de amperímetro-voltímetro

Estadística para investigadores: todo lo que siempre quiso saber y nunca se atrevió a preguntar

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón

Tema 4: Probabilidad y Teoría de Muestras

Guía del Examen de Conocimientos del Idioma Japonés 2010

Determinación del tamaño muestral

Prácticas de Ecología Curso 3 Práctica 1: Muestreo

UTN FRM MEDIDAS ELECTRÓNICAS 1 Página 1 de 5 ERRORES

V B. g (1) V B ) g, (2) +ρ B. =( m H. m H (3) ρ 1. ρ B. Aplicando al aire la ecuación de estado de los gases perfectos, en la forma.

Diplomatura en Ciencias Empresariales X Y

Ejemplos y ejercicios de. Estadística Descriptiva. yanálisis de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios.

El modelo semiclásico de las propiedades de transporte: Objetivo

Marco de referencia. a) Es útil saber si la estrategia de tratamiento sin un. biológico (menos costosa), tiene mejor o igual eficacia

Notas de clase A. Leonardo Bañuelos Saucedo Nayelli Manzanarez Gómez

CAPÍTULO I. INTRODUCCIÓN. Cuando se requiere obtener información de una población, y se desean obtener los mejores

1. Caso no lineal: ajuste de una función potencial

c). Conceptos. Son los grupos o conceptos que se enlistan en las filas de la izquierda de la tabla

Análisis de Datos y Métodos Cuantitativos para la Toma de Decisiones 7ma versión MGM

Open Office Calc. Elaboración de una tabla de valores de las áreas de la distribución normal

Estadística para la toma de decisiones

S = N λ = 5 5 = 1 hora.

SOLUCIONARIO GUÍA ESTÁNDAR ANUAL Ondas I: ondas y sus características

Estadística Básica. Unidad 2. Actividades

Mediciones de ocurrencia: Prevalencia e Incidencia. Dra. M Teresa Valenzuela B. Departamento de Salud Pública y Epidemiología

Salud en Tabasco ISSN: Secretaría de Salud del Estado de Tabasco México

Métodos Numéricos: Guía de estudio Tema 5: Solución aproximada de ecuaciones

Transcripción:

Investigación: Cálculo del tamaño muestral para la determinación de factores pronósticos /5 Cálculo del tamaño muestral para la determinación de factores pronósticos Pértegas Día S. Pita Fernánde S. Unidad de Epidemiología Clínica y Bioestadística. Complexo Hospitalario Juan Canalejo. A Coruña. Cad Aten Primaria 00; 9: 30-33. Actualiación 06/06/00. La identificación de factores capaces de influir en el pronóstico de una enfermedad es de suma importancia para la actividad clínica diaria. Por un lado, porque facilita la toma de decisiones en cuanto a procedimientos diagnósticos o tratamientos y, por otro, porque el conocer la posible evolución de un paciente concreto permitirá informarlo sobre el curso clínico de su enfermedad. La realiación de estudios clínico-epidemiológicos es una de las principales vías de las que se dispone para conocer el pronóstico de una patología determinada. Aunque pueden utiliarse diferentes diseños de investigación, los estudios de seguimiento, ya sean prospectivos o retrospectivos, son los más adecuados para tratar de determinar factores pronóstico. En este tipo de trabajos, una ve identificada una cohorte de pacientes con una patología determinada, se realia un seguimiento y se calcula el riesgo relativo asociado a un determinado factor,. En múltiples ocasiones, además, los datos proporcionados por los estudios clínicos suelen venir expresados en términos de tiempo de supervivencia. Una de las características esenciales de los estudios de seguimiento donde se pretende objetivar la presencia de un evento es la posible presencia de datos censurados. El paciente censurado es el que durante este seguimiento no ha presentado el evento de interés. Esto puede suceder bien porque haya abandonado el estudio antes de fallecer, o bien porque éste termine sin que se haya producido la muerte o el evento estudiado. Esta circunstancia obliga a utiliar métodos estadísticos específicos que permitan manejar este tipo de observaciones. La regresión de Cox es el método apropiado para realiar el análisis cuando existen datos censurados permitiendo, a partir de los coeficientes estimados, calcular el riesgo relativo asociado a cada uno de los factores incluidos en el modelo 3. Todo estudio epidemiológico lleva implícita en la fase de diseño la determinación del tamaño muestral necesario para su ejecución 4. Existen fórmulas sencillas que permiten calcular el tamaño muestral necesario para la estimación de un RR cuando no se dispone del tiempo de seguimiento. Sin embargo, en estudios de supervivencia, las fórmulas para el cálculo del tamaño muestral suelen ser más complicadas y se utilian con menor frecuencia. El presente trabajo tiene por objetivo describir algunas de las fórmulas existentes para calcular el tamaño de la muestra a estudiar cuando se quiere investigar la importancia de un nuevo factor sobre el pronóstico de una enfermedad. En primer lugar, se describe cómo calcular el tamaño muestral mínimo necesario para detectar un determinado riesgo relativo cuando se dispone de información acerca del estatus final del paciente pero no de su tiempo de seguimiento. A continuación, se presentan dos formas sencillas de calcular el tamaño muestral en estudios de supervivencia cuando la importancia pronóstica del factor a estudio se investiga por medio de un modelo de regresión de Cox. Se distingue el caso en el que se hace un análisis univariante de aquel en el que en el que el efecto del nuevo factor se estudia controlando por otras covariables. Cálculo del tamaño de la muestra para la estimación de un riesgo relativo El riesgo relativo mide la fuera de la asociación entre la exposición a un factor y la presencia del evento estudiado (muerte, complicaciones, recidiva, etc.. Se calcula dividiendo la probabilidad de presentar dicho evento entre los expuestos (por ejemplo, la probabilidad de muerte entre esos pacientes y esa misma probabilidad entre los no expuestos,. Si deseamos calcular el tamaño muestral mínimo necesario para detectar un determinado riesgo relativo, deberemos conocer:. Dos de los siguientes tres parámetros: Una idea del valor aproximado del riesgo relativo que se desea estimar (RR. La proporción de expuestos al factor de estudio que presentaron el evento de interés (P. La proporción de no expuestos que presentaron ese mismo evento (P.. El nivel de confiana o seguridad (-α. Generalmente se trabajará con una seguridad del 95%.

Investigación: Cálculo del tamaño muestral para la determinación de factores pronósticos /5 3. La precisión relativa que se quiere para el estudio ε. Dicha precisión es la oscilación mínima con la que se quiere estimar el RR correspondiente, expresada como porcentaje del valor real esperado para ese riesgo. Con estos datos, el cálculo del tamaño muestral se puede realiar mediante la fórmula 5 : / + P ( ln ε / P = n α Ecuación α Donde el valor se obtiene de la distribución normal estándar en función de la seguridad (-α elegida para el estudio 6. En particular, para una seguridad de un 95%, se tiene que =.96. Ilustraremos con un ejemplo el uso de la fórmula anterior: supongamos que deseamos saber si existen diferencias entre dos terapias diferentes A y B utiliadas habitualmente para tratar un determinado tipo de cáncer. Para ello se planea realiar un estudio prospectivo en el que se recogerá el estatus de los pacientes (vivos/muertos al cabo de un año de ser tratados Cuántos pacientes deberán estudiarse con cada tratamiento si se desea calcular el riesgo relativo con una precisión del 50% de su valor real y una seguridad del 95%? De experiencias previas, se estima que el valor real del riesgo relativo es aproximadamente igual a 3 y la probabilidad de fallecer entre los pacientes tratados con el tratamiento A de un 0%. En este caso se tiene que: P = 0. RR = P ε = 0.5 P = RR P = 3 0. = 0.6 Aplicando la Ecuación : 0.6 / 0.6 + 0. ( ln 0.5.96 / 0. = 37.3 Es decir, se necesitaría en cada grupo una muestra de 38 pacientes. Si el tamaño del efecto a detectar fuese menor, el tamaño muestral necesario para llevar a cabo el estudio aumentará. Por ejemplo, si estimamos que el RR correspondiente al nuevo tratamiento es aproximadamente igual a (P =0.4 el tamaño necesario sería: 0.4 / 0.4 + 0. ( ln 0.5.96 / 0. = 43.98 Es decir, un total de 44 pacientes tratados con cada una de las dos terapias.

Investigación: Cálculo del tamaño muestral para la determinación de factores pronósticos 3/5 Cálculo del tamaño de la muestra en estudios de supervivencia Supongamos ahora que, en el ejemplo anterior, se dispone de información no sólo acerca del estatus final de los pacientes en cada uno de los dos grupos, sino que además estamos en condiciones de conocer el tiempo de supervivencia de cada uno de ellos. En este caso, para conocer si el tratamiento A tiene un efecto beneficioso sobre la evolución de los enfermos, podremos utiliar un modelo de regresión de Cox en el que se ajuste por la variable tratamiento, y a partir de cuyos coeficientes podremos estimar el RR asociado a la terapia recibida. Si, con este procedimiento, deseamos calcular el tamaño muestral mínimo necesario para detectar un determinado riesgo relativo, deberemos conocer: a Una idea del valor aproximado del riesgo relativo que se desea detectar (RR. b La proporción de expuestos al factor de estudio (p, es decir, en nuestro caso, la proporción de enfermos habitualmente tratados con la terapia A. c El porcentaje de observaciones censuradas ψ que se espera en el total de la muestra. d El nivel de confiana o seguridad con el que se desea trabajar. e El poder β que se quiere para el estudio. Con estos datos, el cálculo del tamaño muestral puede abordarse mediante la fórmula 7 : + β ( log( RR ψ pp Ecuación donde, de nuevo γ denota el γ -cuantil de la distribución normal estándar 6. Siguiendo con el ejemplo anterior, supongamos que el primer tratamiento (A suele aplicarse a un 70% de los pacientes que padecen ese tipo de cáncer, mientras que la otra terapia (B es recibida sólo por un 30% de los enfermos. Si el efecto pronóstico del tratamiento recibido va a analiarse de modo univariado, la Ecuación puede aplicarse para calcular el número necesario de pacientes a estudiar. Así, para detectar un riesgo relativo de 3, y trabajando con una seguridad del 95% y un poder del 80% se tendría: + β ( log( RR ψ p p = (.96 + 0.84 ( log( 3 0.7 0.7 = 30.97 Esto es, se necesitaría recoger información de 3 pacientes en total para detectar un efecto de RR=3. Si el efecto fuese menor (RR=, se necesitarían un total de 78 pacientes y si este riesgo incluso descendiese a RR=.5, el tamaño aumentaría hasta 8 enfermos. Todo ello si se asume que no existirá censura. Si, por el contrario, se prevé que un 0% de los datos corresponderán a observaciones censuradas, el tamaño muestral obtenido deberá multiplicarse por.5 ( 0. =, resultando en un total de 47 pacientes para detectar un RR=3, 7 para detectar un RR= ó 34 para un RR=.5.

Investigación: Cálculo del tamaño muestral para la determinación de factores pronósticos 4/5 La fórmula anterior por tanto nos permite calcular el n para detectar un efecto ante la presencia de una característica o exposición determinada. Si, como sucede habitualmente, deseamos controlar o tener en cuenta más variables, el tamaño de la muestra se debe modificar teniendo en cuenta esas posibles variables. En una situación como la del ejemplo anterior, el conocimiento apropiado del efecto pronóstico del tratamiento recibido casi siempre exige ajustar por diferentes covariables en un modelo de regresión de Cox. Intuitivamente, el tratar de ajustar un modelo más complejo (ie, con un mayor número de variables con el mismo número de pacientes llevará consigo una pérdida de precisión en la estimación de los coeficientes y, con ello, del RR asociado a cada una de las variables incluidas en el modelo multivariante. En esta situación, es obvio, que se necesita realiar alguna corrección en la Ecuación que permita adaptar el tamaño muestral calculado a las variables que se incluirán a posteriori en el modelo. En este supuesto, la fórmula para el cálculo del tamaño muestral vendrá dada por 8 : + β ( ( ( ( log RR ψ p p ρ Ecuación 3 La Ecuación 3 es así idéntica a la Ecuación, salvo en el factor ρ, normalmente llamado factor de inflación de la variana, donde ρ denota al coeficiente de correlación de Pearson entre el factor a estudio y aquella otra variable que incluiremos en el modelo. En el caso en el que se ajuste por más de otro factor en el modelo, lo más sencillo es considerar ρ como el mayor coeficiente de correlación entre el factor a estudio y todas las variables incluidas. Este coeficiente de correlación, cuanto mayor sea, más incrementará el valor del factor de inflacción de la variana y, por tanto, se incrementará el tamaño de la muestra a estudiar. Siguiendo con el ejemplo anterior, posiblemente el tratamiento aplicado a cada enfermo dependerá, como ya se apuntó, de las características clínicas particulares del mismo, y recibirá una u otra terapia en función, por ejemplo, del estadiaje del tumor. En términos estadísticos, podrá entonces decirse que el factor tratamiento se encuentra correlacionado con esta característica. Supongamos, por ejemplo, que la correlación existente entre el nuevo tratamiento y el estadiaje del tumor es de 0.5. Este dato lo podremos obtener a partir de un estudio piloto o de otros trabajos sobre el tema. En caso de desconocerse, deberemos asumir una correlación suficientemente alta para así asegurar un poder suficiente. Una correlación de 0.5 implica un factor de inflación de la variana de 0.5 =.07. Aplicando la Ecuación 3, se obtendría un tamaño muestral mínimo necesario de 3.07 = 33.7 34 pacientes para detectar un efecto de RR=3, de 78.07 = 83.46 84 = 8.07 = 43.96 44 si se quiere detectar un efecto de RR= y n para detectar un RR=.5. De nuevo, deberemos ajustar el tamaño muestral a posibles pérdidas. Si se prevé, como antes, un 0% de censuras, el tamaño muestral será de 43 pacientes para detectar un RR=3, de 05 para detectar un RR= y de 305 enfermos para detectar un RR=.5. El cálculo del tamaño muestral, por tanto, permite al investigador precisar el número de pacientes a estudiar para detectar como significativos efectos de una magnitud determinada. El no hacerlo, o el no

Investigación: Cálculo del tamaño muestral para la determinación de factores pronósticos 5/5 conocer cuantos pacientes necesitamos para detectar un efecto como significativo podría llevarnos a cometer un error de tipo II, es decir, no encontrar diferencias cuando sí las hay. Es por ello recomendable, por tanto, no sólo tener una idea aproximada del número de pacientes sino además estimar los riesgos con su 95% intervalo de confiana para conocer la precisión y la dirección del efecto investigado. Bibliografía. Pita Fernánde S, Valdés Cañedo FA. Determinación de factores pronósticos. Cad Aten Primaria 997; 4: 6-9. [Texto completo]. Pita Fernánde S, Vila Alonso MT, Carpente Montero J. Determinación de factores de riesgo. Cad Aten Primaria 997; 4: 75-78. [Texto completo] 3. Lee ET. Statistical Methods for Survival Data Analysis. Belmont, California: Lifetime Learning Publications; 980. 4. Pita Fernánde S. Determinación del tamaño muestral. Cad Aten Primaria 996; 3: 38-4. [Texto completo] 5. Lwanga SK, Lemeshow S. Determinación del tamaño muestral en los estudios sanitarios. Manual Práctico. Ginebra: O.M.S.; 99. 6. Pértega Día S, Pita Fernánde S. La distribución normal. Cad Aten Primaria 00; 8: 68-74. [Texto completo] 7. Schoenfeld DA. Sample-sie formula for the proportional-haard regression model. Biometrics 983; 39: 499-503. [Medline] 8. Schmoor C, Sauerbrei W, Schumacher M. Sample sie considerations for the evaluation of prognostic factors in survival analysis. Statistic Med 000; 9: 44-45. [Medline]