En artículos previos hemos abordado cómo

Documentos relacionados
Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

Contrastes de hipótesis. 1: Ideas generales

Tema 13 : Intervalos de probabilidad y confianza. Hipótesis y decisiones estadísticas.

INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016

Tema 9: Contraste de hipótesis.

Teorema Central del Límite (1)

CONTRASTE SOBRE UN COEFICIENTE DE LA REGRESIÓN

INFERENCIA ESTADISTICA

Bioestadística para Reumatólogos

CONCEPTOS FUNDAMENTALES

Tema 13: Distribuciones de probabilidad. Estadística

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo

Hipótesis y decisiones

Módulo 1. Aspectos generales Y prevención primaria GUÍA PARA EL PONENTE

Problemas Prueba de significación de la hipótesis nula Vicente Manzano-Arrondo, 2013

Curso de Estadística Aplicada a las Ciencias Sociales. Tema 12. Contraste de hipótesis. Introducción. Introducción

Determinación del tamaño de muestra (para una sola muestra)

ÍNDICE INTRODUCCIÓN... 21

Análisis de diferencias de medias entre centros educativos chilenos según grupo socioeconómico y dependencia administrativa

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

Los Ensayos Clínicos (EC) son estudios epidemiológicos caracterizados por ser:

Tema 8: Contraste de hipótesis

Tema 8: Introducción a la Teoría sobre Contraste de hipótesis

INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M.

Intervalos de confianza y contrastes de hipótesis. Intervalo de confianza de la media.

en Enfermería del Trabajo

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

POBLACIÓN Y MUESTRAS EN LA INVESTIGACIÓN

BIOESTADISTICA ( ) Evaluación de pruebas diagnósticas. 1) Características del diseño en un estudio para evaluar pruebas diagnósticas.

Objetivos del tema. Qué es una hipótesis? Test de Hipótesis Introducción a la Probabilidad y Estadística. Contrastando una hipótesis

Tabla de Test de Hipótesis ( Caso: Una muestra ) A. Test para µ con σ 2 conocida: Suponga que X 1, X 2,, X n, es una m.a.(n) desde N( µ, σ 2 )

Contrastes de hipótesis paramétricos

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón

Ejercicio 1(10 puntos)

PATRONES DE DISTRIBUCIÓN ESPACIAL

EJERCICIOS DE PRUEBA DE HIPOTESIS

INDICE. Prólogo a la Segunda Edición

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

Pruebas de Hipótesis. Diseño Estadístico y Herramientas para la Calidad. Pruebas de Hipótesis. Hipótesis

Probabilidad y Estadística

Programa de estudios. 1) Muestra y población. Parámetros estimadores y estadísticos. Distribución de Gauss. Intervalo de confianza

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24

2. El razonamiento inductivo, mediante el cual una determinada proposición de orden específico se traslada al orden general, es decir, se generaliza.

Cómo se hace la Prueba t a mano?

Proyecto Tema 8: Tests de hipótesis. Resumen teórico

Facultad de Ciencias Sociales - Universidad de la República

ESTADÍSTICA. Tema 4 Regresión lineal simple

OTRAS HERRAMIETAS ESTADISTICAS UTILES. Dra. ALBA CECILIA GARZON

5.9 Aseguramiento de la calidad de los resultados de ensayo y/o calibración

Tema I. Introducción. Ciro el Grande ( A.C.)

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN

PRÁCTICA 5: CONTRASTES DE HIPÓTESIS PARAMÉTRICOS

CÁLCULO DE INCERTIDUMBRE EN LAS MEDICIONES

Tema 5. Muestreo y distribuciones muestrales

Unidad Temática 3: Probabilidad y Variables Aleatorias

TEST DE HIPÓTESIS. Ejemplo: vamos a analizar los resultados de 5 Servicios de Neonatología de una

Objetivos. 1. Variable Aleatoria y Función de Probabilidad. Tema 4: Variables aleatorias discretas Denición de Variable aleatoria

Tema 1.- Correlación Lineal

TEMA 1. MATRICES, DETERMINANTES Y APLICACIÓN DE LOS DETERMINANTES. CONCEPTO DE MATRIZ. LA MATRIZ COMO EXPRESIÓN DE TABLAS Y GRAFOS.

Tema 7 Intervalos de confianza Hugo S. Salinas

Unidad Temática 2 Probabilidad

de 1 a 3 15 Desarrollo de ideas y precisión proposi Conclusión de 0 a 1 de 1 a 3

Cómo introducir Prueba de Hipótesis para una media, utilizando experimentos en el salón de clase.

Conceptos del contraste de hipótesis

CAPÍTULO 10 ESTIMACIÓN POR PUNTO Y POR INTERVALO 1.- ESTIMACIÓN PUNTUAL DE LA MEDIA Y DE LA VARIANZA 2.- INTERVALO DE CONFIANZA PARA LA MEDIA

Definición de probabilidad

Tema 5 Algunas distribuciones importantes

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

Estadística Convocatoria de Junio Facultad de Ciencias del Mar. Curso 2009/10 28/06/10

Contrastes de hipótesis estadísticas. Contrastes paramétricos

Práctica 5 ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS

PLAN DE TRABAJO 9 Período 3/09/07 al 28/09/07

Tema 3: Cálculo de Probabilidades Unidad 1: Introducción y Concepto

ESTATINAS EN PERSONAS MAYORES

no paramétrica comparar más de dos grupos de rangos (medianas)

METODOLOGÍA DE MUESTREO PARA REPORTE DE TENDENCIAS 4o BÁSICO Y 2o MEDIO SIMCE 2010

Teoría de la decisión

Tema 2. Introducción a la Estadística Bayesiana

Tema 8. Análisis de dos variables Ejercicios resueltos 1

UNIVERSIDAD CENTROCCIDENTAL LISANDRO ALVARADO DECANATO DE INGENIERIA CIVIL ESTADISTICA. CARÁCTER: Obligatoria DENSIDAD HORARIA HT HP HS UCS THS/SEM

INFORME SECTOR. AIDO ARTES GRÁFICAS. Análisis de ciclo de vida de libros impresos

Planteo del problema, Hipótesis (Construcción y Análisis de modelos) Predicciones: alcance de las hipótesis. EXPERIMENTOS Selección del/los modelos

Jesús Eduardo Pulido Guatire, marzo Diagrama de Dispersión y Correlación Lineal Simple

15/06/2008. Los ECC son instrumentos de medida de la eficacia de una intervención terapéutica.

Reporte de Pobreza por Ingresos JUNIO 2015

Probabilidad y Estadística

EVALUACION DE RESULTADOS INTRA-LABORATORIO. EDWIN GUILLEN Servicio Nacional de Metrología INDECOPI Simposio de Metrología Lima PERU - Mayo del 2010

Tema 7: Estadística y probabilidad

Sesión 13. Introducción a la Prueba de Hipótesis. Estadística II Equipo Docente: Iris Gallardo - Andrés Antivilo Francisco Marro

1. Caso no lineal: ajuste de una función potencial

1 Introducción. 2 Modelo. Hipótesis del modelo. MODELO DE REGRESIÓN MÚLTIPLE Julián de la Horra Departamento de Matemáticas U.A.M.

4.12 Ciertos teoremas fundamentales del cálculo de probabilidades

Probabilidad y Estadística

Bloque 1. Contenidos comunes. (Total: 3 sesiones)

Método de cuadrados mínimos

8 MEDIDAS DE POSICIÓN

para una muestra Ref: Apuntes de Estadística, Mtra Leticia de la Torre Instituto Tecnológico de Chiuhuahua

Lección 18: Utilidad de la estadística

Transcripción:

MEDICINA BASADA Intervalos de confianza Roberto Candia B, Gianella Caiozzi A. Confidence intervals En artículos previos hemos abordado cómo analizar en forma crítica la validez de un estudio de terapia 1-3 y cómo expresar los resultados con distintas medidas de efecto (riesgo absoluto, riesgo relativo, número necesario para tratar) 4. Así, al momento de aplicar los resultados de un estudio, lo hacemos utilizando el número que se nos entrega, lo que conocemos como estimador puntual. Si el estudio se volviera a realizar en condiciones idénticas, pero con una nueva muestra, es probable que el resultado no sea exactamente igual, ya que el valor que se nos entrega es una aproximación del valor real. El valor real es el que se obtendría al aplicar la intervención a la población completa 5, entendiendo población como el total de pacientes idénticos a los del estudio dentro de la población general. Este es el valor que realmente nos interesa aplicar en la práctica clínica. Utilizando los datos de un estudio podemos estimar un rango en el que se encuentra con alta probabilidad el valor real, y es precisamente este rango lo que conocemos como intervalo de confianza. Este artículo pretende ayudar a los clínicos a comprender e interpretar un intervalo de confianza, su relación con el tamaño muestral y advertir las diferencias comparativas con el valor P. INTERVALO DE CONFIANZA (IC): DEFINICIÓN Y PROPIEDADES El intervalo de confianza describe la variabilidad entre la medida obtenida en un estudio y la medida real de la población (el valor real). Corresponde a un rango de valores, cuya distribución es normal y en el cual se encuentra, con alta probabilidad, el valor real de una determinada variable. Esta «alta probabilidad» se ha establecido por consenso en 95%. Así, un intervalo de confianza de 95% nos indica que dentro del rango dado se encuentra el valor real de un parámetro con 95% de certeza 5-8. Para comprender y hacer intuitivo el concepto de intervalo de confianza utilizaremos un ejemplo clásico 6 : Supongamos que tenemos una moneda, la cual puede o no estar balanceada. Así, después de varios lanzamientos, la probabilidad que el resultado sea sello variará desde 0 (todas las veces cara, es decir, una moneda balanceada) hasta 1 (todas las veces sello, nuevamente balanceada), pasando por 0,5 (la mitad de las veces sello y las otras cara, lo que equivale a una moneda no balanceada). Como no conocemos la verdadera naturaleza de la moneda, vamos a experimentar con ella. Recibido el 2 de junio, 2005. Aceptado el 5 de julio, 2005. Unidad de Medicina Basada en Evidencia, Pontificia Universidad Católica de Chile. Santiago, Chile. 1111

Iniciamos el experimento con 2 lanzamientos, uno es cara y el otro es sello. La probabilidad de que el resultado sea sello fue 0,5, con lo que podríamos concluir que la moneda no está balanceada, sin embargo, con sólo 2 lanzamientos podemos concluir con total certeza que esa es la naturaleza de la moneda? La respuesta es no, por lo tanto cuál es el rango de valores donde se encuentra el valor real? Dado que el azar pudo influir en este resultado, uno acepta que el rango de valores reales posibles es amplio, incluso desde uno tan bajo como 0 a uno tan alto como 1, por lo tanto aún no estamos seguros de la naturaleza de nuestra moneda. Considerando lo anterior, ampliamos el experimento y realizamos 8 nuevos lanzamientos (10 en total), resultando 5 caras y 5 sellos. Nuevamente el resultado es 0,5, sin embargo, ahora intuitivamente nos percatamos que la verdadera naturaleza de la moneda se encuentra en un rango menos amplio. Por ejemplo, es poco probable que después de 10 lanzamientos 9 sean sello, menos aún que todos lo sean, sin embargo, aún es factible que 8 ó 7 ó 6 sí lo sean. Así, nuestro nuevo rango puede variar entre 0,2 y 0,8, pero con un alcance: todos advertimos que si bien 0,8 y 0,2 son posibles, los valores centrales (0,4 y 0,6) lo son más aún, siendo 0,5 el más probable. Decidimos seguir experimentando, realizando 90 nuevos lanzamientos (100 en total), resultando 50 caras y 50 sellos. Nuevamente el resultado es 0,5, advirtiendo que cada vez es más probable que la verdadera naturaleza de nuestra moneda es el de una no balanceada, pero aún con un rango de variabilidad que podríamos estimar entre 0,4 y 0,6 (es decir, que después de 100 lanzamientos, el resultado real varíe entre 40 y 60 sellos). Realizamos 1.000 lanzamientos, resultando 500 sellos y 500 caras, con lo que estamos aún más seguros que nuestra moneda no está balanceada (nuestro rango puede ser 0,45 a 0,55 o menor). El ejemplo anterior nos permite aclarar varios conceptos: La «verdadera naturaleza» de nuestra moneda (si está balanceada o no) corresponde al valor real. El rango de valores reales posibles, es decir, el rango donde se encuentra la verdadera naturaleza de nuestra moneda, corresponde al IC. El valor real más probable corresponde al estimador puntual del estudio, en este caso 0,5. Finalmente, advertimos la relación inversa entre la amplitud del IC y el tamaño muestral: si consideramos que el número de lanzamientos representa el n de la muestra, observamos que mientras más pequeño es el n más amplio es el IC. A mayor número de lanzamientos (mayor n) más certeza tenemos que el resultado del experimento se acerca al valor real, por lo tanto el IC es más estrecho 5-8. Para llevar a la práctica el concepto vamos a recurrir al ejemplo utilizado en el artículo anterior: la comparación de una nueva droga A versus una droga B en la prevención de AVE en pacientes con antecedente de accidente isquémico transitorio (AIT) (Tabla 1) 4. Tabla 1. Resultados de un ensayo clínico hipotético 4 Tratamiento AVE Total Sí No Droga A 10 250 260 Droga B 42 480 522 Total 52 730 782 Al analizar estos datos se obtiene una reducción absoluta del riesgo (RRA) de 4,2% con 95% de intervalo de confianza de 0,9% a 7,5%. Esto quiere decir que el valor real, es decir, el resultante al aplicar la intervención a la población total de pacientes con AIT, está con 95% de probabilidad entre un RRA de 0,9% a 7,5%, siendo el valor más probable 4,2%. Si aumentamos el n de la muestra a 20.000 obtendríamos nuevamente un RRA de 4,2%, pero con un intervalo de confianza más estrecho, de 3,5% a 4,9% (Fórmula en apéndice 1). Apéndice 1. Fórmula de intervalo de confianza: Estimador puntual ± 1,96 x Donde: p1 Tasa de eventos grupo 1 p2 Tasa de eventos grupo 2 n1 n grupo 1 n2 n grupo 2 p1 (1-p1) + p1 (1-p2) n1 n2 1112

INTERVALOS DE CONFIANZA - R Candia et al INTERPRETACIÓN DE UN IC El intervalo de confianza es una medida de precisión que permite al clínico evaluar 2 aspectos de un resultado (estimador puntual): 1. Si existe diferencia estadística significativa. 2. Si tal diferencia es relevante para recomendarla a mis pacientes (relevancia clínica). Para analizar si existe o no diferencia estadística significativa debemos observar los extremos del IC. Independiente si el estimador puntual muestra beneficio o daño, debemos verificar si alguno de los extremos del IC pasa sobre la línea del no efecto. Si es así, existe la posibilidad de que el valor real corresponda al no efecto o incluso tenga un efecto opuesto al esperado. En este caso no existiría diferencia estadísticamente significativa entre aplicar o no la intervención (Figura 1) 7,8. Cuando un estudio demuestra un efecto con significación estadística (es decir el extremo del IC no cruza ni toca la línea del no efecto), el clínico debe definir cuál es el beneficio mínimo necesario para recomendar la terapia, lo que llamaremos umbral. Así, nuestro estudio hipotético demuestra beneficio estadístico significativo, siendo el beneficio mínimo probable un RRA de 0,9%. El que este beneficio tenga relevancia clínica depende del tipo de evento prevenido o favorecido, los efectos adversos de la droga A v/s la droga B, el costo, las circunstancias clínicas, etc. Si el evento a prevenir es banal, o si la droga A tiene muchos efectos adversos y es más cara que B, nuestro umbral va a ser alto, por lo tanto el beneficio demostrado en nuestro estudio no sería relevante 7,8 (Figura 2). Al contrario, si el evento a prevenir es relevante en sí mismo (por ej: mortalidad o invalidez), o si la nueva droga es más barata y sin efectos adversos, tal vez con demostrar un RRA de sólo 0,5% nos basta para recomendarla (umbral), por lo tanto nuestro estudio no sólo demuestra diferencia estadísticamente significativa, sino que también beneficio relevante para el paciente (Figura 3). Así, para evaluar beneficio clínico, primero debemos establecer un umbral mínimo de beneficio, el que depende del tipo de evento a prevenir o favorecer los efectos adversos, costos, etc. de la nueva droga, y luego observar el beneficio mínimo probable que muestra el estudio, que corresponde Figura 1. Estudio hipotético cuyo estimador puntual informa un RRA 2,8%, pero cuyo IC sobrepasa la línea del no efecto, por lo tanto es posible que el valor real sea daño. No existe diferencia estadística significativa en este estudio. Figura 2. Estudio hipotético que informa beneficio estadístico significativo, sin embargo, el IC pasa sobre el beneficio mínimo necesario para recomendar la terapia (umbral, RRA 3%). El beneficio mínimo demostrado (RRA 0,9%) no es suficiente para recomendar la terapia. Figura 3. Estudio hipotético que informa beneficio estadístico significativo. El IC no sobrepasa el beneficio mínimo necesario para recomendar la terapia (umbral, RRA 0,5%). El beneficio mínimo demostrado (RRA 0,9%) es suficiente para recomendar la terapia. 1113

al extremo del IC más cercano a la línea del no efecto. Si el extremo del IC no sobrepasa el umbral se asume que el beneficio mínimo probable es suficiente para recomendar la nueva terapia. Existe la posibilidad que la nueva droga hiciese daño (RRA negativo). El proceso es similar al anterior, estableciendo un umbral máximo de daño tolerable, y observando el extremo del IC que más se acerca a la línea del no efecto. Si la nueva droga genera más daño con una diferencia estadísticamente significativa, debemos observar si el extremo del IC sobrepasa ese umbral. Si no lo hace se asume que el daño mínimo probable es más alto que lo tolerable, por lo tanto se está en condiciones de rechazar la nueva terapia 7,8 (Figura 4). Figura 4. Estudio hipotético que informa daño estadístico significativo. El IC no sobrepasa el daño mínimo establecido como umbral. El daño mínimo demostrado es suficientemente importante para rechazar la terapia. VALOR P Al comparar dos grupos en un estudio podemos demostrar que no existe diferencia entre ambos (hipótesis nula) o que sí la hay (hipótesis alternativa) 9,10. El valor P es un test de hipótesis que nos ayuda a afirmar con cierto nivel de seguridad (por consenso se usa 95%, que se expresa como P <0,05) que una de las hipótesis es la correcta. Para nuestro ejemplo, la hipótesis nula corresponde a la igualdad de resultados al usar la droga A o B, mientras que la hipótesis alternativa supone que una de ellas es mejor que la otra en prevenir la enfermedad. El valor P representa la probabilidad que una diferencia observada entre 2 grupos sea sólo debida al azar, es decir, la probabilidad que la hipótesis nula sea verdadera a pesar de observar diferencia en un estudio 7-9. Como toda probabilidad, puede tener valores desde 0 a 1. Valores más cercanos a 1 indican que existe una alta probabilidad que las diferencias observadas sean sólo por azar, es decir, apoya la hipótesis nula. En cambio, valores más cercanos a 0 apoyan la hipótesis alternativa. Apliquemos este concepto a nuestro ejemplo, en que se obtiene un RRA de 4,2% con un valor P <0,05 (p=0,039). Si asumimos como valor real que la droga A es igual a B (hipótesis nula) y pudiéramos repetir el estudio muchas veces, el P <0,05 nos dice que en menos de 5% de las ocasiones se observaría tal diferencia entre ambas, sólo por azar. Dicho de otra forma, en la mayor parte de las ocasiones la diferencia observada no se debe al azar, por lo tanto rechazamos la hipótesis nula y establecemos que existe diferencia estadística significativa 9,10. El valor P se correlaciona en forma muy estrecha con el intervalo de confianza, ya que si uno muestra diferencia estadística significativa el otro también lo hace, y viceversa. Sin embargo, el valor P, a diferencia del IC, no nos entrega información respecto al rango en el que se encuentra la magnitud del efecto de un determinado tratamiento (valor real), por lo que sólo nos habla de diferencias estadísticas significativas, sin permitirnos evaluar si esta diferencia es relevante para mi paciente. Por ejemplo, un resultado significativo (P <0,05) podría incluir diferencias clínicamente irrelevantes, y resultados no significativos (P >0,05) podrían esconder una diferencia clínicamente importante entre 2 tratamientos si el estudio no incluye un tamaño muestral adecuado (un estudio con bajo poder puede no mostrar una diferencia que realmente sí existe) 8. De esta forma, aunque el valor P mide la fuerza de una asociación, siempre es útil el intervalo de confianza para complementar la evaluación de la magnitud del efecto de una intervención y poder realizar una interpretación adecuada de los resultados de un estudio. CONCLUSIONES Al leer un estudio es muy importante interpretar los resultados en forma correcta. Esto supone 1114

INTERVALOS DE CONFIANZA - R Candia et al comprender el significado del estimador puntual y de sus medidas de precisión, lo que permite extrapolar los datos a la población de interés. Tanto el análisis de un intervalo de confianza como el de un valor P nos permiten determinar diferencias estadísticas significativas, sin embargo sólo el IC nos permite evaluar el rango de valores donde posiblemente se encuentra el valor real, y por lo tanto, permite realizar una mejor interpretación y aplicación clínica de los resultados. REFERENCIAS 1. PEÑALOZA B, CANDIA R. Por qué vale la pena randomizar un estudio de terapia? Rev Méd Chile 2004; 132: 1007-14. 2. LETELIER LM, MANRÍQUEZ JJ, CLARO JC. El «ciego» en los ensayos clínicos importa? Rev Méd Chile 2004; 132: 1137-9. 3. CAPURRO D, GABRIELLI L, LETELIER LM. Importancia de la intención de tratar y el seguimiento en la validez interna de un estudio clínico randomizado. Rev Méd Chile 2004; 132: 1557-60. 4. RIVERA S, LARRONDO F, ORTEGA J. Evaluación de resultados de un artículo de tratamiento. Rev Méd Chile 2005; 133: 593-6. 5. WHITLEY E, BALL J. Statistics review 2: Samples and populations. Critical Care 2002; 6: 143-8. 6. GUYATT G, JAESCHKE R, HEDDLE N, COOK D, SHANNON H, WALTER S. Basic statistics for clinicians 2. Interpreting study results: confidence intervals. CMAJ 1995; 152: 169-73. 7. MONTORI V, KLEINBART J, NEWMAN T, KEITZ S, WYER P, MOYER V, GUYATT G. Tips for learners of evidencebased medicine: 2. Measures of precision (confidence intervals). CMAJ 2004; 171: 611-5. 8. MONTORI V, KLEINBART J, NEWMAN T, KEITZ S, WYER P, MOYER V ET AL. Tips for teachers of evidencebased medicine 2: Confidence intervals and p values. CMAJ 2004; 171, Online 1-12 (http:// www.cmaj.ca/cgi/data/171/6/611/dc1/1). 9. WHITLEY E, BALL J. Statistics review 3: Hypothesis testing and P values. Critical Care 2002; 6: 222-5. 10. SHAKESPEARE T, GEBSKI V, VENESS M, SIMES J. Improving interpretation of clinical studies by use of confidence levels, clinical significance curves, and risk-benefit contours. Lancet 2001; 357: 1349-53. 1115