Percy MaytaTristán MD, MPH (c), MHEd (c) Profesor, Escuela de Medicina, Universidad Peruana de Ciencias Aplicadas Profesor, Escuela de Posgrado, Universidad Peruana Cayetano Heredia Comité Editor, Revista Peruana de Medicina Experimental y Salud Publica Comité de Ética, Instituto Nacional de Salud percy.mayta@upc.edu.pe
Recordar algunos conceptos básicos de estadística para poder comprender el uso de pruebas de hipótesis. Conocer los pasos para elegir una prueba estadística. Conocer las principales pruebas estadísticas y los escenarios en los que se pueden usar. Conocer la forma de redactar un plan de análisis de datos en un protocolo de investigación.
Día a día, cada decisión que tomamos tiene un margen de error (las cirugías tienen un margen de error, los vuelos aéreos tienen un margen de error, etc.) Conocer cual es la magnitud del error es la tarea del investigador. Por eso se debe plantear en cada caso, el error que estamos dispuestos a aceptar.
Desde el punto de vista matemático siempre se tiene dos hipótesis: Hipótesis nula(h0) o hipótesis de trabajo Hipótesis alternativa (H1) o hipótesis preliminar del investigador
Ejemplos: H0: la variable edad tiene distribución normal H1: la variable edad no tiene distribución normal H0: µ(edad mujeres) = µ(edad varones) H1: µ(edad mujeres) µ(edad varones)
Nivel de significancia: es la máxima cantidad de error que estamos dispuestos aceptar para dar como válida la hipótesis del investigador En líneas generales siempre se establece en 5% o menos(0.05 ó menor)
ErrortipoI: Conocidocomoalfa(α) Ocurre cuando rechazamos la hipótesis nula cuando esta es verdadera La meta es mantener este error lo más pequeño posible
ErrortipoII: Conocidocomobeta(β) Ocurre cuando no rechazamos la hipótesis nula cuando está es falsa La meta es mantener este error lo más pequeño posible(aceptado: 0.20)
Poder(potencia): Elpoderdeunestudiovienedadopor(1 β) Es la probabilidad de rechazar la hipótesis nula cuando es falsa La meta es mantener el poder de un estudio lo más grande posible
Si especificamos que α = 0,05, veremos una región de rechazo:
El p-valor: es la probabilidad de equivocarse al aceptar la hipótesis del investigador como verdadera; es decir, la probabilidad de cometer error tipo I. Interpretación del p-valor: Si el valor de p es menor que el error tipo I (α), entonces es posible rechazar la hipótesis nula Si el valor de p es igual o mayor que el error tipo I (α), entonces no es posible rechazar la hipótesis nula.
Atomarencuenta: ElerrortipoI(α)es0,05enlamayoríadecasos El error tipo II (β) es en la mayoría de casos 0,20, de esta manera el poder de un estudio es de 0,80 (80%) Por convención se juzga como estadísticamente significativosielvalordep<0.05
Hace referencia a la concentración de los valores estimados en torno al valor que se trata de estimar, de tal manera que la distancia entre el valor a estimar y el valor estimado sea pequeña
Esunconceptounidoaltamañodemuestra Por ejemplo: si deseo calcular el tamaño de muestra para un estudio que quiere determinar la prevalencia de caries en escolares de Lima, se requiere saber la prevalencia esperada y la precisión de este estimado.
Es lo cerca que el resultado de una medición está del verdadero valor. La precisión y la exactitud son conceptos ligados pero no significan lo mismo.
Se entiende por un par de números entre los cuales se estima que estará cierto valor desconocido con una determinada probabilidad de acierto. Setratadequelosresultadosdeunamuestra permitan inferir el estimado de la población.
La probabilidad de que el verdadero valor se encuentre en el intervalo que hemos construido se denomina nivel de confianza y sedenotacomo(1-α) Generalmente se construye intervalos de confianza de 95% (otros menos frecuentes sonde90%yde99%)
Se puede construir un intervalo de confianza al 95% (IC95%) para una media, una proporción, una prevalencia, una diferencia, entre otros. A mayor tamaño de muestra, mayor precisión y se tendrá un intervalo de confianza más pequeño.
Cuando se comete un error de tipo I Cuando se comete un error de tipo II Qué es el valor de p Cuando se hace más pequeño un intervalo de confianza.
Cuáles son los objetivos de mi estudio. Qué hipótesis he planteado. Cuál es la naturaleza de mi variable dependiente e independiente.
Estos elementos deben ser previstos desde el protocolo para calcular el tamaño muestral mínimo requerido para demostrar nuestra hipótesis.
SI Grupos relacionados? NO Test de McNemar OJO :) Cuando menos, un valor esperado es menor de 2 o cuando menos el 20% de los valores esperados es menor a 5 NO SI Chi Cuadrado Test Exacto de Fisher
Se desea evaluar si existe asociación entre el género y el uso de piercings en una población de estudiantes de Medicina de la Universidad Z. Se desarrolla un estudio con 39 alumnos de los cuales 8 tienen piercing. Ho: No existe asociación entre el género y el usar piercing
NO Hay valores esperado menor de 2 o cuando menos el 20% son menores a 5?
Test Exacto de Fisher Qué concluiría? Ho: No existe asociación entre el género y el usar piercing
Se desarrolla un estudio de casos y controles, considerando como caso a las personas con la enfermedad gavinica (EG) y como variable de exposición consumo de Redbull. De las 400 personas con EG, 100 se expusieron al Redbull; de los 1200 controles, 200 estuvieron expuestas al Redbull. Ho: No existe asociación entre la enfermedad gavinica y el consumo de Redbull
NO Hay valores esperado menor de 2 o cuando menos el 20% son menores a 5?
Chi Cuadrado Qué concluiría? Ho: No existe asociación entre la enfermedad gavinica y el consumo de Redbull
OR Qué concluiría? Ho: No existe asociación entre la enfermedad gavinica y el consumo de Redbull
Debemos tener claro algunos pasos cuando elegimos una prueba: Cuáles son mis objetivos de estudio. Cuál es mi variable dependiente (outcome) e independiente (exposición), y de que tipo son. Cuál es mi hipótesis (traducir en términos estadísticos). Qué supuestos requiero evaluar para saber que prueba elegir. OJO, este proceso lo debemos hacer desde el protocolo y es la base para estimar el tamaño de muestra.
No continuaremos revisando los supuestos de cada prueba estadística (es todo un curso). Veremos tips básicos a tener en cuenta para cada tipo de prueba (las más comunes).
En otras palabras, evaluar si hay asociación entre dos variables, donde una de ellas es categórica dicotómica Variables numéricas con distribución normal Prueba t de Student (para datos no pareados). Diferencia de medias Asociación entre la edad y la intención de emigrar en estudiantes de medicina. Variables numéricas sin distribución normal tipo Rangos (Orden) o Scores (Puntajes) Prueba de Mann-Whitney. (suma de rangos de Wilcoxon). Diferencia de medianas Asociación entre la satisfacción del usuario y la intención de regreso al servicio. Variable categóricas (Dicotómicas y Politómicas) Prueba de Chi cuadrado o Test Exacto de Fisher según caso. Para evaluar asociación entre dos variables categóricas. Diferencia de proporciones Asociación entre el nivel socioeconómico y la presencia de anemia
En otras palabras, evaluar si hay asociación entre dos variables: Por ejemplo pre-post o dos formas de medir lo mismo en una misma unidad., donde una de ellas es categórica dicotómica Variables numéricas con distribución normal Prueba t de Student (para datos no pareados). Diferencia de medias Cambios en el nivel de colesterol en personas en tratamiento con sacha inchi (antes - después) Variables numéricas sin distribución normal tipo Rangos (Orden) o Scores (Puntajes) Prueba de Mann-Whitney. (suma de rangos de Wilcoxon). Diferencia de medianas Cambios en el nivel de dolor articular luego de un programa de taichi (antes - después) Variable categóricas (Dicotómicas y Politómicas) Prueba de Chi cuadrado o Test Exacto de Fisher según caso. Para evaluar asociación entre dos variables categóricas. Diferencia de proporciones Cambios en la prevalencia de burnout luego de un programa de yoga (antes y después)
En otras palabras, evaluar si hay asociación entre dos variables, donde una de ellas es categórica politómica Variables numéricas con distribución normal ANOVA Diferencia de medias Asociación entre los niveles de glucosa y dosis de jarabe de yacón en ratas. Variables numéricas sin distribución normal tipo Rangos (Orden) o Scores (Puntajes) Kruskall Wallis Diferencia de medianas Asociación entre el puntaje de dolor y las dosis de uña de gato en ratas Variable categóricas (Dicotómicas y Politómicas) Prueba de Chi cuadrado o Test Exacto de Fisher según caso. Diferencia de proporciones Asociación entre la intensidad del higado graso según dosis de boldo en ratas.
En otras palabras, evaluar la magnitud y direccionalidad de la asociación entre dos variables Variables numéricas con distribución normal Variables numéricas sin distribución normal tipo Rangos (Orden) o Scores (Puntajes) Variable categóricas (Dicotómicas y Politómicas) Correlación de Pearson Correlación de Spearman Prueba de Chi cuadrado o Test Exacto de Fisher según caso. Asociación entre el peso de la madre y el peso del niño al nacer Asociación entre el puntaje de calidad del sueño y el rendimiento académico Asociación entre la intensidad del higado graso según dosis de boldo en ratas.
En otras palabras, evaluar la magnitud y direccionalidad de la asociación entre dos variables Variables respuesta es numérica con distribución normal Variable respuesta es ordinal o politómica Variable respuesta es categórica dicotómica Regresión lineal (simple, múltiple) Asociación entre el peso al nacer y el peso de la madre, ajustado por diabetes gestacional, edad, paridad, nivel socioeconómico. Regresión logística ordinal o multinomial Asociación entre el peso (normal, sobrepeso, obeso) y el nivel socioeconómico, ajustado por edad, sexo, ejercicio, educación, ruralidad. Regresión logística (simple o múltiple). Prevalencia >20% buscar otras opciones (GLM, poisson) Asociación entre la intención de emigrar y el nivel educativo de los padres, ajustado por edad, sexo, tipo de universidad, nivel socioeconómico.
La investigación se hace en redes y en equipo. El investigador no debe saber a la perfección todos los aspectos relacionados con los procesos del trabajo, pero si entender por qué se hicieron. Alguien del equipo debe hacerse responsable de la parte del análisis de datos. Deficiencias en el análisis de datos es uno de los principales motivos de rechazo de artículos.
Se definirá el paquete estadístico a usar (STATA, SPSS, R, SAS, Epi-Info, etc.) Sedebeexponerlastécnicaslógicasybásicas para análisis (estadísticas descriptivas) que serán empleadas para descifrar lo que revelan losdatosquesehanrecogidos Se expresa también análisis y modelos más avanzados de ser necesario
Randomized control trial to evaluate the effect of a novel-based intervention to increase HIV testing in MSM in Lima, Peru
Hepatitis B infection and its association with consistent condom use: A population-based survey in Peru
USO DE TECNOLOGÍAS DE INFORMACIÓN Y COMUNICACIÓN EN MÉDICOS RECIÉN EGRESADOS DE LIMA, 2011
25 Artículos publicados 20 15 10 5 Estudiantes Medicina No medicina 0 2007 2008 2009 2010 2011
Cuál era el tema de esta clase?
Revise sus objetivos y enuncie sus hipótesis. Revise las características de las variables implicadas. Plantee cual sería la prueba estadística a elegir.