Curso: Bioestadística básica para médicos asistenciales. Clase Nº 7: Intervalo de Confianza



Documentos relacionados
Ecuaciones de primer grado con dos incógnitas

1.1. Introducción y conceptos básicos

8.1. Introducción Dependencia/independencia estadística Representación gráfica: diagrama de dispersión Regresión...

UNIDAD 1 LAS LEYES FINANCIERAS DE CAPITALIZACIÓN DESCUENTO

ANÁLISIS DE DATOS NO NUMERICOS

Apuntes de Matemática Discreta 9. Funciones

ESTIMACIÓN. puntual y por intervalo

Programa para el Mejoramiento de la Enseñanza de la Matemática en ANEP Proyecto: Análisis, Reflexión y Producción. Fracciones

Lección 24: Lenguaje algebraico y sustituciones

Ejercicio de estadística para 3º de la ESO

Estimación. Intervalos de Confianza para la Media y para las Proporciones

La ventana de Microsoft Excel

Aproximación local. Plano tangente. Derivadas parciales.

Capítulo VI. Diagramas de Entidad Relación

ESTIMACION DE INTERVALOS DE CONFIANZA

Indicaciones específicas para los análisis estadísticos.

1.4. Comparación con otras actividades de ocio

Datos del autor. Nombres y apellido: Germán Andrés Paz. Lugar de nacimiento: Rosario (Código Postal 2000), Santa Fe, Argentina

1.4.- D E S I G U A L D A D E S

Funciones, x, y, gráficos

15 CORREO WEB CORREO WEB

Eduardo Kido 26-Mayo-2004 ANÁLISIS DE DATOS

MANUAL DE USO PARA ESTUDIANTES PLATAFORMA VIRTUAL UNIVERSIDAD TECNOLOGICA INDOAMERICA

Mediante la aplicación de la metodología a los datos disponibles para este estudio, esta

MINI MANUAL PARA CREAR FORMULARIOS CON PHP Marzo 2007

Tema 3. Medidas de tendencia central Introducción. Contenido

MANUAL DE USUARIO DE LA APLICACIÓN DE ACREDITACION DE ACTIVIDADES DE FORMACION CONTINUADA. Perfil Entidad Proveedora

LÍMITES Y CONTINUIDAD DE FUNCIONES

INTRODUCCIÓN-CONCEPTOS BÁSICOS


Pruebas de. Hipótesis

1. MEDIDAS DE TENDENCIA CENTRAL

6 M. C. J. A G U S T I N F L O R E S A V I L A

ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EN SALUD Medidas de Tendencia Central y Dispersión

MATEMÁTICAS para estudiantes de primer curso de facultades y escuelas técnicas

ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS

1. Dominio, simetría, puntos de corte y periodicidad

Técnicas de valor presente para calcular el valor en uso

Medidas de tendencia central o de posición: situación de los valores alrededor

EJERCICIOS DE MATEMÁTICAS I HOJA 4. Ejercicio 1. Se consideran los vectores

Un problema sobre repetidas apuestas al azar

Módulo 9 Sistema matemático y operaciones binarias

Resumen ÁREA DE FACTURACIÓN::INFORMES::Pedidos Detalle Resumen ÁREA DE

Covarianza y coeficiente de correlación

Análisis de propuestas de evaluación en las aulas de América Latina

Actividades con GeoGebra

Tema 2. Espacios Vectoriales Introducción

Diagnosis y Crítica del modelo -Ajuste de distribuciones con Statgraphics-

MEDIDAS DE TENDENCIA CENTRAL

ESTRUCTURAS ALGEBRAICAS 1

Función Logaritmo, dominio y traslación. Guía del profesor.

GUÍA TÉCNICA PARA LA DEFINICIÓN DE COMPROMISOS DE CALIDAD Y SUS INDICADORES

2) Se ha considerado únicamente la mano de obra, teniéndose en cuenta las horas utilizadas en cada actividad por unidad de página.

DOMINIO Y RANGO DE UNA FUNCIÓN I N D I C E. martilloatomico@gmail.com. Página. Titulo:

Análisis de los datos

PANEL DE CONTROL (Zona de Administración) MANUAL DE USO Por conexanet. Revisión 1.1 Fecha

COMO MEDIR LA EFECTIVIDAD DE LA CONCIENTIZACIÓN

ESTUDIO PRELIMINAR DE ALGUNOS FACTORES INFLUYENTES EN EL RENDIMIENTO ACADÉMICO DE ALUMNOS DEL GRUPO EXECUTIVE FISIOTERAPIA

ANÁLISIS DINÁMICO DEL RIESGO DE UN PROYECTO

Asignatura: Econometría. Conceptos MUY Básicos de Estadística

CAPITULO II CARACTERISTICAS DE LOS INSTRUMENTOS DE MEDICION

Ingeniería del Software I Clase de Testing Funcional 2do. Cuatrimestre de 2007

1 de cada 5 ticos usa redes Sociales

EJERCICIOS RESUELTOS SOBRE ERRORES DE REDONDEO

ERRORES CONCEPTUALES DE ESTADÍSTICA EN ESTUDIANTES

Creación paso a paso de Formularios con Google (Parte I) (AKA: no corrijo nunca más!)

I. RELACIONES Y FUNCIONES 1.1. PRODUCTO CARTESIANO { }

LABORATORIO Nº 2 GUÍA PARA REALIZAR FORMULAS EN EXCEL

Lección 1-Introducción a los Polinomios y Suma y Resta de Polinomios. Dra. Noemí L. Ruiz Limardo 2009

Alberto Marcano Díaz

Procesos Críticos en el Desarrollo de Software

Tema 07. LÍMITES Y CONTINUIDAD DE FUNCIONES

Profesor Raúl Vega Muñoz LÍMITES

Transformación de gráfica de funciones

MÓDULO 2. LEYES FINANCIERAS DE CAPITALIZACIÓN Y DESCUENTO SIMPLE

Capítulo 5: METODOLOGÍA APLICABLE A LAS NORMAS NE AI

Introducción

Muchas veces hemos visto un juego de billar y no nos percatamos de los movimientos de las bolas (ver gráfico 8). Gráfico 8

Funcionamiento de la sección Unidades Centinela (UC)

TIPOS DE TEXTO Resumen

TABLA DE DECISION. Consideremos la siguiente tabla, expresada en forma genérica, como ejemplo y establezcamos la manera en que debe leerse.

Anexo 1: Demostraciones

35 Facultad de Ciencias Universidad de Los Andes Mérida-Venezuela. Potencial Eléctrico

Comprendiendo el Histograma. El fotometro del siglo 21

4 Pruebas y análisis del software

GUÍA DE USO DE LA ACTIVIDAD TÁNDEM

E 1 E 2 E 2 E 3 E 4 E 5 2E 4

FORMACIÓN DE EQUIPOS DE E-LEARNING 2.0 MÓDULO DE DISEÑO Y PRODUCCIÓN DE MATERIALES UNIDAD 6 B

G R U P O S INDICE Cómo crear una cuenta en ARQA? Cómo tener un grupo en ARQA? Secciones y funcionalidades de los grupos Configuración del grupo

Ejemplo 1.2 En el capitulo anterior se demostró que el conjunto. V = IR 2 = {(x, y) : x, y IR}

Control Estadístico de Procesos

ASOCIACIÓN LINEAL ENTRE VARIABLES CUANTITATIVAS: la correlación de Pearson

UNIDAD 1. LOS NÚMEROS ENTEROS.

Guía de uso del Sistema de Gestión de Incidencias (RT) del Servicio de Informática

CORRELACIÓN Y PREDICIÓN

Ciclo de vida y Metodologías para el desarrollo de SW Definición de la metodología

Autores en Web of Science y ResearcherID

Datos estadísticos PRESENTACIÓN DE DATOS INDIVIDUALES Y DATOS AGRUPADOS EN TABLAS Y GRÁFICOS

ANÁLISIS DE DAVID HUME DEL PRINCIPIO DE CAUSALIDAD Francesc Llorens

Transcripción:

Bioingenieria e Informatica Médica/Bioengineering- Medical [Index FAC] [Index CCVC] Informatics Curso: Bioestadística básica para médicos asistenciales Clase Nº 7: Intervalo de Confianza Raul E. Ortego, Carlos R. Secotaro Index curso - Clase anterior - Clase siguiente En este tema los conceptos se desarrollan también con palabras conocidas, pero acorde a su significado, en el marco de conversaciones cotidianas, la asociación "suena" ininteligible; por el contrario, en bioestadística, expresan un concepto muy preciso. Nos parece que la principal dificultad para entender este tema es que, justamente, se lo aborda desde el significado habitual de los términos en el lenguaje coloquial. En el diccionario de nuestras consultas (ibid), intervalo es un espacio o un tiempo que separa dos lugares o dos momentos. En música tiene una acepción, que aunque esencialmente matemática, no nos ayuda mucho a nuestros propios intríngulis. A qué espacio o tiempo está refiriéndose intervalo en bioestadística? Nuestras analogías sobre "localización" (espacio) de los valores de la variable, tal vez, nos sirvan también en este caso, ya veremos. En los coloquios, y para el diccionario (ibid), confianza tiene varias acepciones: "Esperanza firme en una persona o cosa", "Ánimo, aliento y vigor para obrar", "Familiaridad en el trato". La "cosa" en bioestadística es un determinado hallazgo. Por otro lado, una de las acepciones del verbo confiar (ibid) es: "Esperar que ocurra algo". El "algo" de referencia para la bioestadística es una repetición, un "bis". Proponemos utilizar para el lenguaje de la Estadística el siguiente significado de confianza: la esperanza firme en la veracidad de un hallazgo; también es útil la acepción de esperar que ocurra algo parecido a lo que ya sucedió. Para ratificar que seguimos dentro de la lengua de Cervantes, quizás en un dialecto en realidad, sugerimos interpretar el intervalo de confianza como la esperanza de que un fenómeno sucedido se repita dentro de límites determinados. En el tema intervalo de confianza (IC) se analiza la probabilidad de que el hallazgo en una sola muestra no sólo represente, sino que permita identificar (confianza) constantes de la población de referencia, si no exactamente, al menos aproximadamente (intervalo). Por una muestra inferir la población El análisis de muestras es el procedimiento que usa la Estadística para conocer las características de una población determinada. Los estadígrafos (funciones de las muestras) son variables y excepcionalmente coincidirán con los parámetros (funciones de la población). Más aún, en el caso de que Estadígrafos y Parámetros sean iguales, no se reconocerá esa circunstancia por cuanto los parámetros son desconocidos.

Asumido que el promedio de una muestra no coincide con el promedio de la población que se desea conocer (inferir); la estadística apela a procedimientos matemáticos para calcular la probabilidad de que el promedio de la población (µ) se ubique dentro de un rango determinado a partir de los estadígrafos hallados. No está demás recordar que rango, como vimos en Estadística Descriptiva, es una manera de señalar los límites de las localizaciones posibles, los límites del intervalo. El espacio limitado por el rango es un intervalo. La esperanza de que el promedio poblacional se encuentre en ese rango es el grado, el nivel de confianza que desea establecer. La probabilidad con la que se establecen los límites del intervalo es un coeficiente a elegir, habitualmente se opta por 95% ó 99%. Los estadígrafos se distribuyen simétricamente alrededor de los parámetros; tanto más cierta esta afirmación, cuanto más grande sea la muestra. Si se analizan experiencias con varias muestras, la confianza (esperanza) es que los diversos estadígrafos se ubicarán en el intervalo calculado con una sola de esas muestras (cualquiera) con una probabilidad predeterminada (coeficiente elegido). Quedan así definidos intervalo de confianza y coeficiente de confianza. La representación no es una reproducción en escala Trataremos de integrar el IC con ideas y expresiones que ya hemos analizado: La Distribución Simétrica o "Campana". El Error Standard (ES) o "Error por Muestreo". Confianza, esperanza, en que se repitan funciones en sucesivos muestreos. Utilizaremos nuevamente uno de los gráficos empleados para discutir ES. En el gráfico está la "campana" de la localización de cada valor de la variable de la población, la muestra "miniatura" ideal, la muestra roja ó 2 y la muestra celeste ó 1. Reutilizaremos también uno de los gráficos de la "Probabilidad de pertenecer".

Este gráfico de distribución simétrica expresa que el 68% ( 34% en cada lado de la campana ) de los valores de la variable se "localizan" ( y X ) en la campana en el rango del promedio µ ± 1 G ( Desvío Standard ); también se observa que el 95% de ellos ( 47,5% en cada lado de la campana ) se ubican en el rango µ ± 2 G, y en el rango de µ ± 3 G se ubica el 99% (49,5% en cada lado de la campana). Los expertos suelen manejarse con la "sombra" de la curva denominada "área bajo la curva" (en relleno rojo del gráfico a la derecha se observa el 99% del " área bajo la curva ") Sin hacer ningún cálculo se aprecia que los promedios (estadígrafos) de las muestras de las dos poblaciones de esta comparación (No Diabéticos y Diabéticos) se distribuyen alrededor de sus respectivos promedios (parámetros) poblacionales. La distribución de los estadígrafos de las muestras alrededor de los parámetros de su población de referencia también es prácticamente simétrica. Esto parece natural, las muestras no sólo representan, son ellas mismas expresión de fenómenos biológicos. Tanto más grandes las muestras, cuanto más simétrica cada una de ellas, y más simétrica la distribución de estadígrafos alrededor de los parámetros. Proponemos retener estas ideas para comprender el lenguaje: 1. Las muestras tienen funciones diferentes a la población que representan. 2. Las muestras de una misma población tienen funciones diferentes entre sí. 3. Las funciones de muestras de una misma población se distribuyen simétricamente alrededor de las funciones de la población representada. Para muestra basta un botón

Se puede retomar nuestra conocida "campana", por su universalidad, también para una cuestión que podríamos resumir en una afirmación y una pregunta: Los estadígrafos difieren con los parámetros y aún entre sí representando a la misma población. Cuántas muestras analizar para proyectar y/o inferir razonablemente sobre la realidad de una población? Veamos lo que sucede cuando superponemos una sola muestra con su promedio y su Desvío Standard ( ± DS) sobre su población representada (µ ± G). El 95% de los valores de la variable de la población que se localizan en la campana se encuentran dentro del rango µ ± 2 G. No hace falta hacer cuentas para percibir que el promedio de una muestra de esa población será un valor que aunque calculado (virtual) tendrá aproximadamente un 95% de probabilidades de estar dentro del mismo rango poblacional (µ ± 2G). En otros términos, analizando 100 muestras, 95 de ellas tendrán un promedio dentro de ese rango poblacional (µ ± 2 G). En la búsqueda de µ Dado el promedio de una muestra: Qué tan alejado está de el promedio µ de la población? Se puede intentar una respuesta sólo con el Desvío Standard (DS) de la muestra. Será más precisa la respuesta si se corrige ese DS con el tamaño de la muestra (n), a esa corrección del DS se la denomina Error Standard (ES) y es, como ya hemos visto, una expresión matemática del error por muestreo. Si observa el gráfico con las campanas superpuestas de una población con una de sus posibles muestras, no necesita demasiados cálculos para percibir que el promedio µ se encuentra dentro del rango ± 2 DS de la muestra.

Si en lugar de X (un valor de la variable) se emplea el promedio de la muestra ES, se mantienen las probabilidades de encontrar a µ. y se reemplaza DS por el Introducir ES significa hacer participar de los cálculos de Z al tamaño de la muestra (n). La consecuencia es: "Z" tendrá valores diferentes según se modifique "n". El valor de "Z" en el cual la probabilidad de aparición de un valor es ± 2.5% (p=0.025) para una muestra con "n" "grande" es 1.96. En otros términos, el 95% de los valores de la variable (47,5% a ambos lados de la campana) se localizarán en el rango " Z" = ± 1.96. En lenguaje matemático el 95% de los valores posibles de "Z" serán: En cualquier texto de Estadística se puede comprobar que simplemente despejando términos a partir de esta "mini" ecuación de "Z" de una muestra "grande" se concluye: Expresándolo con palabras se puede afirmar que con "Z" = 1.96 se verifica que el promedio de la población µ se localizará con un 95% de probabilidades en el intervalo. El intervalo señalado por "Z" = -1.96 y "Z" = +1.96 es el que corresponde en una campana a los valores de la muestra X de igual valor absoluto y signo opuesto que delimitan el 95% de los valores aparecidos de la muestra. Las secuencias algebraicas citadas se pueden ampliar y comprender mejor en el capítulo 10 pag 214 a 220 del libro "Modern Elementary Statistics", Second Edition del Profesor John E. Freund. Editorial Prentice Hall, Inc. Englewood Cliffs, N.J. (Prentice Hall Mathematics Series. Dr Albert A. Bennett, Editor). Muestra grande muestra pequeña En los cálculos aritméticos para despejar al promedio de la población " µ" se trabaja con el Desvío Standard ( ó G) de la población. En realidad ese dato (parámetro) tampoco es conocido; se cuenta con el estadígrafo Desvío Standard (DS). Se admite como lógico, y lo confirma la observación, que "DS" se aproxima progresivamente a "G" en la medida que aumenta el tamaño de la muestra (n). La corrección del "DS" según "n" lo expresamos como el Error Standard (ES). En muestras con variables cuantitativas continuas se considera "grande " una muestra cuando "n" es de 30 valores o más; la muestra es pequeña cuando es < 30. Para nuestra pretensión de poder entender lo que leemos y oímos en trabajos científicos que utilizan estos conceptos para sustentar conclusiones o "evidencias", quizás nos baste con recordar que con una sola

muestra se puede inferir con probabilidad conocida, razonablemente, el promedio de la población de referencia. Más aún, para memorizar, sugerimos redondear el valor de "Z" de 1.96 a 2 y retener este concepto: El promedio poblacional µ tiene alrededor de un 95 % de probabilidades de ser un valor de la variable incluído en el intervalo comprendido entre los valores extremos. La salvedad "alrededor de" se origina en que el factor que corrige al ES ya sabemos que no es siempre exactamente "2" ni tampoco siempre es 1.96 ya que es un valor inconstante influenciado por el tamaño de la muestra. En realidad al factor de corrección, que se lo denomina "t", se lo calcula desde una mini ecuación que tiene las mismas ideas que Z. El factor de corrección "t" es un valor que depende del tamaño de la muestra (n) o si se prefiere luego de una sutileza aritmética (n 1) de los "grados de libertad". La distribución t eórica "t" de las muestras o "Theoretical Sampling Distribution" no es otra cosa que una construcción similar de curvas y tablas como las que vimos al estudiar la "universalidad" de la "campana", cuando citábamos que se podía calcular Z para cualquier distribución simétrica asignando un valor a µ y otro a G (vimos entonces que se podía hacer con 0 y 1 respectivamente). En 1908 W. S. Gosset a quien en su empleo le impedían publicar sus investigaciones, optó por hacerlo de todos modos, pero con el pseudónimo "Student". "Student" comunicó en esa época las consecuencias del tamaño de las muestras "n" sobre la distribución. Desde entonces, a la familia de curvas y tablas de distribución investigadas originalmente para muestras "pequeñas" (n < 30) pero no limitadas por ese número, se las denomina "Distribución t de Student" o "Distribución t". Existen tablas con el valor de "t"; como ejemplos citaremos que para una muestra de 60 valores t = 2, y que no varía demasiado entre 20 (t = 2.09) y 100 ( t = 1.98). Por lo expuesto insistimos en la sugerencia de recordar que el promedio de una población se encuentra con un 95% de probabilidades en el rango del promedio de una de sus muestras ± "2" ES. Informes con intervalo de confianza El sentido de conocer el rango dentro del cual se encuentra el promedio "µ" a partir de los estadígrafos ± DS trasciende a lo meramente académico. Simbolizaremos intervalo de confianza como "IC" agregando a continuación el coeficiente de confianza elegido, la expresión será, por ejemplo, IC 95. Un informe expresa que durante el seguimiento a 5 años un determinado tratamiento disminuye la mortalidad de la cardiopatía isquémica según OR 0.75 (IC 95 0.45 1.05). OR 0.75 (OR<1) señala que mueren 75 pacientes que tienen prescripto el tratamiento referido cada 100 pacientes que mueren sin recibir ese tratamiento. Está claro que OR = 1 nos diría que mueren igual número de pacientes con y sin tratamiento; en otros términos, el tratamiento no caracteriza a una población particular, distinta de la enfermedad original al inferir diferentes parámetros. Por el contrario, OR > 1 indicaría que entre los pacientes con ese tratamiento hay más muertes que entre los pacientes que no lo tienen prescripto. Con palabras populares, que es "peor el remedio que la enfermedad".

Intervalo de confianza graficado Se construye con líneas horizontales expresando el informe con el IC y líneas verticales como referencia de las cuales la más relevante es la correspondiente a la relación 1 (uno) ya que simboliza la ausencia de diferencias significativas. El informe que debemos analizar expresa OR 0.75 (IC 95 0.45 1.05) El intervalo de confianza en este caso agrega al OR de 0.75 que existe una confianza con el 95% de probabilidades de que la relación real entre la muestra de pacientes que tenía prescripto el tratamiento estudiado y la muestra de pacientes a los que no se les instituyó, sea un valor de OR localizado en el intervalo limitado por el rango 0.45 a 1.05. Se puede expresar la misma idea afirmando que si se repite 100 veces la experiencia, en 95 de ellas se espera el OR localizado en el intervalo del rango 0.45-1.05. No se dice nada diferente si se confía en que existe un 95% de probabilidades de que en sucesivas investigaciones el OR esté comprendido en el rango 0.45 1.05. La interpretación del IC y el significado estadístico En Hipótesis de Trabajo aprendimos que para dar significado estadístico a una diferencia entre muestras, esto es que representan a poblaciones diferentes, se exigía, al menos, un probabilidad menor al 5% de que la misma fuese casual (p < 0.05). Con la misma idea en la mente, si confiamos en que con 95 % de probabilidades el OR 0.75 informado representa a una relación entre muestras que se localiza en el intervalo 0.45 1.05, va de suyo que existe más de un 5% de probabilidades de que la relación OR sea > 1 ya que se ubicaría por dentro de uno de los límites (1.05) del intervalo. OR > 1 significa en términos de interpretación de la relación entre las muestras exactamente lo contrario de lo que sugiere OR 0.75 (OR < 1). Con un 95% de confianza en que la relación entre muestras puede ser tanto superior como inferior a 1 (uno) se concluye que se está frente a una relación casualmente diferente de 1; en realidad son muestras de una misma población. En idioma técnico, se confirma la hipótesis nula y se descarta la Hipótesis Alternativa. Sugerimos que observe nuevamente el Intervalo de Confianza graficado y seguramente coincidirá que con sólo un "vistazo" descarta la Hipótesis Alternativa y confirma la Nula. Es el rango del intervalo el que da la confianza en que se trate de muestras de la misma o de diferentes poblaciones. Index curso - Clase anterior - Clase siguiente Publicación: Octubre 2005

Tope Preguntas, aportes y comentarios ser án respondidos por el relator o por expertos en el tema a través de la lista de Bioingenieria e Inform ática Médica Llene los campos del formulario y oprima el botón "Enviar" Preguntas, aportes o comentarios: Nombre y apellido: Dirección de E-Mail: País: Argentina Enviar Borrar Dr. Diego Esandi Co-Presidente Comité Científico Correo electrónico Dra. Silvia Nanfara Co-Presidente Comité Científico Correo electrónico Prof. Dr. Armando Pacher Presidente Comité Técnico/Organizador Correo electrónico 1994-2005 CETIFAC - Bioingeniería UNER Webmaster - Actualización: 10-Oct-2005