Este promedio, calculado con los niveles de glucosa de TODOS los jóvenes de la población, es la media o promedio poblacional que llamaremos µ.

Documentos relacionados
Estadística para investigadores: todo lo que siempre quiso saber y nunca se atrevió a preguntar

Tema 7 Intervalos de confianza Hugo S. Salinas

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR

Bioestadística para Reumatólogos

ESTIMACIÓN Y PRUEBA DE HIPÓTESIS INTERVALOS DE CONFIANZA

1) Características del diseño en un estudio de cohortes.

SOLUCIÓN EXAMEN IV Nombres: Apellidos: C.I.: Firma: Fecha: 19/11/2004

Intervalos para la diferencia de medias de dos poblaciones

INFERENCIA ESTADÍSTICA

INFERENCIA ESTADISTICA

Teoría de muestras. Distribución de variables aleatorias en el muestreo. 1. Distribución de medias muestrales

R E S O L U C I Ó N. a) El intervalo de confianza de la media poblacional viene dado por: I. C. z

INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)

= P (Z ) - P (Z ) = P (Z 1 25) P (Z -1 25)= P (Z 1 25) [P (Z 1 25)] = P (Z 1 25) [1- P (Z 1 25)] =

Probabilidad y Estadística

4. Prueba de Hipótesis

Conceptos Básicos de Inferencia

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 2011 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS

CURSO DE MÉTODOS CUANTITATIVOS I

TEMA 3: Contrastes de Hipótesis en el MRL

Bloque 5. Probabilidad y Estadística Tema 3. Distribuciones de Probabilidad Ejercicios resueltos

Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR

EPIDEMIOLOGIA DESCRIPTIVA BÁSICA PARA ESTUDIANTES DE TRABAJO SOCIAL

Cuál es el campo de estudio de la prueba de hipótesis?

Variables Aleatorias Discretas

Técnicas de Muestreo Métodos

EJERCICIOS RESUELTOS DE ESTADÍSTICA II

Tema 2. Regresión Lineal

UNIVERSIDAD NACIONAL EXPERIMENTAL DE GUAYANA VICERRECTORADO ACADÉMICO COORDINACION DE PRE-GRADO PROYECTO DE CARRERA DE INGENIERIA INDUSTRIAL

Podemos definir un contraste de hipótesis como un procedimiento que se basa en lo observado en las muestras y en la teoría de la probabilidad para

Escribir el modelo. Evaluar los efectos de los factores y la interacción entre ellos.

Trabajo Práctico: Intérvalos de Confianza

RESUMEN DE ALGUNOS CONCEPTOS ESTADÍSTICOS ELEMENTALES Y NOTACIÓN EMPLEADA EN EL CURSO

Tema 7: Introducción a la Teoría sobre Estimación

Al reemplazar la varianza muestral en la fórmula obtenemos otra expresión de la distribución chi-cuadrada:

Ejemplos Resueltos Tema 4

6. ESTIMACIÓN DE PARÁMETROS

INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M.

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

07 Estimación puntual e introducción a la estadística inferencial

1. Ejercicios. 2 a parte

Práctica 5: Estimación de parámetros. Una población.

EJERCICIOS DE SELECTIVIDAD

ESTADÍSTICA DESCRIPTIVA

Distribuciones muestrales. Distribución muestral de Medias

ECONOMETRÍA II Prof.: Begoña Álvarez TEMA 1 INTRODUCCIÓN. Estimación por máxima verosimilitud y conceptos de teoría asintótica

Tema 11: Integral definida. Aplicaciones al cálculo de áreas

Técnicas Cuantitativas para el Management y los Negocios I

Estimaciones puntuales. Estadística II

PROBLEMAS DE DISTRIBUCIÓN NORMAL Y INTERVALOS DE CONFIANZA MATEMÁTICAS APLICADAS A LAS CC.SOCIALES II

Tema 5: Introducción a la inferencia estadística

ESTADÍSTICA INFERENCIAL

AGRO Examen Parcial 2. Nombre:

Otra característica poblacional de interés es la varianza de la población, 2, y su raíz cuadrada, la desviación estándar de la población,. La varianza

POBLACIÓN Y MUESTRA DEL ESTUDIO. Autora: Patricia Villaciervos-Moreno

Tema 10: Introducción a los problemas de Asociación y Correlación

ANÁLISIS DE FRECUENCIAS

Análisis Estadístico. Dra. Adela Del Carpio Rivera Doctor En Medicina

Inferencia estadística Selectividad CCSS Castilla-La Mancha. MasMates.com Colecciones de ejercicios

ALGUNAS CUESTIONES DESTACABLES EN INFERENCIA ESTADÍSTICA

a. N(19 5, 1 2) P(19 X 21) = P( Z ) = = P = P P = = P P = P = = = El 55 72% no son adecuados.

Comparación de dos métodos de aprendizaje sobre el mismo problema

A. PRUEBAS DE BONDAD DE AJUSTE: B.TABLAS DE CONTINGENCIA. Chi cuadrado Metodo G de Fisher Kolmogorov-Smirnov Lilliefords

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.E.

Tema 8: Regresión y Correlación

Contrastes de hipótesis. 1: Ideas generales

Propuesta A. b) Resuelve el sistema planteado en el apartado anterior. (0 5 puntos)

Estadística Clase 5. Maestría en Finanzas Universidad del CEMA. Profesor: Alberto Landro Asistente: Julián R. Siri

Tamaño de la muestra

PATRONES DE DISTRIBUCIÓN ESPACIAL

La distribución de Probabilidad normal, dada por la ecuación:

PROGRAMA DE ESTUDIO : UN SEMESTRE ACADÉMICO : TERCER AÑO, PRIMER SEMESTRE

Muestreo y Distribuciones en el Muestreo

Las herramientas básicas de la epidemiología analítica: Medidas de asociación y significación estadística

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo

Econometría II Grado en finanzas y contabilidad

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS

UNIDAD V Distribuciones Muestrales

BIOESTADISTICA ( ) Evaluación de pruebas diagnósticas. 1) Características del diseño en un estudio para evaluar pruebas diagnósticas.

ESTIMACIÓN PUNTUAL Julián de la Horra Departamento de Matemáticas U.A.M.

PLAN DE TRABAJO 9 Período 3/09/07 al 28/09/07

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia

Hipótesis Alternativa H 1 : ϑ Θ 1

Inferencia estadística Selectividad CCSS Murcia. MasMates.com Colecciones de ejercicios

POBLACIÓN Y MUESTRAS EN LA INVESTIGACIÓN

Junio = = t el mismo significado que el producto anterior

TEMA 4: CONTROL POR VARIABLES Hoja de ejercicios (Entregar el 7 -problema de examen-)

Técnicas Cuantitativas para el Management y los Negocios I

SESIÓN DE APRENDIZAJE Nº 16 FACULTAD DE

Simulación I. Investigación Operativa, Grado en Estadística y Empresa, 2011/12

Caso particular: Contraste de homocedasticidad

Intervalos de confianza y contrastes de hipótesis. Intervalo de confianza de la media.

Estadísticas Pueden ser

Resumen teórico de los principales conceptos estadísticos

UNIVERSIDAD TECNICA PARTICULAR DE LOJA ESTADISTICA Y PROBABILIDAD ENSAYO N 8

1. La Distribución Normal

2. Distribuciones de Muestreo

DISTRIBUCION JI-CUADRADA (X 2 )

GRÁFICOS DE CONTROL. Datos tipo atributo

Transcripción:

CETRO DE IESTIGACIOES EIDEIOLOGICAS Ing.. Luis Foglia Lic. Est. Griselda. egri ESTIACIO e ITERALOS DE COFIAZA (a) ara medias Supóngase que en una población de jóvenes de 15 a 30 años de edad, interesa estudiar el nivel de glucosa en sangre. Sin embargo, como los IELES de glucosa varían de joven a joven, parece lógico utilizar el promedio de todos ellos, como un indicador de nivel de glucosa en la población de jóvenes. O sea si: = cantidad de jóvenes en la población X 1 = nivel de glucosa en joven ro. 1 X 2 = nivel de glucosa en joven ro. 2 oblación X 3 = nivel de glucosa en joven ro. 3 µ ` X = nivel de glucosa en joven ro. µ= X 1 + X 2 +... + X edia o promedio, poblacional Este promedio, calculado con los niveles de glucosa de TODOS los jóvenes de la población, es la media o promedio poblacional que llamaremos µ. Este es el valor que desearía conocer el investigador, y sobre el que debe elaborar las conclusiones de su trabajo. Sin embargo, difícilmente se disponga de recursos económicos y de tiempo, como para determinar niveles de glucosa en todos los miembros de una población. ero supongamos una situación más real: el investigador decide tomar al azar una muestra de 30 jóvenes de la población, y determina en cada uno de ellos el nivel de glucosa en sangre resultando: Joven º 1 x 1 =89 Joven º 2 x 2 =77 79 1

CETRO DE IESTIGACIOES EIDEIOLOGICAS 85 90 87 80 81 102. 87 89 Joven º 30 x 30 =76 Y con estos datos calcula la media (que representamos como x y el desvío estándar muestral, así: x 1 + x 2 +... + x12 x = 30 = 89 + 77 +...76 = 85,17 edia muestral 30 s= ( ) 2 x... ( ) 1 x + x30 x 30 1 2 = 7,23 Desvío Estándar uestral oblación µ x 1 x 2 x 3 x 30 x Esta media de x = 85,17, fue calculada con solo 30 jóvenes de la muestra de aquí que se la denomine media muestral para diferenciarla de µ, que se la calcula con la totalidad de jóvenes de la población. Coincidiría x con µ? En general no, ya que x = 85,17 fue calculada con solo 30 individuos de la población. Sin embargo x es un estimador de µ. 2

CETRO DE IESTIGACIOES EIDEIOLOGICAS Qué quiere decir esto? Significa que aunque no coincida con µ, x estará cerca de µ. ero, como evaluar que tan cerca esta x = 85,17 de la verdadera media µ, que desconocemos? Esto se logra calculando el error estándar del estimador x, cuya expresión es: Error ( x ) = s n 7,23 = 30 =1,32 Error estándar de la media muestral. Esta cantidad debe entenderse como el error promedio de x al estimar µ. Ahora bien, como las conclusiones de un trabajo deben referirse a la verdadera media de la población µ, y no a estimaciones que contienen errores, informaremos para µ, no un solo valor, sino un intervalo que lo contiene. Si deseamos un intervalo que contiene a µ, con un 95% de probabilidad, este se calcula así: [ 1,96 error ( x) x ; x + 1,96 error ( x )] Intervalo de confianza al 95%. O sea : [ 85,17 1,96 1,32 ;85,17 + 1,96 + 1,3 2 ] [ 82, 6 ; 87, 8 ] al 95% Esto debe interpretarse como la verdadera media esta entre 82,6 y 87,8 con una seguridad de 95%. Si se quiere un intervalo que nos dé mejor seguridad de incluir a µ, por ejemplo del 99% solo debemos cambiar el 1,96 que figura en la fórmula anterior por 2,58, y el intervalo será: [8 5,17-2,58 1,32 ; 85,17+2,58 1,3 2 ] Intervalo de confianza al 99%. [ 81,76 ; 88,58 ] al 99 % necesariamente más amplio que el anterior ya que tiene mayor seguridad de contener a la media. 3

CETRO DE IESTIGACIOES EIDEIOLOGICAS (b) ara prevalencias Supóngase ahora, que en una población de adultos de una localidad, queremos investigar el consumo de tabaco. Concretamente, en cada individuo interesa estudiar un atributo que tiene solo dos alternativas: FUA O FUA otar que esta situación es diferente a la del ejemplo anterior donde en cada joven interesaba el nivel de glucosa, que tiene muchas alternativas: 83,2 75 104 93,5 etc. Debido a lo anterior, como indicador del consumo de tabaco utilizaremos la prevalencia de los fumadores en la localidad así: F cantidad de adultos en la población cantidad de fumadores en la población. Luego: = F *100 revalencia poblacional se representa por mayúscula. oblación Esta prevalencia, al calcularse con la totalidad de individuos, es la prevalencia poblacional. Sería el valor que quiere conocer el investigador, y sobre el que debe elaborar las conclusiones de su trabajo. ero, como ya se mencionó anteriormente, difícilmente se dispongan en la práctica de recursos suficientes como para encarar un relevamiento de toda la población. Supóngase entonces que el investigador decide tomar una muestra al azar de 225 adultos, y encuentra que 90 son fumadores. Entonces: n = 225 cantidad de individuos en la muestra. f = 90 cantidad de fumadores en la muestra. p = n f 90 100 = 100 = 40 % revalencia uestral 225 4

CETRO DE IESTIGACIOES EIDEIOLOGICAS oblación. Esta prevalencia del 40%, al ser calculada con sólo los 225 adultos de la muestra se denomina prevalencia muestral p, para diferenciarla de la prevalencia poblacional, que se calcula con toda la población. Al igual que en el ejemplo anterior p = 40% no necesariamente coincidirá con el valor desconocido. Sin embargo p = 40% es un estimador de, en el sentido que, aunque no coincida estará cerca. ara evaluar que tan cerca estará p = 40% de la verdadera prevalencia poblacional, calculamos el error estándar de p así: error (p) = ( p 100 n p ) Error estándar de la prevalencia muestral. ( ) 40 100 40 = = 3,26 % 225 Esta cantidad debe interpretarse como que el error promedio de p es 3,26 %. Ahora bien, como las conclusiones de un trabajo deben referirse a la verdadera prevalencia poblacional, y no a estimaciones que contienen errores, informaremos para, no un solo valor, sino un intervalo que la contiene. Si deseamos un intervalo que contenga a, con un 95 % de probabilidad, este se calcula así: [ p 1,96error( p) ; p +1,96 error (p )] Intervalo de confianza al 95% O sea: [ 40 1, 96 3,26 ; 40+1,96 3,2 6 ] [ 33, 6 % ; 46,4 %] Esto debe interpretarse como que la verdadera prevalencia del consumo de tabaco esta entre 5

CETRO DE IESTIGACIOES EIDEIOLOGICAS 33,6 y 46,4 % con una seguridad del 95%. Además, si se desea un intervalo pero con una seguridad de 99%, solo debe modificarse en la expresión anterior, el 1,96 por el 2,58, resultando. [ 40 2,58 3,26 ; 40+2,58 3,2 6 ] [ 31,6 % ; 48,4 % ] al 99% ótese que al ser un intervalo más seguro, es también más amplio. (c) ara riesgo relativo Supóngase que en una localidad se desea estudiar la relación entre situaciones de violencia familiar y el consumo de marihuana en jóvenes de 15 a 30 años. Aquí, en cada joven interesan conocer las siguientes dos variables de atributos: Existen o existieron en su hogar situaciones de violencia familiar? SI O Consume o ha consumido marihuana habitualmente? SI - O odemos representar la población por un cuadrado, donde es la cantidad total de jóvenes. (Total de jóvenes) Como en la población hay jóvenes que padecieron situaciones de violencia familiar, y otros que no, separémosla en dos subpoblaciones, las de los: Jóvenes con situaciones de iolencia Familiar Jóvenes sin situaciones de iolencia Familiar v jóvenes. v jóvenes. v (con violencia familiar) v (sin violencia familiar) Ahora y suponiendo que se dispone de una cantidad ilimitada de recursos, clasifiquemos los jóvenes de cada grupo según su consumo de marihuana. 6

CETRO DE IESTIGACIOES EIDEIOLOGICAS Se tendrá la población particionada así: A B v C D v En la subpoblación que padeció situaciones de violencia familiar. A Cantidad de consumidores de marihuana. B Cantidad de O consumidores de marihuana. or supuesto A+B = v En la subpoblación que O padeció violencia familiar. C D Cantidad de consumidores de marihuana. Cantidad de O consumidores de marihuana. or supuesto C+D = v lanteadas las cosas así, como indicador del consumo de marihuana, se calculará su prevalencia en cada uno de los grupos: A = = 100 revalencia de consumo de marihuana, en los que padecieron situaciones de violencia familiar. C 100 revalencia de consumo de marihuana, en los que O padecieron situaciones de violencia familiar. Estas dos prevalencias, al ser calculadas con la totalidad de jóvenes, son prevalencias poblacionales. A B v C D v A = *100 C = 100 7

CETRO DE IESTIGACIOES EIDEIOLOGICAS En un caso como el presente, es de esperar una mayor prevalencia de consumo; en el grupo que padeció violencia familiar, respecto del otro. ( > ). Como indicador del RIESGO que aportan las situaciones de violencia familiar sobre el consumo de marihuana se define el RIESGO RELATIO así: RR = Riesgo relativo poblacional. Este riesgo relativo poblacional es el que mide si hay asociación entre situación de violencia familiar y el consumo de marihuana. Si es mayor que 1, indica una mayor prevalencia del consumo de marihuana entre los que padecieron violencia familiar respecto de las que no pasaron por esta situación. Esto se interpreta como que la violencia familiar es un factor de riesgo respecto del consumo de marihuana. EXISTE ASOCIACIO. Si RR = 1, indica que la prevalencia de consumo es igual en los dos grupos, interpretándose como una O EXISTECIA DE ASOCIACIÓ entre situaciones de violencia familiar y consumo. Si RR <1 indicaría un menor consumo de marihuana entre quienes pasaron por situaciones de violencia familiar, respecto del otro grupo. Esto se interpretaría, aunque no es de esperar que ocurra en este caso, como que la violencia familiar es un factor protector contra el consumo de marihuana. EXISTE ASOCIACIÓ. Todo lo anterior fue elaborado sobre la población. Supóngase ahora que el investigador dispone de recursos limitados, y resuelve encarar el estudio a través de una muestra al azar de 1000 jóvenes, interrogando a cada uno de ellos sobre las variables mencionadas. Ahora la muestra la representamos así n = 1000 jóvenes Supóngase que de estos jóvenes, 240 pasaron por situaciones de violencia familiar, quedando la muestra separada en dos grupos. n v = 240 con violencia familiar n = 760 sin violencia familiar v 8

CETRO DE IESTIGACIOES EIDEIOLOGICAS n = 1000 jóvenes Y además supóngase que 18 del primer grupo, y 19 del segundo son o han sido consumidores de marihuana. Queda entonces para la muestra: 18 222 240 con violencia familiar 19 741 760 sin violencia familiar Las prevalencias en cada grupo son: 18 p = 100 = 7,5 % (revalencias muestrales) 240 19 p = 100 = 3,5 % 760 Luego el riesgo relativo muestral es: rr = p = p 7,5% 2,5% = 3 Riesgo relativo muestral Que este riesgo valga 3, significa que en situaciones de violencia familiar se triplica la prevalencia del consumo de marihuana. ero este riesgo rr = 3, al ser calculado solo con los 1000 jóvenes de la muestra, es el riesgo relativo muestral, para diferenciarlo del RR riesgo relativo poblacional que se calcula con toda la población. Como se dijo anteriormente, las conclusiones de un trabajo deben referirse al verdadero riesgo poblacional RR, y no va a estimaciones como rr = 3, que contiene errores. or eso, se informara para RR, no un solo valor, sino un intervalo que lo contiene. A diferencia de los ejemplos anteriores, el calculo de un intervalo de confianza para RR requiere de ciertas complicaciones matemáticas. or eso aquí recurrimos al EI-IFO 6.0. Selecionamos:1 - rogramas. 2 - Statcalc calculador 3 - Tables (2 2,2 n) Y en la cuadrícula. 9

CETRO DE IESTIGACIOES EIDEIOLOGICAS Disease E + - x + O S - U R E Se ingresan los valores muestrales: y apretando F4 resulta: Un riesgo relativo rr =3 Disease + - + 18 222-19 741 y un intervalo de confianza para RR, [ 1,60;5,62] al 95 % Esto debe interpretarse como que el verdadero riesgo relativo en la población esta entre 1,6 y 5,62 con una seguridad del 95%. 10