INFERENCIAS CON STATISTIX Intervalos de confianza Para la media de una población normal Para la proporción en una población Para la diferencia de medias de dos normales independientes Para la diferencia de proporciones Contrastes de hipótesis Para la media de una población normal Para una proporción Para la diferencia de medias de dos normales independientes Para la diferencia de dos proporciones Para la diferencia de medias de dos normales apareadas Test de asociación Profa. M. Carmen Carollo Limeres 1
INTERVALOS DE CONFIANZA CON STATISTIX 1) INTERVALO PARA LA MEDIA DE UNA POBLACIÓN NORMAL Caso I) A través de estadística descriptiva Statistics /Summary Statistics/ Descriptive Statistics. Activar: Conf Int Permite elegir el nivel de confianza Ejemplo: Intervalo de confianza para la agresividad media (en el archivo Alcohol.sx) Descriptive Statistics Variable Lo 95% CI Up 95% CI Minimum Maximum AGGRESS 1.0426 1.2330 0.5900 1.7300 Caso II) Como resultado dentro de un contraste de hipótesis II. A) Caso de tener todas las observaciones en Statistix: Statistics /One, Two, Multi-Sample Tests/One_Sample T test. Es necesario fijar una hipótesis nula (puede ser cualquiera) Por defecto construye un intervalo de confianza del 95% Ejemplo: Intervalo de confianza para la agresividad media (en el archivo Alcoho.sxl) Hypothesis Test - One Mean Null Hypothesis mu = 1.5 Alternative Hyp mu <> 1.5 T -7.76 P 0.0000 95% C.I. Lower Bound 1.0426 95% C.I. Upper Bound 1.2330 2
II. B) Caso de disponer sólo de medidas resumen: Statistics /One, Two, Multi-Sample Tests/Hypothesis tests/one Mean. Es necesario fijar una hipótesis nula (puede ser cualquiera). Permite elegir el nivel de confianza 2) INTERVALO PARA LA PROPORCIÓN DE UNA POBLACIÓN Sólo se puede obtener como resultado dentro de un procedimiento de contraste de hipótesis: Statistics /One, Two, Multi-Sample Tests/Hypothesis tests/one Proportion. Es necesario fijar una hipótesis nula (puede ser cualquiera). Permite elegir el nivel de confianza Ejemplo: Intervalo de confianza para la proporción de bebedores (en el archivo Alcohol.sx) Method 95% Confidence Interval Simple Asymptotic (0.32676, 0.67324) 3) INTERVALO PARA LA DIFERENCIA DE MEDIAS DE DOS NORMALES INDEPENDIENTES Sólo se pueden obtener como resultado dentro de un procedimiento de contraste de hipótesis. A) Caso de tener todas las observaciones en Statistix: Statistics /One, Two, Multi-Sample Tests/Two-sample T test Permite elegir el nivel de confianza Ejemplo: Comparar el peso medio en hombres y mujeres (archivo urgencias.completo.sx) 3
T-Tests for Mean Difference Null Hypothesis: difference = 0 Alternative Hyp: difference <> 0 95% CI for Difference Method Variances DF T P Lower Upper Pooled Equal 74 8,36 0,0000 12.025 19.554 Satterthwait Unequal 66,7 8,26 0,0000 11.972 19.607 Homogeneity of Variances DF F P Folded F Test 35,39 1.59 0,0811 2 2 La salida muestra el test de homogeneidad de varianzas H : 0 σh = σm. El valor del estadístico del contraste es F= 1.59 al que le corresponde un p-valor= 0.0811 que es >0.05 y 2 2 por lo tanto no rechazamos H σ = σ. Al admitir que las varianzas son iguales, el 0 : H M intervalo de confianza para µ H µ M es (12.025 19.554). B) Caso de disponer sólo de medidas resumen: Statistics /One, Two, Multi-Sample Tests/Hypothesis tests/two Means Ejemplo: Algunos autores afirman que los pacientes con depresión tienen una función cortical por debajo de lo normal, debido a un riego sanguíneo por debajo de lo normal. Se ha medido X= flujo sanguíneo en 20 pacientes con depresión (D) y en 22 individuos normales (N). Los resultados fueron los siguientes: n =20, x = 47, s =7.8 D D D n =22, x = 53.8, s =6.1 N N N T-Tests for Mean Difference Null Hypothesis: difference = 0 Alternative Hyp: difference < 0 95% CI for Difference Method Variances DF T P Lower Upper Pooled Equal 40-3,16 0,0015-11.146-2.4543 Satterthwai Unequal 35,9-3,13 0,0018-11.213-2.3874 Homogeneity of Variances DF F P Folded F Test 19,21 1.64 0,1376 ACEPTAMOS IGUALDAD DE VARIANZAS 4
4) INTERVALO PARA LA DIFERENCIA DE DOS PROPORCIONES Sólo se pueden obtener como resultado dentro de un procedimiento de contraste de hipótesis. Statistics /One, Two, Multi-Sample Tests/Hypothesis tests/two Proportions Es necesario fijar una hipótesis nula (puede ser cualquiera). Permite elegir el nivel de confianza Ejemplo: Se quiere comprobar la efectividad de una cierta vacuna. Para ello, se le administra la vacuna a 100 animales de experimentación y se compara con un grupo testigo de otros 100 animales sin vacunar. Se contagia a los 200 animales con la enfermedad y como consecuencia, murieron 8 de los vacunados y 20 de los no vacunados. Podemos concluir que la vacuna es eficaz? Hypothesis Test - Two Proportions Sample Size Successes Proportion Sample 1 100 8 0,08000 Sample 2 100 20 0,20000 Difference -0,12000 Null Hypothesis: P1 = P2 Alternative Hyp: P1 < P2 95% Confidence Interval of Difference -0,21473 < P1-P2 < -0,02527 5
CONTRASTES DE HIPÓTESIS CON STATISTICS 1) CONTRASTE PARA LA MEDIA DE UNA POBLACIÓN NORMAL A) Caso de tener todas las observaciones en Statistix: Ejemplo: Estudio de la variable agresividad en el archivo Alcohol.sx. Podemos admitir que la agresividad media es 1.5? Statistics/ One, two, Multi_sample tests / One_sample test One-Sample T Test Null Hypothesis: mu = 1.5 Alternative Hyp: mu <> 1.5 95% Conf Interval Variable Mean SE Lower Upper T DF P AGGRESS 1.1378 0.0467 1.0426 1.2330-7.76 31 0.0000 RECHAZAMOS LA HIPÓTESIS NULA Ejemplo: Estudio de la variable agresividad en el archivo Alcohol.sx. Podemos admitir que la agresividad media es < 1.5? 6
One-Sample T Test Null Hypothesis: mu = 1.5 Alternative Hyp: mu < 1.5 95% Conf Interval Variable Mean SE Lower Upper T DF P AGGRESS 1.1378 0.0467 1.0426 1.2330-7.76 31 0.000 RECHAZAMOS LA HIPÓTESIS NULA B) Caso de disponer sólo de medidas resumen (tamaño, media y desviación típica) Statistics / One, two, Multi_sample tests / Hipótesis test /One mean Ejemplo: En 28 pacientes se ha medido el nivel de GOT y los resultados fueron los siguientes: x = 24.75, s = 4.25 Contrastar la hipótesis de si GOT es, en promedio, 25. Hypothesis Test - One Mean Null Hypothesis mu = 25 Alternative Hyp mu <> 25 N 28 Mean 24.750 SD 4.2500 SE 0.8032 DF 27 T -0.31 P 0.7580 ACEPTAMOS LA HIPÓTESIS NULA 95% C.I. Lower Bound 23.102 95% C.I. Upper Bound 26.398 7
2) CONTRASTE PARA UNA PROPORCIÓN Statistics / One, two, Multi_sample tests / Hipótesis test / One proportion Ejemplo: Un medicamento conocido cura el 80% de los casos de una enfermedad. Un nuevo medicamento resulta eficaz en 85 pacientes de 100 que se han tratado con dicho medicamento Basta este resultado muestral para asegurar la superioridad del nuevo medicamento? Hypothesis Test - One Proportion Sample Size 100 Successes 85 Proportion 0,85000 Null Hypothesis: P = 0.8 Alternative Hyp: P > 0.8 Difference 0,05000 Standard Error 0,03571 Z (uncorrected) 1,25 P 0,1056 Z (corrected) 1,12 P 0,1303 ACEPTAMOS LA HIPÓTESIS NULA. NO HAY EVIDENCIAS DE QUE SEA MEJOR Method 95% Confidence Interval Simple Asymptotic (0.78002, 0.91998) Simple Asymptotic with CC (0.77502, 0.92498) Wilson Score (0.76716, 0.90694) Wilson Score with CC (0.76147, 0.91085) Notes on C.I.: 1) CC means continuity correction. 2) Wilson Score method with CC is the preferred method, particularly for small samples or for proportions close to 0 or 1. 8
3) CONTRASTE PARA LAS MEDIAS DE DOS NORMALES INDEPENDIENTES Caso I) Caso de tener todas las observaciones en Statistix Ejemplo: Comparación de agresividad media en sobrios y ebrios. Archivo Alcohol.sx Statistics / One, two, Multi_sample tests / Two_sample test Two-Sample T Tests for AGGRESS by DRINK DRINK N Mean SD SE Sober 16 1.0581 0.1980 0.0495 Drinking 16 1.2175 0.3021 0.0755 Difference -0.1594 0.2554 0.0903 T-Tests for Mean Difference Null Hypothesis: difference = 0 Alternative Hyp: difference <> 0 95% CI for differ Method Variances DF T P Lower Upper Pooled Equal 30-1,77 0,0877-0.3438 0.0250 Satterthwaite Unequal 25,9-1,77 0,0894-0.3450 0.0263 ACEPTAMOS LA HIP. NULA. NO HAY RAZÓN PARA ADMITIR QUE LAS MEDIAS SON DISTINTAS Homogeneity of Variances DF F P Folded F Test 15,15 2.33 0,0563 ACEPTAMOS IGUALDAD DE VARIANZAS. La agresividad media es menor en los sobrios? Realizamos un contraste unilateral por la izquierda 9
Two-Sample T Tests for AGGRESS by DRINK DRINK N Mean SD SE Sober 16 1.0581 0.1980 0.0495 Drinking 16 1.2175 0.3021 0.0755 Difference -0.1594 0.2554 0.0903 T-Tests for Mean Difference Null Hypothesis: difference = 0 Alternative Hyp: difference < 0 95% CI for differ Method Variances DF T P Lower Upper Pooled Equal 30-1,77 0,0439-0.3438 0.0250 Satterthwa Unequal 25,9-1,77 0,0447-0.3450 0.0263 RECHAZAMOS NULA. ACEPTAMOS QUE LA AGRESIVIDAD MEDIA ES MENOR EN LOS SOBRIOS Homogeneity of Variances DF F P Folded F Test 15,15 2.33 0,0563 ACEPTAMOS IGUALDAD DE VARIANZAS Caso II) Caso de disponer sólo de medidas resumen (tamaños, medias y desviaciones típicas) Statistics /One, Two, Multi-Sample Tests/Hypothesis tests/two Means Ejemplo: Algunos autores afirman que los pacientes con depresión tienen una función cortical por debajo de lo normal, debido a un riego sanguíneo por debajo de lo normal. Se ha medido X= flujo sanguíneo en 20 pacientes con depresión (D) y en 22 individuos normales (N). Los resultados fueron los siguientes: n =20, x = 47, s =7.8 D D D n =22, x = 53.8, s =6.1 N N N Hypothesis Test - Two Means N Mean SD SE Sample 1 20 47.000 7.8000 1.7441 Sample 2 22 53.800 6.1000 1.3005 Difference -6.8000 6.9595 2.1502 10
T-Tests for Mean Difference Null Hypothesis: difference = 0 Alternative Hyp: difference < 0 95% CI for Difference Method Variances DF T P Lower Upper Pooled Equal 40-3,16 0,0015-11.146-2.4543 Satterthwai Unequal 35,9-3,13 0,0018-11.213-2.3874 RECHAZAMOS LA NULA. ACEPTAMOS QUE LA MEDIA ES MENOR EN LOS DEPRESIVOS Homogeneity of Variances DF F P Folded F Test 19,21 1.64 0,1376 ACEPTAMOS IGUALDAD DE VARIANZAS 4) CONTRASTE PARA DOS PROPORCIONES Statistics / One, two, Multi_sample tests / Hipótesis test / / Two Proportions Ejemplo: Se quiere comprobar la efectividad de una cierta vacuna. Para ello, se le administra la vacuna a 100 animales de experimentación y se compara con un grupo testigo de otros 100 animales sin vacunar. Se contagia a los 200 animales con la enfermedad y como consecuencia, murieron 8 de los vacunados y 20 de los no vacunados. Podemos concluir que la vacuna es eficaz? Hypothesis Test - Two Proportions Sample Size Successes Proportion Sample 1 100 8 0,08000 Sample 2 100 20 0,20000 Difference -0,12000 Null Hypothesis: P1 = P2 Alternative Hyp: P1 < P2 SE (difference) 0,04907 Z (uncorrected) -2,45 P 0,0072 ACEPTAMOS QUE ES SIGNIFICATIVAMENTE EFICAZ Z (corrected) -2,24 P 0,0125 Fisher's Exact 0,0118 95% Confidence Interval of Difference -0,21473 < P1-P2 < -0,02527 11
5) CONTRASTE PARA COMPARAR LAS MEDIAS DE DOS NORMALES APAREADAS Statistics / One, two, Multi_sample tests / Paired T Test Ejemplo: Se quiere estudiar el efecto del ejercicio físico en la reducción del colesterol en suero. A 11 participantes se les mide el nivel de colesterol antes y después de someterse a un programa de ejercicios. Los resultados fueron los siguientes: Antes 182 232 191 200 148 249 276 213 241 480 262 Desp. 198 210 194 220 138 220 219 161 210 313 226 d -16 22-3 -20 10 29 57 52 31 167 36 El ejercicio físico es efectivo para reducir el colesterol? Es necesario considerar dos variables: "Colesterol antes" y " Colesterol después" Null Hypothesis: difference = 0 Alternative Hyp: difference > 0 Mean 33.182 Std Error 15.397 Mean - H0 33.182 Lower 95% CI -1.1250 Upper 95% CI 67.489 T 2.16 DF 10 P 0.0283 RECHAZAMOS LA NULA. ACEPTAMOS QUE EL EJERCICIO REDUCE EL COLESTEROL 12
5) TEST DE ASOCIACIÓN Statistics / Association Test / Chi-Square Test Caso I) Caso de tener todas las observaciones en Statistix Ejemplo: Vamos a estudiar la posible asociación entre estar sobrio o no y el tipo de spicosis Chi-Square Test for Heterogeneity or Independence for 1 = DRINK P_TYPE P_TYPE DRINK Non-ASP ASP +-----------+-----------+ Sober Observed 8 8 16 Expected 8,00 8,00 Cell Chi-Sq 0,00 0,00 +-----------+-----------+ Drinking Obs 8 8 16 Expected 8,00 8,00 Cell Chi-Sq 0,00 0,00 +-----------+-----------+ 16 16 32 Overall Chi-Square 0,00 P-value 1,0000 Degrees of Freedom 1 13
Caso II) Caso de tener una tabla de contingencia Ejemplo: La tabla siguiente muestra el resultado de clasificar una muestra de 141 individuos con arreglo a las características localización y naturaleza del tumor cerebral. El lugar que ocupa el tumor influye en la gravedad del mismo? Naturaleza Benigno Maligno Otros Localización Lóbulo frontal 23 9 6 Lóbulo temporal 21 4 3 Otras áreas 34 24 17 A) Introducción de los datos en el caso general: Forma 1 Crear 3 variables : Benigno, Maligno, Otro. Asociar a cada variable los valores que aparecen en la correspondiente columna. Case benigno maligno otro +-----------+-----------+-----------+ 1 Observed 23 9 6 38 Expected 21,02 9,97 7,01 Cell Chi-Sq 0,19 0,09 0,14 +-----------+-----------+-----------+ 2 Observed 21 4 3 28 Expected 15,49 7,35 5,16 Cell Chi-Sq 1,96 1,53 0,91 +-----------+-----------+-----------+ 3 Observed 34 24 17 75 Expected 41,49 19,68 13,83 Cell Chi-Sq 1,35 0,95 0,73 +-----------+-----------+-----------+ 78 37 26 141 Overall Chi-Square 7,84 Degrees of Freedom 4 P-value 0,0975 14
Forma 2 Crear 3 variables : Localización, Tipo y Frecuencia Asociar a cada combinación de tipo y localización la correspondiente frecuencia. B) Introducción de los datos en el caso de tablas 2x2: 15