INFERENCIAS CON STATISTIX

Documentos relacionados
RESPUESTAS BREVES A LA PRÁCTICA 6

Tenga en cuenta entregar los ejercicios con el desarrollo completo de su resolución.

Análisis de dos muestras

Práctica 4 vgaribay PRÁCTICA 4. CONTRASTE DE HIPOTESIS. 1 ESTUDIO DE NORMALIDAD Plot de normalidad. Camino 1

> t.test (datos_x, datos_y =NULL, alternative = "two.sided", mu = 0, paired =FALSE, var.equal = FALSE, conf.level= 0.95)

7. INFERENCIA ESTADÍSTICA

EJERCICIOS RESUELTOS

Práctica 5 Prueba de Hipótesis

Contrastes de Hipótesis. Carmen Cadarso Suárez

Problemas resueltos. Temas 10 y 11 11, 9, 12, 17, 8, 11, 9, 4, 5, 9, 14, 9, 17, 24, 19, 10, 17, 17, 8, 23, 8, 6, 14, 16, 6, 7, 15, 20, 14, 15.

Tests de Hipótesis basados en dos muestras. ESTADÍSTICA (Q)

Tema II. Las muestras y la teoría paramétrica

PRÁCTICA 8: CONTRASTES DE HIPÓTESIS PARAMÉTRICOS

Tests de hipótesis estadísticas

PRÁCTICA 5: CONTRASTES DE HIPÓTESIS PARAMÉTRICOS

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN

Análisis estadístico básico (I) Magdalena Cladera Munar Departament d Economia Aplicada Universitat de les Illes Balears

CONTRASTES DE HIPÓTESIS

CAPÍTULO 5 ANÁLISIS DE VARIANZA

Práctica de INTERVALOS DE CONFIANZA

Intervalos de confianza con STATGRAPHICS

CAPÍTULO 10 ESTIMACIÓN POR PUNTO Y POR INTERVALO 1.- ESTIMACIÓN PUNTUAL DE LA MEDIA Y DE LA VARIANZA 2.- INTERVALO DE CONFIANZA PARA LA MEDIA

Técnicas Cuantitativas para el Management y los Negocios I

Técnicas de validación estadística Bondad de ajuste

1.- Lo primero que debemos hacer es plantear como hasta ahora la hipótesis nula y la alternativa

Práctica de AJUSTE DE DISTRIBUCIONES II (ajuste de datos)

Estadística II Tema 3. Comparación de dos poblaciones. Curso 2010/11

CAPÍTULO 7 INFERENCIA ESTADÍSTICA

Práctica 3 vgaribay PRÁCTICA 3. INTERVALOS DE CONFIANZA

Técnicas de validación estadística Bondad de ajuste

Análisis Estadísticos con R

7.6 Comparación entre dos medias Poblacionales usando muestras independientes

CONCEPTOS FUNDAMENTALES

Ejemplos del Suplemento 1 resueltos con Minitab

Aplicación del Análisis de la Varianza para estudiar el tiempo de acceso en las aulas informáticas

EJERCICIOS DEL CAPITULO 4

Prácticas de inferencia y muestreo.

11. PRUEBAS NO PARAMÉTRICAS

PRÁCTICA 4. Ingeniería Técnica Industrial (2º) - Mecánica.

Se asignaron al azar ratas en condiciones similares a cuatro dietas (A D). Dos semanas después se midió el tiempo de coagulación.

Estadística Inferencial. Sesión 5. Prueba de hipótesis

Métodos Estadísticos de la Ingeniería Tema 10: Inferencia Estadística, Intervalos de Confianza Grupo B

LEC/LADE/LECD/LADED. (a) Deducir la expresión de la desviación típica de la media muestral, y calcularla para esta muestra.

Tema 1. Modelo de diseño de experimentos (un factor)

Cómo se hace la Prueba t a mano?

PRÁCTICA 3. REGRESIÓN LINEAL SIMPLE CON SPSS Ajuste de un modelo de regresión lineal simple Porcentaje de variabilidad explicado

Muestreo y estimación: problemas resueltos

INFERENCIA ESTADISTICA: Lic. Laura Marangunich

Métodos Estadísticos de la Ingeniería Tema 11: Contrastes de Hipótesis Grupo B

Estadística Avanzada y Análisis de Datos

Estadística inferencial. Aplicación con el SPSS

Introducción a estadística

ESTADÍSTICA INFERENCIAL

Estadística II Tema 2. Conceptos básicos en el contraste de. Curso 2010/11

ANÁLISIS CUANTITATIVO DE DATOS EN CIENCIAS SOCIALES CON EL SPSS (I) Tablas de contingencia y pruebas de asociación

1) Características del diseño en un estudio de casos y controles.

Ventanas de SPSS 1 y resultados de los análisis estadísticos descriptivos

Bioestadística. Curso Capítulo 8

Práctica 5. Contrastes paramétricos en una población

Estadística II Tema 4. Regresión lineal simple. Curso 2010/11

Métodos Estadísticos de la Ingeniería Práctica 7: Contrastes de Hipótesis paramétricos y no paramétricos

Contraste de hipótesis con STATGRAPHICS

CONTRASTES DE HIPÓTESES

t de Student para muestras relacionadas

MANUAL DE PRÁCTICAS DE ORDENADOR

El análisis de la varianza de un factor es una extensión del test de t para dos muestras independientes, para comparar K muestras.

1. Realice la prueba de homogeneidad de variancias e interprete los resultados.

Se desea analizar el nivel de glucemia según tratamientos en un grupo de. enfermos. Para ello se ha medido este nivel antes y después de dichos

Análisis de la varianza ANOVA

IIC Sistemas Recomendadores

ASIGNATURA: AMPLIACIÓN DE ESTADISTICA Titulación: Ingeniería Industrial MANUAL DE PRÁCTICAS DE ORDENADOR

Objetivo: Que el alumno conozca y aprenda a usar algunos de los métodos no paramétricos mas importantes.

PRÁCTICAS DE ESTADÍSTICA CON R

Tema Correlación. Correlación. Introducción

Objetivos. 1. Intervalos de Conanza y test de hipótesis. Tema 7: Intervalos de Conanza y Contrastes de Hipótesis

Julia García Salinero. Departamento de Investigación FUDEN. Introducción

Problemas resueltos. Tema 12. 2º La hipótesis alternativa será que la distribución no es uniforme.

Análisis de la Capacidad o Aptitud de un proceso ( Capítulo 8 ) Control Estadístico de Calidad

Prueba de Hipótesis. Tipos de inferencias (2)

Manual de bolsillo del MegaStat * * MegaStat es un complemento estadístico para el Excel elaborado por el profesor J. B. Orris de Butler University.

Caso particular: Contraste de homocedasticidad

Introducción a la estadística básica, el diseño de experimentos y la regresión

Para ello hacemos lo siguiente: Analizar. o Comparar medias. García Bellido, R.; González Such, J. y Jornet Meliá, J.M.

Práctica 3. Emilio Torres. Departamento de Estadística Universidad de Oviedo February 23, 2011

Transcripción:

INFERENCIAS CON STATISTIX Intervalos de confianza Para la media de una población normal Para la proporción en una población Para la diferencia de medias de dos normales independientes Para la diferencia de proporciones Contrastes de hipótesis Para la media de una población normal Para una proporción Para la diferencia de medias de dos normales independientes Para la diferencia de dos proporciones Para la diferencia de medias de dos normales apareadas Test de asociación Profa. M. Carmen Carollo Limeres 1

INTERVALOS DE CONFIANZA CON STATISTIX 1) INTERVALO PARA LA MEDIA DE UNA POBLACIÓN NORMAL Caso I) A través de estadística descriptiva Statistics /Summary Statistics/ Descriptive Statistics. Activar: Conf Int Permite elegir el nivel de confianza Ejemplo: Intervalo de confianza para la agresividad media (en el archivo Alcohol.sx) Descriptive Statistics Variable Lo 95% CI Up 95% CI Minimum Maximum AGGRESS 1.0426 1.2330 0.5900 1.7300 Caso II) Como resultado dentro de un contraste de hipótesis II. A) Caso de tener todas las observaciones en Statistix: Statistics /One, Two, Multi-Sample Tests/One_Sample T test. Es necesario fijar una hipótesis nula (puede ser cualquiera) Por defecto construye un intervalo de confianza del 95% Ejemplo: Intervalo de confianza para la agresividad media (en el archivo Alcoho.sxl) Hypothesis Test - One Mean Null Hypothesis mu = 1.5 Alternative Hyp mu <> 1.5 T -7.76 P 0.0000 95% C.I. Lower Bound 1.0426 95% C.I. Upper Bound 1.2330 2

II. B) Caso de disponer sólo de medidas resumen: Statistics /One, Two, Multi-Sample Tests/Hypothesis tests/one Mean. Es necesario fijar una hipótesis nula (puede ser cualquiera). Permite elegir el nivel de confianza 2) INTERVALO PARA LA PROPORCIÓN DE UNA POBLACIÓN Sólo se puede obtener como resultado dentro de un procedimiento de contraste de hipótesis: Statistics /One, Two, Multi-Sample Tests/Hypothesis tests/one Proportion. Es necesario fijar una hipótesis nula (puede ser cualquiera). Permite elegir el nivel de confianza Ejemplo: Intervalo de confianza para la proporción de bebedores (en el archivo Alcohol.sx) Method 95% Confidence Interval Simple Asymptotic (0.32676, 0.67324) 3) INTERVALO PARA LA DIFERENCIA DE MEDIAS DE DOS NORMALES INDEPENDIENTES Sólo se pueden obtener como resultado dentro de un procedimiento de contraste de hipótesis. A) Caso de tener todas las observaciones en Statistix: Statistics /One, Two, Multi-Sample Tests/Two-sample T test Permite elegir el nivel de confianza Ejemplo: Comparar el peso medio en hombres y mujeres (archivo urgencias.completo.sx) 3

T-Tests for Mean Difference Null Hypothesis: difference = 0 Alternative Hyp: difference <> 0 95% CI for Difference Method Variances DF T P Lower Upper Pooled Equal 74 8,36 0,0000 12.025 19.554 Satterthwait Unequal 66,7 8,26 0,0000 11.972 19.607 Homogeneity of Variances DF F P Folded F Test 35,39 1.59 0,0811 2 2 La salida muestra el test de homogeneidad de varianzas H : 0 σh = σm. El valor del estadístico del contraste es F= 1.59 al que le corresponde un p-valor= 0.0811 que es >0.05 y 2 2 por lo tanto no rechazamos H σ = σ. Al admitir que las varianzas son iguales, el 0 : H M intervalo de confianza para µ H µ M es (12.025 19.554). B) Caso de disponer sólo de medidas resumen: Statistics /One, Two, Multi-Sample Tests/Hypothesis tests/two Means Ejemplo: Algunos autores afirman que los pacientes con depresión tienen una función cortical por debajo de lo normal, debido a un riego sanguíneo por debajo de lo normal. Se ha medido X= flujo sanguíneo en 20 pacientes con depresión (D) y en 22 individuos normales (N). Los resultados fueron los siguientes: n =20, x = 47, s =7.8 D D D n =22, x = 53.8, s =6.1 N N N T-Tests for Mean Difference Null Hypothesis: difference = 0 Alternative Hyp: difference < 0 95% CI for Difference Method Variances DF T P Lower Upper Pooled Equal 40-3,16 0,0015-11.146-2.4543 Satterthwai Unequal 35,9-3,13 0,0018-11.213-2.3874 Homogeneity of Variances DF F P Folded F Test 19,21 1.64 0,1376 ACEPTAMOS IGUALDAD DE VARIANZAS 4

4) INTERVALO PARA LA DIFERENCIA DE DOS PROPORCIONES Sólo se pueden obtener como resultado dentro de un procedimiento de contraste de hipótesis. Statistics /One, Two, Multi-Sample Tests/Hypothesis tests/two Proportions Es necesario fijar una hipótesis nula (puede ser cualquiera). Permite elegir el nivel de confianza Ejemplo: Se quiere comprobar la efectividad de una cierta vacuna. Para ello, se le administra la vacuna a 100 animales de experimentación y se compara con un grupo testigo de otros 100 animales sin vacunar. Se contagia a los 200 animales con la enfermedad y como consecuencia, murieron 8 de los vacunados y 20 de los no vacunados. Podemos concluir que la vacuna es eficaz? Hypothesis Test - Two Proportions Sample Size Successes Proportion Sample 1 100 8 0,08000 Sample 2 100 20 0,20000 Difference -0,12000 Null Hypothesis: P1 = P2 Alternative Hyp: P1 < P2 95% Confidence Interval of Difference -0,21473 < P1-P2 < -0,02527 5

CONTRASTES DE HIPÓTESIS CON STATISTICS 1) CONTRASTE PARA LA MEDIA DE UNA POBLACIÓN NORMAL A) Caso de tener todas las observaciones en Statistix: Ejemplo: Estudio de la variable agresividad en el archivo Alcohol.sx. Podemos admitir que la agresividad media es 1.5? Statistics/ One, two, Multi_sample tests / One_sample test One-Sample T Test Null Hypothesis: mu = 1.5 Alternative Hyp: mu <> 1.5 95% Conf Interval Variable Mean SE Lower Upper T DF P AGGRESS 1.1378 0.0467 1.0426 1.2330-7.76 31 0.0000 RECHAZAMOS LA HIPÓTESIS NULA Ejemplo: Estudio de la variable agresividad en el archivo Alcohol.sx. Podemos admitir que la agresividad media es < 1.5? 6

One-Sample T Test Null Hypothesis: mu = 1.5 Alternative Hyp: mu < 1.5 95% Conf Interval Variable Mean SE Lower Upper T DF P AGGRESS 1.1378 0.0467 1.0426 1.2330-7.76 31 0.000 RECHAZAMOS LA HIPÓTESIS NULA B) Caso de disponer sólo de medidas resumen (tamaño, media y desviación típica) Statistics / One, two, Multi_sample tests / Hipótesis test /One mean Ejemplo: En 28 pacientes se ha medido el nivel de GOT y los resultados fueron los siguientes: x = 24.75, s = 4.25 Contrastar la hipótesis de si GOT es, en promedio, 25. Hypothesis Test - One Mean Null Hypothesis mu = 25 Alternative Hyp mu <> 25 N 28 Mean 24.750 SD 4.2500 SE 0.8032 DF 27 T -0.31 P 0.7580 ACEPTAMOS LA HIPÓTESIS NULA 95% C.I. Lower Bound 23.102 95% C.I. Upper Bound 26.398 7

2) CONTRASTE PARA UNA PROPORCIÓN Statistics / One, two, Multi_sample tests / Hipótesis test / One proportion Ejemplo: Un medicamento conocido cura el 80% de los casos de una enfermedad. Un nuevo medicamento resulta eficaz en 85 pacientes de 100 que se han tratado con dicho medicamento Basta este resultado muestral para asegurar la superioridad del nuevo medicamento? Hypothesis Test - One Proportion Sample Size 100 Successes 85 Proportion 0,85000 Null Hypothesis: P = 0.8 Alternative Hyp: P > 0.8 Difference 0,05000 Standard Error 0,03571 Z (uncorrected) 1,25 P 0,1056 Z (corrected) 1,12 P 0,1303 ACEPTAMOS LA HIPÓTESIS NULA. NO HAY EVIDENCIAS DE QUE SEA MEJOR Method 95% Confidence Interval Simple Asymptotic (0.78002, 0.91998) Simple Asymptotic with CC (0.77502, 0.92498) Wilson Score (0.76716, 0.90694) Wilson Score with CC (0.76147, 0.91085) Notes on C.I.: 1) CC means continuity correction. 2) Wilson Score method with CC is the preferred method, particularly for small samples or for proportions close to 0 or 1. 8

3) CONTRASTE PARA LAS MEDIAS DE DOS NORMALES INDEPENDIENTES Caso I) Caso de tener todas las observaciones en Statistix Ejemplo: Comparación de agresividad media en sobrios y ebrios. Archivo Alcohol.sx Statistics / One, two, Multi_sample tests / Two_sample test Two-Sample T Tests for AGGRESS by DRINK DRINK N Mean SD SE Sober 16 1.0581 0.1980 0.0495 Drinking 16 1.2175 0.3021 0.0755 Difference -0.1594 0.2554 0.0903 T-Tests for Mean Difference Null Hypothesis: difference = 0 Alternative Hyp: difference <> 0 95% CI for differ Method Variances DF T P Lower Upper Pooled Equal 30-1,77 0,0877-0.3438 0.0250 Satterthwaite Unequal 25,9-1,77 0,0894-0.3450 0.0263 ACEPTAMOS LA HIP. NULA. NO HAY RAZÓN PARA ADMITIR QUE LAS MEDIAS SON DISTINTAS Homogeneity of Variances DF F P Folded F Test 15,15 2.33 0,0563 ACEPTAMOS IGUALDAD DE VARIANZAS. La agresividad media es menor en los sobrios? Realizamos un contraste unilateral por la izquierda 9

Two-Sample T Tests for AGGRESS by DRINK DRINK N Mean SD SE Sober 16 1.0581 0.1980 0.0495 Drinking 16 1.2175 0.3021 0.0755 Difference -0.1594 0.2554 0.0903 T-Tests for Mean Difference Null Hypothesis: difference = 0 Alternative Hyp: difference < 0 95% CI for differ Method Variances DF T P Lower Upper Pooled Equal 30-1,77 0,0439-0.3438 0.0250 Satterthwa Unequal 25,9-1,77 0,0447-0.3450 0.0263 RECHAZAMOS NULA. ACEPTAMOS QUE LA AGRESIVIDAD MEDIA ES MENOR EN LOS SOBRIOS Homogeneity of Variances DF F P Folded F Test 15,15 2.33 0,0563 ACEPTAMOS IGUALDAD DE VARIANZAS Caso II) Caso de disponer sólo de medidas resumen (tamaños, medias y desviaciones típicas) Statistics /One, Two, Multi-Sample Tests/Hypothesis tests/two Means Ejemplo: Algunos autores afirman que los pacientes con depresión tienen una función cortical por debajo de lo normal, debido a un riego sanguíneo por debajo de lo normal. Se ha medido X= flujo sanguíneo en 20 pacientes con depresión (D) y en 22 individuos normales (N). Los resultados fueron los siguientes: n =20, x = 47, s =7.8 D D D n =22, x = 53.8, s =6.1 N N N Hypothesis Test - Two Means N Mean SD SE Sample 1 20 47.000 7.8000 1.7441 Sample 2 22 53.800 6.1000 1.3005 Difference -6.8000 6.9595 2.1502 10

T-Tests for Mean Difference Null Hypothesis: difference = 0 Alternative Hyp: difference < 0 95% CI for Difference Method Variances DF T P Lower Upper Pooled Equal 40-3,16 0,0015-11.146-2.4543 Satterthwai Unequal 35,9-3,13 0,0018-11.213-2.3874 RECHAZAMOS LA NULA. ACEPTAMOS QUE LA MEDIA ES MENOR EN LOS DEPRESIVOS Homogeneity of Variances DF F P Folded F Test 19,21 1.64 0,1376 ACEPTAMOS IGUALDAD DE VARIANZAS 4) CONTRASTE PARA DOS PROPORCIONES Statistics / One, two, Multi_sample tests / Hipótesis test / / Two Proportions Ejemplo: Se quiere comprobar la efectividad de una cierta vacuna. Para ello, se le administra la vacuna a 100 animales de experimentación y se compara con un grupo testigo de otros 100 animales sin vacunar. Se contagia a los 200 animales con la enfermedad y como consecuencia, murieron 8 de los vacunados y 20 de los no vacunados. Podemos concluir que la vacuna es eficaz? Hypothesis Test - Two Proportions Sample Size Successes Proportion Sample 1 100 8 0,08000 Sample 2 100 20 0,20000 Difference -0,12000 Null Hypothesis: P1 = P2 Alternative Hyp: P1 < P2 SE (difference) 0,04907 Z (uncorrected) -2,45 P 0,0072 ACEPTAMOS QUE ES SIGNIFICATIVAMENTE EFICAZ Z (corrected) -2,24 P 0,0125 Fisher's Exact 0,0118 95% Confidence Interval of Difference -0,21473 < P1-P2 < -0,02527 11

5) CONTRASTE PARA COMPARAR LAS MEDIAS DE DOS NORMALES APAREADAS Statistics / One, two, Multi_sample tests / Paired T Test Ejemplo: Se quiere estudiar el efecto del ejercicio físico en la reducción del colesterol en suero. A 11 participantes se les mide el nivel de colesterol antes y después de someterse a un programa de ejercicios. Los resultados fueron los siguientes: Antes 182 232 191 200 148 249 276 213 241 480 262 Desp. 198 210 194 220 138 220 219 161 210 313 226 d -16 22-3 -20 10 29 57 52 31 167 36 El ejercicio físico es efectivo para reducir el colesterol? Es necesario considerar dos variables: "Colesterol antes" y " Colesterol después" Null Hypothesis: difference = 0 Alternative Hyp: difference > 0 Mean 33.182 Std Error 15.397 Mean - H0 33.182 Lower 95% CI -1.1250 Upper 95% CI 67.489 T 2.16 DF 10 P 0.0283 RECHAZAMOS LA NULA. ACEPTAMOS QUE EL EJERCICIO REDUCE EL COLESTEROL 12

5) TEST DE ASOCIACIÓN Statistics / Association Test / Chi-Square Test Caso I) Caso de tener todas las observaciones en Statistix Ejemplo: Vamos a estudiar la posible asociación entre estar sobrio o no y el tipo de spicosis Chi-Square Test for Heterogeneity or Independence for 1 = DRINK P_TYPE P_TYPE DRINK Non-ASP ASP +-----------+-----------+ Sober Observed 8 8 16 Expected 8,00 8,00 Cell Chi-Sq 0,00 0,00 +-----------+-----------+ Drinking Obs 8 8 16 Expected 8,00 8,00 Cell Chi-Sq 0,00 0,00 +-----------+-----------+ 16 16 32 Overall Chi-Square 0,00 P-value 1,0000 Degrees of Freedom 1 13

Caso II) Caso de tener una tabla de contingencia Ejemplo: La tabla siguiente muestra el resultado de clasificar una muestra de 141 individuos con arreglo a las características localización y naturaleza del tumor cerebral. El lugar que ocupa el tumor influye en la gravedad del mismo? Naturaleza Benigno Maligno Otros Localización Lóbulo frontal 23 9 6 Lóbulo temporal 21 4 3 Otras áreas 34 24 17 A) Introducción de los datos en el caso general: Forma 1 Crear 3 variables : Benigno, Maligno, Otro. Asociar a cada variable los valores que aparecen en la correspondiente columna. Case benigno maligno otro +-----------+-----------+-----------+ 1 Observed 23 9 6 38 Expected 21,02 9,97 7,01 Cell Chi-Sq 0,19 0,09 0,14 +-----------+-----------+-----------+ 2 Observed 21 4 3 28 Expected 15,49 7,35 5,16 Cell Chi-Sq 1,96 1,53 0,91 +-----------+-----------+-----------+ 3 Observed 34 24 17 75 Expected 41,49 19,68 13,83 Cell Chi-Sq 1,35 0,95 0,73 +-----------+-----------+-----------+ 78 37 26 141 Overall Chi-Square 7,84 Degrees of Freedom 4 P-value 0,0975 14

Forma 2 Crear 3 variables : Localización, Tipo y Frecuencia Asociar a cada combinación de tipo y localización la correspondiente frecuencia. B) Introducción de los datos en el caso de tablas 2x2: 15