Métodos Estadísticos de la Ingeniería Tema 11: Contrastes de Hipótesis Grupo B Área de Estadística e Investigación Operativa Licesio J. Rodríguez-Aragón Abril 2010 Contenidos............................................................... 2 Conceptos Generales 3 Contrastes de Hipótesis................................................... 4 Pruebas relacionadas con la Media de una Población 6 Prueba para µ = µ 0 cuando σ es Conocida...................................... 7 Prueba para µ µ 0 cuando σ es Conocida...................................... 8 Prueba para µ = µ 0 cuando σ es Desconocida................................... 9 Ejemplo de contraste de hipótesis con R...................................... 10 Prueba para µ µ 0 cuando σ es Desconocida.................................. 12 Ejemplo de contraste de hipótesis con R...................................... 13 Pruebas relacionadas con las Medias de dos Poblaciones Independientes 15 Prueba para µ 1 = µ 2 cuando σ 1 y σ 2 son Conocidas.............................. 16 Prueba para µ 1 µ 2 cuando σ 1 y σ 2 son Conocidas.............................. 17 Prueba para µ 1 = µ 2 cuando σ 1 y σ 2 son Desconocidas pero Iguales................... 18 Prueba para µ 1 µ 2 cuando σ 1 y σ 2 son Desconocidas pero Iguales................... 19 Prueba para µ 1 = µ 2 cuando σ 1 y σ 2 son Desconocidas y Distintas................... 20 Prueba para µ 1 µ 2 cuando σ 1 y σ 2 son Desconocidas y Distintas................... 21 Pruebas relacionadas con las Medias de dos Poblaciones Relacionadas 22 Prueba para µ 1 = µ 2 cuando σ 1, σ 2 y ρ son Desconocidos.......................... 23 Prueba para µ 1 µ 2 cuando σ 1, σ 2 y ρ son Desconocidos.......................... 24 Pruebas relacionadas con las Varianzas de dos Poblaciones 25 Prueba para σ1 2 = σ2 2 con µ 1 y µ 2 Desconocidas................................. 26 Prueba para σ1 2 σ2 2 con µ 1 y µ 2 Desconocidas................................. 27 Pruebas relacionadas con Proporciones 28 Prueba para p = p 0..................................................... 29 Prueba para p p 0..................................................... 30 Contrastes de Hipótesis: p-valor 31 p-valor.............................................................. 32 1
Contenidos Conceptos Generales. Pruebas relacionadas con la media de una población. Pruebas relacionadas con la igualdad de medias de dos poblaciones. Pruebas para datos relacionados. Pruebas para las varianzas. Pruebas para proporciones. Los contrastes de hipótesis permitirán decidirnos entre dos hipótesis formuladas previamente con un determinado nivel de error. Licesio J. Rodríguez-Aragón Tema 11, M.E.I. 2 / 32 2
Conceptos Generales 3 / 32 Contrastes de Hipótesis Una Hipótesis Estadística es una proposición que se establece acerca de una o más poblaciones: Acerca de los parámetros de una distribución. Acerca de el tipo y forma de la distribución. Los contrastes de hipótesis se basan en la información proporcionada por una muestra. La terminología estadística habla de Aceptar o Rechazar una hipótesis: Rechazar, significa que la hipótesis es falsa. Aceptar, solamente implica que no se tiene suficiente información para rechazarla. Las Hipótesis se plantean sobre los posibles valores que puede tomar un parámetro poblacional. Hipótesis Simples, son aquellas que sólo plantean un valor posible para el parámetro. Hipótesis Compuestas, establecen un rango de valores que puede tomar el parámetro poblacional. Se plantea en el contraste dos Hipótesis excluyentes y complementarias: Hipótesis Nula, H 0 : Suele ser la más concreta, la que contenga el signo de igualdad, suele ser simple. Hipótesis Alternativa, H 1 : Complementaria a la Nula, suele ser compuesta. El planteamiento de H 0 permite elaborar un modelo probabilístico a partir del cual podemos llegar a la decisión final. El Contraste de Hipótesis conlleva establecer dos zonas disjuntas y complementarias, Zona de Rechazo de H 0 (Región Crítica) y la Zona de Aceptación de H 0. 1 2 2 Z((1 ) 2) Z((1 + ) 2) Z Licesio J. Rodríguez-Aragón Tema 11, M.E.I. 4 / 32 3
Contrastes de Hipótesis La decisión de aceptar o rechazar H 0 se basa en probabilidades, no en certezas, al tomar la decisión podemos cometer dos tipo de errores. Error Tipo I: Rechazar la Hipótesis Nula, H 0 siendo verdadera. Error Tipo II: Aceptar la Hipótesis Nula, H 0 siendo falsa. H 0 Verdadera H 0 Falsa Aceptar H 0 Decisión Correcta Error Tipo II 1 β Rechazar H 0 Error Tipo I Decisión Correcta 1 β Las probabilidades de los Errores de tipo I y II son probabilidades condicionadas: Nivel de Significación, : Nivel de Confianza, 1 = : = P(Error I) = P(Rechazar H 0 H 0 Verdadera) = 1 P(Error I) = P(Aceptar H 0 H 0 Verdadera) β = P(Error II) = P(Aceptar H 0 H 0 Falsa) Al valor complementario de β se le denomina Potencia del Contraste, 1 β 1 β = P(Rechazar H 0 H 0 Falsa) El objetivo sería disponer de un contraste que maximicen la Confianza ( = 1 ) y la Potencia (1 β) y minimizen los Errores de tipo I y II, esto se logra aumentando el tamaño de la muestra n, hasta un cierto valor. El nivel de Significación es normalmente controlado por el experimentador mientras que β es controlado mediante la elección correcta del tamaño de la muestra. Licesio J. Rodríguez-Aragón Tema 11, M.E.I. 5 / 32 4
Pruebas relacionadas con la Media de una Población 6 / 32 Prueba para µ = µ 0 cuando σ es Conocida Consideremos el problema de probar la hipótesis de que la media de una población, con varianza σ 2 conocida, sea igual a un valor concreto µ 0, en contra de una hipótesis alternativa bilateral de que la media sea diferente. H 0 : µ = µ 0 H 1 : µ µ 0 Sea X 1,X...,X n una m.a.s., el estadístico apropiado para este caso está basado en la media muestral X. El Teorema Central del Limite nos asegura que X N(µ,σ/ n). Para un nivel de Significación = 1 se establecen valores críticos a y b, tales que el intervalo a < X < b defina la Región de Aceptación y la Región Crítica. Los valores críticos se obtienen, Z = (X µ 0 )/(σ/ n) N(0,1) bajo H 0. (a µ 0 )/(σ/ n) = z = 2 z1 2 (b µ 0 )/(σ/ n) = z 1 = 2 z1+ 2 a = µ 0 + (σ/ n)z 2 b = µ 0 + (σ/ n)z 1 2 1 2 2 Z( 2) Z(1 2) Z Así pues, de la población, se elige una muestra de tamaño n y se calcula la media de la muestra X. Si X cae en la Región de Aceptación, a < X < b, entonces, el estadístico Z = (X µ 0 )/(σ/ n) caerá en la Región de Aceptación, Z < z 1 y se aceptará H 0 ; en caso contrario, Región de Rechazo, se rechazará H 0. Z z 1 Los Coeficientes de Confianza o Niveles de Significación más usuales son: = 0.95, = 0.05 z1+ = z 1 = z 0.975 = 1.96, 2 2 = 0.99, = 0.01 z1+ = z 1 = z 0.995 = 2.58. 2 2 Licesio J. Rodríguez-Aragón Tema 11, M.E.I. 7 / 32 5
Prueba para µ µ 0 cuando σ es Conocida En este caso consideremos la hipótesis de que la media de una población, con varianza σ 2 conocida, sea menor o igual a un valor concreto µ 0, en contra de una hipótesis alternativa unilateral de que la media sea mayor. H 0 : µ µ 0 H 1 : µ > µ 0 Para un nivel de Significación = 1 se establecen un valor crítico a, tal que el intervalo X < a defina la Región de Aceptación y la Región Crítica. Z = (X µ 0 )/(σ/ n) N(0,1) bajo H 0. El valor crítico se obtiene, (a µ 0 )/(σ/ n) = z 1 = z a = µ 0 + (σ/ n)z 1 1 Z(1 ) Z Así pues, de la población, se elige una muestra de tamaño n y se calcula la media de la muestra X. Si X cae en la Región de Aceptación, X < a, entonces, el estadístico Z = (X µ 0 )/(σ/ n) caerá en la Región de Aceptación, Z < z 1, y se aceptará H 0 ; en caso contrario, Región de Rechazo, se rechazará H 0. Z z 1, Los Coeficientes de Confianza o Niveles de Significación más usuales son: = 0.95, = 0.05 z = z 1 = z 0.95 = 1.65, = 0.99, = 0.01 z = z 1 = z 0.99 = 2.33. Licesio J. Rodríguez-Aragón Tema 11, M.E.I. 8 / 32 6
Prueba para µ = µ 0 cuando σ es Desconocida Consideremos el problema de probar la hipótesis de que la media de una población, con varianza σ 2 desconocida, sea igual a un valor concreto µ 0, en contra de una hipótesis alternativa bilateral de que la media sea diferente. H 0 : µ = µ 0 H 1 : µ µ 0 Sea X 1,X...,X n una m.a.s., el estadístico apropiado para este caso está basado en la media muestral X. Para un nivel de Significación = 1 se establecen valores críticos a y b, tales que el intervalo a < X < b defina la Región de Aceptación y la Región Crítica. Los valores críticos se obtienen, T = (X µ 0 )/(S c / n) t n 1 bajo H 0. a = µ 0 + (S c / n)t n 1, 2 b = µ 0 + (S c / n)t n 1,1 2 1 2 2 t( 2) t(1 2) T Así pues, de la población, se elige una muestra de tamaño n y se calcula la media de la muestra X. Si X cae en la Región de Aceptación, a < X < b, entonces, el estadístico T = (X µ 0 )/(S c / n) caerá en la Región de Aceptación, T < t n 1,1 y se aceptará H 0 ; en caso contrario, Región de Rechazo, se rechazará H 0. T t n 1,1 Los Coeficientes de Confianza o Niveles de Significación usuales, eg. n = 20: = 0.95, = 0.05 t 19, 1+ = t 19,1 = t 19,0.975 = 2.09, 2 2 = 0.99, = 0.01 t 19, 1+ = t 19,1 = t 19,0.995 = 2.86. 2 2 Licesio J. Rodríguez-Aragón Tema 11, M.E.I. 9 / 32 7
Ejemplo de contraste de hipótesis con R > x <- c(17.7, 17.3, 13.6, 12.3, 14, 13.1, 13, 15.4, 19.7, 19.5) > t.test(x, mu = 15, alt = "two.sided", conf.level = 0.95) One Sample t-test data: x t = 0.6359, df = 9, p-value = 0.5407 alternative hypothesis: true mean is not equal to 15 95 percent confidence interval: 13.56776 17.55224 sample estimates: mean of x 15.56 > pt(0.6359, df = 9) [1] 0.7296637 Licesio J. Rodríguez-Aragón Tema 11, M.E.I. 10 / 32 Ejemplo de contraste de hipótesis con R > x <- c(17.7, 17.3, 13.6, 12.3, 14, 13.1, 13, 15.4, 19.7, 19.5) > t.test(x, mu = 18, alt = "two.sided", conf.level = 0.95) One Sample t-test data: x t = -2.7706, df = 9, p-value = 0.02173 alternative hypothesis: true mean is not equal to 18 95 percent confidence interval: 13.56776 17.55224 sample estimates: mean of x 15.56 > pt(-2.7706, df = 9) [1] 0.01086609 Licesio J. Rodríguez-Aragón Tema 11, M.E.I. 11 / 32 8
Prueba para µ µ 0 cuando σ es Desconocida En este caso consideremos la hipótesis de que la media de una población, con varianza σ 2 desconocida, sea menor o igual a un valor concreto µ 0, en contra de una hipótesis alternativa unilateral de que la media sea mayor. H 0 : µ µ 0 H 1 : µ > µ 0 Para un nivel de Significación = 1 se establecen un valor crítico a, tal que el intervalo X < a defina la Región de Aceptación y la Región Crítica. T = (X µ 0 )/(S c / n) t n 1 bajo H 0. El valor crítico se obtiene, (a µ 0 )/(S c / n) = t n 1,1 = t n 1, a = µ 0 + (S c / n)t n 1,1 1 t(1 ) T Así pues, de la población, se elige una muestra de tamaño n y se calcula la media de la muestra X. Si X cae en la Región de Aceptación, X < a, entonces, el estadístico T = (X µ 0 )/(S c / n) caerá en la Región de Aceptación, T < t n 1,1, y se aceptará H 0 ; en caso contrario, Región de Rechazo, se rechazará H 0. T t n 1,1, Los Coeficientes de Confianza o Niveles de Significación usuales, eg. n = 20: = 0.95, = 0.05 t n 1, = t n 1,1 = t 19,0.95 = 1.73, = 0.99, = 0.01 t n 1, = t n 1,1 = t 19,0.99 = 2.54. Licesio J. Rodríguez-Aragón Tema 11, M.E.I. 12 / 32 9
Ejemplo de contraste de hipótesis con R > x <- c(17.7, 17.3, 13.6, 12.3, 14, 13.1, 13, 15.4, 19.7, 19.5) > t.test(x, mu = 15, alt = "greater", conf.level = 0.95) One Sample t-test data: x t = 0.6359, df = 9, p-value = 0.2703 alternative hypothesis: true mean is greater than 15 95 percent confidence interval: 13.94561 Inf sample estimates: mean of x 15.56 > pt(0.6359, df = 9) [1] 0.7296637 Licesio J. Rodríguez-Aragón Tema 11, M.E.I. 13 / 32 10
Ejemplo de contraste de hipótesis con R > x <- c(17.7, 17.3, 13.6, 12.3, 14, 13.1, 13, 15.4, 19.7, 19.5) > t.test(x, mu = 12, alt = "greater", conf.level = 0.95) One Sample t-test data: x t = 4.0423, df = 9, p-value = 0.001459 alternative hypothesis: true mean is greater than 12 95 percent confidence interval: 13.94561 Inf sample estimates: mean of x 15.56 > pt(4.0423, df = 9) [1] 0.9985408 Licesio J. Rodríguez-Aragón Tema 11, M.E.I. 14 / 32 11
Pruebas relacionadas con las Medias de dos Poblaciones Independientes 15 / 32 Prueba para µ 1 = µ 2 cuando σ 1 y σ 2 son Conocidas Consideremos el problema de probar la hipótesis de que las medias de dos poblaciones normales e independientes, con varianzas σ1 2 y σ2 2 conocidas, sean iguales, en contra de una hipótesis alternativa bilateral de que las medias sean diferentes. H 0 : µ 1 = µ 2 H 1 : µ 1 µ 2 El estadístico apropiado para este caso está basado en la diferencia de las medias muestrales X 1 X 2. Para un nivel de Significación = 1 se establecen valores críticos a y b, tales que el intervalo a < X 1 X 2 < b defina la Región de Aceptación y la Región Crítica. Z = (X 1 X 2 ) σ 2 1 /n 1 + σ 2 2 /n 2 N(0,1) bajo H 0. 1 2 2 Z( 2) Z(1 2) Z Así pues, de las poblaciones, se eligen muestras de tamaño n 1 y n 2 respectivamente y se calculan las medias muestrales X 1 y X obteniéndose Z. La Región de Aceptación vendrá definida por, y se aceptará H 0. Z < z 1 Mientras que en caso contrario, se define la Región de Rechazo, y se rechazará H 0. Z z 1 Licesio J. Rodríguez-Aragón Tema 11, M.E.I. 16 / 32 12
Prueba para µ 1 µ 2 cuando σ 1 y σ 2 son Conocidas Consideremos el problema de probar la hipótesis de que las medias de dos poblaciones normales e independientes, con varianzas σ 2 1 y σ2 2 conocidas, sean µ 1 µ en contra de una hipótesis alternativa unilateral de que sean µ 1 > µ 2. H 0 : µ 1 µ 2 H 1 : µ 1 > µ 2 Para un nivel de Significación = 1 se establecen un valor crítico a, tal que el intervalo X 1 X 2 < a defina la Región de Aceptación y la Región Crítica. Z = (X 1 X 2 ) σ 2 1 /n 1 + σ 2 2 /n 2 N(0,1) bajo H 0. 1 Z(1 ) Z Así pues, de las poblaciones, se eligen muestras de tamaño n 1 y n 2 respectivamente y se calculan las medias muestrales X 1 y X obteniéndose T. La Región de Aceptación vendrá definida por, y se aceptará H 0. Z < z 1, Mientras que en caso contrario, se define la Región de Rechazo, y se rechazará H 0. Z z 1, Licesio J. Rodríguez-Aragón Tema 11, M.E.I. 17 / 32 13
Prueba para µ 1 = µ 2 cuando σ 1 y σ 2 son Desconocidas pero Iguales Consideremos el problema de probar la hipótesis de que las medias de dos poblaciones normales e independientes, con varianzas σ1 2 y σ2 2 desconocidas e iguales, sean iguales, en contra de una hipótesis alternativa bilateral de que las medias sean diferentes. H 0 : µ 1 = µ 2 H 1 : µ 1 µ 2 El estadístico apropiado para este caso está basado en la diferencia de las medias muestrales X 1 X 2. Para un nivel de Significación = 1 se establecen valores críticos a y b, tales que el intervalo a < X 1 X 2 < b defina la Región de Aceptación y la Región Crítica. T = (X 1 X 2 ) t n1 S1 2+n n1 2S2 2 n 1 +n 2 2 ( 1 n 1 + 1 +n 2 2 bajo H 0. n 2 ) 1 2 2 t( 2) t(1 2) T Así pues, de las poblaciones, se eligen muestras de tamaño n 1 y n 2 respectivamente y se calculan las medias muestrales X 1 y X obteniéndose T. La Región de Aceptación vendrá definida por, y se aceptará H 0. T < t n 1,1 Mientras que en caso contrario, se define la Región de Rechazo, y se rechazará H 0. T t n 1,1 Licesio J. Rodríguez-Aragón Tema 11, M.E.I. 18 / 32 14
Prueba para µ 1 µ 2 cuando σ 1 y σ 2 son Desconocidas pero Iguales Consideremos el problema de probar la hipótesis de que las medias de dos poblaciones normales e independientes, con varianzas σ 2 1 y σ2 2 desconocidas e iguales, sean µ 1 µ en contra de una hipótesis alternativa unilateral de que sean µ 1 > µ 2. H 0 : µ 1 µ 2 H 1 : µ 1 > µ 2 Para un nivel de Significación = 1 se establecen un valor crítico a, tal que el intervalo X 1 X 2 < a defina la Región de Aceptación y la Región Crítica. T = (X 1 X 2 ) t n1 S1 2+n n1 2S2 2 n 1 +n 2 2 ( 1 n 1 + 1 +n 2 2 bajo H 0. n 2 ) 1 t(1 ) T Así pues, de las poblaciones, se eligen muestras de tamaño n 1 y n 2 respectivamente y se calculan las medias muestrales X 1 y X obteniéndose T. La Región de Aceptación vendrá definida por, y se aceptará H 0. T < t n1 +n 2 2,1, Mientras que en caso contrario, se define la Región de Rechazo, y se rechazará H 0. T t n1 +n 2 2,1, Licesio J. Rodríguez-Aragón Tema 11, M.E.I. 19 / 32 15
Prueba para µ 1 = µ 2 cuando σ 1 y σ 2 son Desconocidas y Distintas Consideremos el problema de probar la hipótesis de que las medias de dos poblaciones normales e independientes, con varianzas σ1 2 y σ2 2 desconocidas y distintas, sean iguales, en contra de una hipótesis alternativa bilateral de que las medias sean diferentes. H 0 : µ 1 = µ 2 H 1 : µ 1 µ 2 El estadístico apropiado para este caso está basado en la diferencia de las medias muestrales X 1 X 2. Para un nivel de Significación = 1 se establecen valores críticos a y b, tales que el intervalo a < X 1 X 2 < b defina la Región de Aceptación y la Región Crítica. T = (X 1 X 2 ) S 2 c1 n 1 + S2 c 2 n 2 t g bajo H 0, con g = ( ) 2 Sc 2 1 n 1 + S2 c 2 n 2 (Sc 2 1 /n 1 ) 2 n 1 1 + (S2 c 2 /n 2 ) 2 n 2 1. 1 2 2 t( 2) t(1 2) T Así pues, de las poblaciones, se eligen muestras de tamaño n 1 y n 2 respectivamente y se calculan las medias muestrales X 1 y X obteniéndose T. La Región de Aceptación vendrá definida por, y se aceptará H 0. T < t g,1 Mientras que en caso contrario, se define la Región de Rechazo, y se rechazará H 0. T t g,1 Licesio J. Rodríguez-Aragón Tema 11, M.E.I. 20 / 32 16
Prueba para µ 1 µ 2 cuando σ 1 y σ 2 son Desconocidas y Distintas Consideremos el problema de probar la hipótesis de que las medias de dos poblaciones normales e independientes, con varianzas σ 2 1 y σ2 2 desconocidas y distintas, sean µ 1 µ en contra de una hipótesis alternativa unilateral de que sean µ 1 > µ 2. H 0 : µ 1 µ 2 H 1 : µ 1 > µ 2 Para un nivel de Significación = 1 se establecen un valor crítico a, tal que el intervalo X 1 X 2 < a defina la Región de Aceptación y la Región Crítica. T = (X 1 X 2 ) S 2 c1 n 1 + S2 c 2 n 2 t g bajo H 0, con g = ( ) 2 Sc 2 1 n 1 + S2 c 2 n 2 (Sc 2 1 /n 1 ) 2 n 1 1 + (S2 c 2 /n 2 ) 2 n 2 1. 1 t(1 ) T Así pues, de las poblaciones, se eligen muestras de tamaño n 1 y n 2 respectivamente y se calculan las medias muestrales X 1 y X obteniéndose T. La Región de Aceptación vendrá definida por, y se aceptará H 0. T < t g,1, Mientras que en caso contrario, se define la Región de Rechazo, y se rechazará H 0. T t g,1, Licesio J. Rodríguez-Aragón Tema 11, M.E.I. 21 / 32 17
Pruebas relacionadas con las Medias de dos Poblaciones Relacionadas 22 / 32 Prueba para µ 1 = µ 2 cuando σ 1, σ 2 y ρ son Desconocidos Consideremos el problema de probar la hipótesis de que las medias de dos poblaciones normales y apareadas, con σ1 2, σ2 2 y ρ desconocidos, sean iguales, en contra de una hipótesis alternativa bilateral de que las medias sean diferentes. H 0 : µ 1 = µ 2 H 1 : µ 1 µ 2 Sean (X1 1,X1 2 ),(X2 1,X2 2 ),...,(Xn 1,Xn 2 ) n pares de muestras aleatorias simples. El estadístico apropiado para este caso está basado en la diferencia de las medias muestrales D = X 1 X con D i = X1 i Xi 2. Para un nivel de Significación = 1 se establecen valores críticos a y b, tales que el intervalo a < X 1 X 2 < b defina la Región de Aceptación y la Región Crítica. T = (X 1 X 2 ) n i t S n cd n 1 bajo H 0, con S cd = (D i D) 2. n 1 1 2 2 t( 2) t(1 2) T Así pues, de las poblaciones, se eligen muestras de tamaño n 1 y n 2 respectivamente y se calculan las medias muestrales X 1 y X obteniéndose T. La Región de Aceptación vendrá definida por, y se aceptará H 0. T < t n 1,1 Mientras que en caso contrario, se define la Región de Rechazo, y se rechazará H 0. T t n 1,1 Licesio J. Rodríguez-Aragón Tema 11, M.E.I. 23 / 32 18
Prueba para µ 1 µ 2 cuando σ 1, σ 2 y ρ son Desconocidos Consideremos el problema de probar la hipótesis de que las medias de dos poblaciones normales e independientes, con σ 2 1, σ2 2 y ρ desconocidos, sean µ 1 µ en contra de una hipótesis alternativa unilateral de que sean µ 1 > µ 2. H 0 : µ 1 µ 2 H 1 : µ 1 > µ 2 Sean (X1 1,X1 2 ),(X2 1,X2 2 ),...,(Xn 1,Xn 2 ) n pares de muestras aleatorias simples. El estadístico apropiado para este caso está basado en la diferencia de las medias muestrales D = X 1 X con D i = X1 i Xi 2. Para un nivel de Significación = 1 se establecen un valor crítico a, tal que el intervalo X 1 X 2 < a defina la Región de Aceptación y la Región Crítica. T = (X 1 X 2 ) n i t S n cd n 1 bajo H 0, con S cd = (D i D) 2. n 1 1 t(1 ) T Así pues, de las poblaciones, se eligen muestras de tamaño n 1 y n 2 respectivamente y se calculan las medias muestrales X 1 y X obteniéndose T. La Región de Aceptación vendrá definida por, y se aceptará H 0. T < t n 1,1, Mientras que en caso contrario, se define la Región de Rechazo, y se rechazará H 0. T t n 1,1, Licesio J. Rodríguez-Aragón Tema 11, M.E.I. 24 / 32 19
Pruebas relacionadas con las Varianzas de dos Poblaciones 25 / 32 Prueba para σ 2 1 = σ2 2 con µ 1 y µ 2 Desconocidas Consideremos el problema de probar la hipótesis de la igualdad de las varianzas σ1 2 y σ2 2 poblaciones, en contra de una hipótesis alternativa bilateral de que sean diferentes. de dos H 0 : σ 1 = σ 2 H 1 : σ 1 σ 2 El estadístico apropiado para este caso está basado en el cociente de las Cuasivarianzas muestrales S 2 c 1 /S 2 c 2. Para un nivel de Significación = 1 se establecen valores críticos a y b, tales que el intervalo a < S 2 c 1 /S 2 c 2 < b defina la Región de Aceptación y la Región Crítica. F = S2 c 1 S 2 c 2 F n1 1,n 2 1 bajo H 0. 0.0 0.2 0.4 0.6 0.8 1 2 2 F( 2) F(1 2) 0 1 2 3 4 5 6 F Así pues, de las poblaciones, se eligen muestras de tamaño n 1 y n 2 respectivamente y se calcula el estadístico de contraste F. La Región de Aceptación vendrá definida por, F n1 1,n 2 2, < F < F n 2 1 1,n 2 1,1 2 y se aceptará H 0. Mientras que en caso contrario, se define la Región de Rechazo, F F n1 1,n 2 2, o F n 2 1 1,n 2 1,1 F 2 y se rechazará H 0. Licesio J. Rodríguez-Aragón Tema 11, M.E.I. 26 / 32 20
Prueba para σ 2 1 σ 2 2 con µ 1 y µ 2 Desconocidas Consideremos el problema de probar la hipótesis de que las varianzas de dos poblaciones, sean σ 2 1 σ2 en contra de una hipótesis alternativa unilateral de que sean σ2 1 > σ2 2. H 0 : σ 2 1 σ 2 2 H 1 : σ 2 1 > σ 2 2 El estadístico apropiado para este caso está basado en el cociente de las Cuasivarianzas muestrales S 2 c 1 /S 2 c 2. Para un nivel de Significación = 1 se establecen valores críticos a y b, tales que el intervalo S 2 c 1 /S 2 c 2 < a defina la Región de Aceptación y la Región Crítica. F = S2 c 1 S 2 c 2 F n1 1,n 2 1 bajo H 0. 0.0 0.2 0.4 0.6 0.8 1 F(1 ) 0 1 2 3 4 5 6 F Así pues, de las poblaciones, se eligen muestras de tamaño n 1 y n 2 respectivamente y se calcula el estadístico de contraste F. La Región de Aceptación vendrá definida por, y se aceptará H 0. F < F n1 1,n 2 1,1 Mientras que en caso contrario, se define la Región de Rechazo, y se rechazará H 0. F F n1 1,n 2 1,1 Licesio J. Rodríguez-Aragón Tema 11, M.E.I. 27 / 32 21
Pruebas relacionadas con Proporciones 28 / 32 Prueba para p = p 0 Consideremos el problema de probar la hipótesis de que la proporción de elementos con un atributo en una población, sea igual a un valor concreto p 0, en contra de una hipótesis alternativa bilateral de que sea diferente. H 0 : p = p 0 H 1 : p p 0 El estadístico apropiado para este caso está basado en ˆp = X/n, siendo X el número de elementos con el atributo y n el tamaño de la muestra. Para un nivel de Significación = 1 se establecen valores críticos a y b, tales que el intervalo a < ˆp < b defina la Región de Aceptación y la Región Crítica. Z = (ˆp p 0) ˆpˆq n N(0,1) bajo H 0. 1 2 2 Z( 2) Z(1 2) Z Así pues, de la población, se elige una muestra de tamaño n y se calcula ˆp = X/n. Si ˆp cae en la Región de Aceptación, a < ˆp < b, entonces, el estadístico Z caerá en la Región de Aceptación, Z < z 1 y se aceptará H 0 ; en caso contrario, Región de Rechazo, se rechazará H 0. Z z 1 Licesio J. Rodríguez-Aragón Tema 11, M.E.I. 29 / 32 22
Prueba para p p 0 Consideremos el problema de probar la hipótesis de que la proporción de elementos con un atributo en una población, sea menor o igual a un valor concreto p 0, en contra de una hipótesis alternativa unilateral de que sea mayor. H 0 : p p 0 H 1 : p > p 0 Para un nivel de Significación = 1 se establecen un valor crítico a, tal que el intervalo ˆp < a defina la Región de Aceptación y la Región Crítica. Z = (ˆp p 0) ˆpˆq n N(0,1) bajo H 0. 1 Z(1 ) Z Así pues, de la población, se elige una muestra de tamaño n y se calcula ˆp = X/n. Si ˆp cae en la Región de Aceptación, ˆp < a, entonces, el estadístico Z caerá en la Región de Aceptación, Z < z 1, y se aceptará H 0 ; en caso contrario, Región de Rechazo, se rechazará H 0. Z z 1, Licesio J. Rodríguez-Aragón Tema 11, M.E.I. 30 / 32 23
Contrastes de Hipótesis: p-valor 31 / 32 p-valor En contrastes de hipótesis, en Estadística, el p-valor está definido como la probabilidad de obtener un resultado al menos tan extremo como el que realmente se ha obtenido, suponiendo que la hipótesis nula es cierta. p = P( Z > Z obs H 0 ) Si el p-valor es inferior a lo más probable es que la hipótesis H 0 sea falsa. Sin embargo, también es posible que estemos ante una observación atípica, por lo que estaríamos cometiendo el error estadístico de rechazar la hipótesis nula cuando ésta es cierta basándonos en que hemos tenido la mala suerte de encontrar una observación atípica. Este tipo de errores se puede subsanar rebajando el nivel de significación, un nivel de 0.05 es usado en investigaciones habituales sociológicas mientras que niveles de 0.01 se utilizan en investigaciones médicas, en las que cometer un error puede acarrear consecuencias más graves. También se puede tratar de subsanar dicho error aumentando el tamaño de la muestra obtenida, esto reduce la posibilidad de que el dato obtenido sea casualmente raro. Licesio J. Rodríguez-Aragón Tema 11, M.E.I. 32 / 32 24