Inferencia con una variable Tema 2 1. Contraste sobre una proporción 2. Bondad de ajuste 3. Contraste de hipótesis sobre una media 3.1. Con σ 2 conocida, prueba Z 3.2. Con σ 2 desconocida, prueba T 4. Contrastes sobre la forma de una distribución, Kolmogorov-Smirnov
1. Contraste sobre una proporción Se contrasta si la proporción poblacional, π, toma un valor determinado, π 0 Unilateral derecho: H 0 : π π 0 H 1 : π > π 0 Unilateral izquierdo: H 0 : π π 0 H 1 : π < π 0 Bilateral: H 0 : π = π 0 H 1 : π π 0
Muestra pequeña (n 20) X ~ Binomial (n, π 0 ) Se busca el nivel crítico, p, en la tabla binomial y se utiliza para tomar la decisión Unilateral derecho: H 0 : π π 0 H 1 : π > π 0 Nivel crítico: p d = P(X x) Unilateral izquierdo: H 0 : π π 0 H 1 : π < π 0 Nivel crítico: p i = P(X x) Bilateral: H 0 : π = π 0 H 1 : π π 0 Nivel crítico: p b = 2 (el menor de p d y p i )
Muestra grande (n > 20) 1. Hipótesis Unilateral derecho: H 0 : π π 0 H 1 : π > π 0 Unilateral izquierdo: H 0 : π π 0 H 1 : π < π 0 Bilateral: H 0 : π = π 0 H 1 : π π 0 2. Supuestos: - Muestra aleatoria simple - π constante en cada extracción 3. Estadístico de contraste Z = X nπ 0 nπ (1 π ) 0 0 Z ~ Normal(0, 1) 4. Zonas de aceptación y rechazo y nivel crítico: se buscan en la distribución normal, igual que en los contrastes sobre medias 5. Decisión y conclusión
Un laboratorio ha desarrollado un medicamento para mejorar los síntomas del alzhéimer, con el cual la mitad de los pacientes muestran efectos beneficiosos al cabo de seis meses de tratamiento. Queremos averiguar si este tratamiento, combinado con la terapia cognitiva, consigue efectos beneficiosos en un número mayor de personas. Para ello, hemos tomado una muestra de quince pacientes que reciben la terapia combinada y se ha observado que dos terceras partes han mostrado mejoría. Utilizando un nivel de confianza del 99% podemos concluir que la terapia combinada ha mejorado los resultados del medicamento?
1) H 0 : π 0,5 H 1 : π > 0,5 2) Muestra aleatoria simple π constante en cada extracción 3) X ~ Binomial (n = 15, π = 0,5) 2/3 partes de 15 es X = 10 4) Nivel crítico: p = P(X 10) = 1-0,849 = 0,151 5) p > α = 0,01. Mantenemos H 0 No podemos concluir que la terapia combinada es más eficaz que solo el medicamento
Un laboratorio ha desarrollado un medicamento para mejorar los síntomas del alzhéimer, con el cual mitad de los pacientes muestran efectos beneficiosos al cabo de seis meses de tratamiento. Queremos averiguar si este tratamiento, combinado con la terapia cognitiva, consigue efectos beneficiosos en un número mayor de personas. Para ello, hemos tomado una muestra de 30 pacientes que reciben la terapia combinada y se ha observado que 20 de ellos muestran mejoría. Utilizando un nivel de confianza del 99%. 1. Podemos concluir que la terapia combinada ha mejorado los resultados anteriores? 2. Cuánto vale el nivel crítico? 3. Cuantos pacientes tienen que mostrar mejoría para concluir que la terapia combinada es más eficaz que administrar solamente el medicamento?
1. Podemos concluir que la terapia combinada ha mejorado los resultados anteriores? 1) H 0 : π 0,5 H 1 : π > 0,5 2) Muestra aleatoria simple π constante en cada extracción 3) Z X nπ 0 = = = 0 0 20 30(0,5) nπ (1 π ) 30(0,5)0,5 1,83 4) Zona crítica: Z 0,99 Z = 2,326 5) Mantenemos H 0 No podemos concluir que la terapia combinada es más eficaz que solo el medicamento
2. Cuánto vale el nivel crítico? Como el contraste es unilateral derecho y Z = 1,83 p= PZ ( 1,83) = 1 0,9664 = 0, 0336 Por tanto, p = 0,0336 > α = 0,01 y mantenemos H 0
3. Cuantos pacientes tienen que mostrar mejoría para concluir que la terapia combinada es más eficaz que administrar solamente el medicamento? Zona crítica: Z 0,99 Z = 2,326 Z = c X c nπ 0 nπ (1 π ) 0 0 X c 30(0,5) 2,326 = 30(0,5)0,5 X = 15 + 2,326 30(0,5)0,5 = 21, 4 Rechazamos H 0 con X 22 pacientes
Contraste sobre una proporción, resumen 1. Hipótesis Unilateral derecho: H 0 : π π 0 H 1 : π > π 0 Unilateral izquierdo: H 0 : π π 0 H 1 : π < π 0 Bilateral: H 0 : π = π 0 H 1 : π π 0 2. Supuestos: - Muestra aleatoria simple - π constante en cada extracción 3. Estadístico de contraste Muestra pequeña (n 20) Muestra grande (n > 20) X ~ Binomial (n, π 0 ) Decisión a partir del nivel crítico (p) Z = X nπ 0 nπ (1 π ) 0 0 Z ~ Normal(0, 1)
Inferencia con una variable Tema 2 1. Contraste sobre una proporción 2. Bondad de ajuste 3. Contraste de hipótesis sobre una media 3.1. Con σ 2 conocida, prueba Z 3.2. Con σ 2 desconocida, prueba T 4. Contrastes sobre la forma de una distribución, Kolmogorov-Smirnov
2. Bondad de ajuste Extensión del contraste de una proporción para el caso de que la variable tenga más de dos categorías Mide la discrepancia entre una distribución empírica y una distribución teórica Valores de la variable: 1 2 3 Frecuencia observada: n 1 n 2 n 3 Probabilidad teórica: π 1 π 2 π 3 Frecuencia esperada: m 1 m 2 m 3 Donde las frecuencias esperadas se calculan: m i = nπ i
1. Hipótesis H 0 : π 1 = π 01 π 2 = π 02 π 3 = π 03 H 1 : H 0 es falsa 2. Supuestos m.a.s. Todas las n i son mayores de cero El 80% de las n i son mayores de cinco 3. Estadístico de contraste X 2 I ( ni mi) = m i= 1 i 2 I es el número de valores de la variable 4. Zona crítica Valores mayores o iguales a 2 1 α χ I 1 5. Decisión y conclusión
Ejemplo. Estamos estudiando los hábitos de ocio de los jóvenes. Como parte de una encuesta hemos preguntado a 200 jóvenes cual es la actividad que más les gusta hacer en casa. Podemos concluir que existen diferencias significativas entre las actividades a partir de los siguientes datos? Ver la televisión 80 Estudiar 20 Oír música 60 Leer libros 40
1. Hipótesis H 0 : π 1 = 0,25 π 2 = 0,25 π 3 = 0,25 π 4 = 0,25 H 1 : H 0 es falsa 2. Supuestos m.a.s. Todas las n i son mayores de cero El 80% de las n i son mayores de cinco 3. Estadístico de contraste n = 200 n i m i Ver la televisión 80 50 Estudiar 20 50 Oír música 60 50 Leer libros 40 50 Las frecuencias esperadas son: m i = nπ i = 200 0,25 = 50
X 2 I 2 2 2 2 2 ( ni mi) (80 50) (20 50) (60 50) (40 50) = = + + + = m 50 50 50 50 i= 1 i 40 4. Zona crítica, utilizando α = 0,01 Valores mayores o iguales a 2 2 1 α χi 1 0,99 χ3 11,34 = = 5. Decisión y conclusión Como 40 > 11,34, rechazamos H 0 Las preferencias varían de unas actividades a otras
Errores: ei = ni mi Errores tipificados: Z e i = n i m m i i Proporciones de las casillas: p i = ni n n i π i m i e i p i Ver la televisión 80 0,25 50 30 4,24 0,4 Estudiar 20 0,25 50-30 -4,24 0,1 Oír música 60 0,25 50 10 1,41 0,3 Leer libros 40 0,25 50-10 -1,41 0,2 Z ei
Ejemplo. Un laboratorio está desarrollando un medicamento para la infección por coronavirus. Actualmente, el 44% de los infectados fallecen, y el 20% sobreviven con otras complicaciones respiratorias. Al aplicar el nuevo medicamento a una muestra de 26 pacientes se han encontrado los resultados de la siguiente tabla. Concluya si el medicamento muestra resultados eficaces con un nivel de confianza del 95%. Fallecen 12 Complicaciones 6 Sobreviven 8
1. Hipótesis H 0 : π 1 = 0,44 π 2 = 0,20 π 3 = 0,36 H 1 : H 0 es falsa 2. Supuestos m.a.s. Todas las n i son mayores de cero El 80% de las n i son mayores de cinco 3. Estadístico de contraste n = 26 n i π i m i Fallecen 12 0,44 11,44 Complicaciones 6 0,20 5,20 Sobreviven 8 0,36 9,36
X 2 I 2 2 2 2 ( ni mi) (12 11, 44) (6 5, 2) (8 9,36) = = + + = m 11, 44 5, 2 9,36 i= 1 i 0,35 4. Zona crítica, utilizando α = 0,05 Valores mayores o iguales a 2 2 1 α χi 1 0,95 χ2 5,99 = = 5. Decisión y conclusión Como 0,35 < 5,99, mantenemos H 0 No podemos concluir que el medicamento haya tenido eficacia
Ejemplo. Un psicólogo está estudiando el efecto de primacía y recencia en el recuerdo de anuncios de televisión. Presenta 15 anuncios a un grupo de 90 sujetos y les pide que recuerden uno solo de los anuncios presentados. A continuación, valora cuantos sujetos recuerdan un anuncio del principio, del medio o del final. Los datos son: Obtenga una conclusión con un nivel de confianza del 95%. Principio (1 al 5) Medio (6 al 10) Final (10 al 15) 34 18 38
1. Hipótesis H 0 : f(x) es uniforme (π 1 = 1/3, π 2 = 1/3, π 3 = 1/3) H 1 : f(x) no es uniforme (π 1 = 1/3, π 2 = 1/3, π 3 = 1/3) 2. Supuestos m.a.s. Todas las n i son mayores de cero El 80% de las n i son mayores de cinco 3. Estadístico de contraste Principio (1 al 5) Medio (6 al 10) Final (10 al 15) n i 34 18 38 π i 1/3 1/3 1/3 m i 30 30 30 m i = nπ i = 90 1/3 = 30
X 2 = I = i= 1 ( n m ) i 2 2 ( 34 30) ( 18 30) ( 38 30) 30 m i i + 2 30 + 30 2 = 7,47 4. Regla de decisión. Punto crítico: 2 0,95 χ 2 = 5,99 5. Decisión y conclusión Rechazar H 0 El recuerdo no es uniforme Principio (1 al 5) Medio (6 al 10) Final (10 al 15) n i 34 18 38 π i 1/3 1/3 1/3 m i 30 30 30 e i 4-12 8 Z ei 0,73-2,19 1,46 El recuerdo es mejor de lo esperado al principio y al final, y peor en medio
Inferencia con una variable Tema 2 1. Contraste sobre una proporción 2. Bondad de ajuste 3. Contraste de hipótesis sobre una media 3.1. Con σ 2 conocida, prueba Z 3.2. Con σ 2 desconocida, prueba T 4. Contrastes sobre la forma de una distribución, Kolmogorov-Smirnov
3.1. Una media con σ conocida, prueba Z 1. Hipótesis 2. Supuestos 3. Estadístico de contraste Bilateral: H 0 : µ = µ 0 H 1 : µ µ 0 Muestra aleatoria simple Normalidad Z X µ = σ / n Unilateral derecho: H 0 : µ µ 0 H 1 : µ > µ 0 Unilateral izquierdo: H 0 : µ µ 0 H 1 : µ < µ 0
4. Regla de decisión Zonas de aceptación y rechazo. Contraste bilateral Nivel de significación o riesgo: α (0,05 o 0,01) Nivel de confianza: 1-α (0,95 o 0,99)
Zonas de aceptación y rechazo. Contraste unilateral derecho
Zonas de aceptación y rechazo. Contraste unilateral izquierdo
Regla de decisión 1. Zonas de aceptación y rechazo 2. Nivel crítico (p) - Probabilidad asociada al estadístico de contraste - Mide el grado de compatibilidad de los datos con H 0 p α : Rechazar H 0 p > α : Mantener H 0 3. Intervalo de confianza para el parámetro
Cálculo del nivel crítico (p) Probabilidad asociada al estadístico de contraste Se calcula en la dirección de la zona de rechazo para poder compararlo con α - Unilateral derecho p = P(Z z) - Unilateral izquierdo p = P(Z z) - Bilateral p = 2 P(Z z )
Ejemplo: El indicador de confianza del consumidor tomaba en mayo de 2014 el valor 85, siendo la desviación típica (σ) igual a 15. En mayo de 2015 el valor fue 103 en una muestra de cuatro personas. a) Podemos concluir, con un nivel de confianza de 0,95, que la confianza del consumidor ha aumentado? b) Calcule el nivel crítico
1. Hipótesis H 0 : µ 85 H 1 : µ > 85 2. Supuestos: muestra aleatoria simple 3. Estadístico de contraste X µ 103 85 Z = = = 2, 4 σ / n 15 / 4
4. Regla de decisión 1 α = 0,95 α = 0,05 Rechazamos H 0 si Z 0,95 Z Z = 2,4 (estadístico de contraste) Z c = 1,65 (punto crítico) 5. Decisión y conclusión Como 2,4 > 1,65, rechazamos H 0 El promedio del indicador de confianza del consumidor ha aumentado Nivel crítico: p = P(Z 2,4) = 1 0,9918 = 0,0083
Nivel crítico, p = P(Z 2,4) = 0,0082 1 α = 0,95 Nivel de confianza Nivel de significación Nivel crítico Punto crítico (tabla normal) Estadístico de contraste
3.2. Una media con σ desconocida, prueba T para una muestra Mismas hipótesis que en la prueba Z Solo cambia el estadístico de contraste T = S n X µ / n 1 (A partir de la varianza sesgada) T = S X µ n 1 / n (A partir de la varianza insesgada o cuasi-varianza) Buscamos T en la tabla de la distribución t n-1
Ejemplo: Las puntuaciones en una escala de depresión se distribuyen según la curva normal. Queremos saber si la media de una determinada población es inferior a 100. Para ello, tomamos una muestra de cuatro personas y se encuentra el resultado: 97 91 84 102 Obtenga una conclusión con un nivel de confianza del 95%.
1. Hipótesis H 0 : µ 100 H 1 : µ < 100 2. Supuestos: Muestra aleatoria simple 3. Estadístico de contraste X S S 97 + 91+ 84 + 102 = = 93,5 4 97 + 91 + 84 + 102 = 93,5 = 45, 25 4 2 2 2 2 2 2 n n = 45,25 = 6,73 T X µ X µ 93,5 100 = = = = 1, 67 S / n 1 S / n 1 6,73/ 3 n n
4. Regla de decisión, zonas de aceptación y rechazo T ~ t 3 α = 0,05 1 α = 0,95 punto crítico: 0,05t 3 = 2,353 estadístico de contraste: T = 1,67 5. Decisión y conclusión Como T = -1,67 > -2,33, mantenemos H 0 No podemos concluir que la media poblacional es inferior a 100
Inferencia con una variable Tema 2 1. Contraste sobre una proporción 2. Bondad de ajuste 3. Contraste de hipótesis sobre una media 3.1. Con σ 2 conocida, prueba Z 3.2. Con σ 2 desconocida, prueba T 4. Contrastes sobre la forma de una distribución, Kolmogorov-Smirnov
4. Contrastes sobre la forma de una distribución, Kolmogorov-Smirnov Ajuste a una distribución normal H 0 : La variable X sigue la distribución normal H 1 : La distribución de X no es la normal Ejemplo: Analizar si las calificaciones en un examen siguen la distribución normal
Frecuencias observadas Porcentaje teórico normal (5,79, 2,09) 3,5 19,6 54,0 85,5 97,8
Ajuste a una distribución uniforme H 0 : La variable X sigue la distribución uniforme H 1 : La distribución de X no es la uniforme Ejemplo: Lanzamiento de un dado Distancias entre la distribución teórica y la empírica
Frecuencias observadas y esperadas
El 40% de los animales de laboratorio superan la enfermedad del ébola después de adminístrales Zmapp. Un laboratorio está desarrollando un nuevo medicamento para mejorar la tasa de supervivencia. Hemos administrado el nuevo fármaco a una muestra de seis animales para observar cuantos de ellos sobreviven. La siguiente tabla muestra la distribución de la variable número de éxitos. X 0 1 2 3 4 5 6 F(x),047,233,544,821,959,996 1,000 Utilizando un nivel de confianza del 95%: 1. Plantee las hipótesis: H 0 :, H 1 :. 2. Si en la muestra hay cuatro animales que sobreviven, el nivel crítico vale p =. 3. La decisión sobre H 0 es, porque: 4. La conclusión del estudio es: 5. Cuántos animales tienen que sobrevivir para rechazar H 0?, justifique su respuesta:
El 40% de los animales de laboratorio superan la enfermedad del ébola después de adminístrales Zmapp. Un laboratorio está desarrollando un nuevo medicamento para mejorar la tasa de supervivencia. Hemos administrado el nuevo fármaco a una muestra de seis animales para observar cuantos de ellos sobreviven. La siguiente tabla muestra la distribución de la variable número de éxitos. X 0 1 2 3 4 5 6 F(x),047,233,544,821,959,996 1,000 Utilizando un nivel de confianza del 95%: 1. Plantee las hipótesis: H 0 : π 0,4, H 1 : π > 0,4. 2. Si en la muestra hay cuatro animales que sobreviven, el nivel crítico vale p = 0,179. 3. La decisión sobre H 0 es mantener, porque: p = 0,179 > α = 0,05 4. La conclusión del estudio es: No puede decirse que tasa de supervivencia haya aumentado 5. Cuántos animales tienen que sobrevivir para rechazar H 0? Cinco o más, justifique su respuesta: El nivel crítico es menor que α para X 5. Con X = 5, el nivel crítico es p = 0,041 Con X = 6, el nivel crítico es p = 0,004
Según una encuesta del CIS realizada hace un año, el 50% de los ciudadanos se mostraban preocupados por el problema de la inestabilidad institucional. Este año se ha realizado una nueva encuesta, con una muestra de ocho sujetos, para valorar si dicho porcentaje ha variando. La siguiente tabla muestra la distribución del número de sujetos que manifiestan estar preocupados. Vamos a utilizar un nivel de confianza de 0,99. X 0 1 2 3 4 5 6 7 8 f(x),004,031,109,219,273,219,109,031,004 1. Plantee las hipótesis: 2. Con qué valores de X se rechaza H 0? Justifique su respuesta: 3. Si en la muestra encontramos siete ciudadanos preocupados, el nivel crítico tomaría el valor p =. 4. Con el dato del apartado 3, la decisión sobre H 0 es, porque. Se concluye que:
Según una encuesta del CIS realizada hace un año, el 50% de los ciudadanos se mostraban preocupados por el problema de la inestabilidad institucional. Este año se ha realizado una nueva encuesta para valorar si dicho porcentaje ha variando, y se han recogido datos de ocho sujetos. La siguiente tabla muestra la distribución del número de sujetos que manifiestan estar preocupados. Vamos a utilizar un nivel de confianza de 0,99. X 0 1 2 3 4 5 6 7 8 f(x),004,031,109,219,273,219,109,031,004 1. Plantee las hipótesis: H 0 : π = 0,5, H 1 : π 0,5. 2. Con qué valores de X se rechaza H 0? Con X = 0 y X = 8 Justifique su respuesta: En ambos casos el nivel crítico es p = 2 0,004 = 0,008 < α = 0,01 3. Si en la muestra encontramos siete ciudadanos preocupados, el nivel crítico tomaría el valor P(X 7) = 0,031+0,04 = 0,035 p= 2 0,035 = 0,070. 4. Con el dato del apartado 3, la decisión sobre H 0 es mantener, porque: p > α. Se concluye que: no podemos decir que la proporción de ciudadanos preocupados ha variado.