INFERENCIA ESTADISTICA
ESTIMACION 2 maneras de estimar: Estimaciones puntuales x s 2 Estimaciones por intervalo 2
ESTIMACION Estimaciones por intervalo Limites de Confianza LCI<= valor<=lcs P(LCI<= valor<=lcs)=(1-α) α Nivel de Significación (riesgo) (1-α) Nivel de Confianza (Seguridad) α = 5% (0.05)
IC para una media (I) 1) Varianza poblacional conocida (σ²). Limites del IC: L i x Z 2 Var( x) L s x Z 2 Var( x) Donde Z (Variable normal tipificada), cuyos valores se encuentran tabulados. Y además: Var( x ) 2 n
IC para una media (II) Por lo tanto el intervalo de confianza (IC) para estimar una media poblacional queda de la manera siguiente: IC : x Z 2 n
IC para una media - ejemplo Deseamos estimar el promedio de edad de cierta población. Tomamos una muestra de tamaño 100 en la cual se obtuvo una media muestral de 35. La variable considerada tiene distribución normal con una varianza igual a 3. Calcular el intervalo de confianza al 95 %. aplicando simplemente la fórmula para calcular los límites del intervalo de confianza (IC), tenemos: 351.96 3 100
IC para una media (III) 2) Varianza poblacional no conocida, variable X normal. (reemplazando σ² por su estimación s²) Limites del IC: x t / 2, n 1 En donde tα corresponde a los valores del 1-α central de la distribución T, con n-1 grados de libertad. s n
IC para una media - ejemplo Deseamos estimar la presión sistólica promedio de cierta población. Tomamos una muestra de tamaño 20 en la cual se obtuvo una media muestral de 150 mmhg con una varianza muestral igual a 9. La variable considerada tiene distribución normal. Calcular el intervalo de confianza al 95 % para la media poblacional. Solución: Dado que se desea un nivel de confianza del 95%, el error =0.05 y utilizando: s x t0. 025 n Reemplazando t0.05 = 2.09 (buscado en la tabla de la distr. T para dos extremos, valor-p ó =0.05 y 19 gl): 150 2.09 9 20
IC para una media (IV) 3) Varianza poblacional no conocida, variable X. Pero si el tamaño muestral (n) es lo suficientemente grande (>30), entonces la distribución de las medias es normal (Teorema Central del Límite). IC : x Z 2 s n
CALCULO DEL TAMAÑO MUESTRAL Es necesario: Precisión deseada en la estimación Nivel de confianza (o el alfa) Algún otro parámetro poblacional previo Depende de la estrategia del muestreo
CALCULO DEL TAMAÑO MUESTRAL Para estimar una media Supongamos que deseamos tener una imprecisión I en la estimación de la media con un nivel de confianza 1-α y deseamos encontrar n. En este caso la imprecisión corresponde a: Despejando n: I Z 2 n n ( Z 2 I ) 2 2 2
Prueba de Hipótesis
Tipos de hipótesis En la prueba de hipótesis se comienza proponiendo una hipótesis tentativa acerca de un parámetro poblacional A la hipótesis tentativa se le denomina hipótesis nula (H 0 ) La hipótesis alternativa es la opuesta de lo que se afirma en H 0 y se representa por H a El procedimiento de prueba de hipótesis comprende el uso de datos de una muestra para probar las 2 aseveraciones propuestas
Es necesario practicar para poder formular hipótesis en forma correcta Las formas de H 0 y H a van a depender de la aplicación en la cual deseamos realizar la prueba La prueba de hipótesis es una demostración de contradicción Se presentan generalmente 3 tipos de situaciones en los cuales debemos establecer hipótesis: Prueba de hipótesis en Investigación Prueba de validez de una afirmación Prueba en casos de toma de decisiones
Resumen de formas para hipótesis alterna ( valor de interés) nula y H : 0 0 H : a 0 H : 0 0 H : a 0 H : 0 0 H : a 0 La igualdad siempre aparece vinculada al la hipótesis nula Una forma de facilitar la selección de la forma adecuada de las hipótesis es asignando lo que se quiere demostrar a la H a
Una operación en una línea de producción debe llenar cajas con detergente hasta un peso promedio de 300 gr. Periódicamente se selecciona una muestra de cajas llenas. Si los datos de la muestra llevan a la conclusión de que les falta o sobra detergente, se debe parar la línea de producción, y hacer los ajustes necesarios 1.Formule la hipótesis nula y alterna 2.Comente la conclusión y la decisión cuando no se puede rechazar H 0
Error tipo I y II Las hipótesis nula y alterna son aseveraciones sobre la población que compiten entre sí No siempre es posible que las conclusiones sean verdaderas o correctas Aceptar H 0 Rechazar H 0 H 0 verdadera Conclusión Correcta Error tipo I H a verdadera Error tipo II Conclusión Correcta
No se puede eliminar la posibilidad de errores en la prueba de hipótesis, pero si es posible considerar su probabilidad Se define como: =probabilidad de cometer un error tipo I b=probabilidad de cometer error tipo II La máxima probabilidad permisible se le llama nivel de significancia para la prueba. Los valores acostumbrados son de 0.05 y 0.01 En la mayoría de las aplicaciones se controla la probabilidad de cometer error tipo I, luego existe la incertidumbre con respecto al error tipo II
Si los datos muestrales son consistentes con H 0 se adopta en la práctica la conclusión de no rechazar H 0, ya que de esta forma evitamos el riesgo de cometer error tipo II La conclusión de aceptar H 0 se toma sólo cuando se haya determinado el error tipo II
Suponga que se va a implantar un nuevo método de producción si una prueba de hipótesis respalda la conclusión de que con ese método se reduce la media del costo de operación por hora 1.Enuncie las hipótesis nula y alterna si la media del costo para el método actual de producción es de $220 por hora 2. Cuál es el error de tipo I en este caso y sus consecuencias? 3. Cuál es el error tipo II en este caso y sus consecuencias?
Pruebas unilaterales para la media Muestra Grande En este caso (n>30) se asume distribución normal Para pruebas de hipótesis acerca de la media de una población se emplea el estadígrafo z z X / n Se determina si la desviación del valor numérico en estudio es lo suficiente para justificar el rechazo de la hipótesis nula
La probabilidades 0.05 y 0.01 de cometer error tipo I están relacionadas con un valor de z de 1.645 y 2.33 respectivamente Luego se debe rechazar H 0 si el valor de z es menor a 1.645 o 2.33 dependiendo del nivel de significancia El valor z establece el límite de la región de rechazo denominada valor crítico
X n =0.05 =0.01-1.645 0 2.33 z Rechazar H 0 Rechazar H 0
Resumen de pruebas unilaterales sobre media de una población. Si n30 H H : 0 0 a : 0 H H : 0 0 a : 0 z X 0 X 0 ; z / n s / n z X 0 X 0 ; z / n s / n Rechazar H si 0 z z Rechazar H si 0 z z
Valor p Es el valor de probabilidad de obtener un resultado de la muestra que sea al menos tan improbable como lo que se observa Este valor corresponde al valor de la probabilidad asignada al z calculado a partir del valor numérico sometido a la prueba de hipótesis Si p es menor al nivel de significancia predefinido se debe rechazar H 0
Muestra Pequeña En este caso (n < 30) se asume que la población tiene una distribución normal Con distribución t se pueden hacer inferencias acerca de la media de la población t X s/ n 0 Para este estadígrafo se debe considerar los grados de libertad asociados al tamaño de la muestra (n-1) para definir el valor crítico que llevará al rechazo de H 0. Por las características de la tabla resulta complicado calcular el valor de p por lo que se expresa en intervalos
Pruebas bilaterales para la media Muestra grande La diferencia de esta prueba con respecto a las unilaterales está en que la región de rechazo está ubicada simultáneamente en ambas colas En las pruebas bilaterales de hipótesis siempre se determina la región de rechazo colocando un área de probabilidad igual a /2 en cada cola de distribución Para este caso el valor de z para un nivel de significancia de 0.05 corresponderá a 1.96
/2=0.025 /2=0.025 -z -1.96 0 1.96 z
Resumen de pruebas bilaterales sobre media de una población. Si n30 H H : 0 0 a : 0 z X X 0 0 ; z / n s / n Rechazar H si z z z z 0 / 2 / 2
Valor p En una prueba bilateral se determina el p duplicando el área en la cola Esta multiplicación busca comparar el valor de p directamente con y poder mantener la misma regla de rechazo
Muestra pequeña Con una prueba bilateral y un nivel de significancia definido se debe considerar al estadígrafo t /2 para determinar el área de probabilidad asociado a los grados de libertad de la muestra
Relación entre estimación por intervalo y prueba de hipótesis En la determinación del intervalo de confianza para medias se empleo un coeficiente definido por 1-, como una forma de definir si nuestros promedios muestrales contenían al parámetro poblacional X z /2 n Ahora para una prueba bilateral de hipótesis se puede rechazar H 0 si el intervalo de confianza para la media de la población no abarca el promedio poblacional
Prueba de hipótesis y toma de decisiones Siempre que se emplee una prueba de hipótesis en la toma de decisiones estará involucrada una acción El no emprender acciones cuando no se rechaza H 0 está dado por el riesgo de cometer error tipo II Para disminuir esta incertidumbre se debe calcular este error. Otra forma descrita tiene relación con el tamaño de la muestra a estudiar
Error tipo II (Aceptar H 0 cuando es falsa) Formular las hipótesis nula y alterna Usar el nivel de significancia a para establecer una regla de rechazo basado en el estadístico de prueba (z) De acuerdo con la regla de rechazo, despejar el valor de la media de la muestra que identifique la región de rechazo de la prueba Usar el resultado del paso anterior para establecer los valores de la media de muestra que conduzcan a la aceptación de H 0 ( darse medias más bajas y estimar la probabilidad de que le punto medio muestral real sea mayor) La probabilidad de rechazar correctamente H 0 cuando es falsa se llama potencia de la prueba (1-b)
Rechazar H 0 si z 1.645 z X / 0 n Despejar media muestral Darse un promedio menor Recalcular z x 2 x Calcular b Probabilidad de rechazar correctamente H 0 Curva de Potencia H 0 falsa 0
Tamaño de la muestra H 0 : 0 H a :< 0 Controlando el tamaño de la muestra es posible manejar la probabilidad de cometer error tipo I y II C Rechazar H 0 H 0 verdadero = 0 H 0 falsa a < 0 0 z zb b c 0 z c a z n 0 z a zb n n n 0 2 a 2 2 b n a
Pasos de la prueba de hipótesis: 1. Definir la hipótesis nula y alterna para el caso 2. Seleccionar el estadístico de prueba que se usará para decidir rechazar o no H 0 3. Especificar el nivel de significancia,, para la prueba 4. Usar el nivel de significancia para establecer la regla de rechazo que indique los valores que llevarán al rechazo de H 0 5. Reunir los datos de la muestra y calcular el valor del estadístico de prueba 6. Comparar el valor estadístico con los valores críticos o calcular el valor de p