Contraste de Hipótesis

Introducción Ejemplo El peso de plantines de un arbusto forrajero, almacenado a temperatura y humedad relativa ambientes, obtenido a los 20 días desde la germinación es en promedio de 50 mg. Se supone que la ventilación forzada del ambiente de almacenamiento aumentaría el vigor de los plantines y esto se debe reflejar en un aumento del peso.

La idea es: hipótesis científica hipótesis estadística establecer su veracidad (o no). Introducción la ventilación forzada aumentaría el vigor de los plantines herramientas estadísticas tomar una decisión

Introducción Supongamos un modelo para explicar la variación observada de la variable respuesta peso seco del i-ésimo plantín observado en un experimento en el que se almacena con ventilación forzada Y i i error aleatorio media de la distribución de la variable Y

Construcción de una prueba Bajo condiciones ambientales de almacenaje la variable peso de plantines tiene =50mg. cómo podría ser el valor de bajo otra condición?

Construcción de una prueba Las hipótesis a plantear dependen de lo que esperamos que ocurra bajo la nueva condición. Así: H 0 : = 50 vs. H 1 : 50 H 0 : 50 vs. H 1 : < 50 El peso promedio será diferente a 50 mg El peso promedio será menor a 50 mg H 0 : 50 vs. H 1 : > 50 El peso promedio será mayor a 50 mg

Construcción de una prueba Las hipótesis: Hipótesis nula Hipótesis alternativa H 0 vs. H 1 H 0 : 50 vs. H 1 : > 50 El peso promedio será mayor a 50 mg Son proposiciones sobre uno o más parámetros de la distribución de la variable aleatoria en estudio.

Cómo validar el modelo? Introducción experimentación observación lo observado tiene diferencias significativas con lo esperado según el modelo propuesto? procedimiento de decisión

Construcción de una prueba Planificar el experimento o el esquema muestral para obtener datos que permitan la validación (o no) de la hipótesis sometida a prueba.

Experimento: Construcción de una prueba Se registra el peso de 25 plantines obtenidos de semillas mantenidas bajo las nuevas condiciones de almacenamiento.

De la muestra de tamaño n=25 es posible estimar la media y la varianza de la distribución de pesos. Construcción de una prueba Supongamos que la media y varianza muestral son iguales a 53 y 16, respectivamente.

Construcción de una prueba Seleccionar o construir un estadístico cuya distribución queda completamente especificada bajo la hipótesis nula (*) (*) Se supone que lo que se especifica en H 0 es cierto

El estadístico apropiado para el contraste debe involucrar al estimador y al valor del parámetro de interés. Z Y Construcción de una prueba ~ N(0;1) T ~ t 2 2 n 1 n Y S n

Construcción de una prueba Queremos identificar, a partir de la distribución del estadístico, cuando la hipótesis nula es cierta, los valores usuales del mismo bajo muestreo reiterado.

Construcción de una prueba El estadístico apropiado, suponiendo que el tamaño de muestra es n=25 y que la varianza ( 2 ) desconocida es estimada desde la muestra por S 2, es el estadístico T de Student: T 53 50 16 25

Densidad Construcción de una prueba La distribución del estadístico especificada bajo H 0 permite asignar probabilidades a la ocurrencia de valores del estadístico. 0.39 0.30 Función de densidad 0.20 0.10 0.00-5.22-2.61 0.00 2.61 5.22 Variable T t 24 el estadístico y su distribución bajo H 0

Construcción de una prueba Cómo decidir sobre la H 0 en base a los valores del estadístico? Se hace necesario establecer una regla de decisión

Construcción de una prueba Cuáles son los eventos que conducen a no rechazar (aceptar) o a rechazar la H 0? Es necesario establecer el nivel de significación ( ) de la prueba. Usualmente = 0.05 o 0.01 Nivel de significación

Construcción de una prueba De acuerdo a las hipótesis planteadas y al nivel de significación elegido, se determinan los valores del estadístico que conducen a no rechazar (aceptar) o a rechazar la H 0 Región o zona de rechazo de H 0 Región o zona de aceptación de H 0

Construcción de una prueba Tomando =0.05 y dado que: H 0 : 50 vs. H 1 : > 50 La zona de rechazo de H 0 se encuentra en la cola derecha de la distribución del estadístico Contraste unilateral derecho

Densidad Construcción de una prueba Distribución del estadístico bajo H 0 0.40 0.30 0.20 0.10 T Student(24): p(evento)=0.0500 1 - Contraste unilateral derecho 0.00-3.00-2.14-1.29-0.43 0.43 1.29 2.14 3.00-2.57-1.71-0.86 0.00 0.86 1.71 2.57 Variable Zona de aceptación de H 0 Punto crítico

Construcción de una prueba Cómo decidir sobre la H 0? Comparando el valor del estadístico calculado en base a los datos de la muestra, con el punto crítico establecido según el valor de y el tipo de contraste.

Construcción de una prueba El valor del estadístico con los datos de la muestra es: T 53 50 3 15 16 4 4 25 5 3.75 Dado que 3.75 supera al punto crítico 1.71, se rechaza la hipótesis nula.

Construcción de una prueba El rechazo de la H 0 conduce a proponer el uso de ventilación forzada para el almacenamiento de las semillas

Valor p Construcción de una prueba Utilizando la distribución teórica se puede obtener la probabilidad de observar en la experiencia valores del estadístico iguales o más extremos que el resultado obtenido a partir de los datos experimentales, dado que H 0 es verdadera

Construcción de una prueba Valor p Si el valor p es menor que el nivel de significación ( ), se rechaza la hipótesis nula. En caso contrario se concluye que los datos no contradicen la hipótesis nula.

Construcción de una prueba Valor p en el ejemplo dado La probabilidad de obtener un valor T igual o mayor al observado, si se cumple la hipótesis nula de que el peso medio es igual a 50, es: P(T>3.75) = 0.00049 = Valor p.

Construcción de una prueba Valor p en el ejemplo dado Como 0.00049 < 0.05, se rechaza la hipótesis nula. Los datos contradicen H 0.

Construcción de una prueba Planteadas las hipótesis, elegido el estadístico y fijado el nivel de significación, se determinan la zona de no rechazo y la zona de rechazo de H 0

Tipos de contrastes H 0 : = 50 Construcción de una prueba vs. H 1 : 50 Contraste bilateral H 0 : 50 H 0 : 50 vs. H 1 : > 50 Contraste unilateral derecho vs. H 1 : < 50 Contraste unilateral izquierdo

Construcción de una prueba Distribución del estadístico bajo H 0 Contraste bilateral H 0 : = 0 H 1 : 0 /2 1 - /2 Zona de rechazo 0 Zona de rechazo Zona de aceptación de H 0 Punto crítico 1 Punto crítico 2

Construcción de una prueba Distribución del estadístico bajo H 0 Contraste unilateral izquierdo H 0 : 0 H 1 : < 0 Zona de rechazo 0 Zona de aceptación de H 0 Punto crítico

Construcción de una prueba Distribución del estadístico bajo H 0 Contraste unilateral derecho 1 - H 0 : 0 H 1 : > 0 0 Zona de aceptación de H 0 Zona de rechazo Punto crítico

Construcción de una prueba En resumen... Una hipótesis estadística es una proposición sobre los parámetros de un modelo estadístico para la variable de respuesta La hipótesis estadística que se somete a prueba se conoce como hipótesis nula y se simboliza con H 0 Cuando la hipótesis nula se rechaza, se concluye a favor de la hipótesis alternativa que se simboliza con H 1

Errores en la Prueba de Hipótesis Tanto cuando no se rechaza la hipótesis nula como cuando se rechaza, es posible cometer errores

Errores Contraste de Hipótesis Frente a una hipótesis nula se toma una decisión Rechazar H 0 o Aceptar H 0 Es correcto si H 0 es falsa pero incorrecto si fuese verdadera Es correcto si H 0 es verdadera pero incorrecto si fuese falsa

Error de Tipo I Contraste de Hipótesis La hipótesis nula es cierta y se rechaza erróneamente La probabilidad de cometer este tipo de error está bajo control del experimentador. Su máximo valor se simboliza con y recibe el nombre de nivel de significación

Contraste de Hipótesis Error de Tipo I En el ejemplo de los plantines el error de tipo I tiene una probabilidad máxima de 0.05

Contraste de Hipótesis Error de Tipo II: La hipótesis nula es falsa y no se rechaza La probabilidad de cometer este tipo de error se denomina

Error de Tipo II: La probabilidad de cometer este tipo de error queda determinada por: el nivel de significación el tamaño muestral Contraste de Hipótesis la magnitud de la discrepancia entre la hipótesis postulada y la situación verdadera.

Contraste de Hipótesis Error de Tipo II: Para calcular la probabilidad de cometer este tipo de error se debe suponer el verdadero valor para la media de la población

Contraste de Hipótesis Error Tipo II en un contraste bilateral /2 Zona de rechazo 1-0 /2 Zona de rechazo Zona de aceptación de H 0 Punto crítico 1 Punto crítico 2 ( - 0 )/( / n)

Potencia Contraste de Hipótesis Se define a la potencia como: = 1- Esta probabilidad es una medida de la potencialidad que se tiene en un experimento para detectar que la hipótesis nula es falsa.

Potencia Contraste de Hipótesis En la planificación de un experimento, cuál debería ser el tamaño de la muestra (o número de repeticiones) para tener una alta probabilidad de detectar una diferencia dada entre la media verdadera y la postulada en la hipótesis nula?

Potencia Contraste de Hipótesis Cuál es el tamaño muestral (o número de repeticiones) necesario para detectar una diferencia entre la media verdadera y la postulada en la hipótesis nula, con una potencia de por ejemplo 0.8 o más?