TEMA 8: CONTRASTES DE HIPÓTESIS PARAMÉTRICAS PRIMERA PARTE: Conceptos fundamentales 8.1. Hipótesis estadística. Tipos de hipótesis 8.2. Región crítica y región de aceptación 8.3. Errores tipo I y tipo II 8.4. Test uniformemente más potentes. Metodología de Neyman-Pearson 8.5. Concepto de p-valor: cálculo e interpretación 8.6. Etapas en la realización de un contraste SEGUNDA PARTE: Contrastes para variables Normales y para proporciones 8.7. Contrastes en una población Normal 8.8. Contrastes en dos poblaciones Normales MUESTRAS INDEPENDIENTES: Contrastes de igualdad de medias Contraste de igualdad de varianzas MUESTRAS PAREADAS : Contraste de igualdad de medias 8.9. Contrastes de proporciones 2 PRIMERA PARTE: CONCEPTOS FUNDAMENTALES 3
8.1. HIPÓTESIS ESTADÍSTICA. TIPOS DE HIPÓTESIS Hipótesis estadística: afirmación sobre la distribución que genera los datos o sobre alguna característica concreta de dicha distribución. En inferencia paramétrica: Modelo paramétrico: X F(x;) las hipótesis son afirmaciones sobre un(os) parámetro(s) desconocido(s),, del modelo Ejemplo 1: el partido A no obtendrá mayoría absoluta en las elecciones del 2N X= 1 si gana A p si no gana A 1 p Ejemplo 2: una moneda es perfecta X= 1 si sale cara p si sale cruz 1 p b(p) hipótesis: p.5 b(p) hipótesis: p=.5 Ejemplo 3: hay discriminación salarial entre hombres y mujeres X 1 =log(salario hombres) N( 1, 1 ) X 2 =log(salario mujeres) N( 2, 2 ) hipótesis: 1 2 4 En inferencia no paramétrica (Tema 9): no se supone a priori un modelo paramétrico, sino que se contrastan hipótesis más generales. Ejemplo 3: hay discriminación salarial entre hombres y mujeres X 1 =salario hombres F 1 (x) X 2 =salario mujeres F 2 (x) Hipótesis: F 1 F 2 Hipótesis simple: asigna valores puntuales concretos a todos los parámetros del modelo Bajo dicha hipótesis, la distribución queda totalmente especificada. Ejemplo 2: Xb(p) hipótesis: p=.5 Hipótesis compuesta: asigna un rango de valores a los parámetros Ejemplo 1: Xb(p) hipótesis: p.5 Ejemplo 3: X 1 =log(salario hombres) N( 1, 1 ) hipótesis: X 2 =log(salario mujeres) N( 2, 2 ) 1 2 Ejemplo 4: XN(,) hipótesis: =2 (realmente es: =2, > compuesta!) 5
Hipótesis nula H : hipótesis que se somete a prueba y se matendrá como cierta a menos que los datos muestren suficiente evidencia en su contra. (En general, H corresponde al modelo más sencillo: incluye el =) Hipótesis alternativa H 1 : posibles alternativas a la hipótesis nula TIPOS DE CONTRASTES H : H : H : = H 1 : > H 1 : < H 1 : Unilateral derecha Unilateral izqa. Bilateral Contrastes de una cola Contraste de dos colas 6 8.2. REGIÓN CRÍTICA Y REGIÓN DE ACEPTACIÓN Una vez definidas las hipótesis, realizar el contraste consiste en : Decidir si la hipótesis nula está sustentada por la evidencia empírica que proporcionan los datos de una muestra aleatoria (X 1,...,X n ). Analizar el grado de discrepancia entre los datos (observados) y la hipótesis nula (postulada) La decisión se basa en un estadístico de contraste =T(X 1,...,X n ). Ejemplo 5: Una moneda es perfecta (p=.5) o tiene p=p(cara)>.5? H : p=.5 H 1 : p>.5 Estadístico de contraste: pˆ =X.75 Rechazo si X.75 7
Región crítica=c={valores muestrales que conllevan rechazar H } Valor(es) crítico(s)= valor(es) a partir del (de los) cual(es) se rechaza H Ejemplo 5: (continuación) Rechazo H si la proporción de caras en la muestra es mayor que.75, por qué? Porque observar una proporción de caras superior al 75% sería harto improbable si H fuera cierta (moneda perfecta) los datos no sustentan H, por eso rechazo H Región aceptación=a= ={valores muestrales que conllevan no rechazar H } Ejemplo5: (continuación) Muestra concreta: n=3, x =.3 <.75 No rechazo H OBSERVACIÓN: No rechazar H no implica que H sea cierta (no se demuestra que H sea cierta) sino que no hay evidencia suficiente en los datos muestrales para rechazarla. Rechazar H no significa que H sea falsa, sino que resulta muy difícil creer que se haya podido observar algo tan improbable bajo H. 8 8.3. ERRORES TIPO I Y TIPO II Qué consecuencias puede conllevar la regla de decisión establecida? Cuál es el coste de equivocarse tomando una decisión errónea? Estado de la naturaleza Decisión H es cierta H es falsa Aceptar H correcto Error tipo II Rechazar H Error tipo I correcto α() = p(error tipo I) = p(rechazar H /H cierta) = () = p(error tipo II) = p( Aceptar H /H falsa) = Potencia= p(rechazar H /H falsa) = = 9
Objetivo minimizar p(error tipo I) minimizar p(error tipo II) Para una muestra de tamaño n dada, IMPOSIBLE! Veamos un ejemplo con HIPÓTESIS SIMPLES H : = H 1 : = 1 En este caso: p(error tipo I) = p(rechazar H /H cierta) = = α un único valor! p(error tipo II) = p( Aceptar H /H falsa) = = un único valor! 1 Ejemplo 6: (X 1,...,X 16 ) m.a.s. de una distribución N(,5) H : =1 H 1 : =15 Estimador máximo verosímil de ˆ =X Intuitivamente: región crítica en la dirección de la alternativa C= { X } Fijamos =.1 Determinar para que = p (C) =.1 H.1 = p (C) = p ( ) H 1 X = = p X 1 1 1 5/ 16 5/ 16 = X 1 p 1 z 1.25 Tablas: z =1.28 Bajo H :=1 X N(1, 5/ 16 ) X 1 1.25 H N(,1).9.1 z Región crítica X 1 Rechazar H cuando: 1.25 1.28 X 11.6 11
X 15 11,6 15 = p(error tipo II) = p H 1 (C) = p 15( X 11, 6) = 15 1.25 1.25 p =(-2.72)=.33 =.33 H H 1 =.1 =1 =15 =11,6 R. Aceptación Región crítica Si =p(error tipo I) disminuye aumenta = p(error tipo II) (y viceversa) =.465 H H 1 =.1 =1 =15 =12,9 R. Aceptación Región crítica 12 8.4. METODOLOGÍA CLÁSICA DE NEYMAN-PEARSON Dado H, fijar el tamaño máximo tolerable de p(error tipo I)=, que llamaremos nivel de significación : Valores habituales: ={.1,.5,.1} Entre todos las posibles regiones críticas de nivel, elegir la que: minimice p(error tipo II) maximice {1-p(Error tipo II)} maximice la potencia Región crítica del test uniformemente más potente (T.U.M.P.) Cómo obtenerla? 13
HIPÓTESIS SIMPLES: H : = H 1 : = 1 La región crítica del test más potente, entre todos los de nivel, es: L( x1,..., xn; ) C = ( x 1,..., xn ) / k, con p (C ) =. L( x1,..., xn; 1) H HIPÓTESIS COMPUESTAS H : H 1 : 1 Si la región crítica C definida previamente para las hipótesis simples: (a) No depende del valor concreto de especificado en la hipótesis alternativa (b) Mantiene el mismo nivel de significación al ampliar H, es decir: max p(c) C es la región crítica del T.U.M.P. para las hipótesis compuestas ATENCIÓN: no siempre existe región crítica U.M.P.!, pero cuando existe coincide con lo razonable : región crítica en el sentido de la alternativa 14 Ejemplo 6: (continuación) Qué ocurriría si las HIPÓTESIS fueran COMPUESTAS? Por ejemplo: H : =1 H 1 : >1 X 1 Región crítica de nivel α=.1 C ={ 1.25 1.28}={X 11.6} con p =1 (C)=α=.1 H : 1 H 1 : >1 p(error tipo I) = = { p =1 (C)} = α =.1; (ver dibujo) La máxima probabilidad de Error tipo I que se comete es α: H : =1 H : 1 H 1 : >1 H 1 : >1 15
RELACIÓN ENTRE CONTRASTES E INTERVALOS DE CONFIANZA Contrastar las hipótesis H := H 1 : con un nivel de significación EQUIVALE A: Construir un intervalo de confianza para, con nivel de confianza 1-, y: rechazar H si no está en dicho intervalo. 16 8.5. CONCEPTO DE P-VALOR: CÁLCULO E INTERPRETACIÓN Limitaciones de la selección del nivel de significación: Ejemplo 6: (continuación) Estadístico: Z*= H : =1 H 1 : =15 X 1 1.25 H X 1 N(,1) Si =.1 Rechazo H si Z*= 1.25 1.28 a) Si x obs =15 z obs = 15 1.25 1 =4 1.28 Rechazo H al 1% (z obs significativo al 1%) 12.5 1 b) Si x obs =12.5 z obs = 1.25 =2 1.28 Rechazo H al 1% (z obs significativo al 1%) Misma decisión, pero poseen las dos muestras la misma evidencia contra H? 17
El p-valor se define, para una muestra concreta, como la probabilidad de observar, bajo H, un valor del estadístico de contraste igual o más extremo (en la dirección de la alternativa) que el observado en la muestra probabilidad de obtener más discrepancia con H que la obtenida con la muestra Cuanto menor el p-valor más extremo el resultado muestral más evidencia contra H Ejemplo 6: (continuación) a) x obs =15 z obs =4 p-valor = p(z* z obs ) = p(n(,1) 4) =.3 Obtener el valor observado, z obs, o alguno mayor es casi imposible bajo la hipótesis nula rechazo H (no creo que H haya generado mis datos). b) x obs =12.5 z obs =2 p-valor = p(z* z obs ) = p(n(,1) 2) =,228 El valor observado tiene una probabilidad de aparecer muy pequeña si H es cierta, pero no es tan improbable como antes rechazo H pero con menos garantías. 18 p-valor muy pequeño sería muy improbable observar lo observado si H hubiera generado mis datos los datos proporcionan evidencia suficiente en contra de H rechazo H p-valor grande nuestros datos no proporcionan evidencia suficiente en contra de H (es probable que H haya generado mis datos) y no rechazo. Alternativa unilateral izquierda Alternativa unilateral derecha Alternativa bilateral z obs z obs -z obs z obs 19
RELACIÓN ENTRE nivel de significación y p-valor Qué ocurriría en el ejemplo anterior si el nivel de significación fuera =.1? X 1 El valor crítico sería z α =2.33 rechazaríamos H si Z*= 1.25 2.33 Si x obs =12.5 z obs =2 < 2.33 No rechazo al 1% (Si rechazaba al 1%) =.1 p-valor=.218 1- =.1 1.28 2 2.33 Rechazo H al 1% Rechazo H al 1% Rechazamos H para niveles p-valor No rechazamos H para niveles < p-valor p-valor = menor nivel de significación al que se rechaza H 2 8.6. ETAPAS EN LA REALIZACIÓN DE UN CONTRASTE 1. Describir el modelo y formular la hipótesis nula y la alternativa 2. Definir un estadístico de contraste que cuantifique la discrepancia entre los datos y la hipótesis nula, y cuya distribución sea conocida bajo H 3. Definir la región crítica: Qué valores del estadístico de contraste rechazan H? 4. Determinar el valor crítico para un nivel de significación α dado 5. Tomar los datos y calcular el valor del estadístico de contraste 4.' Tomar los datos y calcular el valor del estadístico de contraste 5.' Calcular el p-valor 6. Tomar la decisión de rechazar o no H 21