7-1 Tema 7 Contrastes de Hipótesis para una Muestra Introducción Metodología del contraste de hipótesis Métodos no paramétricos Test binomial Test de los signos Test de rango con signos de Wilcoxon Test de bondad del ajuste: χ 2 Test de bondad del ajuste: Kolmogorov-Smirnov Test de corridas Métodos bayesianos Contraste para la media de una población normal Ejemplo: cúmulos globulares de la Galaxia
7-2 Introducción Contrastes de hipótesis Estimación de parámetros ajuste de modelos El contraste de hipótesis permite tomar decisiones ( son los datos consistentes con un cierto modelo? se ajustan a una cierta distribución de probabilidad? es la muestra consistente con otra muestra? hay correlación? Métodos paramétricos Métodos no paramétricos Contrastes clásicos Contrastes bayesianos Muestras grandes Distribución de probabilidad conocida Datos cuantitativos Distribución de probabilidad conocida Se calcula la probabilidad de la hipótesis Método más directo para incorporar nuevo conocimiento y entender las incertidumbres Muestras pequeñas Distribución de probabilidad desconocida Válidos para datos de rango y cualitativos No existen
Metodología a del contraste de hipótesis 7-3 Formulación de las hipótesis: Hipótesis nula (H 0 ) vs Hipótesis alternativa (H 1 ) Aceptación de la hipótesis nula los datos no están en contra Rechazo de la hipótesis nula los datos indican que es improbable que sea cierta Se utiliza un estadístico de prueba con distribución conocida en el caso de que H 0 sea cierta Ejemplo: media de una población normal α: nivel de significación Contraste bilateral Contrastes unilaterales región crítica región crítica región crítica región de aceptación región de aceptación región de aceptación
7-4 Métodos no paramétricos Test para el parámetro de una población binomial: Test binomial Tests para la mediana de una población o para comparar observaciones pareadas: Test de los signos Test de rango con signos de Wilcoxon Tests de bondad del ajuste a una distribución o a un modelo: Test χ 2 Test de Kolmogorov-Smirnov (1 muestra) Test para comprobar la aleatoriedad de una secuencia: Test de corridas
7-5 Test binomial Test para el parámetro de una distribución binomial Sea una muestra binomial: n ensayos independientes, con O 1 éxitos y O 2 fracasos p: probabilidad de éxito en un ensayo (cte para todos los ensayos) Bilateral: Se buscan los valores críticos t 1 y t 2 tales que, bajo la hipótesis nula: (no se puede hacer para cualquier α) Unilateral: Es la base de tests más elaborados y versátiles que se pueden aplicar a variables no binomiales (NO aplicar este test a otro tipo de variables). Válido para muestras pequeñas. Para muestras grandes, la binomial se aproxima por una normal. El test de los signos es el más directo y potente.
7-6 Bilateral: Test de los signos Prueba no paramétrica para contrastar la mediana de una población. Se reemplaza cada valor de la muestra por un signo + o dependiendo de si es mayor o menor que la mediana poblacional. Mediana de una población X: nº de signos + en la muestra (variable aleatoria binomial) Los valores iguales a la mediana se excluyen de la muestra Para muestras grandes (n > 10): Aproximación a la normal. Se realiza un test binomial con p = 0.5 Para α=0.05 Se puede utilizar para probar la igualdad de medias en observaciones pareadas. Cada par de valores X i i, Y ii se reemplaza por un signo + o dependiendo de cual sea mayor Aplicable a datos dicotómicos y de rango. Algo menos eficiente que el test t para distribuciones normales Mucho más fiable que el test t si la distribución tiene grandes colas.
7-7 Test de rangos con signo de Wilcoxon Modificación del test de los signos para tener en cuenta las magnitudes de las diferencias con la mediana. Sólo se puede aplicar si la distribución es simétrica y continua Bilateral: Unilateral: Se calculan las diferencias respecto a la mediana poblacional. Se asignan rangos a las diferencias absolutas de menor a mayor (sin tener en cuenta el signo; si hay empates se asignan los rangos medios) Se calculan: Bilateral: Unilateral: Para muestras grandes (n > 15): Aproximación a la normal. Comparado con el test t, la eficiencia (A.R.E.) es > 0.864 Se puede utilizar para probar la igualdad de medias en observaciones pareadas (no hace falta suponer simetría).
7-8 Valores críticos para el test de rangos con signo de Wilcoxon
7. Contrastes de Hip Contrastes de Hipótesis para una Muestra Cúmulo M(K) Cúmulo M(K) Cúmulo M(K) 7-9 Ejemplo: Cúmulos C globulares de la Galaxia 47 Tuc -11.79 NGC 6235-8.359 M 28-10.557 NGC 362-10.694 NGC 6256-10.374 M 69-9.803 NGC 1261-9.452 M 62-12.318 Pal 8-8.478 Eridanus 4-5.14 M 19-12.279 M 54-12.717 Pal 2-13.515 NGC 6284-10.775 NGC 6723-10.229 NGC 1851-10.591 NGC 6287-10.706 Be42 19-6.7 NGC 2298-8.825 NGC 6304-11.042 NGC 6760-11.649 NGC 2419-11.687 NGC 6316-12.452 M 55-9.199 NGC 2808-11.687 NGC 6325-10.481 M 75-10.929 NGC 4147-7.633 M 9-10.611 NGC 7006-9.696 NGC 4833-11.347 NGC 6342-9.825 M 2-10.682 M 53-10.284 NGC 6356-11.74 M 30-8.759 NGC 5286-11.046 NGC 6355-11.163 Pal 12-6.97 NGC 5694-9.991 NGC 6366-8.558 NGC 7492-7.365 IC 4499-9.083 Ton 1-12.693 2MASS GC01-10.21 NGC 5824-11.339 NGC 6388-13.509 2MASS GC02-12.667 NGC 5927-11.183 NGC 6401-10.578 NGC 288-7.741 NGC 5946-10.845 NGC 6440-14.205 M 79-9.372 NGC 5986-11.418 NGC 6441-13.294 omega Cen -11.747 M 80-10.16 NGC 6453-10.922 NGC 5466-7.273 M 4-10.091 NGC 6496-9.227 NGC 5634-9.088 NGC 6101-8.662 NGC 6517-13.34 NGC 5897-8 NGC 6144-9.497 NGC 6539-12.565 NGC 6293-9.253 NGC 6139-12.647 NGC 6544-11.478 M 92-7.19 M 107-10.019 NGC 6553-12.36 NGC 6642-8.73 M 13-10.206 Pal 7-10.584 NGC 6652-8.079 NGC 6229-10.388 NGC 6569-10.962 Pal 9-7.509
7-10 Ejemplo: Cúmulos C globulares de la Galaxia Contraste para la media ( puede ser la magnitud media igual a -10? Test de los signos: 30 signos + 51 signos Se rechaza para α=0.05 Test de Wilcoxon: Se asignan rangos a los D i Se acepta para α=0.05 Pero se ha supuesto distribución simétrica
7-11 Test de bondad del ajuste: χ 2 Se ajusta la muestra a un determinado modelo o a una determinada distribución de probabilidad? Los datos se agrupan en k intervalos O i : frecuencias observadas en cada intervalo E i : frecuencias esperadas si se cumple el modelo λ > 5 Si H 0 es cierta: es una χ 2 con k - 1 grados de libertad Si no se cumple que todos los E i > 5, se unen varios intervalos (al menos el 80%) Si para calcular E i hay que usar p parámetros estimados de la muestra (ej. μ, σ), el número de grados de libertad es: Ventajas: Método muy usado. Se puede analizar bin a bin. Fácil de aplicar (como regla aproximada, si χ 2 es mayor que 2 k, se rechaza la hipótesis nula). Desventajas: Pérdida de eficiencia e información al agrupar los datos en intervalos. Son necesarias muestras grandes (para cumplir E i i > 5). Es bilateral (no indica la dirección de las desviaciones).
7-12 Test de bondad del ajuste: Kolmogorov-Smirnov S e (x): distribución de frecuencias acumuladas (función de distribución) bajo H 0 S o (x): distribución de frecuencias acumuladas de la muestra Ventajas sobre el test χ 2 No hay pérdida de información por agrupamiento Válido para muestras pequeñas (para muestras intermedias es más potente) Pueden hacerse contrastes unilaterales Permite calcular un intervalo de confianza para la distribución de probabilidad de la población. Inconvenientes La distribución teórica debe ser continua (aunque existen modificaciones para distribuciones discretas no se puede aplicar a variables cualitativas) No se pueden conocer los valores críticos si se calculan estimaciones de los parámetros poblacionales a partir de la muestra.
7-13 Valores críticos para el test de Kolmogorov-Smirnov (1 muestra)
7-14 Test χ 2 Ejemplo: Cúmulos C globulares de la Galaxia Siguen sus magnitudes absolutas una distribución normal? 12 intervalos 30 Variable: Var2, Distribution: Norm al al Chi-Square test = 3,13214, df df = 4 (adjusted),, p = 0,53596 No. of of observations 25 20 15 10 Agrupando intervalos para tener frecuencias esperadas > 5: 7 intervalos 5 0-16 -15-14 -13-12 -11-10 -9-9 -8-8 -7-7 -6-6 -5-5 -4-4 Category (upper limits) Se acepta la hipótesis de normalidad
7-15 Ejemplo: Cúmulos C globulares de la Galaxia Test de Kolmogorov-Smirnov 110 100 90 Suponiendo: Relative Frequency (%) 80 70 60 50 40 30 20 10 0 Se acepta la hipótesis de normalidad Si: Valores críticos (N=81): α = 0.20 D = 0.1189 α = 0.10 D = 0.1356 α = 0.05 D = 0.1511 Se rechaza para p = 0.10 pero se acepta para p = 0.05
7-16 Test de corridas Test para comprobar la aleatoriedad de una secuencia binaria Sea una secuencia de resultados de un proceso binario (éxito/fracaso): (ej. EEFEEFFEEEEFFF) n 1 : número de éxitos n 2 : número de fracasos r : número de corridas (secuencias del mismo resultado) (las observaciones sucesivas son independientes) Ej: Típicamente, el test se hace unilateral: Para muestras grandes (n 1 ó n 2 > 20) Método útil para comprobar la aleatoriedad de secuencias temporales. Se suele usar para comprobar la aleatoriedad de los residuos (positivos/negativos) en un ajuste a un modelo (ej. espectro). Comprobación de la validez del modelo ajustado
7-17 Valores críticos para el test de corridas Los dos números indican los valores críticos (mínimo y máximo) para un test con n 1 éxitos y n 2 fracasos. El nivel de significación es α = 0.05 para un test bilateral y α = 0.025 para un test unilateral.
7-18 Ejemplo: Ajuste al espectro del cuasar 3C207 Se acepta la hipótesis de aleatoriedad Se rechaza. Hay evidencias de emisión
Métodos bayesianos Contraste para la media para una distribución n normal 7-19 Verosimilitud: La verosimilitud de la muestra es proporcional a la verosimilitud de la media Prior uniforme:
7-20 Métodos bayesianos (II) Prior normal: (prior conjugado) La distribución de probabilidad posterior de μ es una normal con: Posterior Prior Likelihood -5-4 -3-2 -1 0 1 2 3 4 5 m Posterior mean 131
7-21 Bilateral: Métodos bayesianos (III) Contrastes de hipótesis: Para un nivel α, se calcula un intervalo de credibilidad: [μ 1,μ 2 ] Prior normal: (σ se supone conocida) Prior no normal: Unilateral: Se calcula Distribución de probabilidad de la hipótesis Para un prior normal: