Tema 7. Introducción Metodología del contraste de hipótesis Métodos no paramétricos

Documentos relacionados
Contrastes de hipótesis paramétricos

478 Índice alfabético

Contraste de hipótesis Tema Pasos del contraste de hipótesis. 1.1 Hipótesis estadísticas: nula y alternativa. 1.3 Estadístico de contraste

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

INFERENCIA ESTADISTICA

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

A. PRUEBAS DE BONDAD DE AJUSTE: B.TABLAS DE CONTINGENCIA. Chi cuadrado Metodo G de Fisher Kolmogorov-Smirnov Lilliefords

Tema 5. Contraste de hipótesis (I)

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón

Teorema Central del Límite (1)

Estadística Avanzada y Análisis de Datos

ÍNDICE INTRODUCCIÓN... 21

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo

Tabla de Test de Hipótesis ( Caso: Una muestra ) A. Test para µ con σ 2 conocida: Suponga que X 1, X 2,, X n, es una m.a.(n) desde N( µ, σ 2 )

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

Cómo se hace la Prueba t a mano?

para una muestra Ref: Apuntes de Estadística, Mtra Leticia de la Torre Instituto Tecnológico de Chiuhuahua

Unidad IV: Distribuciones muestrales

Tema 2. Introducción a la Estadística Bayesiana

Indicaciones para el lector... xv Prólogo... xvii

Distribución Chi (o Ji) cuadrada (χ( 2 )

Tema 4: Probabilidad y Teoría de Muestras

CONTENIDO. Prólogo a la 3. a edición en español ampliada... Prólogo...

PROGRAMA ACADEMICO Ingeniería Industrial

Técnicas de validación estadística Bondad de ajuste

Técnicas de validación estadística Bondad de ajuste

ESTADISTICA GENERAL. INFERENCIA ESTADISTICA Profesor: Celso Celso Gonzales

INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)

SE OFRECE A ESTUDIANTES DE GRADO: SI X. MÓDULO DEL PLAN 2013 EN QUE ACREDITA: Módulo Metodológico DESCRIPTORES: Probabilidad y Estadística

Test de Kolmogorov-Smirnov

Distribuciones de probabilidad

LA FUNCIÓN DE DISTRIBUCIÓN DE PROBABILIDAD DE LA LLUVIA ANUAL CUANDO OCURRE UN CAMBIO CLIMÁTICO

EJERCICIOS DE SELECTIVIDAD

ESTADÍSTICA. Tema 4 Regresión lineal simple

EJERCICIOS RESUELTOS DE ESTADÍSTICA II

11. PRUEBAS NO PARAMÉTRICAS

= P (Z ) - P (Z ) = P (Z 1 25) P (Z -1 25)= P (Z 1 25) [P (Z 1 25)] = P (Z 1 25) [1- P (Z 1 25)] =

TEMA 4 ELABORACIÓN Y COMPROBACIÓN DE LAS HIPÓTESIS DE INVESTIGACIÓN

Tema 4. MODELOS DE DISTRIBUCIONES DISCRETOS.

Estadísticos Descriptivos

1.- Test de hipótesis de normalidad. 2.- Test de hipótesis para una proporción 6-1

Algunas Distribuciones Continuas de Probabilidad. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

Contenido. 2 Probabilidad 9. Prefacio. 1 Introducci6n a la estadfstica y al an;!llisis de datos

UAP PRUEBAS DE HIPÓTESIS NO PARAMÉTRICAS

TEMA 3: Contrastes de Hipótesis en el MRL

T1. Distribuciones de probabilidad discretas

INTRODUCCIÓN A LA ECONOMETRÍA (LE Y LADE, mañana) Prof. Magdalena Cladera APLICACIONES DE INFERENCIA ESTADÍSTICA DE EXCEL Y SPSS

Germán Jesús Rubio Luna Catedrático de Matemáticas del IES Francisco Ayala

Econometría II Grado en finanzas y contabilidad

MASTER EN CIENCIAS ACTUARIALES Y FINANCIERAS PLAN Módulo: FORMACIÓN FUNDAMENTAL. Créditos ECTS: 6 Presenciales: 5 No presenciales: 1

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E

Tema 4: Probabilidad y Teoría de Muestras

ANALISIS DE FRECUENCIA EN HIDROLOGIA JULIAN DAVID ROJO HERNANDEZ

Carrera: EMM Participantes Representante de las academias de ingeniería Electromecánica de los Institutos Tecnológicos.

EJERCICIOS RESUELTOS DE ESTADÍSTICA II

Pruebas de Hipótesis Multiples

Método de cuadrados mínimos

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO. Facultad de Medicina Veterinaria y Zootecnia. Licenciatura en Medicina Veterinaria y Zootecnia

Facultad de Ciencias Sociales - Universidad de la República

Técnicas de Inferencia Estadística II. Tema 3. Contrastes de bondad de ajuste

ESTADÍSTICA I PRESENTACIÓN DE LA ASIGNATURA

Tema 6. Estadística Descriptiva e Introducción a la Inferencia Estadística

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

1º CURSO BIOESTADÍSTICA

INTERPRETACIÓN DE LA REGRESIÓN. Interpretación de la regresión

Distribuciones de probabilidad con R Commander

CAPÍTULO 10 ESTIMACIÓN POR PUNTO Y POR INTERVALO 1.- ESTIMACIÓN PUNTUAL DE LA MEDIA Y DE LA VARIANZA 2.- INTERVALO DE CONFIANZA PARA LA MEDIA

PRUEBAS PARA DOS MUESTRAS RELACIONADAS

Tema Correlación. Correlación. Introducción

Hipótesis y decisiones

DISTRIBUCIONES BIDIMENSIONALES

Pruebas de bondad de ajuste

ANX-PR/CL/ GUÍA DE APRENDIZAJE. ASIGNATURA Estadistica. CURSO ACADÉMICO - SEMESTRE Primer semestre

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

EJERCICIOS. Curso: Estadística. Profesores: Mauro Gutierrez Martinez Christiam Miguel Gonzales Chávez. Cecilia Milagros Rosas Meneses

Curso de Estadística no-paramétrica

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24

ANALISIS DE FRECUENCIA

Regresión lineal SIMPLE MÚLTIPLE N A Z IRA C A L L E J A

INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M.

PATRONES DE DISTRIBUCIÓN ESPACIAL

INFERENCIA ESTADÍSTICA

CLASE 10: RESUMEN DEL CURSO

Curso de Estadística Aplicada a las Ciencias Sociales. Tema 12. Contraste de hipótesis. Introducción. Introducción

EJERCICIOS RESUELTOS DE ESTADÍSTICA II

2. Análisis de varianza

Objetivos del tema. Qué es una hipótesis? Test de Hipótesis Introducción a la Probabilidad y Estadística. Contrastando una hipótesis

Práctica 5 MÉTODOS DESCRIPTIVOS PARA DETERMINAR LA NORMALIDAD

3. Correlación. Introducción. Diagrama de dispersión

TAMAÑO DE MUESTRA EN LA ESTIMACIÓN DE LA MEDIA DE UNA POBLACIÓN

ANÁLISIS DE FRECUENCIA (CURVAS INTENSIDAD DURACIÓN - FRECUENCIA) Y RIESGO HIDROLÓGICO

MEDIDAS DE VARIABILIDAD

Enlace del Plan de Auditoría con los Riesgos y Exposiciones

GUÍA 5 : EFECTO DEL ESTRÉS EN EL PESO DE RECIÉN NACIDOS

ANEXO X ANALISIS DE FRECUENCIAS DE LAS CRECIDAS DEL RIO SALADO

MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN. Lic. Esperanza García Cribilleros

Pruebas de Hipótesis H0 : μ = 6 H1 : μ 6 α = 0.05 zα/2 = 1.96 (6-1,96 0,4 ; 6+1,96 0,4) = (5,22 ; 6,78) 5,6 Aceptamos la hipótesis nula H 0 2.

Inclusión de la igualdad en la hipótesis nula

Matemáticas 2.º Bachillerato. Intervalos de confianza. Contraste de hipótesis

Transcripción:

7-1 Tema 7 Contrastes de Hipótesis para una Muestra Introducción Metodología del contraste de hipótesis Métodos no paramétricos Test binomial Test de los signos Test de rango con signos de Wilcoxon Test de bondad del ajuste: χ 2 Test de bondad del ajuste: Kolmogorov-Smirnov Test de corridas Métodos bayesianos Contraste para la media de una población normal Ejemplo: cúmulos globulares de la Galaxia

7-2 Introducción Contrastes de hipótesis Estimación de parámetros ajuste de modelos El contraste de hipótesis permite tomar decisiones ( son los datos consistentes con un cierto modelo? se ajustan a una cierta distribución de probabilidad? es la muestra consistente con otra muestra? hay correlación? Métodos paramétricos Métodos no paramétricos Contrastes clásicos Contrastes bayesianos Muestras grandes Distribución de probabilidad conocida Datos cuantitativos Distribución de probabilidad conocida Se calcula la probabilidad de la hipótesis Método más directo para incorporar nuevo conocimiento y entender las incertidumbres Muestras pequeñas Distribución de probabilidad desconocida Válidos para datos de rango y cualitativos No existen

Metodología a del contraste de hipótesis 7-3 Formulación de las hipótesis: Hipótesis nula (H 0 ) vs Hipótesis alternativa (H 1 ) Aceptación de la hipótesis nula los datos no están en contra Rechazo de la hipótesis nula los datos indican que es improbable que sea cierta Se utiliza un estadístico de prueba con distribución conocida en el caso de que H 0 sea cierta Ejemplo: media de una población normal α: nivel de significación Contraste bilateral Contrastes unilaterales región crítica región crítica región crítica región de aceptación región de aceptación región de aceptación

7-4 Métodos no paramétricos Test para el parámetro de una población binomial: Test binomial Tests para la mediana de una población o para comparar observaciones pareadas: Test de los signos Test de rango con signos de Wilcoxon Tests de bondad del ajuste a una distribución o a un modelo: Test χ 2 Test de Kolmogorov-Smirnov (1 muestra) Test para comprobar la aleatoriedad de una secuencia: Test de corridas

7-5 Test binomial Test para el parámetro de una distribución binomial Sea una muestra binomial: n ensayos independientes, con O 1 éxitos y O 2 fracasos p: probabilidad de éxito en un ensayo (cte para todos los ensayos) Bilateral: Se buscan los valores críticos t 1 y t 2 tales que, bajo la hipótesis nula: (no se puede hacer para cualquier α) Unilateral: Es la base de tests más elaborados y versátiles que se pueden aplicar a variables no binomiales (NO aplicar este test a otro tipo de variables). Válido para muestras pequeñas. Para muestras grandes, la binomial se aproxima por una normal. El test de los signos es el más directo y potente.

7-6 Bilateral: Test de los signos Prueba no paramétrica para contrastar la mediana de una población. Se reemplaza cada valor de la muestra por un signo + o dependiendo de si es mayor o menor que la mediana poblacional. Mediana de una población X: nº de signos + en la muestra (variable aleatoria binomial) Los valores iguales a la mediana se excluyen de la muestra Para muestras grandes (n > 10): Aproximación a la normal. Se realiza un test binomial con p = 0.5 Para α=0.05 Se puede utilizar para probar la igualdad de medias en observaciones pareadas. Cada par de valores X i i, Y ii se reemplaza por un signo + o dependiendo de cual sea mayor Aplicable a datos dicotómicos y de rango. Algo menos eficiente que el test t para distribuciones normales Mucho más fiable que el test t si la distribución tiene grandes colas.

7-7 Test de rangos con signo de Wilcoxon Modificación del test de los signos para tener en cuenta las magnitudes de las diferencias con la mediana. Sólo se puede aplicar si la distribución es simétrica y continua Bilateral: Unilateral: Se calculan las diferencias respecto a la mediana poblacional. Se asignan rangos a las diferencias absolutas de menor a mayor (sin tener en cuenta el signo; si hay empates se asignan los rangos medios) Se calculan: Bilateral: Unilateral: Para muestras grandes (n > 15): Aproximación a la normal. Comparado con el test t, la eficiencia (A.R.E.) es > 0.864 Se puede utilizar para probar la igualdad de medias en observaciones pareadas (no hace falta suponer simetría).

7-8 Valores críticos para el test de rangos con signo de Wilcoxon

7. Contrastes de Hip Contrastes de Hipótesis para una Muestra Cúmulo M(K) Cúmulo M(K) Cúmulo M(K) 7-9 Ejemplo: Cúmulos C globulares de la Galaxia 47 Tuc -11.79 NGC 6235-8.359 M 28-10.557 NGC 362-10.694 NGC 6256-10.374 M 69-9.803 NGC 1261-9.452 M 62-12.318 Pal 8-8.478 Eridanus 4-5.14 M 19-12.279 M 54-12.717 Pal 2-13.515 NGC 6284-10.775 NGC 6723-10.229 NGC 1851-10.591 NGC 6287-10.706 Be42 19-6.7 NGC 2298-8.825 NGC 6304-11.042 NGC 6760-11.649 NGC 2419-11.687 NGC 6316-12.452 M 55-9.199 NGC 2808-11.687 NGC 6325-10.481 M 75-10.929 NGC 4147-7.633 M 9-10.611 NGC 7006-9.696 NGC 4833-11.347 NGC 6342-9.825 M 2-10.682 M 53-10.284 NGC 6356-11.74 M 30-8.759 NGC 5286-11.046 NGC 6355-11.163 Pal 12-6.97 NGC 5694-9.991 NGC 6366-8.558 NGC 7492-7.365 IC 4499-9.083 Ton 1-12.693 2MASS GC01-10.21 NGC 5824-11.339 NGC 6388-13.509 2MASS GC02-12.667 NGC 5927-11.183 NGC 6401-10.578 NGC 288-7.741 NGC 5946-10.845 NGC 6440-14.205 M 79-9.372 NGC 5986-11.418 NGC 6441-13.294 omega Cen -11.747 M 80-10.16 NGC 6453-10.922 NGC 5466-7.273 M 4-10.091 NGC 6496-9.227 NGC 5634-9.088 NGC 6101-8.662 NGC 6517-13.34 NGC 5897-8 NGC 6144-9.497 NGC 6539-12.565 NGC 6293-9.253 NGC 6139-12.647 NGC 6544-11.478 M 92-7.19 M 107-10.019 NGC 6553-12.36 NGC 6642-8.73 M 13-10.206 Pal 7-10.584 NGC 6652-8.079 NGC 6229-10.388 NGC 6569-10.962 Pal 9-7.509

7-10 Ejemplo: Cúmulos C globulares de la Galaxia Contraste para la media ( puede ser la magnitud media igual a -10? Test de los signos: 30 signos + 51 signos Se rechaza para α=0.05 Test de Wilcoxon: Se asignan rangos a los D i Se acepta para α=0.05 Pero se ha supuesto distribución simétrica

7-11 Test de bondad del ajuste: χ 2 Se ajusta la muestra a un determinado modelo o a una determinada distribución de probabilidad? Los datos se agrupan en k intervalos O i : frecuencias observadas en cada intervalo E i : frecuencias esperadas si se cumple el modelo λ > 5 Si H 0 es cierta: es una χ 2 con k - 1 grados de libertad Si no se cumple que todos los E i > 5, se unen varios intervalos (al menos el 80%) Si para calcular E i hay que usar p parámetros estimados de la muestra (ej. μ, σ), el número de grados de libertad es: Ventajas: Método muy usado. Se puede analizar bin a bin. Fácil de aplicar (como regla aproximada, si χ 2 es mayor que 2 k, se rechaza la hipótesis nula). Desventajas: Pérdida de eficiencia e información al agrupar los datos en intervalos. Son necesarias muestras grandes (para cumplir E i i > 5). Es bilateral (no indica la dirección de las desviaciones).

7-12 Test de bondad del ajuste: Kolmogorov-Smirnov S e (x): distribución de frecuencias acumuladas (función de distribución) bajo H 0 S o (x): distribución de frecuencias acumuladas de la muestra Ventajas sobre el test χ 2 No hay pérdida de información por agrupamiento Válido para muestras pequeñas (para muestras intermedias es más potente) Pueden hacerse contrastes unilaterales Permite calcular un intervalo de confianza para la distribución de probabilidad de la población. Inconvenientes La distribución teórica debe ser continua (aunque existen modificaciones para distribuciones discretas no se puede aplicar a variables cualitativas) No se pueden conocer los valores críticos si se calculan estimaciones de los parámetros poblacionales a partir de la muestra.

7-13 Valores críticos para el test de Kolmogorov-Smirnov (1 muestra)

7-14 Test χ 2 Ejemplo: Cúmulos C globulares de la Galaxia Siguen sus magnitudes absolutas una distribución normal? 12 intervalos 30 Variable: Var2, Distribution: Norm al al Chi-Square test = 3,13214, df df = 4 (adjusted),, p = 0,53596 No. of of observations 25 20 15 10 Agrupando intervalos para tener frecuencias esperadas > 5: 7 intervalos 5 0-16 -15-14 -13-12 -11-10 -9-9 -8-8 -7-7 -6-6 -5-5 -4-4 Category (upper limits) Se acepta la hipótesis de normalidad

7-15 Ejemplo: Cúmulos C globulares de la Galaxia Test de Kolmogorov-Smirnov 110 100 90 Suponiendo: Relative Frequency (%) 80 70 60 50 40 30 20 10 0 Se acepta la hipótesis de normalidad Si: Valores críticos (N=81): α = 0.20 D = 0.1189 α = 0.10 D = 0.1356 α = 0.05 D = 0.1511 Se rechaza para p = 0.10 pero se acepta para p = 0.05

7-16 Test de corridas Test para comprobar la aleatoriedad de una secuencia binaria Sea una secuencia de resultados de un proceso binario (éxito/fracaso): (ej. EEFEEFFEEEEFFF) n 1 : número de éxitos n 2 : número de fracasos r : número de corridas (secuencias del mismo resultado) (las observaciones sucesivas son independientes) Ej: Típicamente, el test se hace unilateral: Para muestras grandes (n 1 ó n 2 > 20) Método útil para comprobar la aleatoriedad de secuencias temporales. Se suele usar para comprobar la aleatoriedad de los residuos (positivos/negativos) en un ajuste a un modelo (ej. espectro). Comprobación de la validez del modelo ajustado

7-17 Valores críticos para el test de corridas Los dos números indican los valores críticos (mínimo y máximo) para un test con n 1 éxitos y n 2 fracasos. El nivel de significación es α = 0.05 para un test bilateral y α = 0.025 para un test unilateral.

7-18 Ejemplo: Ajuste al espectro del cuasar 3C207 Se acepta la hipótesis de aleatoriedad Se rechaza. Hay evidencias de emisión

Métodos bayesianos Contraste para la media para una distribución n normal 7-19 Verosimilitud: La verosimilitud de la muestra es proporcional a la verosimilitud de la media Prior uniforme:

7-20 Métodos bayesianos (II) Prior normal: (prior conjugado) La distribución de probabilidad posterior de μ es una normal con: Posterior Prior Likelihood -5-4 -3-2 -1 0 1 2 3 4 5 m Posterior mean 131

7-21 Bilateral: Métodos bayesianos (III) Contrastes de hipótesis: Para un nivel α, se calcula un intervalo de credibilidad: [μ 1,μ 2 ] Prior normal: (σ se supone conocida) Prior no normal: Unilateral: Se calcula Distribución de probabilidad de la hipótesis Para un prior normal: