PRUEBAS DE BONDAD DE AJUSTE

Documentos relacionados
Tabla de Test de Hipótesis ( Caso: Una muestra ) A. Test para µ con σ 2 conocida: Suponga que X 1, X 2,, X n, es una m.a.(n) desde N( µ, σ 2 )

Distribución Chi (o Ji) cuadrada (χ( 2 )

Teorema Central del Límite (1)

A. PRUEBAS DE BONDAD DE AJUSTE: B.TABLAS DE CONTINGENCIA. Chi cuadrado Metodo G de Fisher Kolmogorov-Smirnov Lilliefords

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

Test de Kolmogorov-Smirnov

INFERENCIA ESTADISTICA

Técnicas de validación estadística Bondad de ajuste

Técnicas de validación estadística Bondad de ajuste

PRUEBAS DE BONDAD DE AJUSTE y DE INDEPENDENCIA

Nivel socioeconómico medio. Nivel socioeconómico alto SI NO TOTAL

Técnicas de Inferencia Estadística II. Tema 3. Contrastes de bondad de ajuste

Pruebas de Bondad de Ajuste

Contrastes de hipótesis paramétricos

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón

Algunas Distribuciones Continuas de Probabilidad. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

2. Análisis de varianza

INSTITUTO NACIONAL DE ESTADÍSTICAS (INE) 29 de Abril de 2016

para una muestra Ref: Apuntes de Estadística, Mtra Leticia de la Torre Instituto Tecnológico de Chiuhuahua

Tema 5. Contraste de hipótesis (I)

OTRAS HERRAMIETAS ESTADISTICAS UTILES. Dra. ALBA CECILIA GARZON

Pruebas de Hipótesis Multiples

Tema 4: Probabilidad y Teoría de Muestras

A. PRUEBAS DE BONDAD DE AJUSTE: B.TABLAS DE CONTINGENCIA

Indicaciones para el lector... xv Prólogo... xvii

DISTRIBUCIONES BIDIMENSIONALES

ANALISIS DE FRECUENCIA EN HIDROLOGIA JULIAN DAVID ROJO HERNANDEZ

LIGAMIENTO Y RECOMBINACIÓN

Contraste de hipótesis Tema Pasos del contraste de hipótesis. 1.1 Hipótesis estadísticas: nula y alternativa. 1.3 Estadístico de contraste

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E

III Verano de Probabilidad y Estadística Curso de Procesos de Poisson (Víctor Pérez Abreu) Lista de Ejercicios

no paramétrica comparar más de dos grupos de rangos (medianas)

Teoría de errores -Hitogramas

6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE

Este procedimiento prueba hipótesis acerca de cualquiera de los siguientes parámetros:

Tema 5 Algunas distribuciones importantes

OPCIÓN A. La empresa A (x) tiene 30 trabajadores, la B (y) 20 trabajadores y la C (z) 13 trabajadores.

MÓDULO III. MEDIDAS DE TENDENCIA CENTRAL, DISPERSIÓN Y ASIMETRÍA

Desigualdad de ingresos en Costa Rica a la luz de las ENIGH 2004 y 2013

Variables aleatorias

LECTURA 01: LA DISTRIBUCIÓN NORMAL GENERAL. LA DISTRIBUCIÓN NORMAL ESTÁNDAR (PARTE I). TEMA 1: LA DISTRIBUCION NORMAL GENERAL.

Probabilidad II Algunas distribuciones notables. Antonio Cuevas Departamento de Matemáticas Universidad Autónoma de Madrid

Maestría en Bioinformática Probabilidad y Estadística: Clase 3

Práctica 3: Distribuciones de Probabilidad Binomial, Poisson y Normal

Variable Aleatoria Continua. Principales Distribuciones

Análisis de datos Categóricos

Presentación. Los Autores. Universidad Nacional Autónoma de México Facultad de Estudios Superiores Cuautitlán.

Generación de variables aleatorias continuas Método de la transformada inversa

Unidad IV. Una variable aleatoria X es continua si su función de distribución es una función continua.

Introducción a una prueba de Hipótesis para una proporción

ÍNDICE INTRODUCCIÓN... 21

Pruebas de Hipótesis-ANOVA. Curso de Seminario de Tesis Profesor QF Jose Avila Parco Año 2016

Reporte de Pobreza y Desigualdad DICIEMBRE 2015

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo

Medidas de dispersión

CAPITULO II : MARCO TEORICO INTRODUCCIÓN A LA MODELACIÓN Y A LA SIMULACIÓN

Tema 4: Probabilidad y Teoría de Muestras

b) dado que es en valor absoluto será el área entre -1,071 y 1,071 luego el resultado será F(1,071)-(1-F(1,071)=0,85-(1-0,85)=0,7

Propiedades en una muestra aleatoria

ESTADÍSTICA. Tema 4 Regresión lineal simple

EJERCICIOS RESUELTOS DE ESTADÍSTICA II

Estadística Inferencial. Sesión No. 8 Pruebas de hipótesis para varianza.

Técnicas Cuantitativas para el Management y los Negocios I

Contenido. 2 Probabilidad 9. Prefacio. 1 Introducci6n a la estadfstica y al an;!llisis de datos

478 Índice alfabético

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS

Distribución de Probabilidades con Nombre Propio Problemas Propuestos

a. N(19 5, 1 2) P(19 X 21) = P( Z ) = = P = P P = = P P = P = = = El 55 72% no son adecuados.

Otra característica poblacional de interés es la varianza de la población, 2, y su raíz cuadrada, la desviación estándar de la población,. La varianza

Reporte de Pobreza. Marzo 2016

Tema 5: Principales Distribuciones de Probabilidad

EJERCICIOS RESUELTOS DE ESTADÍSTICA II

Ejercicios T2 y T3.- DISTRIBUCIONES MUESTRALES Y ESTIMACIÓN PUNTUAL

Reporte de Pobreza por Ingresos JUNIO 2015

Matemáticas 2.º Bachillerato. Intervalos de confianza. Contraste de hipótesis

Estadística Inferencial 3.7. Prueba de hipótesis para la varianza. σ gl = n -1. Es decir: Ho: σ 2 15 Ha: σ 2 > 15 (prueba de una cola)

ESTADÍSTICA SEMANA 3

Tipo de punta (factor) (bloques)

5 DISTRIBUCIONES BINOMIAL Y DE POISSON

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

Los factores de mayor incidencia causantes de estrés, son el Psicológico

Distribuciones de probabilidad

RELACIÓN DE PROBLEMAS. Distribuciones de probabilidad

F (x, y) = no es la función de distribución acumulada de ningún vector aleatorio. b) Mostrar que. { (1 e x )(1 e y ) si x 0, y 0

Intervalos de Confianza para dos muestras

Objetivos. Epígrafes 3-1. Francisco José García Álvarez

TEMA 6: DERIVACION NUMERICA

Unidad Temática 5 Estimación de parámetros: medias, varianzas y proporciones

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN

TEMA 4 ELABORACIÓN Y COMPROBACIÓN DE LAS HIPÓTESIS DE INVESTIGACIÓN

INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)

MÓDULO 1: GESTIÓN DE CARTERAS

Pruebas de bondad de ajuste

Validación de los métodos microbiológicos HERRAMIENTAS ESTADISTICAS. Bqca. QM Alicia I. Cuesta, Consultora Internacional de la FAO

Análisis de Decisiones II. Tema 17 Generación de números al azar. Objetivo de aprendizaje del tema

5 Variables aleatorias contínuas

ESTADISTICA INFERENCIAL

Transcripción:

PRUEBAS DE BONDAD DE AJUSTE Las pruebas de bondad de ajuste son pruebas de hipótesis para verificar si los datos observados en una muestra aleatoria se ajustan con algún nivel de significancia a determinada distribución de probabilidad (uniforme, exponencial, normal, poisson, u otra cualquiera). La hipótesis nula H o indica la distribución propuesta, mientras que la hipótesis alternativa H 1, nos indica que la variable en estudio tiene una distribución que no se ajusta a la distribución propuesta. H o : f(x)=f o (x) H 1 : f(x) f o (x)

PRUEBAS DE BONDAD DE AJUSTE Para realizar la prueba, se clasifican los datos observados en k clases o categorías, y se contabiliza el número de observaciones en cada clase, para posteriormente comparar la frecuencia observada en cada clase con la frecuencia que se esperaría obtener en esa clase si la hipótesis nula es correcta. k = No. de clases, k>2 o i = Frecuencia observada en la clase i e i = Frecuencia esperada en la clase i, si H o es correcta.

PRUEBAS DE BONDAD DE AJUSTE Frecuencias o i e i = n*p i Las pruebas de bondad de ajuste comparan la frecuencia observada con la frecuencia esperada en cada clase. e i = n*p i, donde: n=tamaño de la muestra, p i =área bajo la curva f o (x) en el intervalo lim sup -lim inf de la clase i Si f o (x) es continua, entonces: Límites de clase p i = lím lím sup i inf i f o ( x) dx

PRUEBAS DE BONDAD DE AJUSTE - LA PRUEBA JI-CUADRADA - Existen varios procedimientos para probar la bondad de ajuste de una distribución a los datos observados en una muestra, uno de ellos es la prueba Ji-cuadrada, que se basa en el estadístico de prueba: Y = k i= 1 ( o i e e El cual tiene distribución Ji-cuadrada con k-r-1 grados de libertad. Si las diferencias o i -e i son pequeñas, el valor del estadístico es pequeño, por el contrario si esas diferencias son grandes (lo observado no se ajusta a lo propuesto), el valor del estadístico es grande, por lo tanto, la región de rechazo de la hipótesis nula se ubica en la cola superior de la distribución Ji-cuadrada al nivel de significancia α. 2 RR :{ Y > χα, k r 1} Donde: k = No. de clases. r = no. de parámetros estimados en f o (x) para encontrar e i i i 2 )

RECOMENDACIONES PARA REALIZAR LA PRUEBA El tamaño de la muestra deberá ser moderadamente grande, pues si la muestra es muy pequeña no se podrá formar un número suficiente de clases y si la muestra es muy grande la prueba conducirá al rechazo casi con seguridad. Se sugiere que n sea aproximadamente igual a 5 veces el número de clases. Se recomienda clasificar la muestra en mínimo cinco clases y máximo diez. Hacer que toda frecuencia observada o esperada no sea menor que cinco, esto puede lograrse combinando clases vecinas, pero para cada par de clases que se combinan, el número de grados de libertad debe reducirse en uno (k es el número de clases efectivas en la tabla de frecuencias). Si fo(x) es continua: Para la primera clase, calcular p 1 considerando el intervalo desde - hasta el límite superior de la clase. Para la última clase, calcular p k considerando el intervalo desde el límite inferior de la clase hasta +.

PRUEBA DE BONDAD DE AJUSTE CHI-CUADRADA Ejercicio 11.47, pag. 404, Hines El número de unidades defectuosas encontradas cada día por un probador de circuitos en un proceso de ensamble se muestra a continuación. Es razonable concluir que estos datos provienen de una distribución normal? Datos Originales Tabla de frecuencias de la muestra (fronteras) Frecuencia observada TAREA: REVISAR LOS CÁLCULOS DE ESTE EJEMPLO Ho: f(x)=fo(x); Normal Datos α= 0.05 estimados a Ho sin especificar media y varianza k= 7 partir de la media Desv. Est. r= 2 muestra. 25.26 9.233465719 ν= 4 Tabla de frecuencias esperadas si Ho es correcta Frecuencia esperada bajo relativa intervalo de Z bajo Ho p i Ho intervalo frec límites aparentes límites reales xi fi = Oi f'i Lím inf Lím sup e i = n*pi (Oi-ei) 2 /ei 0 10 6 0 10-0.5 10.5 5 6 0.0513-1.60 P(Z<-1.6) = 0.0550 6.43 0.02870594 11 15 11 11 15 10.5 15.5 13 11 0.0940-1.60-1.06 P(-1.6<Z<-1.06) = 0.0903 10.56 0.0181057 16 20 16 16 20 15.5 20.5 18 16 0.1368-1.06-0.52 P(-1.06<Z<-0.52) = 0.1578 18.47 0.32954852 21 25 28 21 25 20.5 25.5 23 28 0.2393-0.52 0.03 P(-0.52<Z<0.03) = 0.2073 24.25 0.57975963 26 30 22 26 30 25.5 30.5 28 22 0.1880 0.03 0.57 P(0.03<Z<0.57) = 0.2044 23.92 0.15419785 31 35 19 31 35 30.5 35.5 33 19 0.1624 0.57 1.11 P(0.57<Z<1.11) = 0.1515 17.72 0.09193601 36 40 11 36 45 35.5 45.5 40.5 15 0.1282 1.11 + P(Z>1.11) = 0.1337 15.65 0.02669689 41 45 4 * Como la última clase tiene frecuencia menor a 5, se combina con la clase Sumas: n= 117 1 1.0000 c 2 m= 1.229 30 25 20 15 10 5 0 fi = Oi 5 13 18 23 28 33 40.5 Rechazar Ho si c 2 m > c 2 α, k-1-r = 9.48772846 Conclusión: No se rechaza Ho Valor P = 0.87331 PruebaBondad.xls-Normal

PRUEBA DE BONDAD DE AJUSTE CHI-CUADRADA Ho: f(x)=uniforme Ejercicio 10.5, pag. 375, Canavos Una organización de seguridad vial desea determinar si el número de accidentes fatales se encuentra distribuido de igual forma para el color de los automóviles involucrados. De una muestra aleatoria de 600 accidentes se obtuvieron los siguientes resultados. Existe alguna razón para creer que las proporciones de color no son idénticas? frecuencia frecuencia frecuencia observada relativa pi esperada bajo Ho α= 0.01 k= 6 r= 1 ν= 4 clase fi = Oi f'i ei = n*pi (Oi-ei) 2 /ei rojo 75 0.1250 0.1667 100.00 6.25 café 125 0.2083 0.1667 100.00 6.25 amarillo 70 0.1167 0.1667 100.00 9 blanco 80 0.1333 0.1667 100.00 4 gris 135 0.2250 0.1667 100.00 12.25 azul 115 0.1917 0.1667 100.00 2.25 n= 600 1.0000 c 2 m= 40.000 150 fi = Oi Rechazar Ho si 100 50 0 rojo café amarillo blanco gris azul fi = Oi c 2 m > c 2 α, k-1-r = 13.2766986 Se rechaza Ho Valor P = 0.00000 PruebaBondad.xls-Uniforme

PRUEBA DE BONDAD DE AJUSTE CHI-CUADRADA Ho: F(x)=Ver enunciado Ejercicio 10.1, pag. 374, Canavos Según lo registros de una tienda modas para esta temporada, de los vestidos el 50% se venden a precio normal, el 25% con un descuento de 20%, el 15% con un descuento de 40% y los restantes con una reducción en su precio de 60%. Para esta temporada se adquirieron 300 vestidos y su venta fue de la siguiente forma: Existe alguna razón para creer que la disminución en ventas fue diferente en esta temporada? α= 0.05 k= 4 r= 0 ν= 3 venta real: frecuencia frecuencia frecuencia observada relativa pi esperada bajo Ho clase fi = Oi f'i ei = n*pi (Oi-ei) 2 /ei Precio Normal 140 0.4667 0.5000 150.00 0.66666667 20% desc. 90 0.3000 0.2500 75.00 3 40% desc. 30 0.1000 0.1500 45.00 5 60% desc. 40 0.1333 0.1000 30.00 3.33333333 n= 300 1.0000 c 2 m= 12.000 Rechazar Ho si c 2 m > c 2 α, k-1-r = 7.8147247 Se rechaza Ho Valor P = 0.00738 PruebaBondad.xls-Otra