Tema 13: Contrastes No Paramétricos

Documentos relacionados
CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS

Contraste de hipótesis paramétricas

Técnicas de Inferencia Estadística II. Tema 3. Contrastes de bondad de ajuste

Tema 8: Contraste de hipótesis

Teorema Central del Límite (1)

Práctica 5 ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS

Test de Kolmogorov-Smirnov

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón

Proyecto Tema 8: Tests de hipótesis. Resumen teórico

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico

Contrastes de Hipótesis paramétricos y no-paramétricos.

Contrastes de hipótesis paramétricos

en Enfermería del Trabajo

Podemos definir un contraste de hipótesis como un procedimiento que se basa en lo observado en las muestras y en la teoría de la probabilidad para

Problemas resueltos. Tema 12. 2º La hipótesis alternativa será que la distribución no es uniforme.

Tabla de Test de Hipótesis ( Caso: Una muestra ) A. Test para µ con σ 2 conocida: Suponga que X 1, X 2,, X n, es una m.a.(n) desde N( µ, σ 2 )

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

Contrastes de hipótesis estadísticas. Contrastes paramétricos

INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M.

Tema 9: Contraste de hipótesis.

Tema 8: Introducción a la Teoría sobre Contraste de hipótesis

Contraste de hipótesis Tema Pasos del contraste de hipótesis. 1.1 Hipótesis estadísticas: nula y alternativa. 1.3 Estadístico de contraste

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

Tema 8. Muestreo. Indice

INFERENCIA ESTADISTICA

A. PRUEBAS DE BONDAD DE AJUSTE: B.TABLAS DE CONTINGENCIA. Chi cuadrado Metodo G de Fisher Kolmogorov-Smirnov Lilliefords

Conceptos del contraste de hipótesis

ANÁLISIS DE FRECUENCIA (CURVAS INTENSIDAD DURACIÓN - FRECUENCIA) Y RIESGO HIDROLÓGICO

Pruebas de Bondad de Ajuste

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo

Contrastes de hipótesis. 1: Ideas generales

Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR

1. La Distribución Normal

Tema 13: Distribuciones de probabilidad. Estadística

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

Técnicas de validación estadística Bondad de ajuste

PATRONES DE DISTRIBUCIÓN ESPACIAL

INFERENCIA ESTADÍSTICA: CONTRASTES DE HIPÓTESIS

Tema 5. Muestreo y distribuciones muestrales

Tema 13 : Intervalos de probabilidad y confianza. Hipótesis y decisiones estadísticas.

INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

Matemáticas 2.º Bachillerato. Intervalos de confianza. Contraste de hipótesis

EJERCICIOS DE PRUEBA DE HIPOTESIS

Técnicas de validación estadística Bondad de ajuste

ESTADÍSTICA. Tema 4 Regresión lineal simple

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E

Pruebas de Hipótesis Multiples

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN

INDICE. Prólogo a la Segunda Edición

MASTER EN CIENCIAS ACTUARIALES Y FINANCIERAS PLAN Módulo: FORMACIÓN FUNDAMENTAL. Créditos ECTS: 6 Presenciales: 5 No presenciales: 1

Técnicas estadísticas más utilizadas en la investigación

Curso de Estadística Aplicada a las Ciencias Sociales. Tema 12. Contraste de hipótesis. Introducción. Introducción

Pruebas para evaluar diferencias

Distribución Chi (o Ji) cuadrada (χ( 2 )

Tema 5: Introducción a la inferencia estadística

Pruebas de Hipótesis. Diseño Estadístico y Herramientas para la Calidad. Pruebas de Hipótesis. Hipótesis

INDICE Capítulo I: Conceptos Básicos Capitulo II: Estadística Descriptiva del Proceso

Intervalos para la diferencia de medias de dos poblaciones

Tema 7 Intervalos de confianza Hugo S. Salinas

Tema 5. Contraste de hipótesis (I)

ÍNDICE INTRODUCCIÓN... 21

Problemas Prueba de significación de la hipótesis nula Vicente Manzano-Arrondo, 2013

INFERENCIA DE LA PROPORCIÓN

CAPÍTULO 10 ESTIMACIÓN POR PUNTO Y POR INTERVALO 1.- ESTIMACIÓN PUNTUAL DE LA MEDIA Y DE LA VARIANZA 2.- INTERVALO DE CONFIANZA PARA LA MEDIA

6. ESTIMACIÓN DE PARÁMETROS

Econometría II Grado en finanzas y contabilidad

Tema 4: Probabilidad y Teoría de Muestras

Práctica 5 MÉTODOS DESCRIPTIVOS PARA DETERMINAR LA NORMALIDAD

Estadísticos Aplicados en el SPSS 2008

CONTRASTE SOBRE UN COEFICIENTE DE LA REGRESIÓN

= P (Z ) - P (Z ) = P (Z 1 25) P (Z -1 25)= P (Z 1 25) [P (Z 1 25)] = P (Z 1 25) [1- P (Z 1 25)] =

478 Índice alfabético

TAMAÑO DE MUESTRA EN LA ESTIMACIÓN DE LA MEDIA DE UNA POBLACIÓN

Análisis de la varianza ANOVA

Teoría del muestreo. Tipos de muestras

Estadísticos Descriptivos

ESTIMACIÓN PUNTUAL Julián de la Horra Departamento de Matemáticas U.A.M.

CONCEPTOS FUNDAMENTALES

Tema 5. Muestreo y distribuciones muestrales

III Verano de Probabilidad y Estadística Curso de Procesos de Poisson (Víctor Pérez Abreu) Lista de Ejercicios

Indicaciones para el lector... xv Prólogo... xvii

EJERCICIOS DE SELECTIVIDAD

PRUEBAS PARA DOS MUESTRAS RELACIONADAS

INFERENCIA ESTADÍSTICA

Estadística Convocatoria de Junio Facultad de Ciencias del Mar. Curso 2009/10 28/06/10

ESTADÍSTICA I PRESENTACIÓN DE LA ASIGNATURA

1.- Test de hipótesis de normalidad. 2.- Test de hipótesis para una proporción 6-1

EJERCICIOS RESUELTOS DE ESTADÍSTICA II

PLAN DE TRABAJO 9 Período 3/09/07 al 28/09/07

Estadística Avanzada y Análisis de Datos

EJERCICIOS RESUELTOS TEMA 1.

Algunas Distribuciones Continuas de Probabilidad. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

Ejemplos y ejercicios de. Estadística Descriptiva. yanálisis de Datos. 2 Descripción estadística de una variable. Ejemplos y ejercicios.

Objetivos del tema. Qué es una hipótesis? Test de Hipótesis Introducción a la Probabilidad y Estadística. Contrastando una hipótesis

3. ANÁLISIS DE DATOS DE PRECIPITACIÓN.

Estadística con. Práctica 5: Intervalos de Conanza. Test de Hipótesis. Objetivo. 1. Intervalos y test (una sola muestra)

UNIVERSIDAD DEL VALLE DE MÉXICO PROGRAMA DE ESTUDIO DE LICENCIATURA PRAXIS MES XXI

Modelos de probabilidad. Modelos de probabilidad. Modelos de probabilidad. Proceso de Bernoulli. Objetivos del tema:

Método de cuadrados mínimos

Transcripción:

Tema 13: Contrastes No Paramétricos Presentación y Objetivos. La validez de los métodos paramétricos depende de la validez de las suposiciones que se hacen sobre la naturaleza de los datos recogidos. La falta de validez del modelo asumido puede producir errores considerables en las inferencias. Por ejemplo, las inferencias respecto a las varianzas son muy sensibles a la hipótesis de normalidad, por lo que si no existe una certeza razonable para admitirla, no deberán realizarse. Por ello, es necesario desarrollar métodos que permitan no sólo contrastar la validez del modelo paramétrico asumido (test de bondad de ajuste), sino también analizar los datos sin suponer un modelo concreto para los mismos. Se estudiarán principalmente dos contrastes para comprobar si una muestra proviene de una población con distribución especíca: el test de ajuste χ 2 de Pearson y el test de Kolmogorov- Smirnov. En el primero los datos se deben grupar en clases. Se compara el número de observaciones en cada grupo con el número de observaciones esperado y se construye el estadístico del contraste basado en esta diferencia. Bajo la hipótesis nula, dicho estadístico se distribuye asintóticamente como una χ 2. El test de Kolmogorov-Smirnov se basa en las diferencias entre la función de distribución teórica, de la que se quiere ver si proceden o no los datos, y la empírica de la muestra. Solamente se utiliza cuando la primera es continua. La distribución del estadístico utilizado es independiente de la distribución propuesta en la hipótesis nula. Este test trata cada observación individual independientemente con lo que evita los problemas e inconvenientes derivados de las agrupaciones. Los objetivos de este tema son: Entender la motivación de un contraste de bondad de ajuste. Distinguir cuándo aplicar cada uno de los dos contrastes de bondad de ajuste expuestos. Resolverlos obteniendo una conculsión sobre los datos analizados. Esquema Inicial 1. Introducción. 2. Contraste de la χ 2 de Pearson. 3. Contraste de Kolmogorov-Smirnov. Desarrollo del Tema 1. Introducción Hasta ahora hemos supuesto en las hipótesis hechas que la distribución de la población era conocida salvo parámetros. Con los contrastes no paramétricos podremos contrastar: 1

Tema 13 1. Si la distribución supuesta es consistente con los datos, es decir, comprobar si los datos proceden de una distribución dada. Esto se denomina efectuar un contraste de la bondad del ajuste. Veremos dos: Contraste χ 2 de Pearson: para v.a.'s discretas y continuas. Contraste de Kolmogorov-Smirnov: sólo para continuas. 2. Si las observaciones son independientes. Contrastes basados en rachas y basados en el coeciente de autocorrelación (el más utilizado es el de Ljung-Box). 3. Si la muestra es homogénea, es decir, todas las observaciones proceden de la misma población. Contraste de Wilcoxon, Análisis de tablas de contingencia, estudio de datos atípicos. 2. Contraste de la χ 2 de Pearson La idea es comparar las frecuencias observadas en la muestra con las esperadas si H 0 es cierta, a partir del modelo teórico que se contrasta (obtenido si H 0 es cierta). Rechazaremos H 0 si existe una diferencia suciente entre ambos conjuntos de frecuencias. La hipótesis nula es del estilo: H 0 : los datos vienen de un determinado modelo, con dos variantes: H 0 especica totalmente la distribución. H 0 : X N(3, 2) H 0 no especica totalmente la distribución. H 0 : X N(µ, 2) La hipótesis alternativa no está determinada de forma explícita en muchos casos. Suele consistir en la negación de la hipótesis nula. 2.1. Caso Discreto Supongamos que la variable de estudio X es discreta y puede tomar los k valores x 1,..., x k. Tomamos una m.a.s. de n elementos (n > k). Queremos contrastar si esta muestra tiene la distribución de la variable aleatoria de partida. Consideramos las frecuencias absolutas observadas de cada valor de la muestra O 1,..., O k, tales que k i=1 O i = n. Sean p 1,..., p k las probabilidades teóricas de x 1,..., x k respectivamente, que asigna el modelo teórico ( k i=1 p i = 1). Llamaremos E 1 = np 1,..., E k = np k a las frecuencias esperadas (o teóricas) de acuerdo con el modelo. 2

La v.a. D 2 = k (O i E i ) 2 i=1 se distribuye aproximadamente como una χ 2 (cuando el modelo es correcto). Sus grados de libertad son: k 1 si el modelo especica completamente las p i antes de tomar la muestra, es decir, no debemos estimar ningún parámetro. k r 1 si las p i se han calculado una vez que hemos estimado r parámetros del modelo por máxima verosimilitud. Fijado α, rechazaremos H 0 cuando: E i ˆD 2 > χ 2 k r 1,α 1. Durante el quinto partido de baloncesto de la temporada celebrada en cierto estado, se preguntó a 200 personas seleccionadas al azar, el número de partidos anteriores a los que habían asistido. Los resultados son los de la tabla. No. de partidos asistidos No. de personas 0 33 1 67 2 66 3 15 4 19 Contrastar la hipótesis de que estos valores observados se pueden considerar como una muestra de una distribución binomial. Utilizar un nivel de signicación α = 0.05. 2.2. Caso Continuo Para una v.a. continua agrupamos los n datos en k clases (k 5), de forma que se cubra todo el recorrido de la variable. Tenemos O 1,..., O k frecuencias observadas de cada clase (el número de datos muestrales en cada una). Conviene tener aproximadamente el mismo número de datos en cada clase y al menos 3 en cada una. Calculamos las probabilidades p 1,..., p k que asigna el modelo teórico a cada clase ( k i=1 p i = 1) y las frecuencias esperadas E 1,..., E k (E i = np i ). Si algún E i < 5, se agrupan dos clases contiguas en una, disminuyendo en 1 el número de clases, y por tanto los grados de libertad. 3

Tema 13 Fijado α, rechazamos H 0 si Observaciones: ˆD 2 > χ 2 k r 1,α 1. Para que el test funcione correctamente es necesario que se cumpla: n 30, E i 5 i, k 5, O i 3 i. 2. Conviene calcular por separado los términos (O i E i ) 2 E i más que los otros en el rechazo de la hipótesis. para ver si hay alguno que inuye 3. Realmente el test no contrasta qué distribución propiamente dicha siguen los datos, sino las probabilidades que se asocian a cada intervalo. Por ello se recomienda k 5. 4. Para muestras muy grandes se rechaza casi siempre la hipótesis. 2. La vida de 70 motores ha tenido la siguiente distribución: Años de funcionamiento [0, 1) [1,2) [2,3) [3,4) 4 frecuencia observada 30 23 6 5 6 Utilizando un nivel de signicación del 5 %, contrastar la hipótesis de que los datos proceden de una distribución exponencial. 3. Contraste de Kolmogorov-Smirnov Este contraste solamente lo podemos utilizar para v.a. continuas. Se basa en comparar la función de distribución teórica (propuesta bajo H 0 ) y la función de distribución empírica de la muestra (la función de distribución acumulativa que se observa en la muestra ordenada). La hipótesis nula será H 0 : La muestra procede de un modelo continuo F (x) A partir de la muestra {x 1,..., x n }, seguimos los siguientes pasos: 1. La ordenamos x (1) x (2)... x (n) 2. Construimos la función de distribución empírica: 0 si x < x (1).. k F n (x) = si x n (k) x < x (k+1) k = 1, 2,..., n 1.. 1 si x x (n) 4

3. Calculamos la discrepancia máxima entre la función de distribución empírica y la teórica, con el estadístico de Kolmogorov-Smirnov: D n = máx F n (x) F (x) x En la práctica, calculamos para cada x (h) D n (x (h) ) = máx{ F n (x (h 1) ) F (x (h) ), F n (x (h) ) F (x (h) ) } y después el valor del estadístico, que será: D n = máx{d n (x (h) )} Su distribución está tabulada cuando H 0 es cierta y es independiente del modelo propuesto bajo H 0, se evalúa solamente en función del tamaño muestral n. Rechazamos H 0 a un nivel de signicación α si ˆD n > D n,α Inconvenientes: 1. Si F (x) no está totalmente especicada, la distribución de D n es sólo aproximada y el caracter del test es conservador, tendiendo a aceptar H 0. 2. No puede aplicarse a casos en que las observaciones no sean inherentemente cuantitativas por las ambigüedades que pueden surgir al ordenar las observaciones. 3. Contrastar si la siguiente muestra de duraciones de vida puede suponerse exponencial: 16 8 10 12 6 10 20 7 2 24 5