Conceptos básicos de inferencia estadística (IV): Inferencia no paramétrica: Contrastes de aleatoriedad.

Documentos relacionados
CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS

Tema 10: Introducción a los problemas de Asociación y Correlación

ESTADISTICA II. INGENIERIA INFORMATICA, 3 ER Curso

Econometría II Grado en finanzas y contabilidad

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón

ESTADISTICA II. INGENIERIA INFORMATICA, 3 ER Curso Septiembre Primera Parte

Contrastes de hipótesis. 1: Ideas generales

Análisis de Estructuras Espaciales Persistentes. Desempleo Departamental en Argentina.

Tema 8: Contraste de hipótesis

CONTRASTE DE HIPÓTESIS

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

Contrastes de Hipótesis paramétricos y no-paramétricos.

478 Índice alfabético

UNIVERSIDAD TECNICA PARTICULAR DE LOJA ESTADISTICA Y PROBABILIDAD ENSAYO N 8

Conceptos del contraste de hipótesis

Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR

Proyecto Tema 8: Tests de hipótesis. Resumen teórico

Departamento de Matemática Aplicada a las T.I.C. SOLUCIONES

Muestreo de variables aleatorias

Contrastes de hipótesis paramétricos

Nombre y Apellidos:... EXAMEN ECONOMETRÍA II (Enero 2010)

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

Guía docente MÉTODOS ESTADÍSTICOS PARA LA EMPRESA

ANÁLISIS DE LA VARIANZA CON UN FACTOR (ANOVA)

T2. El modelo lineal simple

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR

ECONOMETRÍA II Prof.: Begoña Álvarez TEMA 1 INTRODUCCIÓN. Estimación por máxima verosimilitud y conceptos de teoría asintótica

ESTADÍSTICA. Tema 4 Regresión lineal simple

Universidad de Chile DIPLOMA PREPARACIÓN Y EVALUACIÓN SOCIAL DE PROYECTOS Prof: Sara Arancibia

Definición Una hipótesis es una afirmación acerca de un parámetro.

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

Tema 5. Muestreo y distribuciones muestrales

Tema 13 : Intervalos de probabilidad y confianza. Hipótesis y decisiones estadísticas.

Máster en comunicaciones. Clase 2. Modelos predictores.

Teorema Central del Límite (1)

Preparación de los datos de entrada

Métodos Estadísticos de la Ingeniería Tema 11: Contrastes de Hipótesis Grupo B

DIFERENCIAS EN LA UTILIZACIÓN DE LA BIBLIOTECA DEL IIESCA ANTE UN CAMBIO DE INFORMACIÓN

MODELO DE RESPUESTAS Objetivos 2, 3, 4, 5, 6, 7, Y 8.

ÍNDICE CAPÍTULO 1. INTRODUCCIÓN

INFERENCIA ESTADÍSTICA: CONTRASTES DE HIPÓTESIS

Tema 9: Contraste de hipótesis.

Tema 5. Contraste de hipótesis (I)

ESTADISTICA II. INGENIERIA INFORMATICA, 3 ER Curso

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo

Pruebas de hipótesis

Se permite un folio escrito por las dos caras. Cada problema se realiza en hojas diferentes y se entregan por separado.

Práctica 5 ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS

Contrastes de hipótesis estadísticas. Contrastes paramétricos

Contraste de hipótesis Tema Pasos del contraste de hipótesis. 1.1 Hipótesis estadísticas: nula y alternativa. 1.3 Estadístico de contraste

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica

INDICE. Prólogo a la Segunda Edición

Objetivos. Epígrafes 3-1. Francisco José García Álvarez

EJERCICIOS DE SELECTIVIDAD

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico

1. La Distribución Normal

Econometría III Examen. 29 de Marzo de 2012

Tema 7: Estadística y probabilidad

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

Análisis de la varianza

ESTADISTICA II INGENIERIA INFORMATICA, 3 ER Curso

Estadística I Tema 7: Estimación por intervalos

Ejemplos Resueltos Tema 4

VARIABLES ESTADÍSTICAS BIDIMENSIONALES

A. PRUEBAS DE BONDAD DE AJUSTE: B.TABLAS DE CONTINGENCIA. Chi cuadrado Metodo G de Fisher Kolmogorov-Smirnov Lilliefords

Teoría de la decisión

Podemos definir un contraste de hipótesis como un procedimiento que se basa en lo observado en las muestras y en la teoría de la probabilidad para

Econometría de series de tiempo aplicada a macroeconomía y finanzas

Transformaciones de variables

viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos

Estadísticos Descriptivos

1) Características del diseño en un estudio de cohortes.

Introducción a la Estadística Aplicada en la Química

DISTRIBUCIONES BIDIMENSIONALES

APUNTES DE QUIMIOMETRIA REGRESIO LINEAL

Econometría Universidad Carlos III de Madrid Soluciones Examen Final 27 de Mayo de 2013

= P (Z ) - P (Z ) = P (Z 1 25) P (Z -1 25)= P (Z 1 25) [P (Z 1 25)] = P (Z 1 25) [1- P (Z 1 25)] =

Test ANOVA. Prof. Jose Jacobo Zubcoff 1 ANOVA ANOVA. H 0 : No existen diferencias entre los k niveles H 1 : La hipótesis nula no es cierta

1. Ejercicios. 2 a parte

ANOVA. Análisis de la Varianza. Univariante Efectos fijos Muestras independientes

Estadística Descriptiva II: Relación entre variables

PROGRAMA DE ESTADÍSTICA DESCRIPTIVA

Tema 4: Probabilidad y Teoría de Muestras

Qué hacemos cuando la distribución no es normal? Qué significa ser normal? Qué significa ser normal? 1er. Simposio Metodología Seis Sigma

ANÁLISIS EN EL DOMINIO DEL TIEMPO

Departamento de Estadística y Econometría. Curso EJERCICIOS DE ESTADÍSTICA APLICADA A LA EMPRESA II. L.A.D.E. TEMA 2

Repaso Estadística Descriptiva

Fiabilidad y variabilidad

Problemas deestadísticaii Cuaderno II: Regresión Multiple

Modelo Econométrico sobre el Turismo

INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos

PRUEBA DE HIPÓTESIS BENJAMIN MAMANI CONDORI

INFERENCIA ESTADISTICA

Técnicas de Investigación Social

Bioestadística. El resultado de un experimento aleatorio puede ser descrito en ocasiones como una cantidad numérica.

Índice general. Pág. N. 1. Capítulo 1 ETAPAS DE UNA INVESTIGACIÓN. Diseño. Población. Muestra. Individuo (Observación, Caso, Sujeto) Variables

1. Objetivos. Introducción 2. ANOVA. Tema 8: Relaciones entre variables Test de hipótesis para el ANOVA. M. Iniesta Universidad de Murcia

INDICE Capítulo I: Conceptos Básicos Capitulo II: Estadística Descriptiva del Proceso

Pruebas de Hipótesis Multiples

Técnicas de regresión: Regresión Lineal Simple

Transcripción:

Conceptos básicos de inferencia estadística (IV): Inferencia no paramétrica: Contrastes de aleatoriedad. Tema 1 (IV) Estadística 2 Curso 08/09 Tema 1 (IV) (Estadística 2) Contrastes de aleatoriedad Curso 08/09 1 / 16

Introducción Contrastes de aleatoriedad Introducción Los métodos ("clásicos") de inferencia estadística se basan en: X 1,..., X n m.a.s.de X Por tanto suponen que X 1,..., X n son independientes. La ausencia de aleatoriedad es difícil de corregir y puede in uir notablemente en el análisis estadístico Si existe dependencia entre las observaciones muestrales (i.e. el conocimiento de X i proporciona información sobre los valores de X i+1, X i+2,... ) los métodos estudiados no son válidos (pueden conducir a conclusiones erróneas). Tema 1 (IV) (Estadística 2) Contrastes de aleatoriedad Curso 08/09 2 / 16

Contrastes de aleatoriedad Introducción Esto es debido principalmente a que introduce un sesgo en los estimadores de las varianzas (obtenidos bajo independencia) Por tanto, los correspondientes intervalos de con anza y contrastes de hipótesis tendrán una con anza o una potencia distinta de la que deberían. Si X 1 y X 2 son independientes (Cov(X 1, X 2 ) = 0): Var(X 1 + X 2 ) = Var(X 1 ) + Var(X 2 ) En el caso general (dependencia): Var(X 1 + X 2 ) = Var(X 1 ) + Var(X 2 ) + 2Cov(X 1, X 2 ) Típicamente Cov(X 1, X 2 ) > 0 por lo que con los métodos "clásicos" (basados en independencia) se suelen producir subestimaciones de las varianzas (IC más estrechos y tendencia a rechazar H 0 en contrastes). Tema 1 (IV) (Estadística 2) Contrastes de aleatoriedad Curso 08/09 3 / 16

Contrastes de aleatoriedad Introducción Métodos para detectar dependencia Sería de esperar que datos cercanos en el tiempo (o en el espacio) sean más parecidos (dependientes) que datos más alejados ) dependencia temporal (espacial, espacio-temporal). Métodos para detectar dependencia temporal: Grá cos: Dispersión de variable frente a índice (tiempo) f(i, X i )g n i =1 Dispersión f(x i, X i +1 )g n i =1 1 Correlograma Contrastes: Tests basados en rachas Test de Ljung-Box Tema 1 (IV) (Estadística 2) Contrastes de aleatoriedad Curso 08/09 4 / 16

Grá co secuencial Métodos grá cos Grá co secuencial El grá co de dispersión f(i, X i )g n i=1 permite detectar la presencia de una dependencia temporal. Es importante mantener/guardar el orden de recogida de los datos. Si existe una tendencia los datos no son homogéneos (debería tenerse en cuenta la variable índice, o tiempo, como variable explicativa). Podría indicar la presencia de un "efecto aprendizaje". Independencia Tendencia (lineal) Tema 1 (IV) (Estadística 2) Contrastes de aleatoriedad Curso 08/09 5 / 16

Métodos grá cos Grá co secuencial Valores próximos muy parecidos (valores grandes seguidos de grandes y viceversa) indicarían una posible dependencia positiva. Valores próximos dispares (valores grandes seguidos de pequeños y viceversa) indicarían una posible dependencia negativa. Dependencia positiva Dependencia negativa Tema 1 (IV) (Estadística 2) Contrastes de aleatoriedad Curso 08/09 6 / 16

Métodos grá cos Grá co de dispersion retardado Grá co de dispersion retardado El grá co de dispersión f(x i, X i+1 )g n i=1 1 permite detectar dependencias a un retardo (relaciones entre valores separados por un instante) Independencia X i+1 X i Tema 1 (IV) (Estadística 2) Contrastes de aleatoriedad Curso 08/09 7 / 16

Métodos grá cos Grá co de dispersion retardado Dependencia positiva Dependencia negativa X i+1 X i+1 X i X i Se puede generalizar al grá co f(x i, X i+k )g que permite detectar dependencias a k retardos (separadas k instantes). Tema 1 (IV) (Estadística 2) Contrastes de aleatoriedad Curso 08/09 8 / 16

El correlograma Métodos grá cos El correlograma Para estudiar si el grado de relación (lineal) entre X i y X i+k podemos utilizar el coe ciente de correlación: ρ (X i, X i+k ) = Cov (X i, X i+k ) σ (X i ) σ (X i+k ) En el caso de datos homogéneos (estacionarios): ρ (X i, X i+k ) ρ (k) denominada función de autocorrelación simple (fas) o correlograma. Su estimador es el correlograma muestral: k r(k) = n i=1 (X i X )(X i+k X ) n i=1(x i X ) 2 Tema 1 (IV) (Estadística 2) Contrastes de aleatoriedad Curso 08/09 9 / 16

Métodos grá cos El correlograma En caso de independencia es de esperar que las autocorrelaciones muestrales sean próximas a cero (valores "grandes" indicarían dependencia positiva o negativa según el signo). Suponiendo normalidad e independencia, asintóticamente: r(k) N ρ(k), 1 aprox. n Si el tamaño muestral es grande, podríamos aceptar H 0 : ρ (k) = 0 si: jr(k)j < 2 p n En el grá co de autocorrelaciones muestrales (también denominado correlograma) se representan las estimaciones r(k) de las autocorrelaciones correspondientes a los primeros retardos (típicamente k < n/4) y las correspondientes bandas de con anza (para detectar dependencias signi cativas). Tema 1 (IV) (Estadística 2) Contrastes de aleatoriedad Curso 08/09 10 / 16

ACF est. ACF est. Métodos grá cos El correlograma ACF est. Independencia 1,0,5 0,0,5 1,0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Dependencia positiva Retardo Dependencia negativa 1,0 1,0,5,5 0,0 0,0,5,5 1,0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1,0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Retardo Retardo Tema 1 (IV) (Estadística 2) Contrastes de aleatoriedad Curso 08/09 11 / 16

Test de rachas Contrastes de hipótesis Test de rachas Permite contrastar si el orden de aparición de dos valores de una variable dicotómica es aleatorio. Supongamos que X toma los valores + y Observamos una muestra del tipo: + + + + + + + + + + + + + y nos interesa contrastar: H0 : La muestra es aleatoria H 1 : La muestra no es aleatoria Una racha es una secuencia de observaciones iguales (o similares): + + {z ++ } 1 {z } 2 + {z + + } 3 {z} 4 + + + {z + ++ } 5 {z } 6 Tema 1 (IV) (Estadística 2) Contrastes de aleatoriedad Curso 08/09 12 / 16

Contrastes de hipótesis Test de rachas Una muestra con muchas o pocas rachas sugeriría que la muestra no es aleatoria (con dependencia negativa o positiva, respec.). Estadístico del contraste: R = "N o total de rachas en la muestra" Bajo la hipótesis nula de aleatoriedad: R N 1 + 2n 1n 2, 2n 1n 2 (2n 1 n 2 n) aprox. n n 2 (n 1) siendo: n 1 = n o de signos + en la muestra n 2 = n o de signos (n 1 + n 2 = n) Para tamaños muéstrales pequeños (n < 40), la aproximación anterior no es buena y conviene utilizar la distribución exacta (o utilizar corrección por continuidad). Los valores críticos de esta distribución están tabulados. Tema 1 (IV) (Estadística 2) Contrastes de aleatoriedad Curso 08/09 13 / 16

Contrastes de hipótesis Test de rachas Este contraste se emplea también para variables continuas, se ja un punto de corte para dicotomizarlas. Normalmente se toma como punto de corte la mediana. En este caso si k = n 1 (' n 2 ) y (si n ' 2k > 40): k(k 1) R N k + 1, aprox. 2k 1 Se rechaza la hipótesis nula de aleatoriedad si el número de rachas es signi cativamente pequeño o grande. Si el tamaño muestral es grande, el p-valor será:! R E (R) p ' 2 P Z p Var(R) Tema 1 (IV) (Estadística 2) Contrastes de aleatoriedad Curso 08/09 14 / 16

Contrastes de hipótesis Ejemplo test de rachas Ejemplo (problema 2.4) X = "tiempo de funcionamiento (en cientos de horas) de cierto tipo de impresoras antes de la primera avería" Se ha observado una muestra de diez impresoras (orden fabricación): 16.16 18.39 1.69 4.70 3.68 2.99 3.03 9.72 15.87 7.32 Contrastar la aleatoriedad de la muestra. 1 Se calcula la mediana = 4.70+7.32 2 = 6.01 2 Se obtienen las rachas: 16.16 18.39 1.69 4.70 3.68 2.99 3.03 9.72 15.87 7.32 + + - - - - - + + + 3 n 1 = n 2 = 5 y R = 3 4 p valor = 2 0.04 ) se acepta (con poca "seguridad") la aleatoriedad Tema 1 (IV) (Estadística 2) Contrastes de aleatoriedad Curso 08/09 15 / 16

Contrastes de hipótesis El contraste de Ljung-Box El contraste de Ljung-Box Test muy utilizado (en series de tiempo) para contrastar la hipótesis de independencia. Se contrasta la hipótesis nula de que las primeras m autocorrelaciones son cero: H0 : ρ 1 = ρ 2 =... = ρ m = 0 H 1 : ρ i 6= 0 para algún i Se elige un m tal que la estimación r(m) de ρ m = ρ(m) sea " able". El estadístico del contraste: Q = n(n + 2) m k=1 r(k) 2 n k aprox. χ2 m 1, si H 0 es cierta. Se rechaza H 0 si el valor observado es grande (Q χ 2 m 1,1 α ): p = P χ 2 m 1 Q Tema 1 (IV) (Estadística 2) Contrastes de aleatoriedad Curso 08/09 16 / 16