CONCEPTOS FUNDAMENTALES



Documentos relacionados
TEMA 4: CONTRASTES DE HIPÓTESIS. CONCEPTOS BÁSICOS

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN

Técnicas Cuantitativas para el Management y los Negocios I

Estadística II Tema 2. Conceptos básicos en el contraste de. Curso 2010/11

Tema 2. Contraste de hipótesis en una población

Contrastes de hipótesis paramétricos

Estadística Avanzada y Análisis de Datos

Técnicas de validación estadística Bondad de ajuste

Test de Kolmogorov-Smirnov

CONTRASTE DE HIPÓTESIS

Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR

Estadística Inferencial. Sesión 5. Prueba de hipótesis

Técnicas de validación estadística Bondad de ajuste

CONTRASTE DE HIPÓTESIS

ANÁLISIS CUANTITATIVO DE DATOS EN CIENCIAS SOCIALES CON EL SPSS (I) Tablas de contingencia y pruebas de asociación

Técnicas de Inferencia Estadística II. Tema 3. Contrastes de bondad de ajuste

Prueba de hipótesis. 1. Considerando lo anterior específica: a. La variable de estudio: b. La población: c. El parámetro. d. Estimador puntual:

PRUEBAS PARA DOS MUESTRAS RELACIONADAS

Problemas resueltos. Temas 10 y 11 11, 9, 12, 17, 8, 11, 9, 4, 5, 9, 14, 9, 17, 24, 19, 10, 17, 17, 8, 23, 8, 6, 14, 16, 6, 7, 15, 20, 14, 15.

ESTIMACIÓN Y PRUEBA DE HIPÓTESIS INTERVALOS DE CONFIANZA

Análisis estadístico básico (I) Magdalena Cladera Munar Departament d Economia Aplicada Universitat de les Illes Balears

Econometria. 4. Modelo de Regresión Lineal Simple: Inferencia. Prof. Ma. Isabel Santana

Problemas resueltos. Tema 12. 2º La hipótesis alternativa será que la distribución no es uniforme.

PLAN DE TRABAJO 9 Período 3/09/07 al 28/09/07

Muestreo y estimación: problemas resueltos

Apuntes de Métodos Estadísticos I

Tema Correlación. Correlación. Introducción

Tema 9: Contraste de hipótesis.

Unidad Temática 5 Estimación de parámetros: medias, varianzas y proporciones

Teoría de la decisión Estadística

Tema 7. Contrastes de Hipótesis

6. ESTIMACIÓN DE PARÁMETROS

ESTADÍSTICA INFERENCIAL

Estadistica II Tema 1. Inferencia sobre una población. Curso 2009/10

Tema 8: Contrastes de hipótesis

Objetivos. 1. Intervalos de Conanza y test de hipótesis. Tema 7: Intervalos de Conanza y Contrastes de Hipótesis

Tema 6: Introducción a la inferencia estadística Parte 1

Estadística II Tema 3. Comparación de dos poblaciones. Curso 2010/11

ESTADÍSTICA I Tema 5: Contraste de hipótesis

Técnicas de Inferencia Estadística II. Tema 1. Contrastes de hipótesis

Verificación de hipótesis paramétricas

Tema 14: Inferencia estadística

Tema 11: Intervalos de confianza.

TEMA 5 Inferencia no paramétrica. Guía docente:

Técnicas de Inferencia Estadística II. Tema 1. Contrastes de hipótesis

1. Límites normales de tolerancia: estos límites asumen que los datos son una muestra aleatoria de una distribución normal.

Contraste de Hipótesis

ESTIMACIONES INTERVALOS DE CONFIANZA CON VARIANZA DIFERENTE LI. MIGUEL CANO

1) Características del diseño en un estudio de casos y controles.

ESTIMACIONES INTERVALOS DE CONFIANZA CON VARIANZA DIFERENTE LI. MIGUEL CANO

Teorema Central del Límite (1)

Estadística Inferencial. Sesión No. 8 Pruebas de hipótesis para varianza.

Estadística Inferencia Estadística

Pruebas de bondad de ajuste

Tema 5. Contraste de hipótesis (I)

TEMA Nº 2 CONTRASTE DE HIPÓTESIS EN LOS DISEÑOS DE UNA MUESTRA

Métodos Estadísticos de la Ingeniería Tema 11: Contrastes de Hipótesis Grupo B

Inferencia de información

REVISION DE CONCEPTOS BÁSICOS

Tests de Hipótesis basados en una muestra. ESTADÍSTICA (Q) 5. TESTS DE HIPÓTESIS PARA LA MEDIA DE UNA POBLACIÓN NORMAL CON VARIANZA CONOCIDA

Estadística II Examen Final - Enero Responda a los siguientes ejercicios en los cuadernillos de la Universidad.

ESTADISTICA APLICADA: PROGRAMA

Variable Aleatoria. Relación de problemas 6

Estimación por intervalos

Tema 5. Muestreo y distribuciones muestrales

Juan Carlos Colonia PRUEBA DE HIPÓTESIS

ÍNDICE CAPITULO UNO CAPITULO DOS. Pág.

ESTADISTICA INFERENCIAL

CUESTIONES TEÓRICAS ESTADÍSTICA

Contrastes de hipótesis. 1: Ideas generales

3. Análisis univariable y bivariable

BLOQUE III: INFERENCIA ESTADISTICA. X, variable aleatoria de interés sobre una determinada población

Técnicas de Inferencia Estadística II. Tema 1. Introducción a los contrastes de

Tema 1. Modelo de diseño de experimentos (un factor)

Estadística II Tema 4. Regresión lineal simple. Curso 2010/11

Tema 5.5: Contrastes de hipótesis

PROBABILIDAD Y ESTADÍSTICA. Sesión 5 (En esta sesión abracamos hasta tema 5.8)

Diseño de experimentos - prueba de hipótesis.

EJERCICIOS RESUELTOS. TOMA DE DECISIONES EN ESTADISTICA.

Pruebas de Bondad de Ajuste

Tema II. Las muestras y la teoría paramétrica

Tema 6: Contraste de hipótesis

Tema 7. Contrastes no paramétricos en una población

Pruebas de Hipótesis

Muestreo y Distribuciones muestrales. 51 SOLUCIONES

Introducción a la estadística básica, el diseño de experimentos y la regresión

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo

Contrastes de hipótesis estadísticas. Contrastes paramétricos

Prácticas de inferencia y muestreo.

UNIVERSIDAD CENTRAL DE VENEZUELA FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES ESCUELA DE SOCIOLOGÍA DEPARTAMENTO DE ESTADÍSTICA INFERENCIA ESTADÍSTICA

Tema 8: Contraste de hipótesis

ECONOMETRÍA I. Tema 4: El Modelo de Regresión Lineal Múltiple: inferencia y validación

Matemáticas aplicadas a las Ciencias Sociales II

Transcripción:

TEMA 8: CONTRASTES DE HIPÓTESIS PARAMÉTRICAS PRIMERA PARTE: Conceptos fundamentales 8.1. Hipótesis estadística. Tipos de hipótesis 8.2. Región crítica y región de aceptación 8.3. Errores tipo I y tipo II 8.4. Test uniformemente más potentes. Metodología de Neyman-Pearson 8.5. Concepto de p-valor: cálculo e interpretación 8.6. Etapas en la realización de un contraste SEGUNDA PARTE: Contrastes para variables Normales y para proporciones 8.7. Contrastes en una población Normal 8.8. Contrastes en dos poblaciones Normales MUESTRAS INDEPENDIENTES: Contrastes de igualdad de medias Contraste de igualdad de varianzas MUESTRAS PAREADAS : Contraste de igualdad de medias 8.9. Contrastes de proporciones 2 PRIMERA PARTE: CONCEPTOS FUNDAMENTALES 3

8.1. HIPÓTESIS ESTADÍSTICA. TIPOS DE HIPÓTESIS Hipótesis estadística: afirmación sobre la distribución que genera los datos o sobre alguna característica concreta de dicha distribución. En inferencia paramétrica: Modelo paramétrico: X F(x;) las hipótesis son afirmaciones sobre un(os) parámetro(s) desconocido(s),, del modelo Ejemplo 1: el partido A no obtendrá mayoría absoluta en las elecciones del 2N X= 1 si gana A p si no gana A 1 p Ejemplo 2: una moneda es perfecta X= 1 si sale cara p si sale cruz 1 p b(p) hipótesis: p.5 b(p) hipótesis: p=.5 Ejemplo 3: hay discriminación salarial entre hombres y mujeres X 1 =log(salario hombres) N( 1, 1 ) X 2 =log(salario mujeres) N( 2, 2 ) hipótesis: 1 2 4 En inferencia no paramétrica (Tema 9): no se supone a priori un modelo paramétrico, sino que se contrastan hipótesis más generales. Ejemplo 3: hay discriminación salarial entre hombres y mujeres X 1 =salario hombres F 1 (x) X 2 =salario mujeres F 2 (x) Hipótesis: F 1 F 2 Hipótesis simple: asigna valores puntuales concretos a todos los parámetros del modelo Bajo dicha hipótesis, la distribución queda totalmente especificada. Ejemplo 2: Xb(p) hipótesis: p=.5 Hipótesis compuesta: asigna un rango de valores a los parámetros Ejemplo 1: Xb(p) hipótesis: p.5 Ejemplo 3: X 1 =log(salario hombres) N( 1, 1 ) hipótesis: X 2 =log(salario mujeres) N( 2, 2 ) 1 2 Ejemplo 4: XN(,) hipótesis: =2 (realmente es: =2, > compuesta!) 5

Hipótesis nula H : hipótesis que se somete a prueba y se matendrá como cierta a menos que los datos muestren suficiente evidencia en su contra. (En general, H corresponde al modelo más sencillo: incluye el =) Hipótesis alternativa H 1 : posibles alternativas a la hipótesis nula TIPOS DE CONTRASTES H : H : H : = H 1 : > H 1 : < H 1 : Unilateral derecha Unilateral izqa. Bilateral Contrastes de una cola Contraste de dos colas 6 8.2. REGIÓN CRÍTICA Y REGIÓN DE ACEPTACIÓN Una vez definidas las hipótesis, realizar el contraste consiste en : Decidir si la hipótesis nula está sustentada por la evidencia empírica que proporcionan los datos de una muestra aleatoria (X 1,...,X n ). Analizar el grado de discrepancia entre los datos (observados) y la hipótesis nula (postulada) La decisión se basa en un estadístico de contraste =T(X 1,...,X n ). Ejemplo 5: Una moneda es perfecta (p=.5) o tiene p=p(cara)>.5? H : p=.5 H 1 : p>.5 Estadístico de contraste: pˆ =X.75 Rechazo si X.75 7

Región crítica=c={valores muestrales que conllevan rechazar H } Valor(es) crítico(s)= valor(es) a partir del (de los) cual(es) se rechaza H Ejemplo 5: (continuación) Rechazo H si la proporción de caras en la muestra es mayor que.75, por qué? Porque observar una proporción de caras superior al 75% sería harto improbable si H fuera cierta (moneda perfecta) los datos no sustentan H, por eso rechazo H Región aceptación=a= ={valores muestrales que conllevan no rechazar H } Ejemplo5: (continuación) Muestra concreta: n=3, x =.3 <.75 No rechazo H OBSERVACIÓN: No rechazar H no implica que H sea cierta (no se demuestra que H sea cierta) sino que no hay evidencia suficiente en los datos muestrales para rechazarla. Rechazar H no significa que H sea falsa, sino que resulta muy difícil creer que se haya podido observar algo tan improbable bajo H. 8 8.3. ERRORES TIPO I Y TIPO II Qué consecuencias puede conllevar la regla de decisión establecida? Cuál es el coste de equivocarse tomando una decisión errónea? Estado de la naturaleza Decisión H es cierta H es falsa Aceptar H correcto Error tipo II Rechazar H Error tipo I correcto α() = p(error tipo I) = p(rechazar H /H cierta) = () = p(error tipo II) = p( Aceptar H /H falsa) = Potencia= p(rechazar H /H falsa) = = 9

Objetivo minimizar p(error tipo I) minimizar p(error tipo II) Para una muestra de tamaño n dada, IMPOSIBLE! Veamos un ejemplo con HIPÓTESIS SIMPLES H : = H 1 : = 1 En este caso: p(error tipo I) = p(rechazar H /H cierta) = = α un único valor! p(error tipo II) = p( Aceptar H /H falsa) = = un único valor! 1 Ejemplo 6: (X 1,...,X 16 ) m.a.s. de una distribución N(,5) H : =1 H 1 : =15 Estimador máximo verosímil de ˆ =X Intuitivamente: región crítica en la dirección de la alternativa C= { X } Fijamos =.1 Determinar para que = p (C) =.1 H.1 = p (C) = p ( ) H 1 X = = p X 1 1 1 5/ 16 5/ 16 = X 1 p 1 z 1.25 Tablas: z =1.28 Bajo H :=1 X N(1, 5/ 16 ) X 1 1.25 H N(,1).9.1 z Región crítica X 1 Rechazar H cuando: 1.25 1.28 X 11.6 11

X 15 11,6 15 = p(error tipo II) = p H 1 (C) = p 15( X 11, 6) = 15 1.25 1.25 p =(-2.72)=.33 =.33 H H 1 =.1 =1 =15 =11,6 R. Aceptación Región crítica Si =p(error tipo I) disminuye aumenta = p(error tipo II) (y viceversa) =.465 H H 1 =.1 =1 =15 =12,9 R. Aceptación Región crítica 12 8.4. METODOLOGÍA CLÁSICA DE NEYMAN-PEARSON Dado H, fijar el tamaño máximo tolerable de p(error tipo I)=, que llamaremos nivel de significación : Valores habituales: ={.1,.5,.1} Entre todos las posibles regiones críticas de nivel, elegir la que: minimice p(error tipo II) maximice {1-p(Error tipo II)} maximice la potencia Región crítica del test uniformemente más potente (T.U.M.P.) Cómo obtenerla? 13

HIPÓTESIS SIMPLES: H : = H 1 : = 1 La región crítica del test más potente, entre todos los de nivel, es: L( x1,..., xn; ) C = ( x 1,..., xn ) / k, con p (C ) =. L( x1,..., xn; 1) H HIPÓTESIS COMPUESTAS H : H 1 : 1 Si la región crítica C definida previamente para las hipótesis simples: (a) No depende del valor concreto de especificado en la hipótesis alternativa (b) Mantiene el mismo nivel de significación al ampliar H, es decir: max p(c) C es la región crítica del T.U.M.P. para las hipótesis compuestas ATENCIÓN: no siempre existe región crítica U.M.P.!, pero cuando existe coincide con lo razonable : región crítica en el sentido de la alternativa 14 Ejemplo 6: (continuación) Qué ocurriría si las HIPÓTESIS fueran COMPUESTAS? Por ejemplo: H : =1 H 1 : >1 X 1 Región crítica de nivel α=.1 C ={ 1.25 1.28}={X 11.6} con p =1 (C)=α=.1 H : 1 H 1 : >1 p(error tipo I) = = { p =1 (C)} = α =.1; (ver dibujo) La máxima probabilidad de Error tipo I que se comete es α: H : =1 H : 1 H 1 : >1 H 1 : >1 15

RELACIÓN ENTRE CONTRASTES E INTERVALOS DE CONFIANZA Contrastar las hipótesis H := H 1 : con un nivel de significación EQUIVALE A: Construir un intervalo de confianza para, con nivel de confianza 1-, y: rechazar H si no está en dicho intervalo. 16 8.5. CONCEPTO DE P-VALOR: CÁLCULO E INTERPRETACIÓN Limitaciones de la selección del nivel de significación: Ejemplo 6: (continuación) Estadístico: Z*= H : =1 H 1 : =15 X 1 1.25 H X 1 N(,1) Si =.1 Rechazo H si Z*= 1.25 1.28 a) Si x obs =15 z obs = 15 1.25 1 =4 1.28 Rechazo H al 1% (z obs significativo al 1%) 12.5 1 b) Si x obs =12.5 z obs = 1.25 =2 1.28 Rechazo H al 1% (z obs significativo al 1%) Misma decisión, pero poseen las dos muestras la misma evidencia contra H? 17

El p-valor se define, para una muestra concreta, como la probabilidad de observar, bajo H, un valor del estadístico de contraste igual o más extremo (en la dirección de la alternativa) que el observado en la muestra probabilidad de obtener más discrepancia con H que la obtenida con la muestra Cuanto menor el p-valor más extremo el resultado muestral más evidencia contra H Ejemplo 6: (continuación) a) x obs =15 z obs =4 p-valor = p(z* z obs ) = p(n(,1) 4) =.3 Obtener el valor observado, z obs, o alguno mayor es casi imposible bajo la hipótesis nula rechazo H (no creo que H haya generado mis datos). b) x obs =12.5 z obs =2 p-valor = p(z* z obs ) = p(n(,1) 2) =,228 El valor observado tiene una probabilidad de aparecer muy pequeña si H es cierta, pero no es tan improbable como antes rechazo H pero con menos garantías. 18 p-valor muy pequeño sería muy improbable observar lo observado si H hubiera generado mis datos los datos proporcionan evidencia suficiente en contra de H rechazo H p-valor grande nuestros datos no proporcionan evidencia suficiente en contra de H (es probable que H haya generado mis datos) y no rechazo. Alternativa unilateral izquierda Alternativa unilateral derecha Alternativa bilateral z obs z obs -z obs z obs 19

RELACIÓN ENTRE nivel de significación y p-valor Qué ocurriría en el ejemplo anterior si el nivel de significación fuera =.1? X 1 El valor crítico sería z α =2.33 rechazaríamos H si Z*= 1.25 2.33 Si x obs =12.5 z obs =2 < 2.33 No rechazo al 1% (Si rechazaba al 1%) =.1 p-valor=.218 1- =.1 1.28 2 2.33 Rechazo H al 1% Rechazo H al 1% Rechazamos H para niveles p-valor No rechazamos H para niveles < p-valor p-valor = menor nivel de significación al que se rechaza H 2 8.6. ETAPAS EN LA REALIZACIÓN DE UN CONTRASTE 1. Describir el modelo y formular la hipótesis nula y la alternativa 2. Definir un estadístico de contraste que cuantifique la discrepancia entre los datos y la hipótesis nula, y cuya distribución sea conocida bajo H 3. Definir la región crítica: Qué valores del estadístico de contraste rechazan H? 4. Determinar el valor crítico para un nivel de significación α dado 5. Tomar los datos y calcular el valor del estadístico de contraste 4.' Tomar los datos y calcular el valor del estadístico de contraste 5.' Calcular el p-valor 6. Tomar la decisión de rechazar o no H 21