Técnicas de Inferencia Estadística II. Tema 1. Introducción a los contrastes de

Documentos relacionados
Contraste de hipótesis Tema Pasos del contraste de hipótesis. 1.1 Hipótesis estadísticas: nula y alternativa. 1.3 Estadístico de contraste

Contrastes de hipótesis paramétricos

Teorema Central del Límite (1)

Tema 5. Contraste de hipótesis (I)

INFERENCIA ESTADISTICA

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo

Estadística II Tema 2. Conceptos básicos en el contraste de. Curso 2010/11

Curso de Estadística Aplicada a las Ciencias Sociales. Tema 12. Contraste de hipótesis. Introducción. Introducción

para una muestra Ref: Apuntes de Estadística, Mtra Leticia de la Torre Instituto Tecnológico de Chiuhuahua

Objetivos del tema. Qué es una hipótesis? Test de Hipótesis Introducción a la Probabilidad y Estadística. Contrastando una hipótesis

Tabla de Test de Hipótesis ( Caso: Una muestra ) A. Test para µ con σ 2 conocida: Suponga que X 1, X 2,, X n, es una m.a.(n) desde N( µ, σ 2 )

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS

Tema 5: Introducción a la inferencia estadística

EJERCICIOS DE SELECTIVIDAD

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E

CONCEPTOS FUNDAMENTALES

= P (Z ) - P (Z ) = P (Z 1 25) P (Z -1 25)= P (Z 1 25) [P (Z 1 25)] = P (Z 1 25) [1- P (Z 1 25)] =

EJERCICIOS. Curso: Estadística. Profesores: Mauro Gutierrez Martinez Christiam Miguel Gonzales Chávez. Cecilia Milagros Rosas Meneses

INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M.

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

CONTRASTES DE HIPÓTESIS PARAMÉTRICOS. La estadística en cómic (L. Gonick y W. Smith)

TEMA 3: Contrastes de Hipótesis en el MRL

EJERCICIOS RESUELTOS DE ESTADÍSTICA II

INFERENCIA ESTADÍSTICA. Metodología de Investigación. Tesifón Parrón

TEMA 4: CONTRASTES DE HIPÓTESIS. CONCEPTOS BÁSICOS

ESTADISTICA GENERAL. INFERENCIA ESTADISTICA Profesor: Celso Celso Gonzales

Pruebas de Hipótesis Multiples

TAMAÑO DE MUESTRA EN LA ESTIMACIÓN DE LA MEDIA DE UNA POBLACIÓN

OPCIÓN A. La empresa A (x) tiene 30 trabajadores, la B (y) 20 trabajadores y la C (z) 13 trabajadores.

Este procedimiento prueba hipótesis acerca de cualquiera de los siguientes parámetros:

Tema 4: Probabilidad y Teoría de Muestras

Germán Jesús Rubio Luna Catedrático de Matemáticas del IES Francisco Ayala

Técnicas de Inferencia Estadística II. Tema 3. Contrastes de bondad de ajuste

JUNIO Encuentra, si existen, matrices cuadradas A, de orden 2, distintas de la matriz identidad, tales que: A

ESTIMACIÓN PUNTUAL Julián de la Horra Departamento de Matemáticas U.A.M.

EJERCICIOS RESUELTOS DE ESTADÍSTICA II

A. PRUEBAS DE BONDAD DE AJUSTE: B.TABLAS DE CONTINGENCIA. Chi cuadrado Metodo G de Fisher Kolmogorov-Smirnov Lilliefords

INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)

478 Índice alfabético

a. N(19 5, 1 2) P(19 X 21) = P( Z ) = = P = P P = = P P = P = = = El 55 72% no son adecuados.

Econometría II Grado en finanzas y contabilidad

Técnicas Cuantitativas para el Management y los Negocios I

Distribución Chi (o Ji) cuadrada (χ( 2 )

Intervalos de confianza y contrastes de hipótesis. Intervalo de confianza de la media.

Pruebas de Hipótesis H0 : μ = 6 H1 : μ 6 α = 0.05 zα/2 = 1.96 (6-1,96 0,4 ; 6+1,96 0,4) = (5,22 ; 6,78) 5,6 Aceptamos la hipótesis nula H 0 2.

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

Hipótesis y decisiones

INFERENCIA ESTADÍSTICA

Propuesta A B = M = (

Matemáticas 2.º Bachillerato. Intervalos de confianza. Contraste de hipótesis

2 Introducción a la inferencia estadística Introducción Teoría de conteo Variaciones con repetición...

CAPÍTULO IV TRABAJO DE CAMPO Y PROCESO DE CONTRASTE DE LAS HIPÓTESIS

Ingeniería Técnica Industrial, todas especialidades. Ingeniería Técnica Telecomunicaciones, Telemática Problemas de examenes

ESTRUCTURA DEL EXAMEN DE MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II PARA ALUMNOS DE BACHILLERATO

Inclusión de la igualdad en la hipótesis nula

Tema 6. Estadística Descriptiva e Introducción a la Inferencia Estadística

Tema 4: Probabilidad y Teoría de Muestras

6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE

Tema 5. Muestreo y distribuciones muestrales

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24

TEMA 4 ELABORACIÓN Y COMPROBACIÓN DE LAS HIPÓTESIS DE INVESTIGACIÓN

Objetivos. Epígrafes 3-1. Francisco José García Álvarez

Algunas Distribuciones Continuas de Probabilidad. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

Estadística con. Práctica 5: Intervalos de Conanza. Test de Hipótesis. Objetivo. 1. Intervalos y test (una sola muestra)

2. Análisis de varianza

6. VARIABLES ALEATORIAS

Cómo se hace la Prueba t a mano?

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

La distribución de Probabilidad normal, dada por la ecuación:

INTRODUCCIÓN A LA ECONOMETRÍA (LE Y LADE, mañana) Prof. Magdalena Cladera APLICACIONES DE INFERENCIA ESTADÍSTICA DE EXCEL Y SPSS

ANEXO I. ANÁLISIS DE LA VARIANZA.

Funciones de Regresión No Lineales (SW Cap. 6)

Conceptos Básicos de Inferencia

Variables aleatorias

PRUEBA DE HIPÓTESIS DE UNA MUESTRA PARA PROPORCIONES J UA N J O S É H E R NÁ N D E Z O C A ÑA

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.E.

Estadística Convocatoria de Junio Facultad de Ciencias del Mar. Curso 2009/10 28/06/10

DISTRIBUCIONES BIDIMENSIONALES

Econometría de series de tiempo aplicada a macroeconomía y finanzas

ESTADÍSTICA. Tema 4 Regresión lineal simple

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Examen de Matemáticas Aplicadas a las CC. Sociales II (Coincidente-Junio 2012) Selectividad-Opción A Tiempo: 90 minutos

3. Correlación. Introducción. Diagrama de dispersión

CAPÍTULO 1: ESTADÍSTICA Y MÉTODO CIENTÍFICO.

CAPÍTULO 10 ESTIMACIÓN POR PUNTO Y POR INTERVALO 1.- ESTIMACIÓN PUNTUAL DE LA MEDIA Y DE LA VARIANZA 2.- INTERVALO DE CONFIANZA PARA LA MEDIA

Problemas. Intervalos de Confianza y Contrastes de Hipótesis

Examen de Matemáticas Aplicadas a las CC. Sociales II (Junio 2015) Selectividad-Opción A Tiempo: 90 minutos

RESUMEN DE ALGUNOS CONCEPTOS ESTADÍSTICOS ELEMENTALES Y NOTACIÓN EMPLEADA EN EL CURSO

INFERENCIA DE LA PROPORCIÓN

Variable Aleatoria Continua. Principales Distribuciones

Tema 4. MODELOS DE DISTRIBUCIONES DISCRETOS.

ENUNCIADOS DE PROBLEMAS

1º CURSO BIOESTADÍSTICA

Fundamentos de Estadística

Tema 5 Algunas distribuciones importantes

EJERCICIOS DE ESTADÍSTICA:

Puntuaciones Estándarizadas, Distribución Normal y Aplicaciones. Dra. Noemí L. Ruiz Limardo 2008 Derechos de Autor Reservados, Revisado 2010

TEOREMA DEL LÍMITE CENTRAL

MATERIA: MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II INSTRUCCIONES Y CRITERIOS GENERALES DE CALIFICACIÓN

Transcripción:

Técnicas de Inferencia Estadística II Tema 1. Introducción a los contrastes de hipótesis Conchi Ausín Universidad Carlos III de Madrid Grado en Estadística y Empresa Curso 2015/16

Contenidos 1. Definición de hipótesis estadística y contraste de hipótesis. 2. Hipótesis nula y alternativa. 3. Tipos de contrastes 4. Errores de tipo I y de tipo II y potencia de un contraste 5. Metodología del contraste 6. Nivel crítico o p-valor

Contraste de hipótesis Hipótesis estadística Una hipótesis estadística es una afirmación respecto a una característica de una población. Esta hipótesis puede ser cierta o no. La mejor manera de averiguar si una hipótesis es cierta o no sería examinar toda la población. Como en general esto no es factible, se toma una muestra aleatoria de la población y se realiza un contraste de hipótesis. Contraste o test de hipótesis Un contraste de hipótesis es un procedimiento formal para rechazar o no una hipótesis estadística planteada sobre una población utilizando para ello una muestra de observaciones.

Ejemplo 1.1. Se desea saber si el precio medio por comensal en el Asador Felipe es mayor de los 30 euros que se indica en la Guía del Ocio. Para ello, se toma una muestra del gasto de 10 clientes independientes que hayan comido en este asador en distintos días.

Hipótesis nula y alternativa La hipótesis nula, H 0, es la hipótesis por defecto. H 0 se mantiene a no ser que los datos indiquen su falsedad. H 0 nunca se considera probada. H 0 se rechaza si la muestra de datos proporciona evidencias de que es falsa. H 0 siempre tiene un sólo elemento, por ejemplo, µ = 7. La hipótesis alternativa, H 1, es habitualmente la que el investigador quiere demostrar como cierta. Cuando se rechaza H 0, se admite que H 1 es cierta. Si no se especifica H 1 de manera expĺıcita, se considera definida impĺıcitamente como H 0 es falsa. H 1 nula suele contener más de un elemento, por ejemplo, µ > 7.

Hipótesis nula y alternativa En un contraste de hipótesis no se trata de juzgar cuál de las dos hipótesis, H 0 ó H 1, es más verosímil, sino de decidir si la muestra proporciona o no evidencia suficiente para rechazar H 0. Cuando se rechaza H 0, se admite que H 1 es cierta. Ejemplo 1.2. Se desea saber si el precio medio por comensal en el Asador Felipe es mayor de los 30 euros que se indica en la Guía del Ocio. Para ello, se toma una muestra del gasto de 10 clientes independientes que hayan comido en este asador en distintos días. El objetivo es contrastar: H 0 : µ = 30 H 1 : µ > 30 donde µ es la esperanza de la variable aleatoria, X, que representa el precio de la comida de un cliente tomado al azar en el Asador Felipe.

Tipos de contrastes Una test de hipótesis puede ser: 1. Relativo a una única variable aleatoria, X, de la que se tiene una muestra (X 1, X 2,..., X n). Relativo a más de una variable, por ejemplo: Dos variables independientes, X e Y, de las que se tienen dos muestras (X 1, X 2,..., X n) e (Y 1, Y 2,..., Y m). Una variable bivariante, (X, Y ), de la que se tiene una muestra emparejada: {(X 1, Y 1 ),..., (X n, Y n)}. 2. Paramétrico: Se asume un modelo paramétrico sobre la variable, por ejemplo, se asume que X N(µ, σ 2 ). No paramétrico: No se asume ningún modelo paramétrico sobre la distribución de X.

Ejemplo 1.3. Plantear un test de hipótesis para contrastar si... 1. El precio medio de alquiler un piso de dos habitaciones en un barrio es mayor a los 30 euros mensuales que pide un arrendador. 2. El gasto medio mensual de los clientes de una compañía telefónica es diferente en clientes de tarjeta que de contrato. 3. El gasto medio mensual por familia en comida es que mayor que en ropa y calzado. 4. En unas elecciones municipales, la proporción de votantes a un partido poĺıtico es mayor del 25 %. 5. La distribución de los salarios en un país es diferente para hombres que para mujeres. 6. El ancho de los berberechos de la Ría de Arousa no sigue una distribución normal. 7. El sueldo de los empleados de una empresa depende de la edad.

Errores de tipo I y de tipo II Para cualquier decisión que se tome, hay cuatro posibilidades: H 0 es cierta H 0 es falsa Rechazar H 0 Error tipo I (α) Decisión correcta No rechazar H 0 Decisión correcta Error tipo II (β) Lo ideal sería encontrar un test que hiciese mínima las probabilidades de ambos errores. Sin embargo, esto no es posible ya que la reducción de la probabilidad de un tipo de error hace que aumente la probabilidad del otro tipo de error. Como se considera que el error más grave es el de tipo I, se le impondrá una cota, α, llamada nivel de significación, (normalmente 0.05 ó 0.01): Pr(Rechazar H 0 H 0 cierta) = Pr(Error tipo I) α

Potencia de un contraste La probabilidad de cometer un error de tipo II se denota por: β = Pr(Error tipo II) = Pr(No rechazar H 0 H 0 falsa) La potencia de un contraste es la probabilidad de NO cometer un error de tipo II: Potencia = 1 β = Pr(Rechazar H 0 H 0 falsa) La potencia de un contraste disminuye cuando α disminuye. La potencia de un contraste aumenta cuanto mayor es la diferencia entre H 0 y la realidad. La potencia de un contraste aumenta cuanto mayor es el tamaño de la muestra.

Recapitulando... Un contraste de hipótesis puede rechazar la hipótesis nula. Un contraste de hipótesis no puede probar la hipótesis nula. Si rechazamos H 0, es porque se está razonablemente seguro de que es falsa ya que: Pr(Rechazar H 0 H 0 ) α, y estamos aceptando impĺıcitamente la hipótesis alternativa. Si por el contrario, no rechazamos H 0 debe interpretarse como que las observaciones no han aportado evidencia para descartarla. Se puede tomar α tan pequeña como se quiera, pero esto hará que aumente la probabilidad de error de tipo II y disminuya la potencia del contraste.

Metodología del contraste Es necesario desarrollar una regla de decisión para rechazar H 0. La primera regla consiste en definir una región de rechazo, R, tal que: Si {X 1,..., X n} R, se rechaza H 0. Si {X 1,..., X n} / R, no se rechaza H 0. La región R tiene que considerar el signo de H 1 que lleva a definir regiones de rechazo en una o dos direcciones. La región R tiene que ser tal que: Pr(R H 0 ) α Por tanto, es necesario conocer la probabilidad de R cuando H 0 es cierta. Para ello, se puede asumir un modelo paramétrico sobre los datos.

Ejemplo 1.4. Consideramos de nuevo el siguiente contraste sobre el precio medio de un restaurante. H 0 : µ = 30 H 1 : µ > 30 Parece natural rechazar H 0 si X es mucho mayor que 30 euros. Queremos poder calcular Pr(R H 0 ) y determinar R para que esta probabilidad sea menor que α. Tiene sentido asumir que el precio de la comida en el asador, X, sigue una distribución normal, X N(µ, σ 2 ).

Metodología del contraste En realidad, lo que hemos hecho en el ejemplo anterior es considerar una medida de discrepancia entre las observaciones y la hipótesis nula, de modo que si la discrepancia es grande, se rechaza H 0. En contrastes paramétricos, es habitual tomar medidas de discrepacia basadas en un estimador del parámetro de interés: Discrepancia = Estimador Parámetro Desviación típica del estimador La medida de discrepancia se denomina estadístico de contraste y tiene que ser tal que su distribución es conocida si H 0 es cierta.

-rechazo dependen de la hipótesis alternativa, H1: Ejemplo 1.5. hazo la forman H 1 : θ < θ En el ejemplo anterior, si asumimos que X N(µ, σ 2 ) y si H 0 es cierta: istribución del con la misma b). La región de rechazo la forman 0 la cola inferior de la distribución del X 30 σ/ n H 0 N(0, 1) estadístico bajo H0, con la probabilidad α. Aceptación chazo 2 Rechazo Así, para que el error de tipo I sea igual a un nivel de significación, α, fijado previamente, la región de rechazo más razonable es: { 1 α } α X 30 R = σ/ n > z α. chazo la forman distribución del robabilidad α. Aceptación 1 α Rechazo α

Ejemplo 1.6. Se desea saber si el precio medio por comensal en el Asador Felipe es mayor de los 30 euros que se indica en la Guía del Ocio. Para ello, se toma una muestra del gasto de 10 clientes independientes que hayan comido en este asador en distintos días dando lugar a una media muestral de x = 33.3 euros. Suponiendo que el precio de la comida en el asador, X, sigue una distribución normal, X N(µ, σ 2 ), y que la desviación típica es conocida (no realista) e igual a 5 euros. Resolver el siguiente contraste al nivel α = 0.05: H 0 : µ = 30 H 1 : µ > 30

Metodología del contraste Recapitulando, los pasos para resolver un contraste de hipótesis son: 1. Plantear las hipótesis nula, H 0, y alternativa, H 1. 2. Definir un estadístico de contraste cuya distribución sea conocida cuando H 0 es cierta. 3. Fijar un nivel de significación, α, (normalmente 0.05 ó 0.01) y determinar la región de rechazo, R, tal que Pr(R H 0 ) α. 4. Tomar una muestra de datos y calcular el valor del estadístico de contraste. Si éste valor está en R, se rechaza H 0.

Nivel crítico o p-valor El procedimiento para obtener la región de rechazo usando el nivel de significación tiene dos incovenientes: 1. El resultado del test puede depender mucho del valor de α. 2. Dar sólo el resultado del test no permite diferenciar el grado de evidencia que la muestra indica a favor o en contra de H 0. Ejemplo 1.7. Resolver el contraste del ejemplo anterior al nivel α = 0.01: H 0 : µ = 30 H 1 : µ > 30

Nivel crítico o p-valor El nivel crítico p o p-valor es es la probabilidad de encontrar una discrepancia mayor o igual que la observada en los datos, cuando H 0 es cierta. El p-valor no se fija a priori, sino que depende de los datos. Usando el p-valor podemos resolver el contraste para cualquier α: Si α > p-valor, se rechaza H 0 al nivel α. Si α < p-valor, no se rechaza H 0 al nivel α. El p-valor es el nivel de significación más pequeño para el que la muestra obtenida obligaría a rechazar la hipótesis nula. El p-valor se puede interpretar como una medida de la evidencia a favor de la hipótesis nula.

Nivel crítico o p-valor Ejemplo 1.8. Se desea saber si el precio medio por comensal en el Asador Felipe es mayor de los 30 euros que se indica en la Guía del Ocio. Para ello, se toma una muestra del gasto de 10 clientes independientes que hayan comido en este asador en distintos días dando lugar a una media muestral de x = 33.3 euros. Suponiendo que el precio de la comida en el asador, X, sigue una distribución normal, X N(µ, σ 2 ), y que la desviación típica es conocida (no realista) e igual a 5 euros. Resolver el siguiente contraste para cualquier nivel usando el p-valor. H 0 : µ = 30 H 1 : µ > 30

Nivel crítico o p-valor Recapitulando, los pasos para resolver un contraste de hipótesis utilizando el p-valor son: 1. Plantear la hipótesis nula, H 0, y alternativa, H 1. 2. Definir un estadístico de contraste cuya distribución sea conocida si H 0 es cierta. 3. Fijar un nivel de significación, α. 4. Calcular el p-valor. Si este es suficientemente pequeño (menor que α), rechazar H 0.