Inf In e f re r ncia est es adís t t adís ica: ic Prueba de Hipótesis Jhon Jairo Jair Pa P dilla a A., PhD. PhD

Documentos relacionados
Inferencia estadística: Prueba de Hipótesis. Jhon Jairo Padilla A., PhD.

ESTIMACIONES INTERVALOS DE CONFIANZA CON VARIANZA DIFERENTE LI. MIGUEL CANO

ESTIMACIONES INTERVALOS DE CONFIANZA CON VARIANZA DIFERENTE LI. MIGUEL CANO

Determinación del tamaño de muestra (para una sola muestra)

Distribuciones de muestreo importantes. Jhon Jairo Padilla Aguilar, PhD.

Estimación de Parámetros.

INFERENCIA ESTADISTICA

Podemos definir un contraste de hipótesis como un procedimiento que se basa en lo observado en las muestras y en la teoría de la probabilidad para

Esta proposición recibe el nombre de hipótesis

Teorema Central del Límite (1)

Prueba de Hipótesis. Bondad de Ajuste. Tuesday, August 5, 14

Prof. Jose Jacobo Zubcoff Universidad de Alicante 1

UNIDAD 4. INFERENCIA ESTADÍSTICA. Prof. Eliana Guzmán U. Semestre A-2015

Objetivo: Comprender cómo se calculan los intervalos de confianza y determinar el tamaño ideal de una muetra

ESTIMACION DEL TAMAÑO DE LA MUESTRA Y DE LA POTENCIA

para una muestra Ref: Apuntes de Estadística, Mtra Leticia de la Torre Instituto Tecnológico de Chiuhuahua

Estimación de Parámetros

INGENIERO AGRÓNOMO EN PRODUCCIÓN TEMA: ESTIMACION Y PRUEBA DE HIPÓTESIS

MODELOS DE SIMULACIÓN ESTADÍSTICOS CLASE 4: DISTRIBUCIÓN t, CHI-CUADRADA y EXPONENCIAL PROFESOR: OSCAR SAAVEDRA ANDRÉS DURANGO.

Prueba de Hipótesis. Una hipótesis estadística es una proposición sobre los parámetros de una o más poblaciones.

ESTIMACIÓN Y PRUEBA DE HIPÓTESIS INTERVALOS DE CONFIANZA

Contrastes de hipótesis paramétricos

Estadística. Contrastes para los parámetros de la Normal

Diseño de experimentos - prueba de hipótesis.

Cap. 7 : Pruebas de hipótesis

para una muestra Ref: Apuntes de Estadística, Mtra Leticia de la Torre Instituto Tecnológico de Chiuhuahua

Universidad Rafael Belloso Chacín (URBE) Cátedra: Fundamentos de Estadística y Simulación Básica Semestre Profesor: Jaime Soto

Estadística Inferencial. Resúmen

EL CÁLCULO DE LA MUESTRA SE BASA EN EL DISEÑO DE ESTUDIO, MEDIANTE CARACTERÍSTICAS QUE SE CONOCEN EN LA POBLACIÓN

Ejemplos Resueltos Tema 4

Pruebas de hipótesis

BLOQUE III: INFERENCIA ESTADISTICA. X, variable aleatoria de interés sobre una determinada población

El primer paso en la realización de una investigación es planear las hipótesis de investigación. Definamos el concepto de hipótesis:

PRUEBAS DE BONDAD DE AJUSTE

4. Prueba de Hipótesis

Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR

INFERENCIA ESTADÍSTICA MUESTRAL TEMA 2: ESTIMACIÓN POR INTERVALO

Pruebas de Hipótesis

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

El procedimiento de decisión incluye la posibilidad de equivocarnos, por lo tanto nuestra conclusión bien puede ser errónea

Folleto de Estadísticas. Teoría del 2do Parcial

Inferencia estadística. Hipótesis estadística Errores! y " BC. Nathalia Navarro Trevisan

Contraste de Hipótesis

Estimación de Parámetros. Jhon Jairo Padilla A., PhD.

Estimación de Parámetros. Jhon Jairo Padilla A., PhD.

UNIVERSIDAD CENTRAL DE VENEZUELA FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES ESCUELA DE SOCIOLOGÍA DEPARTAMENTO DE ESTADÍSTICA INFERENCIA ESTADÍSTICA

CONTRASTE DE HIPÓTESIS

CONTRASTE DE HIPÓTESIS

Distribuciones Fundamentales de Muestreo. UCR ECCI CI-0115 Probabilidad y Estadística Prof. Kryscia Daviana Ramírez Benavides

Contraste de Hipótesis

MATERIA: ESTADÍSTICA EJEMPLOS DE POSIBLES PREGUNTAS DE EXAMEN. a. Cuáles son las escalas en que pueden estar los datos en un análisis estadístico.

Prueba de Hipótesis. Una hipótesis estadística es un supuesto que se establece sobre las características de una distribución poblacional

Tests de hipótesis. Técnicas de validación estadística Bondad de ajuste. Pruebas de bondad de ajuste. Procedimiento en una prueba de hipótesis

Pruebas de Hipótesis. Diseño Estadístico y Herramientas para la Calidad. Pruebas de Hipótesis. Hipótesis

INFERENCIA ESTADISTICA

Tabla de Test de Hipótesis ( Caso: Una muestra ) A. Test para µ con σ 2 conocida: Suponga que X 1, X 2,, X n, es una m.a.(n) desde N( µ, σ 2 )

7. Inferencia Estadística. Métodos Estadísticos para la Mejora de la Calidad 1

Fundamentos de la Prueba de Hipótesis. Maestría en Administración Universidad Cristóbal Colón

PLAN DE TRABAJO 9 Período 3/09/07 al 28/09/07

aceptar o rechazar evidencia hipótesis nula y la hipótesis alternativa enunciado que se probará "no hay efecto" o "no hay diferencia"

SOLUCIÓN EXAMEN IV Nombres: Apellidos: C.I.: Firma: Fecha: 19/11/2004

Estadísticas Pueden ser

TEMA Nº 2 CONTRASTE DE HIPÓTESIS EN LOS DISEÑOS DE UNA MUESTRA

INFERENCIA ESTADÍSTICA MUESTRAL TEMA 4: MEDIAS Y PROPORCIONES CON DOS POBLACIONES

UNIVERSIDAD TECNICA PARTICULAR DE LOJA ESTADISTICA Y PROBABILIDAD ENSAYO N 8

Introducción a la Inferencia Estadística

Universidad Técnica de Babahoyo INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA

Teoría de la decisión Estadística

Matemáticas aplicadas a las Ciencias Sociales II

PRUEBA DE BONDAD DE AJUSTE O PRUEBA CHI - CUADRADO

I. Error tipo I y II II. Nivel de significancia III. Intervalo de confianza

aceptar o rechazar evidencia hipótesis nula y la hipótesis alternativa enunciado que se probará "no hay efecto" o "no hay diferencia"

6. Inferencia con muestras grandes. Informática. Universidad Carlos III de Madrid

Distribución Chi (o Ji) cuadrada (χ( 2 )

2 Pruebas de hipótesis paramétricas

Algunas Distribuciones Continuas de Probabilidad. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

Matemáticas aplicadas a las Ciencias Sociales II

de Muestreo de Medias, Inferencia Estadística (Naturaleza de las Pruebas ) (Cap. 7 y Sec. 8.3)

Diseño de bloques completos Aleatorizados. Jhon Jairo Padilla Aguilar, PhD.

Conceptos del contraste de hipótesis

Contrastes sobre la media Sea X 1, X 2,..., X n una m.a.s. extraída de una población normal X con media desconocida µ. Se desea contrastar:

Verificación de hipótesis paramétricas

1) Características del diseño en un estudio de cohortes.

Profesor: Carlos Valle Página:

Diseño de experimentos Hugo Alexer Pérez Vicente

Tema 7. Introducción Metodología del contraste de hipótesis Métodos no paramétricos

Tema 5. Contraste de hipótesis (I)

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico

Técnicas de Inferencia Estadística II. Tema 1. Introducción a los contrastes de

Tema 9: Contraste de hipótesis.

Estadística Inferencia Estadística

Mantenimiento Eléctrico

TEST DE RAZÓN DE VEROSIMILITUD GENERALIZADA

INFERENCIA ESTADÍSTICA MUESTRAL TEMA 3: PRUEBAS DE HIPÓTESIS

Tema 8: Contraste de hipótesis

Estadística Inferencial. Sesión 6. Pruebas de hipótesis para medias y proporciones.

Tema 7. Contrastes no paramétricos en una población

Tema 7. Contrastes de Hipótesis

viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos

Tema 8: Contrastes de hipótesis

Transcripción:

Inferencia estadística: Prueba de Hipótesis Jhon Jairo Padilla A., PhD.

Justificación Es una etapa de análisis i de datos de un experimento comparativo: Se compara un parámetro de una va v.a. con un valor dado. Estos experimentos comparativos simples se encuentran muy a menudo en la práctica. Los experimentos comparativos proporcionan bases sólidas paralos problemas de diseño experimental (se obtiene un modelo de una población a partir de unas muestras). Nuestro interés: Experimentos comparativos en los que interviene sólo una población.

Ejemplo Se tienen interés en el tiempo que dura el procesamiento de un producto. La velocidad con que se procesa el producto es una variable aleatoria que puede describirse con una distribución de probabilidad. Específicamente, se requiere decidir si: la media de la velocidad de procesamiento es de 50cm/s. Formalmente, esto se expresa como: H0: µ=50cm/s H1: µ=50cm/s

Definiciones Hipótesis i Nula: Conclusión de i d hi ó i Es el enunciado H0: µ=50cm/s Hipótesis alternativa: Es el enunciado H1: µ=50cm/s Hay dos tipos de hipótesis alternativas: De una cola: Ejemplos: H1: µ<50cm/s ó H1: µ>50cm/s De dos colas: Ejemplo:H1: µ=50cm/s rechazo de Ho Mayor que, Menor que, superior a, que exceda a, al menos No implica dirección, ó la afirmación es diferente de Tipo de hipótesis alternativa Hipótesis de una cola Hipótesis de dos colas

Prueba de hipótesis A un proceso que lleva a una decisión acerca de una hipótesis particular se le llama prueba de una hipótesis. Las hipótesis son siempre enunciados acerca de la población o distribución bajo estudio, no son enunciados acerca de la muestra.

Objetivos de una prueba de hipótesis El valor dl del parámetro utilizado en la hipótesis i nula (ej: 50cm/s) puede ser resultado de alguna de tres situaciones. Según la situación, la prueba de hipótesis tendrá un objetivo diferente. Fuente del parámetro Objetivo de la prueba Experiencia pasada, conocimiento previo del proceso, pruebas o experimentos anteriores Verificar si el parámetro ha sufrido cambios Teoría o modelo matemático del proceso bajo estudio Especificaciones de diseño u obligaciones contractuales Verificar la teoría o modelo Prueba de conformidad

Resultado de la prueba de hipótesis El resultado obtenido es que: La hipótesis nula es verdadera La hipótesis nula es falsa No existe certeza total de que el resultado sea correcto (tendríaqueexaminarselapoblación examinarse completa). Existeunaprobabilidaddellegara de llegar a unaconclusión incorrecta. El rechazo de la hipótesis nula, lleva siempre a aceptar la hipótesis alternativa.

Procedimiento general Tomar una muestra aleatoria Calcular un estadístico de prueba de los datos muestrales Se toma una decisión ió acerca de la hipótesis i nula con base en el estadístico de prueba

Criterio de aceptación de hipótesis nula Región crítica Región de aceptación Región crítica Se rechaza Ho No puede rechazarse Ho Se rechaza Ho µ=50 µ=50 µ=50 48,5 µ=50 51,5 x Valores críticos Estadístico ti de prueba

Conclusiones incorrectas Podría llegarse a una conclusión incorrecta en varios casos: Error Tipo I: Rechazo dela hipótesis nula, cuandoen realidad es verdadera Puede deberse a que la muestra particular tomada arroja un valor del estadístico en la región crítica cuando en realidad está en la región de aceptación. Error Tipo II: Aceptación dela hipótesis nulacuando en realidad es falsa Puede deberse a que la media muestral cae en la región de aceptación, cuando en realidad está en la región crítica

Nivel de Significación de la prueba Es la probabilidad bilid d de que ocurra un error de tipo I. Se denota por la letra α. También se le llama amplitud de la prueba. Suponiendo que se cumplen las condiciones delteorema dellímitelímite central, la probabilidad de error tipo I será el área de la región sombreada, con: Valor dado para el σ 25 2,5 σ = = = 0,79 problema X n 10 Debe hacerse la transformación de X a una vanormal v.a estándar: X µ Z = σ n Luego, α=0,0287+0,0287=0,0574

Interpretación del resultado Para el ejemplo anterior, el 5,74% de las posibles muestras aleatorias que se tomen llevarían a un error tipo I (Rechazo de la hipótesis cuando en realidad es verdadera). Cómo se puede reducir la probabilidad de error tipo I? Ampliando la región de aceptación Ó aumentando el número de muestras

Probabilidad de error de tipo II A la probabilidad de que ocurra un error de tipo II se le denotará por β. β Ejemplo: Se tiene una hipótesis nula con µ=50, pero en la realidad µ=52. Los valores críticos que limitan la región de aceptación son 48.5 y 51.5 Según la muestra tomada, existirá una probabilidad β de que la media esté en la región crítica: 48.5<x<51.5 (área azul en la figura) Z X µ σ n 48,5 52 0,79 1 1 = = = 4, 43 β = P( 4,43 Z 0,63) β = P ( Z 0,63) P( Z 4,43) β = 0, 2643 0, 000 = 0, 2643 Z 2 X µ σ n 51,5 52 0,79 2 = = = 0,63

Probabilidad de error de tipo II La probabilidad bilid d de error de tipo II aumenta conforme el verdadero valor de µ se acerca al valor propuesto en la hipótesis. Para el ejemplo de la figura, el área azul (β) aumenta con respecto al ejemplo anterior. Si están muy cerca los valores hipotético y real, no preocupa mucho equivocarse y aceptar la hipótesis.

Factores que afectan α y β Región de Aceptación Tamaño de la muestra (n) α β con µ=52 β con µ=50,5 48,5<x<51,5 <51 5 10 0,05760576 0,2643 0,8923 48<x<52 10 0,0114 0,5000 0,9705 48,5<x<51,5 16 0,0164 0,2119 0,9445 48<x<52 16 0,0014 0,5000 0,9918 El tamaño de la región crítica y por consiguiente la probabilidad a de un error de tipo I, siempre puede reducirse mediante la selección apropiada de los valores críticos. Los errores de tipo I y II están relacionados. Una reducción de la probabilidad de un tipo de error resulta en un incremento en la probabilidad del otro (si no cambia el tamaño de la muestra, n) Un incremento del tamaño de la muestra (n) generalmente dará como resultado una reducción tanto t de α como de β (il (si los valores críticos permanecen constantes). Cuando una hipótesis nula es falsa, β se incrementa conforme el verdadero valor del parámetro se aproxima al valor hipotético propuesto en la hipótesis nula.

Características de las conclusiones El analista puede controlar los valores críticos, luego puede controlar la probabilidad de rechazar incorrectamente a Ho. Por tanto, al rechazo de la hipótesis nula Ho siempre se le considera una conclusión robusta. La probabilidad de error de tipo II depende del tamaño de la muestra (n) y del valor verdadero del parámetro a probar. Se considera que la decisión de aceptar Ho es una conclusión débil (a menos que β sea muy pequeña). pq Terminología: En lugar de decir que se acepta Ho, se prefiere decir No puede rechazarse Ho Por tanto No puede rechazarse Ho significa que no se ha encontrado evidencia suficiente para rechazar Ho. El no poder rechazar Ho no significa necesariamente que exista una alta probabilidad de que sea verdadera. Puede significar simplemente que se requieren más datos para llegar a una conclusión robusta.

Potencia de una prueba estadística La potencia de una prueba estadística es la probabilidad de rechazar la hipótesis nula Ho cuando la hipótesis alternativa es verdadera. Potencia=1 ββ La potencia de una prueba estadística es la probabilidad de rechazar correctamente una hipótesis nula.

Potencia de una prueba estadística La potencia es una medida de la sensibilidad de una prueba estadística. Sensibilidad: capacidad de la prueba para detectar diferencias. Ejemplo: n=10 µ=52 Ho: µ=50 Potencia=1 β=1 0,2643=0,7357 Significado: Si la media verdadera es 52, esta prueba rechazará correctamente la hipótesis Ho:µ=50 y detectará esta diferencia el 73,57% de las veces. Si el valor de la sensibilidad se considera muybajo bajo, el analista puede incrementar α o el tamaño de la muestra n.

Procedimiento general de las pruebas de hipótesis 1. Por el contexto t dl del problema, identificar el parámetro de interés. 2. Establecer la hipótesis nula Ho. 3. Especificar una hipótesis alternativa apropiada, H 1. 4. Elegir un nivel de significación α. 5. Establecer un estadístico de la prueba apropiado. 6. Establecer la región de rechazo del estadístico. 7. Cl Calcular l las cantidades d muestrales necesarias, sustituirlas i en la ecuación del estadístico de la prueba, y calcular ese valor. 8. Decidir si deberá rechazarse o no Ho y contextualizar la decisión del problema.

Intervalo de confianza para la media, varianza conocida Si x es la media muestral lde una muestra aleatoria de tamaño n de una población con varianza conocida σ 2, un intervalo de confianza del 100(1 α) por ciento para µ está dado por x z σ / n µ x + z σ / n a/2 a/2 Donde zα/2 es el punto porcentual 100α/2 superior de la distribución normal estándar. El intervalo de confianza que se obtiene con esta aproximación darábuenos resultados si el número de muestras n>30 (o si la distribución de la población es normal).

Relación entre intervalos de confianza y pruebas de hipótesis Si [l,u] es un intervalo dl del 100(1-α) por ciento para el parámetro θ, entonces la prueba de amplitud α de la hipótesis Ho: θ=θ 0 x z σ / n a /2 / Región de aceptación x + z n a /2 σ / H 1 : θ=θ 0 Llevará al rechazo de H 0 si y sólo si θ 0 no está en el intervalo de confianza [l,u] del 100(1-α) por ciento.

Elección del nivel de confianza Cuál nivel lde confianza escoger? 95%...99%? 99%? Es razonable un nivel de confianza alto? Intervaloconfianza con α=0.01: 01: Zα/2=z 0,005 =2,58 Longitud del intervalo: σ Intervalo confianza con α=0.05: 005 Zα/2=z 0,025 =1,96 2(2,58 / n) = 5,16 σ / Longitud del intervalo: 2(1.96 σ / n) = 3,92 σ / El intervalo de confianza es más largo para una confianza del 99%. Es deseable un intervalo de confianza que sea lo suficientemente corto para fines de toma de decisiones, pero que ofrezca a su vez una confianza adecuada. Esto se puede manejar eligiendo i un tamaño de muestra adecuado d n n

Elección del tamaño de la muestra Si se usa la media muestral () (x) como estimación ió de µ, puede tenerse una confianza del 100(1 α) por ciento de que el error x µ no excederá una cantidad especificada E cuando el tamaño de la muestra es 2 z σ n α /2 = E E x z n a /2 σ / x µ x + z n a /2 σ /

Ejemplo Suponga que se quisiera que el error al estimar la velocidad media de procesamiento de un producto fuera menor que 1.5cm/s, /, con una confianza del 95%. Suponga una σ=2. Solución: El valor de α es α=0,05 Luego zα/2=z 0,025 =1,96 Por tanto, el tamaño de la muestra será n 2 2 zα /2 σ (1.96) 2 = = = 6,83 7 E 15 1.5

Prueba de la bondad del ajuste Es un tipo de prueba de hipótesis donde se desconoce la distribución de probabilidad de la población. El objetivo es determinar si una distribución particular será satisfactoria como modelo de la población. Algunos métodos: gráficas de probabilidad, prueba ji cuadrada, prueba de cuantiles.

Procedimiento Se toma una muestra aleatoria de tamaño n de la población cuya distribución de probabilidad es desconocida. Las n observaciones se ordenan en un histograma con k intervalos de clase: Sea Oi la frecuencia observada en el intervalo de clase i. Se calcula la frecuencia esperada a partir de la distribución de probabilidad hipotética. Para el intervalo de clase i ésimo, denotado por Ei, el estadístico de prueba es k 2 2 ( Oi Ei) χ 0 i= 1 = E i

Interpretación de resultados Si la población sigue la distribución ib ió hipotética i 2 propuesta, χ 0 tiene aproximadamente una distribución ji cuadrada con k p 1 grados de libertad. Donde p representa el número de parámetros de la distribución hipotética, estimados por los estadísticos muestrales. Estaaproximación aproximación mejora conforme n se incrementa. La hipótesis de que la distribución de la población es la distribución hipotética se rechazaría si el valor 2 2 calculado del estadístico de prueba χ0 > χα, k p 1.

Condiciones de la prueba Ji cuadrado Si las frecuencias esperadas son muy pequeñas (tanto t como 1 ó 2), 2 entonces el estadístico de prueba χ 0 no reflejará la desviación de las frecuencias observadas y las esperadas, sino únicamente la pequeña magnitud de las frecuencias esperadas. El mínimo de las frecuencias esperadas debe estar entre 3 y 5. Algunos autores proponen que una frecuencia esperada podría ser tan pequeña como 1 ó 2 siempre que la mayoría de las frecuencias excedan de 5. Si alguna frecuencia es muy pequeña, es mejor combinar su clase con una clase adyacente, tanto en los valores observados como en los valores obtenidos de la distribución hipotética. Esto reduce k. (No es necesario que los intervalos de clase tengan la misma anchura).

Ejemplo: Una distribución de Poisson Se propone S Número de Frecuencia hipotéticamente que el defectos observada 0 32 número de defectos en tarjetas de circuitos impresos sigue una distribución depoisson Poisson. Se ha colectado una muestra aleatoria de n=60 tarjetas de circuitos impresos y se observó el número de defectos. Los datos de la tabla son el resultado. 1 15 2 9 3 4

Solución La media es desconocida y db debe estimarse de los datos dt muestrales. La media muestral será entonces: (32 0) + (15 1) + (9 2) + (4 3) x = = 075 0,75 60 Por tanto, la tasa media de la distribución de Poisson será λ=0,75. Se calcula la probabilidad para cada valor de x con la expresión de la distribución de Poisson (con t=1): f( x) = e λt ( λt) x!! Obteniéndose los valores de la tabla para la frecuencia esperada como Ei=npi x

Solución Frecuencia esperada Número de df defectos Probabilidad Frecuencia esperada 0 0,472 28,32 1 0,354 21,24 2 0,133 7,98 3 ó más 0,041 2,46 Frecuencias corregidas Número de Frecuencia Frecuencia defectos observada esperada 0 32 28,32 1 15 21,2424 2 ó más 13 10,44 Se unen en una sola clase, por ser la última frecuencia menor de 3

Solución: Prueba de hipótesis 1. La variable ibl de interés es la forma de distribución ib ió de los defectos df en las tarjetas de circuitos impresos. 2. Ho: la forma de la distribución de los defectos es de Poisson. 3. H 1 : La forma de la distribución de los defectos no es de Poisson. 4. α=0,05 5. El estadístico de la prueba es 6. Se rechaza Ho si 7. Cálculos: l χ χ χ k 2 ( Oi Ei) χ 0 = i= 1 Ei 2 2 2 0 > 0,05,3 1 1 = 0,05,1 = 3,84 2 2 2 2 (32 28,32) (15 21, 24) (13 10, 44) χ0 = + + = 2,94 28,32 21, 24 10, 44 8. Conclusión: Puesto que el estadístico ji cuadrado es menor que 3.84, no puede rechazarse la hipótesis nula de que la distribución de los defectos en las tarjetas de circuitos impresos es de Poisson. 2