Contrastes de Hipótesis

Documentos relacionados

Tema 12: Contrastes Paramétricos

PRUEBAS DE HIPÓTESIS

Tema 3. Comparaciones de dos poblaciones

Pruebas de Hipótesis de Una y Dos Muestras. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

Inferencia Estadística

TEMA 4: Introducción al Control Estadístico de Procesos

ESTIMACIÓN. puntual y por intervalo

Capítulo 7: Distribuciones muestrales

Práctica 5. Contrastes paramétricos en una población

SEMINARIOS. (Problemas de exámenes de años anteriores) Estadística. 1º Grado en Informática

Tema 1: Test de Distribuciones de Probabilidad

ESTIMACION POR INTERVALOS

Estimación de una probabilidad

TEMA 2. FILOSOFÍA DE LOS GRÁFICOS DE CONTROL. Principios básicos de los gráficos de control. Análisis de patrones.

Problemas de Probabilidad resueltos.

PRÁCTICA 4. Ingeniería Técnica Industrial (2º) - Mecánica.

Calculadora de Tamaño muestral GRANMO

Pruebas de. Hipótesis

Tests de hipótesis estadísticas

Solución ESTADÍSTICA. Prueba de evaluación contínua 2 - PEC2

INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA

Biometría Clase 8 Pruebas de hipótesis para una muestra. Adriana Pérez 1

Estimación. Intervalos de Confianza para la Media y para las Proporciones

IES Fco Ayala de Granada Junio de 2012 (General Modelo 4) Soluciones Germán-Jesús Rubio Luna

Test ( o Prueba ) de Hipótesis

Test de hipótesis. Si H0 es cierta el estadístico. sigue una distribución t de Student con n grados de libertad: s n

Pruebas de Acceso a las Universidades de Castilla y León

Métodos estadísticos y numéricos Contraste de hipótesis pag. 1 PROBLEMAS RESUELTOS DE CONTRASTE DE HIPÓTESIS

1. a) Definimos X =número de personas con síntomas si examino sólo una persona, la cual sigue una distribución B(1, p), donde

ANÁLISIS DE VARIANZA EMPLEANDO EXCEL y WINSTATS

PRUEBA DE KOLMOGOROV SMIRNOV (Contraste sobre la forma de la distribución) F(X) es la función de distribución que hipotetizamos.

EJERCICIOS RESUELTOS SOBRE ERRORES DE REDONDEO

Nombre...Apellidos... Grado en:...grupo:...

Muestreo estadístico. Relación 2 Curso

UNIVERSIDAD DE ATACAMA

Estadística y Método Científico Hugo S. Salinas. Fuente:

1.1. Introducción y conceptos básicos

6. Sea X una v.a. con distribución N(0,1). Calcular p(x=0)

TEMA 7: Análisis de la Capacidad del Proceso

Clase 8: Distribuciones Muestrales

Control Estadístico de Procesos

Indicaciones específicas para los análisis estadísticos.

REPASO CONCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓN NORMAL.

1. Introducción a la estadística 2. Estadística descriptiva: resumen numérico y gráfico de datos 3. Estadística inferencial: estimación de parámetros

Curso Práctico de Bioestadística Con Herramientas De Excel

CAPITULO 4 JUSTIFICACION DEL ESTUDIO. En este capítulo se presenta la justificación del estudio, supuestos y limitaciones de

Se toma una muestra aleatoria de diez personas de una población. Se ha estimado de experiencias anteriores que la característica en estudio se

Otras medidas descriptivas usuales

Análisis de la varianza (un factor): ANOVA

MEDICION DEL TRABAJO

CARTAS DE CONTROL. FeGoSa

MATEMÁTICAS CCSS II Sobrantes 2010 (Modelo 1) SELECTIVIDAD ANDALUCÍA

Un vistazo a la calle revela que hay una gran cantidad de vehículos con arañazos o

RELACIÓN EJERCICIOS DEL CAPÍTULO 1. Intervalos de Confianza 1. La vida media de una muestra aleatoria de 10 focos es de 4.

Inferencia Estadística

ACCIONES Y OTROS TÍTULOS DE INVERSIÓN

ESTIMACION DE INTERVALOS DE CONFIANZA

Fundamentos de Investigación de Operaciones Investigación de Operaciones 1

Puedes descargar este examen en pdf desde esta dirección (busca el enlace Dropbox en la parte inferior de la página):

Selectividad Septiembre 2013 OPCIÓN B

Tema 5: Estimación puntual y por intervalos

TEMA 4: Variables binarias

UNIVERSIDAD DE ATACAMA FACULTAD DE INGENIERÍA / DEPARTAMENTO DE MATEMÁTICA

"CONTRASTES DE HIPÓTESIS" 4.4 Parte básica

ANÁLISIS ESTADÍSTICO Calculadora Gráfica TI 83 Plus José Carlos Vega Vilca, Ph.D.

x y 8000 x + y a) La región factible asociada a las restricciones anteriores es la siguiente: Pedro Castro Ortega lasmatematicas.

INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA

EL ANÁLISIS DE LA VARIANZA (ANOVA) 1. Comparación de múltiples poblaciones

Selectividad Septiembre 2006 SEPTIEMBRE 2006

INFERENCIA ESTADISTICA: CONTRASTE DE HIPÓTESIS

ANÁLISIS DE DATOS NO NUMERICOS

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS

Análisis y cuantificación del Riesgo

OPCIÓN A 0 1 X = Podemos despejar la matriz X de la segunda ecuación ya que la matriz. 1 1 ; Adj 0 1 X =

INFERENCIA ESTADÍSTICA

Tema 1 con soluciones de los ejercicios. María Araceli Garín

LA MEDIDA Y SUS ERRORES

Control Estadístico del Proceso. Ing. Claudia Salguero Ing. Alvaro Díaz

Covarianza y coeficiente de correlación

Tema 2: Estimación puntual

Universitat Autònoma de Barcelona Introducció a l Economia, Curs Codi: Examen Parcial, 13 de Noviembre de 2008 EXAMEN TIPO 1

capitulo3 MARCO TEÓRICO Para el diseño de la reubicación de los procesos se hará uso de la Planeación

3. ANÁLISIS ESTADÍSTICOS DE LAS PRECIPITACIONES EN EL MAR CASPIO

Créditos académicos. Ignacio Vélez. Facultad de Ingeniería Industrial. Politécnico Grancolombiano

8. Estimación puntual

Semana de dieta (X) Peso en Kg (Y)

Un problema sobre repetidas apuestas al azar

GRAFICOS DE CONTROL DATOS TIPO VARIABLES

Tema 3: Variables aleatorias y vectores aleatorios bidimensionales

Tratamiento del Riesgo

Experimentos con un solo factor: El análisis de varianza. Jhon Jairo Padilla Aguilar, PhD.

Master en Gestión de la Calidad

1 Ejemplo de análisis descriptivo de un conjunto de datos

SESIÓN PRÁCTICA 6: CONTRASTES DE HIPÓTESIS PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas

INFERENCIA ESTADÍSTICA: CONTRASTE DE HIPÓTESIS

Tamaño muestral Cómo estimar n adecuadamente? Estimación puntual. Marta Cuntín González Biostatech Advice, Training and Innovation in Biostatistics

- MANUAL DE USUARIO -

Tema 2: Muestreo. Estadística. 4 o Curso. Licenciatura en Ciencias Ambientales

Diana del Pilar Cobos del Angel. Experimento: Es una prueba o ensayo. Es el proceso de obtener una observación.

Tema 3: Variable aleatoria 9. Tema 3: Variable aleatoria

Transcripción:

Capítulo 8 Contrastes de Hipótesis 8.1. Introducción. Conceptos básicos Una hipótesis estadística es una afirmación acerca de una característica poblacional formulada en base a los parámetros de su distribución. Existen diversos tipos de hipótesis: - Hacen referencia a un parámetro de una población. Por ejemplo, consideremos el rendimiento obtenido en un proceso químico,x, con distribución N(µ, σ), siendo µ desconocido. Podríamos plantear las siguientes hipótesis: µ =90 µ 6= 90 µ>90 µ<90 Si la hipótesis asigna un único valor al parámetro se le llama hipótesis simple, enca- so contrario, hipótesis compuesta. Enesteejemplo, laprimeraessimpleyelrestoson compuestas. - Comparan parámetros de varias poblaciones. Por ejemplo, supongamos que queremos contrastar si el fumar provoca cáncer. Esto equivale a contrastar si la proporción de fumadores con cáncer, p 1, es significativamente mayor que la proporción de no fumadores con cáncer, p 2. 119

120 Capítulo 8. Contrastes de Hipótesis Contrastar una hipótesis es comparar lo que dice la hipótesis con la información que nos proporciona una muestra. Si hay coincidencia, dentro de un margen de error admisible entre la hipótesis planteada (hipótesis nula, H 0 ) y la información muestral entonces la mantendremos como cierta, en caso contrario la rechazaremos. Rechazar una hipótesis es sustituirla por otra que sea capaz de explicar la realidad observada en la muestra (hipótesis alternativa, H 1 ). Por ejemplo, supongamos que nos planteamos si el rendimiento del proceso puede ser en media del 90 %, H 0 : µ =90. Realizamos una serie de pruebas y el rendimiento medio muestral resulta ser x =75, menor que 90. La información muestral parece ir más a favor de H 1 : µ<90 que de H 0 : µ =90. Una cosa en la que hay que hacer hincapié es la siguiente: nunca podemos afirmar el que una hipótesis sea verdadera o falsa, ya que para ello tendríamos que tener observaciones de toda la población. Por lo tanto, al realizar un contraste y tomar una decisión siempre cabe la posibilidad de equivocarnos. Existen dos tipos de errores asociados a cualquier contraste: error tipo I, que tiene lugar cuando rechazamos H 0 siendo cierta, y error tipo II, que ocurre si aceptamos H 0 siendo falsa. H 0 cierta H 0 falsa Acepto H 0 No hay error Error tipo II Rechazo H 0 Error tipo I No hay error A la probabilidad de que ocurra el error tipo I se le llama nivel de significación del contraste, que denotamos por α yquefijamos antes de realizar un contraste. A la probabilidad de error tipo II la denotamos por β. A 1 α se le llama nivel de confianza, ya1 β potencia del test. α = P (error tipo I)=P (rechazar H 0 /H 0 es cierta), β = P (error tipo II)=P (aceptar H 0 /H 0 es falsa) Lógicamente, a medida que uno disminuye el otro aumenta. Un ejemplo clásico es el siguiente: supongamos queunjueztienequedeclararaunindividuo culpable o inocente. H 0 : inocente H 1 : culpable

8.2. Pasos a seguir para realizar un contraste 121 Si rechaza H 0 declara culpable al individuo, y si la acepta lo declara inocente. Comete un error de tipo I si declara culpable al acusado siendo inocente, y un error de tipo II si lo declara inocente siendo culpable. Desde el punto de vista moral parece más grave el primer error, de ahí que en un contraste se fije el nivel de significación α y se minimice β. 8.2. Pasos a seguir para realizar un contraste 1. Planteamos la hipótesis nula H 0 (de tipo igualdad) y la alternativa H 1 (a favor de la información muestral). H 0 : θ = θ 0 H 1 : θ 6= θ 0 θ<θ 0 θ>θ 0 2. Fijamos el nivel de significación del contraste α.generalmente se fija en 0.05, 0.01 o 0.1. 3. Determinamos una medida de discrepancia entre la hipótesis nula y la información muestral. Esta medida estará en función de la diferencia del valor que especifica H 0 para el parámetro y el estimador muestral del parámetro, y tendrá distribución conocida. A tal medida la llamamos estadístico de contraste bajo H 0. 4. Determinamos la discrepancia máxima que estamos dispuestos a admitir para aceptar H 0. Este valor dependerá de la distribución del estadístico de contraste bajo H 0,delnivelde significación α especificado y del tipo de hipótesis alternativa que tengamos. Delimita las regiones de aceptación y rechazo de H 0. 5. Concluimos: si el estadístico de contraste observado (empírico) cae en la región de rechazo, rechazamos H 0, en caso contrario, la mantendremos como cierta. Ejemplo 8.1: Sea X N(µ, σ) con µ, σ desconocidas, y sobre µ planteamos el siguiente contraste: H 0 : µ =90 H 1 : µ>90 Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.

122 Capítulo 8. Contrastes de Hipótesis Seleccionamos una muestra de tamaño n y el estadístico de contraste bajo H 0 (suponiendo H 0 cierta) es: X 90 T = t S n 1, n X µ ya que Z = σ N(0, 1), χ 2 (n 1)S2 = σ 2 χ 2 n 1, son independientes, y T = Z r. χ 2 n n 1 Observemos que valores observados en X mucho mayores que 90 irían claramente a favor de H 1 (en contra de H 0 ). A su vez tales valores llevarían a un estadístico de contraste T muy grande y positivo. En consecuencia, valores muy grandes y positivos en T nos llevarían a rechazar H 0.(siendo cierta). De ahí que la región de rechazo esté en este caso en la cola de la derecha (de la distribución t n 1 ) y presente un aréa igual a α (probabilidad de rechazar H 0 siendo cierta). El valor que delimita la región de rechazo es por lo tanto t 1 α,n 1. Entonces rechazaremos H 0 si el estadístico de contraste observado, t, es mayor o igual que t 1 α,n 1. A la probabilidad de que el estadístico de contraste teórico, este caso T, sea mayor que el observado, en este caso t, se le llama p-valor. Por lo tanto, el criterio de rechazo en base al p-valor será: rechazar H 0 siempre que el p-valor sea menor o igual que α. Supongamos que una muestra seleccionada de tamaño 20 nos proporciona una media x =98 y una desviación típica s =2,21. El estadístico observado es por tanto t = 98 90 2,21 20 =16,188 Para un nivel de significación α =0,05, t 1 α,n 1 = t 0,95,19 =1,73. Como 16,188 no es mayor que 1,73 no podemos rechazar H 0. Ejemplo 8.2: Sobre el ejemplo anterior, consideremos ahora la hipótesis alternativa H 1 : µ<90. H 0 : µ =90 H 1 : µ<90 En este caso, valores en X mucho menores que 90 irían a favor de H 1 (en contra de H 0 ). Por lo tanto, valores muy grandes en valor absoluto y negativos en el estadístico de contraste llevarían a rechazar H 0. La región de rechazo está ahora en la cola de la izquierda, y el valor queladelimitaest α,n 1. Rechazamos entonces H 0 si t t α,n 1.

8.3. Contrastes de hipótesis clásicos 123 Si observamos una muestra de tamaño 20 y se obtiene una media muestral x =83yuna desviación típica s =1,96, el estadístico observado es: t = 3,068, y t α,n 1 = t 0,05,19 = 1,73. Como 3,068 es menor que 1,73, rechazamos H 0 para un nivel de significación del 5 %. Por lo tanto, el rendimiento medio es significativamente menor que 90. Ejemplo 8.3: Consideremos por último la hipótesis alternativa H 1 : µ 6= 90. H 0 : µ =90 H 1 : µ 6= 90 En este caso valores en el estadístico muy grandes en valores absoluto, negativos y positivos, llevarían a rechazar H 0. Existen ahora por lo tanto dos regiones de rechazo, una a la izquierda y otra a la derecha, cada una de las cuales engloba un área de α/2. Los valores que las delimitan son respectivamente t α/2,n 1 =-t 1 α/2,n 1 y t 1 α/2,n 1. Rechazamos H 0 si t -t 1 α/2,n 1 o t t 1 α/2,n 1. Para una muestra de tamaño 20 con media x =80ydesviaciónmuestrals =1,86, t = 24,044, y t 1 α/2,n 1 = t 0,975,19 =2,09. Como 24,044 es menor que 2,09, rechazamos H 0 para un nivel de significación del 5 %. El rendimiento medio es significativamente distinto de 90. 8.3. Contrastes de hipótesis clásicos 8.3.1. Contraste para la media de una normal con varianza conocida Sea X 1,X 2,..., X n una muestra aleatoria de una población X N(µ, σ), σconocida. Hipótesis nula Estadístico de contraste H 0 : µ = µ 0 Z = X µ 0 σ/ n Hipótesis alternativa Criterios de rechazo H 1 : µ 6= µ 0 H 1 : µ>µ 0 H 1 : µ<µ 0 Z z α/2 o Z z 1 α/2 Z z 1 α Z z α Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.

124 Capítulo 8. Contrastes de Hipótesis Ejemplo 8.4: Los sistemas de escape de emergencia para las tripulaciones de aeronaves son impulsados por un combustible sólido. Una de las características de este producto es la rapidez de combustión, que se supone con distribución Normal. Las especificaciones requieren que la rapidez promedio de combustión sea de 50 cm/s. Se sabe que la rapidez estándar de la rapidez de combustión es σ =2cm/s. El experimentador decide especificar una probabilidad para el error tipo I de α =0,05. Selecciona una muestra aleatoria de tamaño 25 y se obtiene una media muestral de 53.1 cm/s. A qué conclusiones llega?. Planteamos el siguiente contraste: H 0 : µ =50 H 1 : µ 6= 50 con varianza conocida. El estadístico de contraste es: 53,1 50 Z = 2/ 25 =7,75 Rechazamos H 0 si Z z α/2 o Z z 1 α/2, siendo z α/2 = z 0,025 = 1,96 y z 1 α/2 = z 0,975 =1,96. Por lo tanto, rechazamos H 0 para un nivel de significación del 5 %. La rapidez de combustión es significativamente distinta de 50 cm/s. 8.3.2. Contraste para la media de una normal con varianza desconocida Sea X 1,X 2,..., X n una muestra aleatoria de una población X N(µ, σ), σdesconocida. Hipótesis nula Estadístico de contraste H 0 : µ = µ 0 T = X µ 0 S/ n Hipótesis alternativa Criterios de rechazo H 1 : µ 6= µ 0 H 1 : µ>µ 0 H 1 : µ<µ 0 T t α/2,n 1 o T t 1 α/2,n 1 T t 1 α,n 1 T t α,n 1

8.3. Contrastes de hipótesis clásicos 125 Ejemplo 8.5: Un artículo publicado en la revista Materials Engineering describe los resultados de pruebas de resistencia a la adhesión de 22 especímenes de aleación U-700. La carga para la que cada especimen falla es la siguiente (en MPa): 19.8 18.5 17.6 16.7 15.8 15.4 14.1 13.6 11.9 11.4 11.4 8.8 7.5 15.4 15.4 19.5 14.9 12.7 11.9 11.4 10.1 7.9 Sugieren los datos que la carga promedio de fallo es mayor que 10 MPa?. Realizar el contraste a un 10 % de significación. El contraste a realizar es: H 0 : µ =10 H 1 : µ>10 con varianza σ 2 desconocida. La media y desviación típica muestrales resultan 13.71 y 3.55 respectivamente, con lo cual: 13,71 10 t = 3,55/ 22 =4,90 Dado que t =4,90 >t 1 α,n 1 = t 0,95,21 =1,72, rechazamos H 0 al 5 % de significación. La carga promedio de fallo es significativamente mayor que 10. 8.3.3. Contraste para la varianza de una normal con media conocida Sea X 1,X 2,..., X n una muestra aleatoria de una población X N(µ, σ), con µ conocida. Hipótesis nula Estadístico de contraste H 0 : σ 2 = σ 2 0 P n χ 2 i=1 = i µ) 2 Hipótesis alternativa Criterios de rechazo σ 2 0 H 1 : σ 2 6= σ 2 0 H 1 : σ 2 >σ 2 0 H 1 : σ 2 <σ 2 0 χ 2 χ 2 α/2,n o χ2 χ 2 1 α/2,n χ 2 χ 2 1 α,n χ 2 χ 2 α,n Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.

126 Capítulo 8. Contrastes de Hipótesis 8.3.4. Contraste para la varianza de una normal con media desconocida Sea X 1,X 2,..., X n una muestra aleatoria de una población X N(µ, σ), con µ desconocida. Hipótesis nula H 0 : σ 2 = σ 2 0 Hipótesis alternativa H 1 : σ 2 6= σ 2 0 H 1 : σ 2 >σ 2 0 H 1 : σ 2 <σ 2 0 Estadístico de contraste χ 2 = (n 1) S2 σ 2 0 Criterios de rechazo χ 2 χ 2 α/2,n 1 o χ2 χ 2 1 α/2,n 1 χ 2 χ 2 1 α,n 1 χ 2 χ 2 α,n 1 Ejemplo 8.6: Un fabricante de detergente líquido está interesado en la uniformidad de la máquina que utiliza para llenar las botellas. De manera específica, es deseable que la varianza del proceso de llenado sea menor que 0.01, de otro modo existe un porcentaje mayor que el deseable de botellas con un contenido menor de detergente. Supóngase que la distribución del volumen de llenado es aproximadamente Normal. Al tomar una muestra aleatoria de 20 botellas se obtiene una varianza muestral de 0.0153. Tiene el fabricante problemas en el proceso de llenado de las botellas?. Realizar el contraste al 5 % de significación. El contraste a realizar es: H 0 : σ 2 =0,01 H 1 : σ 2 > 0,01 con media desconocida. El estadístico de contraste resulta: χ 2 = 19 0,0153 0,01 =29,07 Puesto que 29.07 no es mayor que χ 2 1 α,n 1 = χ2 0,95,19 =30,14, no podemos rechazar H 0, no hay suficiente evidencia empírica para concluir que la varianza del proceso de llenado es superior a la deseada.

8.3. Contrastes de hipótesis clásicos 127 8.3.5. Contraste para el cociente de varianzas de dos normales independientes con medias conocidas Sea X 1,X 2,..., X n1 una muestra aleatoria de una población X N(µ 1,σ 1 ), y Y 1,Y 2,..., Y n2 una muestra aleatoria de una población Y N(µ 2,σ 2 ). Ambas poblaciones se suponen independientes. Hipótesis nula Estadístico de contraste P n1 H 0 : σ 2 1 = σ 2 i=1 2 F = (x i µ 1 ) 2 /n 1 P n2 i=1 (y i µ 2 ) 2 /n 2 Hipótesis alternativa Criterios de rechazo H 1 : σ 2 1 6= σ 2 1 H 1 : σ 2 1 >σ 2 2 H 1 : σ 2 1 <σ 2 2 F 1/f 1 α/2,n2,n 1 o F f 1 α/2,n1,n 2 F f 1 α,n1,n 2 F 1/f 1 α,n2,n 1 8.3.6. Contraste para el cociente de varianzas de dos normales independientes con medias desconocidas Sea X 1,X 2,..., X n1 una muestra aleatoria de una población X N(µ 1,σ 1 ), y Y 1,Y 2,..., Y n2 una muestra aleatoria de una población Y N(µ 2,σ 2 ). Ambas poblaciones se suponen independientes. Hipótesis nula Estadístico de contraste H 0 : σ 2 1 = σ 2 2 F = S2 1 S 2 2 Hipótesis alternativa Criterios de rechazo H 1 : σ 2 1 6= σ 2 2 H 1 : σ 2 1 >σ 2 2 H 1 : σ 2 1 <σ 2 2 F 1/f 1 α/2,n2 1,n 1 1 o F f 1 α/2,n1 1,n 2 1 F f 1 α,n1 1,n 2 1 F 1/f 1 α,n2 1,n 1 1 8.3.7. Contraste para la diferencia de medias de dos normales independientes con varianzas conocidas Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.

128 Capítulo 8. Contrastes de Hipótesis Sea X 1,X 2,..., X n1 una muestra aleatoria de una población X N(µ 1,σ 1 ), y Y 1,Y 2,..., Y n2 una muestra aleatoria de una población Y N(µ 2,σ 2 ). Ambas poblaciones se suponen independientes. Hipótesis nula Estadístico de contraste H 0 : µ 1 µ 2 = δ 0 Z = X Ȳ δ 0 s σ 2 1 + σ2 2 n 1 n 2 Hipótesis alternativa H 1 : µ 1 µ 2 6= δ 0 H 1 : µ 1 µ 2 >δ 0 H 1 : µ 1 µ 2 <δ 0 Criterios de rechazo Z z α/2 o Z z 1 α/2 Z z 1 α Z z α 8.3.8. Contraste para la diferencia de medias de dos normales independientes con varianzas desconocidas pero iguales Sea X 1,X 2,..., X n1 una muestra aleatoria de una población X N(µ 1,σ), y Y 1,Y 2,..., Y n2 una muestra aleatoria de una población Y N(µ 2,σ). Ambas poblaciones se suponen independientes. Hipótesis nula Estadístico de contraste H 0 : µ 1 µ 2 = δ 0 T = s X Ȳ δ 0 µ 1 Hipótesis alternativa S 2 p n 1 + 1 n 2 Criterios de rechazo, H 1 : µ 1 µ 2 6= δ 0 H 1 : µ 1 µ 2 >δ 0 H 1 : µ 1 µ 2 <δ 0 T t α/2,n o T t 1 α/2,n T t 1 α,n T t α,n donde n = n 1 + n 2 2 S 2 p = (n 1 1) S 2 1 +(n 2 1) S 2 2 n

8.3. Contrastes de hipótesis clásicos 129 Ejemplo 8.7: Se analizan dos catalizadores para determinar la forma en la que afectan el rendimiento promedio de un proceso químico. De manera específica, el catalizador 1 es el que se está empleando en este momento, pero el catalizador 2 también es aceptable. Como el catalizador 2 es más caro, sólo interesará emplearlo siempre y cuando aumente el rendimiento promedio del proceso. Se hace una prueba piloto, y los rendimientos obtenidos en % son los siguientes: Catalizador 1 Catalizador 2 91.5 89.19 94.18 90.95 92.18 90.46 95.39 93.21 91.79 97.19 89.07 97.04 94.72 91.07 89.21 92.75 (a) Contrastar al 10 % de significación si la variabilidad en el rendimiento del proceso puede considerarse independiente del catalizador empleado. El contraste es: con medias desconocidas. El estadístico de contraste resulta: H 0 : σ 2 1 = σ 2 2 H 1 : σ 2 1 6= σ 2 2 F = S2 1 S 2 = 5,688 2 8,901 =0,639 Como F no es menor que 1/f 1 α/2,n2 1,n 1 1 =1/f 0,95,7,7 =0,264 ni F es mayor que f 1 α/2,n1 1,n 2 1 = f 0,95,7,7 =3,79, no podemos rechazar H 0, por lo tanto, la variabilidad en el rendimiento del proceso puede considerarse independiente del catalizador empleado. (b) Contrastar al 5 % si interesa emplear el catalizador 2. Veamos si el catalizador 2 aumenta el rendimiento promedio del proceso. Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.

130 Capítulo 8. Contrastes de Hipótesis Planteamos entonces el siguiente contraste: H 0 : µ 1 µ 2 =0 H 1 : µ 1 µ 2 < 0 con varianzas desconocidas pero iguales (según el contraste realizado anteriormente). X T = Ȳ δ 0 92,255 92,733 0 s µ 1 Sp 2 + 1 = s µ 1 7,295 n 1 n 2 8 + 1 = 0,354 8 Como T no es menor que t α,n = t 0,05,14 = 1,761 no podemos rechazar H 0 para un nivel de significación del 5 %. Por lo tanto, el catalizador 2 no aumenta significativamente el rendimiento promedio del proceso. 8.3.9. Contraste para la diferencia de medias de dos normales relacionadas (muestras apareadas) con varianzas desconocidas pero iguales Sea X 1,X 2,..., X n una muestra aleatoria de una población X N(µ 1,σ), apareada con una muestra Y 1,Y 2,..., Y n de una población Y N(µ 2,σ). Hipótesis nula Estadístico de contraste H 0 : µ 1 µ 2 = δ 0 T = D δ q 0 SD 2 n Hipótesis alternativa H 1 : µ 1 µ 2 6= δ 0 H 1 : µ 1 µ 2 >δ 0 H 1 : µ 1 µ 2 <δ 0 Criterios de rechazo T t α/2,n 1 o T t 1 α/2,n 1 T t 1 α,n 1 T t α,n 1 donde D = X Y. Ejemplo 8.8: Se desea comparar dos métodos para predecir la resistencia al corte de vigas de placa de acero. Con este fin se selecciona una muestra de 9 vigas, a las que se aplican los

8.3. Contrastes de hipótesis clásicos 131 dos métodos. Los datos se presentan en la siguiente tabla: Mét. 1 1.186 1.151 1.322 1.339 1.2 1.402 1.365 1.537 1.559 Mét. 2 1.061 0.992 1.063 1.062 1.065 1.178 1.037 1.086 1.052 Contrastar al 5 % de significación si existe alguna diferencia entre estos dos métodos. Claramente se trata de un contraste de igualdad de medias en muestras apareadas (se aplica a las mismas vigas los dos métodos). Llamamos D a la diferencia de resistencia entre el método 1 y el método 2 y el contraste es: Los valores muestrales de D son: H 0 : µ D =0 H 1 : µ D 6=0 D 0.119 0.159 0.259 0.277 0.138 0.224 0.328 0.451 0.507, que proporcionan una media de 0.2736 y una desviación de 0.1356. El estadístico de contraste observado es: T = q 0,2736 =6,05, 0,1356 2 9 t α/2,n 1 = t 0,025,8 = 2,306 y t 1 α,n 1 = t 0,975,8 =2,306. Al ser 6.05 mayor que 2.306, rechazamos H 0, es decir, los métodos proporcionan resultados diferentes. 8.3.10. Contraste para una proporción Sea X 1,X 2,..., X n una muestra aleatoria de una población X Bernoulli(p). Hipótesis nula Estadístico de contraste H 0 : p = p 0 Z = ˆp p 0 r p0 (1 p 0 ) Hipótesis alternativa H 1 : p 6= p 0 H 1 : p>p 0 H 1 : p<p 0 n Criterios de rechazo Z z α/2 o Z z 1 α/2 Z z 1 α Z z α Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.

132 Capítulo 8. Contrastes de Hipótesis Ejemplo 8.9: Un distribuidor adquirirá un lote de equipos si el porcentaje de defectuosos no es mayor que el 3 %, y se quiere una probabilidad del 5 % de rechazar la compra aunque verifique la condición requerida. Prueba 30 equipos y 2 de ellos resultan defectuosos. Qué decisión debe adoptar?. Llamamos p a la proporción de equipos defectuosos en el lote, y queremos comprobar si es mayor que 0.03. Realizamos para ello el siguiente contraste: H 0 : p =0,03 H 1 : p>0,03 En este caso el nivel de significación viene dado por: α = P (Rechazar H 0 /H 0 cierta) = P (Rechazar el lote/no contiene más del 3 % de defectuosos)=0.05 La proporción de defectuosos en la muestra es ˆp =2/30 = 0,067,con lo cual: Z = 0,067 0,03 r 0,03 0,97 30 =1,188 Al ser no ser Z mayor que z 1 α = z 0,95 =1,65 no se rechaza H 0. Es decir, no hay suficiente evidencia empírica para concluir que el porcentaje de defectuosos por lote es superior al 3 %. 8.3.11. Contraste para la comparación de dos proporciones Sean X 1,..., X n1 una m.a.s. de X Bernoulli(p 1 ) y Y 1,..., Y n2 una m.a.s. de Y Bernoulli(p 2 ). Ambas poblaciones se suponen independientes. Hipótesis nula Estadístico de contraste ˆp 1 ˆp 2 H 0 : p 1 = p 2 Z = r ³ ³ ˆ p T 1 p ˆ T /n 1 + p ˆ T 1 p ˆ T /n 2 Hipótesis alternativa H 1 : p 1 6= p 2 H 1 : p 1 >p 2 H 1 : p 1 <p 2 Criterios de rechazo Z z α/2 o Z z 1 α/2 Z z 1 α Z z α

8.3. Contrastes de hipótesis clásicos 133 donde ˆp T = n 1 ˆp 1 + n 2 ˆp 2 n1+n 2 Ejemplo 8.10: Una central de productos lácteos recibe diariamente la leche de dos granjas AyB. Conelfin de estudiar la calidad de los productos recibidos se extraen dos muestras, una de cada granja, y se analiza el contenido de materia grasa de cada producto. Se obtienen los siguientes resultados: Granja A Granja B 0.32 0.28 0.29 0.30 0.30 0.33 0.28 0.29 0.33 0.31 0.31 0.29 0.30 0.33 0.29 0.32 0.33 0.29 0.32 0.32 0.30 0.31 0.29 0.32 0.29 0.33 Si la central rechaza aquellos productos con un contenido graso superior a 0.32, existen diferencias significativas entre los porcentajes de productos de A y B que se tendrían que rechazar?. Realizar el contraste al 5 % de significación. El contraste es: H 0 : p 1 = p 2 H 1 : p 1 6= p 2 donde el subíndice 1 hace refencia a la granja A y el 2 a la B. Las proporciones de productos que superan un contenido graso de 0.32 en las muestras son ˆp 1 =0,167 y ˆp 2 =0,214, yla Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.

134 Capítulo 8. Contrastes de Hipótesis proporción muestral total es ˆp T =0,192. Por lo tanto, el estadístico de contraste resulta: Z = 0,167 0,214 p 0,192 (1 0,192) /12 + 0,192 (1 0,192) /14 = 0,303 Como Z no es menor que z 0,025 = 1,96 ni Z es mayor que z 0,975 =1,96 no podemos rechazar H 0. No existen diferencias significativas en las proporciones de productos a rechazar en ambas granjas. 8.4. Relación entre intervalos de confianza y contrastes de hipótesis Existe una estrecha relación entre la prueba de una hipótesis estadística sobre un parámetro θ y el intervalo de confianza de θ. Si denotamos por [θ L,θ U ]elintervalodeconfianza para θ a un nivel de confianza del (1 α)100 %, entonces el contraste bilateral (dos colas) H 0 : θ = θ 0 H 1 : θ 6= θ 0 aunniveldesignificación α conduce a rechazar H 0 si θ 0 no pertenece al intervalo [θ L,θ U ]. 8.5. Ejercicios 1. Se utilizan dos máquinas diferentes de moldeo por inyección para la fabricación de piezas de plástico. Una pieza se considera defectuosa si tiene un encogimiento excesivo o si le falta color. Se toman dos muestras aleatorias, ambas de tamaño 300, y se encuentan 15 piezas defectuosas en la muestra de la máquina 1 y 8 defectuosas en la muestra de la máquina 2. Podemos concluir que la máquina 2 produce menos piezas defectuosas que la máquina 1?. Realizar el contraste para un nivel de significación a =0,05. Suponer que sendas muestras proceden de poblaciones normales e independientes. 2. En un proceso de fabricación de tubos de aluminio, la longitud de éstos se distribuye según una normal de media 100 cm y varianza 16 cm 2. Se realiza una reparación y ahora se desea discernir si ha habido un cambio en la longitud media de los tubos. Para ello se

8.5. Ejercicios 135 selecciona una muestra de tamaño 9, obteniéndose una media muestral de 102 cm. Para un nivel de significación del 5 %, a qué conclusión se llega?. 3. Dos laboratorios farmacéuticos presentan sendas vacunas contra la alergia en el mercado al mismo tiempo. Una organización de consumidores desea comprobar cuál es más efectiva de las dos. Con este fin,aplicancadavacunaaunamuestrade10personasalérgicasyse mide el nivel de alergia (de 0 a 3) que presentan en la primavera del año siguiente. Los resultados son: Vacuna 1 1 2 1 2 1 1 2 1 1 2 Vacuna 2 2 3 3 2 1 3 2 2 2 3 Es la vacuna 1 significativamente más eficazquela2?realizarelcontrasteal5%de significación. 4. Un fabricante de monitores prueba dos diseños de microcircuitos para determinar si producen un flujo de corriente distinto. El departamento de ingeniería ha obtenido los datos siguientes: Diseño 1 n 1 =15 x 1 =24,2 S 2 1 =10 Diseño 2 n 2 =10 x 2 =23,9 S 2 2 =10,89 Determinar si existe alguna diferencia significativa en el flujo de corriente de los dos diseños. Tomar α =0,05. 5. Dos compañías de compuestos químicos pueden surtir materia prima, y la concentración de un elemento en particular en este material es importante. La concentración promedio de ambos proveedores es la misma, pero se sospecha que la variabilidad en la concentración puede diferir en las dos compañías. La desviación estándar de la concentración en una muestra aleatoria de 15 lotes producidos por la compañía 1 es 4.7g/l, mientras para la compañía 2, una muestra de 20 lotes proporciona una desviación estándar de 5.8 g/l. Existe suficiente evidencia en los datos para concluir que la variabilidad en la compañía 1 es mayor que la variabidad de la compañía 2? Realizar el constraste para un nivel de significación del 5 %. 6. Un fabricante de lentes intraoculares evalúa una nueva máquina pulidora. El fabricante aprobará la máquina si el porcentaje de lentes pulidos que contienen defectos en la superficie no es mayor del 2 %. Se toma una muestra aleatoria de 250 lentes y se encuentra Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.

136 Capítulo 8. Contrastes de Hipótesis que 6 de ellos tienen defectos. Aprueba el fabricante la nueva máquina pulidora?. Tomar α =0,1 7. Se utilizan dos máquinas diferentes de moldeo por inyección para la fabricación de piezas de plástico. Una pieza se considera defectuosa si tiene un encogimiento excesivo o si le falta color. Se toman dos muestras aleatorias, cada una de tamaño 300, y se encuentran 15 defectuosas en la primera y 8 en la segunda. Es razonable concluir que la proporción de defectuosas es la misma en ambas máquinas?. Realizar el contraste al 5 % de significación. 8. Quince hombres adultos con edades comprendidas entre 35 y 50 años participan en un estudio para evaluar el efecto de la dieta y el ejercicio sobre el nivel de colesterol en la sangre. Los niveles de colesterol medidos sobre cada individuo antes y después de haber realizado el programa (dieta baja en grasas y ejercicio) aparecen en la siguiente tabla: Sujeto Antes Después 1 265 229 2 240 231 3 258 227 4 295 240 5 251 238 6 245 241 7 287 234 8 314 256 9 260 247 10 279 239 11 283 246 12 240 218 13 238 219 14 225 226 15 247 233 Contrastar con un nivel de significación del 5 % si el programa reduce el nivel de colesterol. 9. En la fabricación de semiconductores, a menudo se utiliza una sustancia química para quitar el sicilio de la parte trasera de las obleas antes de la metalización. En este proceso

8.5. Ejercicios 137 es importante la rapidez con la que actúa la sustancia. Se han comparado dos soluciones químicas, utilizando para ello dos muestras aleatorias de 10 obleas para cada solución. La rapidez de acción observada es la siguiente (en mils/min): Solución 1 9.9 9.4 9.3 9.6 10.2 10.1 10.3 10.0 9.3 10.1 Solución 2 10.2 10.6 10.7 11.4 10.5 11.0 10.2 10.7 10.4 10.3 a) Contrastar la igualdad de varianzas para un nivel de significación del 10 %. b) Es significativamente mayor la rapidez (media) de actuación de la sustancia empleada en la solución 2?. Realizar el contraste para un nivel de significación del 5% 10. Se mide la producción diaria de 2 máquinas durante 9 días seleccionados al azar. Los datos obtenidos se recogen en la siguiente tabla: Máquina 1 Máquina 2 103 101 115 98 101 110 105 99 107 98 110 110 105 109 110 99 115 100 a. Obtener un intervalo de confianza para la producción media de cada máquina con un nivel de confianza del 95 %. b. Contrastar si las varianzas pueden suponerse iguales al 10 % de significación. c. Contrastar si la producción media diaria de la máquina 1 es significativamente mayor que la producción media diaria de la máquina 2. Realizar el contraste para un nivel de significación del 5 %. Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.

138 Capítulo 8. Contrastes de Hipótesis 11. Un sindicato pretende analizar los accidentes laborales en los sectores de la construcción y la siderometalurgia. Para ello, toma una muestra aleatoria de 125 empresas dedicadas a la construcción y otra de 75 pertenecientes al sector de la siderometalurgia. Una vez analizados los porcentajes de accidentes en cada una de estas empresas, se obtienen los siguientes datos: N o de empresas por sector con un % de accidentes menor del 10 % Construcción 98 27 Siderometalurgia 54 21 N o de empresas por sector con un % de accidentes mayor o igual del 10 % Puede afirmarse al 5 % de significación que el porcentaje de accidentes laborales es independiente del sector al que pertenece la empresa?. 12. La Consejería de Obras Públicas y Urbanismo de una Comunidad engarga un estudio para comparar el precio de las viviendas nuevas de dos municipios, A y B. Con tal fin, se recoge información sobre el precio del m 2 de 42 viviendas de promotoras distintas, seleccionadas al azar en el municipio A y de 40 viviendas en el municipio B. En la muestra de viviendas del municipio A, el precio medio del m 2 ha resultado ser de 0.98 miles de euros con una desviación típica de 0.09 miles de euros, mientras que en la muestra de viviendas del municipio B, el precio medio del m 2 es de 0.95 y la desviación típica de 0.07. A partir de esta información, puede aceptarse que en los dos municipios no hay diferencias significativas en el precio medio de las viviendas de nueva construcción para un nivel de significación del 5 %?. 13. Seinvestigalatemperaturadedeflexión bajo carga para dos tipos diferentes de tubería de plástico. Para ello se toman dos muestras aleatorias, cada una de 10 unidades, anotando

8.5. Ejercicios 139 las temperaturas de deflexión observadas ( o F). Los resultados son los siguientes. Tipo 1 Tipo 2 206 177 188 197 205 206 187 201 194 180 193 176 207 185 185 200 189 197 213 192 Suponiendo que sendas muestras proceden de poblaciones normales e independientes, a. Obténunintervalodeconfianza para el cociente de varianzas con un nivel de confianza del 95 %. Pueden considerarse iguales las varianzas? b. Apoyan los datos la afirmación de que la temperatura de deflexión bajo carga para la tubería de tipo 2 es mayor que para la tubería de tipo 1?. Tomar α =0,05. Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.