ESTADÍSTICA Grado en CC. de la Alimentación Tema 3 Contrastes de hipótesis Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 1
Estructura de este tema Qué es un contraste de hipótesis? Elementos de un contraste: hipótesis, tipos de error, nivel de significación, región crítica. El p-valor. Contrastes para la media de una población normal. Comparación de dos medias: muestras independientes y datos emparejados (sólo se tratará el caso de varianzas iguales). Contrastes para una proporción. Comparación de dos proporciones. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 2
Qué es un contraste de hipótesis? Una hipótesis es una afirmación que se hace sobre la población. La hipótesis es paramétrica si se refiere a los valores que toma alguno de los parámetros poblacionales. El problema de contrastar una hipótesis: Confirmar o refutar una afirmación acerca de una población mediante datos muestrales. Un contraste de hipótesis es una técnica estadística para juzgar si los datos aportan evidencia o no para confirmar una hipótesis. En este tema estudiamos contrastes de hipótesis paramétricas: confirmar o refutar una afirmación acerca de uno o varios parámetros de la distribución de una o varias variables aleatorias. Por ejemplo: la media es no negativa (µ 0); la proporción de personas con obesidad es un 40 % (p = 0, 40); la media de una población es mayor o igual a la de otra (µ 1 µ 2 ); etc. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 3
Elementos de un contraste Paso 1. Plantear el contraste: Se establece una hipótesis básica, que llamaremos hipótesis nula y denotaremos H 0, y frente a ella otra hipótesis H 1, o hipótesis alternativa. Paso 2. Fijar una regla de decisión para aceptar o rechazar H 0 : se fija el estadístico del contraste, una función de la muestra cuyos valores, si H 0 es cierta, estarán una cierta región A (región de aceptación) con elevada probabilidad. Paso 3. Tomar la decisión: Si, al observar la muestra, el estadístico del contraste toma valores en la región de rechazo R = A c, se rechaza H 0. Si toma valores en A, se acepta H 0. Nota importante: Los contrastes de hipótesis que estudiaremos tienden a ser muy conservadores con H 0. Sólo rechazaremos H 0 cuando haya una fuerte evidencia (muestral) en su contra. En este sentido, se asemejan a un juicio en el que el acusado se considera inocente a no ser que se demuestre lo contrario. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 4
Ejemplo 3.1: Los refrescos de cola light utilizan edulcorantes artificiales que pueden perder su efecto con el tiempo. En un experimento se pidió a varias personas que probaran refrescos dietéticos y calificaran su grado de sabor dulce en una escala de 1 a 10. Tras almacenar las bebidas durante un mes a alta temperatura (para imitar el efecto de 4 meses de almacenamiento a temperatura ambiente) las mismas personas probaron de nuevo los refrescos y calificaron de nuevo su grado de sabor dulce. En la siguiente tabla aparecen las diferencias en las puntuaciones (a mayor diferencia, mayor caída del sabor): 2 0,4 0,7 2-0,4 2,2-1,3 1,2 1,1 2,3 Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 5
Ejemplo 3.1 (cont.): La mayoría de los datos son positivos. Es decir, la mayoría de las personas apreciaron pérdida en el nivel de sabor. Pero las diferencias no son muy grandes (e incluso dos personas apreciaron un incremento). La pregunta que trata de responder un contraste de hipótesis es: Proporcionan estos datos evidencia de que el nivel medio de sabor decrece en media? La media estimada a partir de los datos es x = 1,02. Refleja esta estimación un auténtico descenso en el nivel medio de sabor? Se debe el resultado a razones puramente aleatorias? Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 6
Ejemplo 3.1 (cont.): Paso 1. Plantear el contraste. Llamamos µ al descenso medio (desconocido) del grado de sabor de los refrescos. Como queremos confirmar si el grado medio de sabor realmente desciende (es decir, si µ > 0), queremos contrastar H 0 : µ 0 frente a H 1 : µ > 0. Si rechazamos H 0, esto significará que los datos muestran una fuerte evidencia en contra de H 0. Es decir, necesitamos pruebas estadísticas para declarar al acusado culpable. Nota importante: La hipótesis para la que se desea encontrar evidencia estadística es la hipótesis alternativa, H 1. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 7
Ejemplo 3.1 (cont.): Paso 2. Fijar una regla de decisión. El razonamiento básico para hacer este contraste es: Supongamos que H 0 es cierta, es decir, µ 0. Es el resultado obtenido a partir de los datos ( x = 1, 02) extraño o poco frecuente bajo esta hipótesis? Si esto es así, los datos aportan evidencia contra H 0 y a favor de H 1. Para llevar a cabo el análisis anterior tenemos que estudiar qué valores son los que cabe esperar que tome la media muestral X cuando H 0 es cierta. Simplificación: Para simplificar suponemos de momento que la población es normal y que la varianza es conocida y vale σ 2 = 1. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 8
Ejemplo 3.1 (cont.): Supongamos que H 0 es cierta y que µ vale 0 (toma el valor en el que más difícil es distinguir entre H 0 y H 1 ). Sabemos (tema 2) que X µ σ/ n N(0, 1). Para juzgar si el valor observado en la muestra x = 1,02 es compatible con µ = 0 calculamos t = 1, 02 0 1/ 10 = 3, 2255 y comparamos con la distribución normal estándar, N(0, 1). Observación: t es el estadístico del contraste. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 9
Ejemplo 3.1 (cont.): Paso 3. Tomar la decisión. Como 3,2255 es un valor bastante improbable para una distribución N(0, 1), los datos proporcionan bastante evidencia en contra de H 0 y a favor de H 1. 0.4 N 0,1 0.3 0.2 0.1 3,2255 4 2 2 4 Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 10
Ejemplo 3.1 (cont.): Podemos interpretar t = 3, 2255 como la distancia entre x y 0 medida en desviaciones típicas. Mirando las tablas de la normal: P{Z > 3, 2255} < 0, 001. Si µ = 0, en menos de 1 de cada 1000 muestras se obtendría un valor de t superior a 3,2255. Parece que la distancia entre x y 0 es suficientemente grande como para rechazar H 0 : µ 0. Qué significa suficientemente grande? Depende de lo seguros que queramos estar a la hora de rechazar o no la hipótesis nula. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 11
Tipos de error Podemos cometer 2 tipos de error: Rechazar H 0 Rechazar H 1 H 0 cierta Error de tipo I Decisión correcta H 1 cierta Decisión correcta Error de tipo II De los dos errores sólo vamos a poder controlar el error de tipo I. Por ello, se deben definir las hipótesis de forma que el error de tipo I sea el más grave (equivalentemente, H 1 debe ser la hipótesis que queremos confirmar). Se llama tamaño del contraste a la mayor probabilidad de cometer un error de tipo I cuando se realiza ese contraste. Lo que se hace es fijar un nivel de significación α (0, 1) tal que tamaño del contraste α. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 12
Ejemplo 3.2: Una empresa cárnica japonesa se plantea comercializar carne procedente de la prefectura de Fukushima. Para averiguar si su consumo es seguro se realizan análisis sobre varios trozos de dicha carne para detectar la presencia de materiales radiactivos. Cómo creemos que se debe plantear el contraste? H 0 : H 1 : H 0 : H 1 : La carne es apta para el consumo Los niveles de radiactividad superan los ĺımites permitidos Internacional Política España Deportes Economía Gente y TV Sociedad Ir a portada de ELPAÍS.com Los niveles de radiactividad superan los ĺımites permitidos Martes, 19/7/2011 SECCIONES DE LA EDICIÓN IMPRESA: La Primeracarne Internacional España eseconomía apta Opinión Viñetas para el Tendencias consumo Obituarios Deportes Pantalla Última Estás en: ELPAIS.com> Edición impresa> Sociedad AGENCIAS - Tokio - 18/07/2011 Vota Resultado 24 votos Recomendar 45 El segundo mayor suministrador de carne de Japón, la compañía Aeon, reconoció ayer que ha vendido carne de vaca contaminada con cesio radiactivo en varios establecimientos de Tokio y sus alrededores, según informó la empresa en un comunicado. En el país nipón se han registrado casos de vegetales, té, leche, marisco y agua contaminados por radiación desde que se produjo el accidente en la central nuclear de Fukushima-1, gravemente dañada por el terremoto y el tsunami del pasado 11 de marzo, que ha supuesto la mayor crisis nuclear desde Chernóbil (Ucrania) en 1986. Descubre nuestro visor de la edición impresa. Permite visualizarla y descargarla Aeon admitió que ha vendido carne de vaca Japón prohíbe la venta de carne de contaminada en una tienda de Tokio y en más de vacuno procedente de Fukushima una decena de establecimientos cerca de la capital japonesa. Aeon, que compite con el mayor suministrador del país, Seven and I Holdings, Japón indicó que las vacas fueron alimentadas con A FONDO Capital: Tokio. pienso fabricado con arroz que excede los límites Gobierno: de cesio radiactivo impuestos por el Gobierno. Monarquía Constitucional. Población: Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 13
Ejemplo 3.1 (cont.): Vamos a rechazar H 0 : µ 0 siempre que la distancia entre x y µ = 0 sea suficientemente grande, mayor que un valor crítico c: x 0 1/ 10 > c. Para determinar c fijamos el nivel de significación α. Los valores α = 0,01 o α = 0,05 son los más habituales. { } x 0 α = P H0 (Rechazar H 0 ) = P H0 1/ 10 > c = P(Z > c). Por lo tanto c = z α. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 14
Ejemplo 3.1 (cont.): Rechazamos H 0 a nivel α si el valor t observado está en { } x 0 R = 1/ 10 > z α. 0.4 N 0,1 0.3 0.2 0.1 A R 4 2 zα 2 4 Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 15
Ejemplo 3.1 (cont.): Rechazaremos H 0 : µ 0 a nivel α siempre que se satisfaga la condición de la región de rechazo o región crítica { } x 0 R = 1/ 10 > z α. Para los datos del ejemplo recordemos que x 0 1/ 10 = 3, 2255 Para hacer el contraste a nivel α = 0, 05, buscamos en las tablas z 0,05 = 1, 64. Como 3, 2255 > 1, 64, estamos en la región crítica y rechazamos la hipótesis nula µ 0 a nivel α = 0, 05. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 16
Posibles resultados R Región crítica o de rechazo (x 1,,x n) Decisión Rechazo H0 Test (x 1,,x n) Región de aceptación A Acepto H 0 Para la mayoría de los contrastes la región crítica es de la forma: { } Distancia entre datos y H0 R = > c (tablas). E.T. de la distancia Todos los contrastes que veremos siguen el mismo patrón. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 17
Contrastes para la media de una población normal (varianza desconocida) Contrastes unilaterales: Hipótesis: H 0 : µ µ 0 frente a H 1 : µ > µ 0 Región crítica: { } x µ0 R = s/ n > t n 1;α. Hipótesis: H 0 : µ µ 0 frente a H 1 : µ < µ 0 Región crítica: { } x µ0 R = s/ n < t n 1;α. Contraste bilateral (hipótesis nula puntual): Hipótesis: H 0 : µ = µ 0 frente a H 1 : µ µ 0 Región crítica: { } x µ0 R = s/ n > t n 1;α/2. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 18
Ejemplo 3.1 (cont.): Queremos contrastar H 0 : µ 0 frente a H 1 : µ > 0 a nivel α = 0, 05. Como σ no es conocida la estimamos a partir de la muestra: mediante 2 0, 4 0, 7 2 0, 4 2, 2 1, 3 1, 2 1, 1 2, 3 s = n i=1 (x i x) 2 n 1 Calculamos el estadístico del contraste: = 1,196. t = x µ 0 s/ n = 1,02 0 1,196/ 10 = 2,697. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 19
Ejemplo 3.1 (cont.): Como 2, 697 > t 9;0,05 = 1, 833 estamos en la región crítica y rechazamos H 0 a nivel α = 0, 05. 0.4 t 9 0.3 0.2 0.1 4 2 2 4 2,697 Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 20
Ejemplo 3.1 (cont.): Cuál es la conclusión si fijamos α = 0,01? 0.4 t 9 0.3 0.2 0.1 4 2 2 4 2,697 Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 21
Ejemplo 3.1 (cont.): Solución con SPSS Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 22
Prueba T Ejemplo 3.1 (cont.): Solución con SPSS [Conjunto_de_datos0] C:\Documents and Settings\usuario\Mis documentos\joser\docen \estap\datos\edulcorante.sav Estadísticos para una muestra dulzor N Desviación Error típ. de Media típ. la media 10 1,020 1,1961,3782 Prueba para una muestra dulzor Valor de prueba = 0 95% Intervalo de confianza para la Diferencia diferencia t gl Sig. (bilateral) de medias Inferior Superior 2,697 9,025 1,0200,164 1,876 Valor de prueba: µ 0 (el valor de µ que separa H 0 de H 1 ). Por defecto µ 0 = 0. Sig (bilateral): es el p-valor del test bilateral H 0 : µ = µ 0 frente a H 1 : µ µ 0 (transparencias siguientes). Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 23
El p-valor de un contraste Crítica a la selección del nivel de significación α (a) El resultado del test puede depender mucho del valor de α elegido, que es arbitrario, siendo posible rechazar H 0 con α = 0,05 y aceptarlo con α = 0,04. 0.4 0.4 0.3 0.3 0.2 0.2 0.1 Α 0,05 0.1 Α 0,04 4 2 2 4 4 2 2 4 Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 24
Crítica a la selección del nivel de significación α (b) Dar sólo el resultado del test (aceptación o rechazo) no permite diferenciar el grado de evidencia que la muestra indica a favor o en contra de H 0. 0.4 N 0,1 0.3 0.2 0.1 4 2 2 4 1,75 3,09 Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 25
A medida que el nivel de significación disminuye es más difícil rechazar la hipótesis nula (manteniendo los mismos datos). 0.4 t 9 0.4 t 9 0.3 0.3 0.2 0.2 0.1 Α 0,05 0.1 Α 0,01 4 2 2 4 2,697 4 2 2 4 2,697 Hay un valor α = p a partir del cual ya no podemos rechazar H 0. Es decir si α < p ya no se rechaza H 0. A p se le llama el p-valor del contraste. El p-valor indica el punto de división entre el rechazo y la aceptación: Si α < p, no podemos rechazar H 0 a nivel α. Si α > p, podemos rechazar H 0 a nivel α. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 26
Interpretación: El p-valor se interpreta como una medida de la evidencia estadística que los datos aportan a favor de la hipótesis alternativa H 1 (o en contra de H 0 ): cuando el p-valor es pequeño se considera que hay una fuerte evidencia a favor de H 1. Utilización: Es más informativo utilizar el p-valor que fijar un nivel de significación ya que proporciona una idea de hasta qué punto la información muestral soporta H 0. En general: Si p > 0, 1, no hay evidencia para rechazar H 0. Si 0, 01 < p < 0, 1, el rechazo de H 0 dependerá de nuestro criterio y de las consecuencias que conlleve rechazar H 0. Si p < 0, 01, en general se rechaza H 0. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 27
Crítica a la selección del nivel de significación α (a) El resultado del test puede depender mucho del valor de α elegido, que es arbitrario, siendo posible rechazar H 0 con α = 0,05 y aceptarlo con α = 0,04. 0.4 0.4 0.3 0.3 0.2 0.2 0.1 Α 0,05 0.1 Α 0,04 4 2 2 4 4 2 2 4 p-valor = 0,045 Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 28
Crítica a la selección del nivel de significación α (b) Dar sólo el resultado del test (aceptación o rechazo) no permite diferenciar el grado de evidencia que la muestra indica a favor o en contra de H 0. 0.4 N 0,1 0.3 0.2 0.1 4 2 2 4 p 0,04 p 0,001 Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 29
Los paquetes de software estadístico sólo dan como resultado de un contraste su p-valor. SPSS llama Sig. (de significación) al Prueba p-valor. T Excel lo llama Probabilidad. [Conjunto_de_datos0] C:\Documents and Settings\usuario\Mis documentos\jose \estap\datos\edulcorante.sav Conociendo el p-valor, el usuario puede tomar la decisión de aceptar o rechazar H 0 para cualquier α. Estadísticos para una muestra SPSS siempre calcula el p-valor Desviación para elerror contraste típ. de bilateral. Si N Media típ. la media queremos hacer un contraste unilateral, tenemos que dividir 10 1,020 1,1961,3782 entre 2 el valor calculado por SPSS. dulzor Prueba para una muestra dulzor Valor de prueba = 0 95% Intervalo de confianza para la Diferencia diferencia t gl Sig. (bilateral) de medias Inferior Superior 2,697 9,025 1,0200,164 1,876 En el ejemplo, el p-valor del contraste es 0,025/2 = 0,0125. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 30
Ejemplo 3.1 (cont.): En el ejemplo, el p-valor del contraste es 0,025/2 = 0,0125: Si α < 0,0125 no podemos rechazar µ 0. Si α > 0,0125 podemos rechazar µ 0. 0.4 t 9 0.3 0.2 p 0,0125 0.1 4 2 2 4 2,697 Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 31
sodio Pavo Media 460,8125 21,79435 Mediana 469,5000 Comparación de dos Varianza medias (muestras 7599,896 Desv. típ. 87,17738 Mínimo 357 Máximo 588 independientes) Rango 231,00 Desv. típ. 102,43472 Mínimo 253 Ejemplo 3.3: Se ha considerado la cantidad de calorías y de sodio Máximo 645 Rango 392,00 en salchichas de varias marcas de dos tipos: Amplitud ternera intercuartil y pavo. 158,75 Resumen del procesamiento de los casos tipo Estadístico Error típ. Amplitud intercuartil 161,50 Ternera Media 401,1500 22,90510 Mediana 380,5000 Varianza 10492,871 sodio tipo Pavo Ternera Casos Válidos Perdidos Total N Porcentaje N Porcentaje N Porcentaje 16 100,0% 0,0% 16 100,0% 20 100,0% 0,0% 20 100,0% 600,00 Descriptivos sodio tipo Pavo Ternera Media Mediana Varianza Desv. típ. Mínimo Máximo Rango Amplitud intercuartil Media Mediana Varianza Desv. típ. Mínimo Máximo Rango Amplitud intercuartil Estadístico Error típ. 460,8125 21,79435 469,5000 7599,896 87,17738 357 588 231,00 161,50 401,1500 22,90510 380,5000 10492,871 102,43472 253 645 392,00 158,75 sodio 500,00 400,00 300,00 Pavo tipo Ternera Págin Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 32
Ejemplo 3.3 (cont.): Aportan evidencia estos datos para afirmar que el contenido medio poblacional de sodio de las salchichas de pavo es distinto al de las salchichas de ternera? X 1,..., X n1 es una muestra de N(µ 1, σ) Y 1,..., Y n2 es una muestra de N(µ 2, σ) Supuestos necesarios: Las muestras proceden de dos poblaciones normales. Las varianzas son desconocidas pero iguales. Las dos muestras son independientes. Contrastamos H 0 : µ 1 = µ 2 frente a H 1 : µ 1 µ 2 (α = 0, 05) x ȳ R = > t s 1 p n 1 + 1 n1 +n 2 2,α/2. n 2 Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 33
Ejemplo 3.3 (cont.): Con los datos del ejemplo, x ȳ = 460, 81 401, 15 = 59, 66 s 2 p = (n 1 1)s 2 1 + (n 2 1)s 2 2 n 1 + n 2 2 = 15 7599, 89 + 19 10492, 871 34 = Estimador combinado de la varianza = 9216, 556 t = x ȳ s p 1 n 1 + 1 n 2 = 59, 66 59, 66 = = 1, 853 9216, 556 (1/16 + 1/20) 32,2 Como 1, 853 < t 34;0,025 = 2, 04, no podemos rechazar H 0. Las diferencias encontradas en las cantidades medias de sodio de las dos muestras no son significativas al nivel α = 0, 05. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 34
Ejemplo 3.3 (cont.): Con SPSS Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 35
Ejemplo 3.3 (cont.): Con SPSS Estadísticos de grupo sodio Desviación Error típ. de la media tipo N Media típ. Pavo 16 460,8125 87,17738 21,79435 Ternera 20 401,1500 102,43472 22,90510 Prueba de muestras independientes Prueba de Levene para la igualdad de varianzas F Sig. t gl Prueba T para la igualdad de medias Error típ. Sig. Diferencia de la 95% Intervalo de confianza (bilateral) de medias diferencia para la diferencia sodio Se han asumido varianzas iguales No se han asumido varianzas iguales Inferior Superior,008,930 1,853 34,073 59,66250 32,2003-5,77649 125,10149 1,887 33,84,068 59,66250 31,6170-4,60214 123,92714 El p-valor es 0,073. Esto significa que se puede rechazar H 0 si α > 0,073. Al nivel α = 0,05 no podemos rechazar. Error típico de la diferencia: s p 1/n1 + 1/n 2. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 36
Comparación de dos medias (datos emparejados) Ejemplo 3.4: Se usan cinco dosis de una sustancia ferrosa para determinar si existen diferencias entre llevar a cabo un análisis químico de laboratorio o un análisis de fluorescencia por rayos X para determinar el contenido de hierro. Cada dosis se divide en dos partes iguales a las que se aplica cada uno de los dos procedimientos. Los resultados obtenidos son los siguientes: Dosis 1 2 3 4 5 Rayos X 2,0 2,0 2,3 2,1 2,4 Análisis Químico 2,2 1,9 2,5 2,3 2,4 Se supone que las poblaciones son normales. Aportan los datos suficiente evidencia a nivel α = 0,05 para afirmar que el contenido medio de hierro determinado con el análisis químico es diferente del contenido medio determinado cuando se utilizan rayos X? Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 37
Ejemplo 3.4 (cont.): Parámetros: µ 1 es el contenido medio detectado por rayos X µ 2 es el contenido medio detectado por análisis químico. Hipótesis: Cuando las muestras no son independientes, en lugar de contrastar H 0 : µ 1 = µ 2 frente a H 1 : µ 1 µ 2, se contrasta H 0 : µ = 0 frente a H 1 : µ 0, donde µ es el valor esperado de las diferencias d i = x i y i. Dosis 1 2 3 4 5 x i 2,0 2,0 2,3 2,1 2,4 y i 2,2 1,9 2,5 2,3 2,4 d i 0,2 0,1 0,2 0,2 0 Con estos datos: d = 0,1 y s d = 0,1414. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 38
Ejemplo 3.4 (cont.): Región crítica: R = { } d S d / n > t n 1;α/2. Mirando en las tablas t 4;0,025 = 2,776. Por otra parte, d S d / n = 0,1 0,1414/ 5 = 1,5811. Como 1,5811 < 2,776, los datos disponibles no permiten afirmar a nivel 0,05 que los dos métodos proporcionan cantidades medias de hierro diferentes. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 39
Ejemplo 3.4 (cont.): Con SPSS Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 40
Par 1 X AQ Estadísticos de muestras relacionadas Desviación Error típ. de Media N típ. la media 2,1600 5,18166,08124 2,2600 5,23022,10296 Correlaciones de muestras relacionadas Par 1 X y AQ N Correlación Sig. 5,789,113 Prueba de muestras relacionadas Diferencias relacionadas Desviación Error típ. de 95% Intervalo de confianza para la diferencia Media típ. la media Inferior Superior t -,10000,14142,06325 -,27560,07560-1,581 Prueba de muestras relacionadas gl Sig. (bilateral) 4,189 Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 41
Contrastes para una proporción Ejemplo 3.5: En un estudio, 1000 personas siguieron una dieta de adelgazamiento durante 3 meses. De las 1000 personas, 791 perdieron más de 3 kg de peso. Permiten los datos afirmar, con el nivel de significación α = 0,01, que más del 70 % de la población perdería más de 3 kg de peso de seguir la misma dieta durante el mismo tiempo? Hipótesis: H 0 : p 0,7 frente a H 1 : p > 0,7, donde p es la proporción poblacional que pierde peso. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 42
Región crítica (formulario): ˆp p 0 R = p 0 (1 p 0 ) n > z α En este caso, n = 1000, p 0 = 0,7, ˆp = 0,791 y z 0,01 = 2,33. ˆp p 0 p 0 (1 p 0 ) n = 0,791 0,7 0,7 0,3 1000 = 6,28 Por lo tanto, podemos rechazar H 0 y afirmar que más del 70 % de la población perdería más de 3 kg de peso de seguir la misma dieta durante el mismo tiempo con un nivel de significación α = 0,01. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 43
Comparación de dos proporciones Ejemplo 3.6: Se ha llevado a cabo un estudio para determinar si un medicamento dirigido a reducir el nivel de colesterol reduce también la probabilidad de sufrir un infarto. Para ello, a hombres de entre 45 y 55 años se les asignó aleatoriamente uno de los dos tratamientos siguientes: 2051 hombres tomaron un medicamento para reducir el nivel de colesterol 2030 hombres tomaron un placebo Durante los cinco años que duró el estudio, 56 de los hombres que tomaron el medicamento, y 84 de los que tomaron el placebo, sufrieron infartos. Podemos afirmar a nivel 0,05 que el medicamento es efectivo? Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 44
Ejemplo 3.6 (cont.): Parámetros: p 1 : Probabilidad de sufrir un infarto si se toma el medicamento. p 2 : Probabilidad de sufrir un infarto si se toma el placebo. Estimadores de los parámetros: ˆp 1 = 56 2051 = 0,0273 y ˆp 2 = 84 2030 = 0,0414 Hipótesis: H 0 : p 2 p 1 frente a H 1 : p 2 > p 1. Estimación de la probabilidad de infarto si fuese p 1 = p 2 (es decir, cuando H 0 es cierta pero es difícil distinguir H 0 de H 1 ): p = Numero total de infartos 56 + 84 = Numero total de personas 2051 + 2030 = 0,0343 Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 45
Región crítica (formulario) ˆp 2 ˆp 1 R = ( ) > z α p(1 p) 1 + 1 n1 n2 Con los datos del ejemplo: ˆp 2 ˆp 1 ( ) = 0,0141 p(1 p) 1 + 1 0,0343 0,9657 ( 1 2051 + 1 ) = 2,47 2030 n1 n2 z 0,05 = 1,64 Como 2,47 > 1,64, podemos rechazar H 0 y afirmar que el medicamento es efectivo a nivel α = 0,05. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 46