ESTADÍSTICA. Tema 3 Contrastes de hipótesis



Documentos relacionados
Biometría Clase 8 Pruebas de hipótesis para una muestra. Adriana Pérez 1

Métodos estadísticos y numéricos Contraste de hipótesis pag. 1 PROBLEMAS RESUELTOS DE CONTRASTE DE HIPÓTESIS

1. Introducción a la estadística 2. Estadística descriptiva: resumen numérico y gráfico de datos 3. Estadística inferencial: estimación de parámetros

PRÁCTICA 4. Ingeniería Técnica Industrial (2º) - Mecánica.

Intervalo para la media (caso general)

Asignatura: Econometría. Conceptos MUY Básicos de Estadística

Selectividad Septiembre 2013 OPCIÓN B

"CONTRASTES DE HIPÓTESIS" 4.4 Parte básica

Test ( o Prueba ) de Hipótesis

PRUEBAS DE HIPÓTESIS

Tema 3. Comparaciones de dos poblaciones

TEMA 5. MUESTREO PARA LA ACEPTACIÓN.

Hipótesis Alternativa: Afirmación sobre las posibles alternativas que se tienen a la afirmación hecha en la hipótesis nula.

Tema 1. Inferencia estadística para una población

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo

Tema 12: Contrastes Paramétricos

INFERENCIA ESTADISTICA: CONTRASTE DE HIPÓTESIS

1 Introducción a contrastes de hipótesis

CUARTA GUÍA DE EJERCICIOS: PRUEBAS DE HIPÓTESIS

OPCIÓN A 0 1 X = Podemos despejar la matriz X de la segunda ecuación ya que la matriz. 1 1 ; Adj 0 1 X =

LÍMITES Y CONTINUIDAD

SESIÓN PRÁCTICA 6: CONTRASTES DE HIPÓTESIS PROBABILIDAD Y ESTADÍSTICA. PROF. Esther González Sánchez. Departamento de Informática y Sistemas

EJERCICIOS RESUMEN. Aplicación: INFERENCIA ESTADÍSTICA. Nota técnica preparada por: Mayte Zaragoza Benítez Fecha: 13 de mayo de 2013

PRODUCTOS LIGHT ALIMENTOS LIGHT. Confederación de consumidores y Usuarios CECU-

INFERENCIA ESTADÍSTICA: CONTRASTE DE HIPÓTESIS

Inferencia Estadística

GUÍA TÉCNICA PARA LA DEFINICIÓN DE COMPROMISOS DE CALIDAD Y SUS INDICADORES

Pruebas de Hipótesis de Una y Dos Muestras. UCR ECCI CI-1352 Probabilidad y Estadística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

Selectividad Septiembre 2009 SEPTIEMBRE Opción A

Análisis de la Varianza (ANOVA) de un factor y test a posteriori.

Métodos no paramétricos para la comparación de dos muestras

7.- PRUEBA DE HIPOTESIS

Pruebas de. Hipótesis

Movilidad habitual y espacios de vida en España. Una aproximación a partir del censo de 2001

Eduardo Kido 26-Mayo-2004 ANÁLISIS DE DATOS

LÍMITES DE FUNCIONES. CONTINUIDAD

Hay diferencias en la media del HOMA entre los diabéticos y los no diabéticos? Resumen del procesamiento de los casos

Muestreo. Introducción

Informe de Resultados

ÍNDICE. Ficha técnica Encuesta y cuestionario Finalidad y resultados de la encuesta Primera parte: conocimiento...

Consumo y Opinión de la Televisión en Segmentos Poblacionales:

UNIVERSIDAD DE ATACAMA

WEB 2.0 ESTUDIO SOBRE LA UTILIZACION DE LA WEB 2.0 POR PARTE DE LOS MENORES

Práctico 1. Estadística y Dinámica de Poblaciones

Qué requisitos deben cumplir los albaranes o notas de entrega?

GESTIÓN Y CONTROL DEL DESARROLLO E IMPLANTACIÓN DE APLICACIONES

PROPUESTAS COMERCIALES

Estadística y Método Científico Hugo S. Salinas. Fuente:

UNIVERSIDADES DE ANDALUCÍA PRUEBA DE ACCESO A LA UNIVERSIDAD OPCIÓN A

ESTADÍSTICA SEMANA 4

Test de hipótesis. Si H0 es cierta el estadístico. sigue una distribución t de Student con n grados de libertad: s n

Tema 5. Variables aleatorias discretas

Centro de Capacitación en Informática

En España hay 2,5 millones de. Usuarios de lentes de contacto, Puede seguir creciendo esta cifra?

Fundamentos de Investigación de Operaciones Investigación de Operaciones 1

PARA COMERCIANTES Y AUTÓNOMOS. INFORMACIÓN SOBRE TARJETAS DE CRÉDITO.

ENCUESTA SOBRE EQUIPAMIENTO Y USO DE TECNOLOGÍAS DE INFORMACIÓN Y COMUNICACIÓN EN LOS HOGARES (TIC-H) HOGARES Y POBLACIÓN

Las razones financieras ayudan a determinar las relaciones existentes entre diferentes rubros de los estados financieros

Revisión del Universo de empresas para la Estimación de los Datos Del Mercado Español de Investigación de Mercados y Opinión.

Soluciones Examen de Estadística Ingeniería Superior de Telecomunicación

Estrategias de producto y precio

Análisis de la varianza (un factor): ANOVA

ONG PANKARA EcoGlobal CUIDANDO EL PRESENTE, SEMBRANDO EL FUTURO

Importancia de la investigación clínica EN ONCOLOGÍA. ONCOvida. oncovida_20.indd 1 10/10/11 12:53

GRAFICOS DE CONTROL DATOS TIPO VARIABLES

ESTIMACIÓN. puntual y por intervalo

POLITICAS DE LA COMPETENCIA Licenciatura en Economía, 4º Curso (Grupos I y II) Profesor: Georges Siotis. Hoja 5: Integración vertical

Matemáticas C.C.S.S. Repaso de Selectividad 1. Se desea obtener dos elementos químicos a partir de las sustancias A y B. Un kilo de A contiene 8

ESTIMACION DE INTERVALOS DE CONFIANZA

SISTEMA InfoSGA Manual de Actualización Mensajeros Radio Worldwide C.A Código Postal 1060

Cómo investigar y no morir en el intento

Indicaciones específicas para los análisis estadísticos.

COMERCIO EXTERIOR E INTRACOMUNITARIO

Colegio Alexander von Humboldt - Lima. Tema: La enseñanza de la matemática está en un proceso de cambio

Covarianza y coeficiente de correlación

ANALISIS MULTIVARIANTE

CAPÍTULO 10 Aplicaciones de la Derivada a Funciones Económicas

INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA

PROGRAMAS OFICIALES DE POSGRADO

Propuesta A. 2 0 b) Dada la ecuación matricial: X =, despeja y calcula la matriz X (0.75 ptos) 1 1

Centro de Capacitación en Informática

Marketing Jurídico, generando negocios online Por: Equipo Mi Guía Legal, El Salvador 23 de febrero de 2016

VI. SINDICATOS Y RELACIONES LABORALES

Ejercicio Nº 3: Realizar aumentos en una Tabla de Sueldos

LÍMITES DE FUNCIONES. CONTINUIDAD

MANUAL DE USUARIO CONTROL LOGÍSTICO DE TIEMPOS

MANUAL PARA EL USO DE SPSS

Tema 5: Sistemas Monetarios Internacionales

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 2015 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 1: MATRICES. Junio, Ejercicio 1, Opción B

Aire ambiente: No se recogieron muestras en esta comunidad.

x y 8000 x + y a) La región factible asociada a las restricciones anteriores es la siguiente: Pedro Castro Ortega lasmatematicas.

LA ESTRATEGIA NACIONAL DE BOSQUES Y CAMBIO CLIMÁTICO

CONCEPTOS PREVIOS TEMA 2

INFORME: LA SINIESTRALIDAD LABORAL EN LA COMUNIDAD DE MADRID ENERO MARZO

MANUAL DE AYUDA HERRAMIENTA DE APROVISIONAMIENTO

ESTADÍSTICA APLICADA. Tema 3: Contrastes de hipótesis

El modelo EOQ básico (Economic Order Quantity) es el más simple y fundamental de todos los modelos de inventarios.

Análisis y cuantificación del Riesgo

NOTIFICACIÓN DE MOVIMIENTOS DE ESTUPEFACIENTES POR PARTE DE LOS LABORATORIOS FARMACÉUTICOS Y ALMACENES MAYORISTAS DE DISTRIBUCIÓN

CAPÍTULO III ANÁLISIS DE INVERSIONES GANADERAS

Transcripción:

ESTADÍSTICA Grado en CC. de la Alimentación Tema 3 Contrastes de hipótesis Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 1

Estructura de este tema Qué es un contraste de hipótesis? Elementos de un contraste: hipótesis, tipos de error, nivel de significación, región crítica. El p-valor. Contrastes para la media de una población normal. Comparación de dos medias: muestras independientes y datos emparejados (sólo se tratará el caso de varianzas iguales). Contrastes para una proporción. Comparación de dos proporciones. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 2

Qué es un contraste de hipótesis? Una hipótesis es una afirmación que se hace sobre la población. La hipótesis es paramétrica si se refiere a los valores que toma alguno de los parámetros poblacionales. El problema de contrastar una hipótesis: Confirmar o refutar una afirmación acerca de una población mediante datos muestrales. Un contraste de hipótesis es una técnica estadística para juzgar si los datos aportan evidencia o no para confirmar una hipótesis. En este tema estudiamos contrastes de hipótesis paramétricas: confirmar o refutar una afirmación acerca de uno o varios parámetros de la distribución de una o varias variables aleatorias. Por ejemplo: la media es no negativa (µ 0); la proporción de personas con obesidad es un 40 % (p = 0, 40); la media de una población es mayor o igual a la de otra (µ 1 µ 2 ); etc. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 3

Elementos de un contraste Paso 1. Plantear el contraste: Se establece una hipótesis básica, que llamaremos hipótesis nula y denotaremos H 0, y frente a ella otra hipótesis H 1, o hipótesis alternativa. Paso 2. Fijar una regla de decisión para aceptar o rechazar H 0 : se fija el estadístico del contraste, una función de la muestra cuyos valores, si H 0 es cierta, estarán una cierta región A (región de aceptación) con elevada probabilidad. Paso 3. Tomar la decisión: Si, al observar la muestra, el estadístico del contraste toma valores en la región de rechazo R = A c, se rechaza H 0. Si toma valores en A, se acepta H 0. Nota importante: Los contrastes de hipótesis que estudiaremos tienden a ser muy conservadores con H 0. Sólo rechazaremos H 0 cuando haya una fuerte evidencia (muestral) en su contra. En este sentido, se asemejan a un juicio en el que el acusado se considera inocente a no ser que se demuestre lo contrario. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 4

Ejemplo 3.1: Los refrescos de cola light utilizan edulcorantes artificiales que pueden perder su efecto con el tiempo. En un experimento se pidió a varias personas que probaran refrescos dietéticos y calificaran su grado de sabor dulce en una escala de 1 a 10. Tras almacenar las bebidas durante un mes a alta temperatura (para imitar el efecto de 4 meses de almacenamiento a temperatura ambiente) las mismas personas probaron de nuevo los refrescos y calificaron de nuevo su grado de sabor dulce. En la siguiente tabla aparecen las diferencias en las puntuaciones (a mayor diferencia, mayor caída del sabor): 2 0,4 0,7 2-0,4 2,2-1,3 1,2 1,1 2,3 Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 5

Ejemplo 3.1 (cont.): La mayoría de los datos son positivos. Es decir, la mayoría de las personas apreciaron pérdida en el nivel de sabor. Pero las diferencias no son muy grandes (e incluso dos personas apreciaron un incremento). La pregunta que trata de responder un contraste de hipótesis es: Proporcionan estos datos evidencia de que el nivel medio de sabor decrece en media? La media estimada a partir de los datos es x = 1,02. Refleja esta estimación un auténtico descenso en el nivel medio de sabor? Se debe el resultado a razones puramente aleatorias? Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 6

Ejemplo 3.1 (cont.): Paso 1. Plantear el contraste. Llamamos µ al descenso medio (desconocido) del grado de sabor de los refrescos. Como queremos confirmar si el grado medio de sabor realmente desciende (es decir, si µ > 0), queremos contrastar H 0 : µ 0 frente a H 1 : µ > 0. Si rechazamos H 0, esto significará que los datos muestran una fuerte evidencia en contra de H 0. Es decir, necesitamos pruebas estadísticas para declarar al acusado culpable. Nota importante: La hipótesis para la que se desea encontrar evidencia estadística es la hipótesis alternativa, H 1. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 7

Ejemplo 3.1 (cont.): Paso 2. Fijar una regla de decisión. El razonamiento básico para hacer este contraste es: Supongamos que H 0 es cierta, es decir, µ 0. Es el resultado obtenido a partir de los datos ( x = 1, 02) extraño o poco frecuente bajo esta hipótesis? Si esto es así, los datos aportan evidencia contra H 0 y a favor de H 1. Para llevar a cabo el análisis anterior tenemos que estudiar qué valores son los que cabe esperar que tome la media muestral X cuando H 0 es cierta. Simplificación: Para simplificar suponemos de momento que la población es normal y que la varianza es conocida y vale σ 2 = 1. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 8

Ejemplo 3.1 (cont.): Supongamos que H 0 es cierta y que µ vale 0 (toma el valor en el que más difícil es distinguir entre H 0 y H 1 ). Sabemos (tema 2) que X µ σ/ n N(0, 1). Para juzgar si el valor observado en la muestra x = 1,02 es compatible con µ = 0 calculamos t = 1, 02 0 1/ 10 = 3, 2255 y comparamos con la distribución normal estándar, N(0, 1). Observación: t es el estadístico del contraste. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 9

Ejemplo 3.1 (cont.): Paso 3. Tomar la decisión. Como 3,2255 es un valor bastante improbable para una distribución N(0, 1), los datos proporcionan bastante evidencia en contra de H 0 y a favor de H 1. 0.4 N 0,1 0.3 0.2 0.1 3,2255 4 2 2 4 Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 10

Ejemplo 3.1 (cont.): Podemos interpretar t = 3, 2255 como la distancia entre x y 0 medida en desviaciones típicas. Mirando las tablas de la normal: P{Z > 3, 2255} < 0, 001. Si µ = 0, en menos de 1 de cada 1000 muestras se obtendría un valor de t superior a 3,2255. Parece que la distancia entre x y 0 es suficientemente grande como para rechazar H 0 : µ 0. Qué significa suficientemente grande? Depende de lo seguros que queramos estar a la hora de rechazar o no la hipótesis nula. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 11

Tipos de error Podemos cometer 2 tipos de error: Rechazar H 0 Rechazar H 1 H 0 cierta Error de tipo I Decisión correcta H 1 cierta Decisión correcta Error de tipo II De los dos errores sólo vamos a poder controlar el error de tipo I. Por ello, se deben definir las hipótesis de forma que el error de tipo I sea el más grave (equivalentemente, H 1 debe ser la hipótesis que queremos confirmar). Se llama tamaño del contraste a la mayor probabilidad de cometer un error de tipo I cuando se realiza ese contraste. Lo que se hace es fijar un nivel de significación α (0, 1) tal que tamaño del contraste α. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 12

Ejemplo 3.2: Una empresa cárnica japonesa se plantea comercializar carne procedente de la prefectura de Fukushima. Para averiguar si su consumo es seguro se realizan análisis sobre varios trozos de dicha carne para detectar la presencia de materiales radiactivos. Cómo creemos que se debe plantear el contraste? H 0 : H 1 : H 0 : H 1 : La carne es apta para el consumo Los niveles de radiactividad superan los ĺımites permitidos Internacional Política España Deportes Economía Gente y TV Sociedad Ir a portada de ELPAÍS.com Los niveles de radiactividad superan los ĺımites permitidos Martes, 19/7/2011 SECCIONES DE LA EDICIÓN IMPRESA: La Primeracarne Internacional España eseconomía apta Opinión Viñetas para el Tendencias consumo Obituarios Deportes Pantalla Última Estás en: ELPAIS.com> Edición impresa> Sociedad AGENCIAS - Tokio - 18/07/2011 Vota Resultado 24 votos Recomendar 45 El segundo mayor suministrador de carne de Japón, la compañía Aeon, reconoció ayer que ha vendido carne de vaca contaminada con cesio radiactivo en varios establecimientos de Tokio y sus alrededores, según informó la empresa en un comunicado. En el país nipón se han registrado casos de vegetales, té, leche, marisco y agua contaminados por radiación desde que se produjo el accidente en la central nuclear de Fukushima-1, gravemente dañada por el terremoto y el tsunami del pasado 11 de marzo, que ha supuesto la mayor crisis nuclear desde Chernóbil (Ucrania) en 1986. Descubre nuestro visor de la edición impresa. Permite visualizarla y descargarla Aeon admitió que ha vendido carne de vaca Japón prohíbe la venta de carne de contaminada en una tienda de Tokio y en más de vacuno procedente de Fukushima una decena de establecimientos cerca de la capital japonesa. Aeon, que compite con el mayor suministrador del país, Seven and I Holdings, Japón indicó que las vacas fueron alimentadas con A FONDO Capital: Tokio. pienso fabricado con arroz que excede los límites Gobierno: de cesio radiactivo impuestos por el Gobierno. Monarquía Constitucional. Población: Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 13

Ejemplo 3.1 (cont.): Vamos a rechazar H 0 : µ 0 siempre que la distancia entre x y µ = 0 sea suficientemente grande, mayor que un valor crítico c: x 0 1/ 10 > c. Para determinar c fijamos el nivel de significación α. Los valores α = 0,01 o α = 0,05 son los más habituales. { } x 0 α = P H0 (Rechazar H 0 ) = P H0 1/ 10 > c = P(Z > c). Por lo tanto c = z α. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 14

Ejemplo 3.1 (cont.): Rechazamos H 0 a nivel α si el valor t observado está en { } x 0 R = 1/ 10 > z α. 0.4 N 0,1 0.3 0.2 0.1 A R 4 2 zα 2 4 Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 15

Ejemplo 3.1 (cont.): Rechazaremos H 0 : µ 0 a nivel α siempre que se satisfaga la condición de la región de rechazo o región crítica { } x 0 R = 1/ 10 > z α. Para los datos del ejemplo recordemos que x 0 1/ 10 = 3, 2255 Para hacer el contraste a nivel α = 0, 05, buscamos en las tablas z 0,05 = 1, 64. Como 3, 2255 > 1, 64, estamos en la región crítica y rechazamos la hipótesis nula µ 0 a nivel α = 0, 05. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 16

Posibles resultados R Región crítica o de rechazo (x 1,,x n) Decisión Rechazo H0 Test (x 1,,x n) Región de aceptación A Acepto H 0 Para la mayoría de los contrastes la región crítica es de la forma: { } Distancia entre datos y H0 R = > c (tablas). E.T. de la distancia Todos los contrastes que veremos siguen el mismo patrón. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 17

Contrastes para la media de una población normal (varianza desconocida) Contrastes unilaterales: Hipótesis: H 0 : µ µ 0 frente a H 1 : µ > µ 0 Región crítica: { } x µ0 R = s/ n > t n 1;α. Hipótesis: H 0 : µ µ 0 frente a H 1 : µ < µ 0 Región crítica: { } x µ0 R = s/ n < t n 1;α. Contraste bilateral (hipótesis nula puntual): Hipótesis: H 0 : µ = µ 0 frente a H 1 : µ µ 0 Región crítica: { } x µ0 R = s/ n > t n 1;α/2. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 18

Ejemplo 3.1 (cont.): Queremos contrastar H 0 : µ 0 frente a H 1 : µ > 0 a nivel α = 0, 05. Como σ no es conocida la estimamos a partir de la muestra: mediante 2 0, 4 0, 7 2 0, 4 2, 2 1, 3 1, 2 1, 1 2, 3 s = n i=1 (x i x) 2 n 1 Calculamos el estadístico del contraste: = 1,196. t = x µ 0 s/ n = 1,02 0 1,196/ 10 = 2,697. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 19

Ejemplo 3.1 (cont.): Como 2, 697 > t 9;0,05 = 1, 833 estamos en la región crítica y rechazamos H 0 a nivel α = 0, 05. 0.4 t 9 0.3 0.2 0.1 4 2 2 4 2,697 Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 20

Ejemplo 3.1 (cont.): Cuál es la conclusión si fijamos α = 0,01? 0.4 t 9 0.3 0.2 0.1 4 2 2 4 2,697 Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 21

Ejemplo 3.1 (cont.): Solución con SPSS Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 22

Prueba T Ejemplo 3.1 (cont.): Solución con SPSS [Conjunto_de_datos0] C:\Documents and Settings\usuario\Mis documentos\joser\docen \estap\datos\edulcorante.sav Estadísticos para una muestra dulzor N Desviación Error típ. de Media típ. la media 10 1,020 1,1961,3782 Prueba para una muestra dulzor Valor de prueba = 0 95% Intervalo de confianza para la Diferencia diferencia t gl Sig. (bilateral) de medias Inferior Superior 2,697 9,025 1,0200,164 1,876 Valor de prueba: µ 0 (el valor de µ que separa H 0 de H 1 ). Por defecto µ 0 = 0. Sig (bilateral): es el p-valor del test bilateral H 0 : µ = µ 0 frente a H 1 : µ µ 0 (transparencias siguientes). Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 23

El p-valor de un contraste Crítica a la selección del nivel de significación α (a) El resultado del test puede depender mucho del valor de α elegido, que es arbitrario, siendo posible rechazar H 0 con α = 0,05 y aceptarlo con α = 0,04. 0.4 0.4 0.3 0.3 0.2 0.2 0.1 Α 0,05 0.1 Α 0,04 4 2 2 4 4 2 2 4 Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 24

Crítica a la selección del nivel de significación α (b) Dar sólo el resultado del test (aceptación o rechazo) no permite diferenciar el grado de evidencia que la muestra indica a favor o en contra de H 0. 0.4 N 0,1 0.3 0.2 0.1 4 2 2 4 1,75 3,09 Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 25

A medida que el nivel de significación disminuye es más difícil rechazar la hipótesis nula (manteniendo los mismos datos). 0.4 t 9 0.4 t 9 0.3 0.3 0.2 0.2 0.1 Α 0,05 0.1 Α 0,01 4 2 2 4 2,697 4 2 2 4 2,697 Hay un valor α = p a partir del cual ya no podemos rechazar H 0. Es decir si α < p ya no se rechaza H 0. A p se le llama el p-valor del contraste. El p-valor indica el punto de división entre el rechazo y la aceptación: Si α < p, no podemos rechazar H 0 a nivel α. Si α > p, podemos rechazar H 0 a nivel α. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 26

Interpretación: El p-valor se interpreta como una medida de la evidencia estadística que los datos aportan a favor de la hipótesis alternativa H 1 (o en contra de H 0 ): cuando el p-valor es pequeño se considera que hay una fuerte evidencia a favor de H 1. Utilización: Es más informativo utilizar el p-valor que fijar un nivel de significación ya que proporciona una idea de hasta qué punto la información muestral soporta H 0. En general: Si p > 0, 1, no hay evidencia para rechazar H 0. Si 0, 01 < p < 0, 1, el rechazo de H 0 dependerá de nuestro criterio y de las consecuencias que conlleve rechazar H 0. Si p < 0, 01, en general se rechaza H 0. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 27

Crítica a la selección del nivel de significación α (a) El resultado del test puede depender mucho del valor de α elegido, que es arbitrario, siendo posible rechazar H 0 con α = 0,05 y aceptarlo con α = 0,04. 0.4 0.4 0.3 0.3 0.2 0.2 0.1 Α 0,05 0.1 Α 0,04 4 2 2 4 4 2 2 4 p-valor = 0,045 Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 28

Crítica a la selección del nivel de significación α (b) Dar sólo el resultado del test (aceptación o rechazo) no permite diferenciar el grado de evidencia que la muestra indica a favor o en contra de H 0. 0.4 N 0,1 0.3 0.2 0.1 4 2 2 4 p 0,04 p 0,001 Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 29

Los paquetes de software estadístico sólo dan como resultado de un contraste su p-valor. SPSS llama Sig. (de significación) al Prueba p-valor. T Excel lo llama Probabilidad. [Conjunto_de_datos0] C:\Documents and Settings\usuario\Mis documentos\jose \estap\datos\edulcorante.sav Conociendo el p-valor, el usuario puede tomar la decisión de aceptar o rechazar H 0 para cualquier α. Estadísticos para una muestra SPSS siempre calcula el p-valor Desviación para elerror contraste típ. de bilateral. Si N Media típ. la media queremos hacer un contraste unilateral, tenemos que dividir 10 1,020 1,1961,3782 entre 2 el valor calculado por SPSS. dulzor Prueba para una muestra dulzor Valor de prueba = 0 95% Intervalo de confianza para la Diferencia diferencia t gl Sig. (bilateral) de medias Inferior Superior 2,697 9,025 1,0200,164 1,876 En el ejemplo, el p-valor del contraste es 0,025/2 = 0,0125. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 30

Ejemplo 3.1 (cont.): En el ejemplo, el p-valor del contraste es 0,025/2 = 0,0125: Si α < 0,0125 no podemos rechazar µ 0. Si α > 0,0125 podemos rechazar µ 0. 0.4 t 9 0.3 0.2 p 0,0125 0.1 4 2 2 4 2,697 Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 31

sodio Pavo Media 460,8125 21,79435 Mediana 469,5000 Comparación de dos Varianza medias (muestras 7599,896 Desv. típ. 87,17738 Mínimo 357 Máximo 588 independientes) Rango 231,00 Desv. típ. 102,43472 Mínimo 253 Ejemplo 3.3: Se ha considerado la cantidad de calorías y de sodio Máximo 645 Rango 392,00 en salchichas de varias marcas de dos tipos: Amplitud ternera intercuartil y pavo. 158,75 Resumen del procesamiento de los casos tipo Estadístico Error típ. Amplitud intercuartil 161,50 Ternera Media 401,1500 22,90510 Mediana 380,5000 Varianza 10492,871 sodio tipo Pavo Ternera Casos Válidos Perdidos Total N Porcentaje N Porcentaje N Porcentaje 16 100,0% 0,0% 16 100,0% 20 100,0% 0,0% 20 100,0% 600,00 Descriptivos sodio tipo Pavo Ternera Media Mediana Varianza Desv. típ. Mínimo Máximo Rango Amplitud intercuartil Media Mediana Varianza Desv. típ. Mínimo Máximo Rango Amplitud intercuartil Estadístico Error típ. 460,8125 21,79435 469,5000 7599,896 87,17738 357 588 231,00 161,50 401,1500 22,90510 380,5000 10492,871 102,43472 253 645 392,00 158,75 sodio 500,00 400,00 300,00 Pavo tipo Ternera Págin Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 32

Ejemplo 3.3 (cont.): Aportan evidencia estos datos para afirmar que el contenido medio poblacional de sodio de las salchichas de pavo es distinto al de las salchichas de ternera? X 1,..., X n1 es una muestra de N(µ 1, σ) Y 1,..., Y n2 es una muestra de N(µ 2, σ) Supuestos necesarios: Las muestras proceden de dos poblaciones normales. Las varianzas son desconocidas pero iguales. Las dos muestras son independientes. Contrastamos H 0 : µ 1 = µ 2 frente a H 1 : µ 1 µ 2 (α = 0, 05) x ȳ R = > t s 1 p n 1 + 1 n1 +n 2 2,α/2. n 2 Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 33

Ejemplo 3.3 (cont.): Con los datos del ejemplo, x ȳ = 460, 81 401, 15 = 59, 66 s 2 p = (n 1 1)s 2 1 + (n 2 1)s 2 2 n 1 + n 2 2 = 15 7599, 89 + 19 10492, 871 34 = Estimador combinado de la varianza = 9216, 556 t = x ȳ s p 1 n 1 + 1 n 2 = 59, 66 59, 66 = = 1, 853 9216, 556 (1/16 + 1/20) 32,2 Como 1, 853 < t 34;0,025 = 2, 04, no podemos rechazar H 0. Las diferencias encontradas en las cantidades medias de sodio de las dos muestras no son significativas al nivel α = 0, 05. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 34

Ejemplo 3.3 (cont.): Con SPSS Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 35

Ejemplo 3.3 (cont.): Con SPSS Estadísticos de grupo sodio Desviación Error típ. de la media tipo N Media típ. Pavo 16 460,8125 87,17738 21,79435 Ternera 20 401,1500 102,43472 22,90510 Prueba de muestras independientes Prueba de Levene para la igualdad de varianzas F Sig. t gl Prueba T para la igualdad de medias Error típ. Sig. Diferencia de la 95% Intervalo de confianza (bilateral) de medias diferencia para la diferencia sodio Se han asumido varianzas iguales No se han asumido varianzas iguales Inferior Superior,008,930 1,853 34,073 59,66250 32,2003-5,77649 125,10149 1,887 33,84,068 59,66250 31,6170-4,60214 123,92714 El p-valor es 0,073. Esto significa que se puede rechazar H 0 si α > 0,073. Al nivel α = 0,05 no podemos rechazar. Error típico de la diferencia: s p 1/n1 + 1/n 2. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 36

Comparación de dos medias (datos emparejados) Ejemplo 3.4: Se usan cinco dosis de una sustancia ferrosa para determinar si existen diferencias entre llevar a cabo un análisis químico de laboratorio o un análisis de fluorescencia por rayos X para determinar el contenido de hierro. Cada dosis se divide en dos partes iguales a las que se aplica cada uno de los dos procedimientos. Los resultados obtenidos son los siguientes: Dosis 1 2 3 4 5 Rayos X 2,0 2,0 2,3 2,1 2,4 Análisis Químico 2,2 1,9 2,5 2,3 2,4 Se supone que las poblaciones son normales. Aportan los datos suficiente evidencia a nivel α = 0,05 para afirmar que el contenido medio de hierro determinado con el análisis químico es diferente del contenido medio determinado cuando se utilizan rayos X? Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 37

Ejemplo 3.4 (cont.): Parámetros: µ 1 es el contenido medio detectado por rayos X µ 2 es el contenido medio detectado por análisis químico. Hipótesis: Cuando las muestras no son independientes, en lugar de contrastar H 0 : µ 1 = µ 2 frente a H 1 : µ 1 µ 2, se contrasta H 0 : µ = 0 frente a H 1 : µ 0, donde µ es el valor esperado de las diferencias d i = x i y i. Dosis 1 2 3 4 5 x i 2,0 2,0 2,3 2,1 2,4 y i 2,2 1,9 2,5 2,3 2,4 d i 0,2 0,1 0,2 0,2 0 Con estos datos: d = 0,1 y s d = 0,1414. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 38

Ejemplo 3.4 (cont.): Región crítica: R = { } d S d / n > t n 1;α/2. Mirando en las tablas t 4;0,025 = 2,776. Por otra parte, d S d / n = 0,1 0,1414/ 5 = 1,5811. Como 1,5811 < 2,776, los datos disponibles no permiten afirmar a nivel 0,05 que los dos métodos proporcionan cantidades medias de hierro diferentes. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 39

Ejemplo 3.4 (cont.): Con SPSS Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 40

Par 1 X AQ Estadísticos de muestras relacionadas Desviación Error típ. de Media N típ. la media 2,1600 5,18166,08124 2,2600 5,23022,10296 Correlaciones de muestras relacionadas Par 1 X y AQ N Correlación Sig. 5,789,113 Prueba de muestras relacionadas Diferencias relacionadas Desviación Error típ. de 95% Intervalo de confianza para la diferencia Media típ. la media Inferior Superior t -,10000,14142,06325 -,27560,07560-1,581 Prueba de muestras relacionadas gl Sig. (bilateral) 4,189 Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 41

Contrastes para una proporción Ejemplo 3.5: En un estudio, 1000 personas siguieron una dieta de adelgazamiento durante 3 meses. De las 1000 personas, 791 perdieron más de 3 kg de peso. Permiten los datos afirmar, con el nivel de significación α = 0,01, que más del 70 % de la población perdería más de 3 kg de peso de seguir la misma dieta durante el mismo tiempo? Hipótesis: H 0 : p 0,7 frente a H 1 : p > 0,7, donde p es la proporción poblacional que pierde peso. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 42

Región crítica (formulario): ˆp p 0 R = p 0 (1 p 0 ) n > z α En este caso, n = 1000, p 0 = 0,7, ˆp = 0,791 y z 0,01 = 2,33. ˆp p 0 p 0 (1 p 0 ) n = 0,791 0,7 0,7 0,3 1000 = 6,28 Por lo tanto, podemos rechazar H 0 y afirmar que más del 70 % de la población perdería más de 3 kg de peso de seguir la misma dieta durante el mismo tiempo con un nivel de significación α = 0,01. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 43

Comparación de dos proporciones Ejemplo 3.6: Se ha llevado a cabo un estudio para determinar si un medicamento dirigido a reducir el nivel de colesterol reduce también la probabilidad de sufrir un infarto. Para ello, a hombres de entre 45 y 55 años se les asignó aleatoriamente uno de los dos tratamientos siguientes: 2051 hombres tomaron un medicamento para reducir el nivel de colesterol 2030 hombres tomaron un placebo Durante los cinco años que duró el estudio, 56 de los hombres que tomaron el medicamento, y 84 de los que tomaron el placebo, sufrieron infartos. Podemos afirmar a nivel 0,05 que el medicamento es efectivo? Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 44

Ejemplo 3.6 (cont.): Parámetros: p 1 : Probabilidad de sufrir un infarto si se toma el medicamento. p 2 : Probabilidad de sufrir un infarto si se toma el placebo. Estimadores de los parámetros: ˆp 1 = 56 2051 = 0,0273 y ˆp 2 = 84 2030 = 0,0414 Hipótesis: H 0 : p 2 p 1 frente a H 1 : p 2 > p 1. Estimación de la probabilidad de infarto si fuese p 1 = p 2 (es decir, cuando H 0 es cierta pero es difícil distinguir H 0 de H 1 ): p = Numero total de infartos 56 + 84 = Numero total de personas 2051 + 2030 = 0,0343 Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 45

Región crítica (formulario) ˆp 2 ˆp 1 R = ( ) > z α p(1 p) 1 + 1 n1 n2 Con los datos del ejemplo: ˆp 2 ˆp 1 ( ) = 0,0141 p(1 p) 1 + 1 0,0343 0,9657 ( 1 2051 + 1 ) = 2,47 2030 n1 n2 z 0,05 = 1,64 Como 2,47 > 1,64, podemos rechazar H 0 y afirmar que el medicamento es efectivo a nivel α = 0,05. Estadística (Alimentación). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 46