ESTADÍSTICA APLICADA. Tema 3: Contrastes de hipótesis

Documentos relacionados
Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo

ESTADÍSTICA. Tema 3 Contrastes de hipótesis

Tema 8: Contraste de hipótesis

Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR

Universidad Rafael Belloso Chacín (URBE) Cátedra: Fundamentos de Estadística y Simulación Básica Semestre Profesor: Jaime Soto

Teorema Central del Límite (1)

Contrastes de hipótesis. 1: Ideas generales

Proyecto Tema 8: Tests de hipótesis. Resumen teórico

Prueba de hipótesis para la diferencia de medias

Contrastes de hipótesis paramétricos

4. Prueba de Hipótesis

Tema 9: Contraste de hipótesis.

ESTADÍSTICA. Tema 4 Regresión lineal simple

Contraste de hipótesis Tema Pasos del contraste de hipótesis. 1.1 Hipótesis estadísticas: nula y alternativa. 1.3 Estadístico de contraste

Práctica 2: Intervalos de confianza y contrastes con SPSS 1

Pruebas de hipótesis

Tema 13 : Intervalos de probabilidad y confianza. Hipótesis y decisiones estadísticas.

Ejemplos Resueltos Tema 4

Contrastes de hipótesis estadísticas. Contrastes paramétricos

DEFINICIONES BÁSICAS

El primer paso en la realización de una investigación es planear las hipótesis de investigación. Definamos el concepto de hipótesis:

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR

Práctica 5 ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS

INFERENCIA ESTADISTICA

ANOVA. Análisis de la Varianza. Univariante Efectos fijos Muestras independientes

TÉCNICAS ESTADÍSTICAS APLICADAS EN NUTRICIÓN Y SALUD

CONTRASTE DE HIPÓTESIS

MODELO DE RESPUESTAS Objetivos 2, 3, 4, 5, 6, 7, Y 8.

Estadística I Tema 7: Estimación por intervalos

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

EJERCICIOS DE SELECTIVIDAD

INFERENCIA ESTADÍSTICA: CONTRASTES DE HIPÓTESIS

Podemos definir un contraste de hipótesis como un procedimiento que se basa en lo observado en las muestras y en la teoría de la probabilidad para

Tema 5. Contraste de hipótesis (I)

1. Realice la prueba de homogeneidad de variancias e interprete los resultados.

TEMA 10 COMPARAR MEDIAS

Objetivos del tema. Qué es una hipótesis? Test de Hipótesis Introducción a la Probabilidad y Estadística. Contrastando una hipótesis

Pruebas de Hipótesis. Diseño Estadístico y Herramientas para la Calidad. Pruebas de Hipótesis. Hipótesis

PROYECTO DEL CURSO DE ESTADÍSTICA INFERENCIAL

Métodos Estadísticos de la Ingeniería Tema 11: Contrastes de Hipótesis Grupo B

= P (Z ) - P (Z ) = P (Z 1 25) P (Z -1 25)= P (Z 1 25) [P (Z 1 25)] = P (Z 1 25) [1- P (Z 1 25)] =

Tema 10: Introducción a los problemas de Asociación y Correlación

INTERVALOS DE CONFIANZA Julián de la Horra Departamento de Matemáticas U.A.M.

Prueba de Hipótesis. Bondad de Ajuste. Tuesday, August 5, 14

INFERENCIA ESTADISTICA

Tabla de Test de Hipótesis ( Caso: Una muestra ) A. Test para µ con σ 2 conocida: Suponga que X 1, X 2,, X n, es una m.a.(n) desde N( µ, σ 2 )

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS

Introducción a la Inferencia Estadística

Curso de Estadística Aplicada a las Ciencias Sociales. Tema 12. Contraste de hipótesis. Introducción. Introducción

Conceptos del contraste de hipótesis

Teoría de la decisión Estadística

Contraste de hipótesis paramétricas

1. Ejercicios. 2 a parte

MATERIA: ESTADÍSTICA EJEMPLOS DE POSIBLES PREGUNTAS DE EXAMEN. a. Cuáles son las escalas en que pueden estar los datos en un análisis estadístico.

PLAN DE TRABAJO 9 Período 3/09/07 al 28/09/07

UNIVERSIDAD TECNICA PARTICULAR DE LOJA ESTADISTICA Y PROBABILIDAD ENSAYO N 8

TODO ECONOMETRIA. Bondad del ajuste Contraste de hipótesis

Solución Examen Parcial IV Nombres: Apellidos: C.I.: Firma: Fecha: 22/06/2005

EJERCICIOS DE PRUEBA DE HIPOTESIS

ANÁLISIS DESCRIPTIVO DE LOS DATOS DE VARIABLES CUANTITATIVAS

CONTRASTE SOBRE UN COEFICIENTE DE LA REGRESIÓN

R E S O L U C I Ó N. a) El intervalo de confianza de la media poblacional viene dado por: I. C. z

CONTRASTES DE HIPÓTESIS PARAMÉTRICOS. La estadística en cómic (L. Gonick y W. Smith)

ANÁLISIS DE LA VARIANZA CON UN FACTOR (ANOVA)

Estadística II / PRUEBAS DE HIPOTESIS. Una hipótesis estadística es una afirmación o conjetura acerca de una o mas poblaciones.

Capítulo 13. Contrastes sobre medias: Los procedimientos Medias y Prueba T. Medias

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

CONTRASTES DE HIPÓTESIS

Germán Jesús Rubio Luna Catedrático de Matemáticas del IES Francisco Ayala

Intervalos de confianza y contrastes de hipótesis. Intervalo de confianza de la media.

INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)

Tema 8: Introducción a la Teoría sobre Contraste de hipótesis

CONCEPTOS FUNDAMENTALES

Tema 4: Probabilidad y Teoría de Muestras

Problemas Prueba de significación de la hipótesis nula Vicente Manzano-Arrondo, 2013

Contrastes de Hipótesis paramétricos y no-paramétricos.

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 2011 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS

Formulario. Estadística Administrativa. Módulo 1. Introducción al análisis estadístico

paramétrica comparar dos grupos de puntuaciones

INFERENCIA ESTADÍSTICA

en Enfermería del Trabajo

Sesión 13. Introducción a la Prueba de Hipótesis. Estadística II Equipo Docente: Iris Gallardo - Andrés Antivilo Francisco Marro

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN

TAMAÑO DE MUESTRA EN LA ESTIMACIÓN DE LA MEDIA DE UNA POBLACIÓN

Unidad VI Pruebas de Hipótesis Dos Muestras

PATRONES DE DISTRIBUCIÓN ESPACIAL

Estadísticas Pueden ser

Esta proposición recibe el nombre de hipótesis

Introducción al Tema 6. Tema 5. Intervalos de confianza Definición. Ejemplos de intervalos de confianza. Determinación del tamaño muestral.

Análisis Estadístico de Datos Climáticos. Pruebas de Hipótesis (Wilks, cap. 5)

Estadistica II Tema 0. Repaso de conceptos básicos. Curso 2009/10

DIFERENCIAS EN LA UTILIZACIÓN DE LA BIBLIOTECA DEL IIESCA ANTE UN CAMBIO DE INFORMACIÓN

Teoría de muestras. Distribución de variables aleatorias en el muestreo. 1. Distribución de medias muestrales

Estadística Inferencial

Inferencia estadística Selectividad CCSS Andalucía. MasMates.com Colecciones de ejercicios

Estadística II / PRUEBAS DE HIPOTESIS. Una hipótesis estadística es una afirmación o conjetura acerca de una o mas poblaciones.

PRUEBA DE HIPÓTESIS BENJAMIN MAMANI CONDORI

Pruebas de Hipótesis H0 : μ = 6 H1 : μ 6 α = 0.05 zα/2 = 1.96 (6-1,96 0,4 ; 6+1,96 0,4) = (5,22 ; 6,78) 5,6 Aceptamos la hipótesis nula H 0 2.

para una muestra Ref: Apuntes de Estadística, Mtra Leticia de la Torre Instituto Tecnológico de Chiuhuahua

Análisis de la varianza ANOVA

Transcripción:

ESTADÍSTICA APLICADA Grado en Nutrición Humana y Dietética Tema 3: Contrastes de hipótesis Qué es un contraste de hipótesis? Elementos de un contraste: hipótesis, tipos de error, nivel de significación, región crítica. Contrastes para la media de una población normal. El p-valor. Comparación de dos medias: muestras independientes y datos emparejados (sólo se tratará el caso de varianzas iguales). Contrastes para una proporción. Comparación de dos proporciones. Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 1

Qué es un contraste de hipótesis? Una hipótesis es una afirmación que se hace sobre la población. La hipótesis es paramétrica si se refiere a los valores que toma alguno de los parámetros poblacionales. Un contraste de hipótesis es una técnica estadística para juzgar si los datos muestrales aportan evidencia o no para confirmar una hipótesis sobre una población. En este tema nos centraremos en los contrastes de hipótesis paramétricas: confirmar o refutar una afirmación acerca de uno o varios parámetros de la distribución de una o varias variables aleatorias. Por ejemplo: la media es no negativa (µ 0); la proporción de personas con obesidad es un 40 % (p = 0, 40); la media de una población es mayor o igual a la de otra (µ 1 µ 2 ); etc. Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 2

Planteamiento de un contraste Paso 1. Plantear el contraste: Se establece una hipótesis básica, que llamaremos hipótesis nula y denotaremos H 0, y frente a ella otra hipótesis H 1, o hipótesis alternativa. Paso 2. Fijar una regla de decisión para aceptar o rechazar H 0 : Se realiza un experimento aleatorio, S, para el que se sabe que si H 0 es cierta, la probabilidad de que ocurra es pequeña. Paso 3. Tomar la decisión: Si al realizar el experimento ocurre S, se rechaza H 0. Si por el contrario no ocurre S, se acepta H 0. Nota importante: Los contrastes de hipótesis que estudiaremos tienden a ser muy conservadores con H 0. Sólo rechazaremos H 0 cuando haya una fuerte evidencia (muestral) en contra suya. En este sentido, se asemejan a un juicio en el que el acusado se considera inocente a no ser que se demuestre lo contrario. Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 3

Ejemplo 3.1 (refresco de cola light): Los refrescos de cola light utilizan edulcorantes artificiales que pueden perder su efecto con el tiempo. En un experimento se pidió a varias personas que probaran refrescos dietéticos y calificaran su grado de sabor dulce en una escala de 1 a 10. Tras almacenar las bebidas durante un mes a alta temperatura (para imitar el efecto de 4 meses de almacenamiento a temperatura ambiente) las mismas personas probaron de nuevo los refrescos y calificaron de nuevo su grado de sabor dulce. En la siguiente tabla aparecen las diferencias en las puntuaciones (a mayor diferencia, mayor caída del sabor): 2, 0.4, 0.7, 2, 0.4, 2.2, 1.3, 1.2, 1.1, 2.3 Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 4

Ejemplo 3.1 (refresco de cola light): La mayoría de los datos son positivos. Es decir, la mayoría de las personas apreciaron pérdida en el nivel de sabor. Pero las diferencias no son muy grandes (e incluso dos personas apreciaron un incremento). La pregunta que trata de responder un contraste de hipótesis es: Proporcionan estos datos evidencia de que el nivel medio de sabor decrece? La media estimada a partir de los datos es x = 1.02. Refleja esta estimación un auténtico descenso en el nivel medio de sabor? Se debe el resultado a razones puramente aleatorias? Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 5

Ejemplo 3.1 (refresco de cola light): Paso 1. Plantear el contraste. Llamamos X al cambio experimentado en la puntuación del refresco (es decir, 1 a calificación - 2 a calificación) y µ = E(X ) al descenso medio (desconocido) del grado de sabor de los refrescos. Como queremos confirmar si el grado medio realmente desciende (es decir, si µ > 0), queremos contrastar H 0 : µ 0 frente a H 1 : µ > 0. Si rechazamos H 0, esto significará que los datos muestran una fuerte evidencia en contra de H 0. Es decir, necesitamos pruebas estadísticas para declarar al acusado culpable. Nota importante: La hipótesis para la que se desea encontrar evidencia estadística es la hipótesis alternativa, H 1. Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 6

Ejemplo 3.1 (refresco de cola light): Paso 2. Fijar una regla de decisión. El razonamiento básico para hacer este contraste es: Supongamos que H 0 es cierta, es decir, µ 0. Es el resultado obtenido a partir de los datos ( x = 1.02) extraño o poco frecuente bajo esta hipótesis? Si esto es así, los datos aportan evidencia contra H 0 y a favor de H 1. Para llevar a cabo el análisis anterior tenemos que estudiar qué valores son los que cabe esperar que tome la media muestral X cuando H 0 es cierta. Simplificación: Para simplificar suponemos de momento que la población es normal y que la varianza es conocida y vale σ 2 = 1. Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 7

Ejemplo 3.1 (refresco de cola light): Supongamos que H 0 es cierta y que µ vale 0 (toma el valor en el que más difícil es distinguir entre H 0 y H 1 ). Entonces sabemos (tema 2) que X µ σ/ N(0, 1). n Para juzgar si el valor observado en la muestra x = 1.02 es compatible con µ = 0 calculamos t = 1.02 0 1/ 10 = 3.2255 y comparamos con la distribución normal estándar, N(0, 1). Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 8

Ejemplo 3.1 (refresco de cola light): Paso 3. Tomar la decisión. Mirando las tablas de la normal: P(Z > 3.2255) < 0.001, es decir, si µ = 0, en menos de 1 de cada 1000 muestras se obtendría un valor de t superior a 3.2255. Por tanto, 3.2255 es un valor improbable para una distribución N(0, 1). Concluimos que los datos proporcionan bastante evidencia en contra de H 0 y a favor de H 1. N 0,1 0.3 0.2 0.1 3,2255 Qué significa bastante evidencia? Depende de lo seguros que queramos estar a la hora de rechazar o no la hipótesis nula. Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 9

Tipos de error Podemos cometer 2 tipos de errores: Rechazar H 0 Rechazar H 1 H 0 cierta Error de tipo I Decisión correcta H 1 cierta Decisión correcta Error de tipo II Error de tipo I: Rechazar H 0 cuando H 0 es cierta. Error de tipo II: Aceptar H 0 cuando H 0 es falsa. De los dos errores sólo podemos controlar uno: se elige el error de tipo I. Por ello, se deben definir las hipótesis de forma que el error de tipo I sea el más grave (equivalentemente, H 1 debe ser la hipótesis para la que buscamos mucha evidencia muestral antes de aceptarla). Se llama nivel de significación α de un contraste a la máxima probabilidad de cometer un error de tipo I cuando se realiza ese contraste. Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 10

Ejemplo 3.1 (refresco de cola light): Vamos a rechazar H 0 : µ 0 siempre que la discrepancia entre x y µ = 0 sea suficientemente grande, mayor que un valor crítico c: t = x 0 1/ 10 > c. Para determinar c fijamos el nivel de significación α. Los valores α = 0.01 o α = 0.05 son los más habituales. { } x 0 α = P H0 {Rechazar H 0 } = P H0 1/ 10 > c = P {Z > c}. Por lo tanto c = z α. N 0,1 0.3 0.2 0.1 A R 4 2 zα 2 4 Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 11

Ejemplo 3.1 (refresco de cola light): Rechazamos H 0 : µ 0 a nivel de significación α si el valor t observado está en la región de rechazo o región crítica: { } x 0 R = 1/ 10 > z α. Para los datos del ejemplo recordemos que x 0 1/ 10 = 3.2255 Para hacer el contraste a nivel α = 0.05, buscamos en las tablas z 0.05 = 1.64. Como 3.2255 > 1.64, estamos en la región crítica y rechazamos la hipótesis nula µ 0 a nivel α = 0.05. Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 12

Posibles resultados R Región crítica o de rechazo (x 1,,x n) Decisión Rechazo H0 Test (x 1,,x n) Región de aceptación A Acepto H 0 Para la mayoría de los contrastes la región crítica es de la forma: { } Distancia entre datos y H0 R = > c (tablas). E.T. de la distancia Todos los contrastes que veremos se basan en las mismas ideas que hemos introducido hasta ahora. En lo que sigue vamos a ver ejemplos de aplicación de las fórmulas en distintas situaciones. Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 13

Contrastes para la media de una población normal (varianza desconocida) Contrastes unilaterales: Hipótesis: H 0 : µ µ 0 frente a H 1 : µ > µ 0 Región crítica: { } x µ0 R = s/ n > t n 1,α. Hipótesis: H 0 : µ µ 0 frente a H 1 : µ < µ 0 Región crítica: { } x µ0 R = s/ n < t n 1,α. Contraste bilateral: Hipótesis: H 0 : µ = µ 0 frente a H 1 : µ µ 0 Región crítica: { } x µ0 R = s/ n > t n 1,α/2. Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 14

Ejemplo 3.1 (refresco de cola light): Queremos contrastar H 0 : µ 0 frente a H 1 : µ > 0 (es decir, contraste unilateral con µ 0 = 0) a nivel α = 0.05. Suponemos ahora que σ no es conocida. La estimamos a partir de la muestra: 2, 0.4, 0.7, 2, 0.4, 2.2, 1.3, 1.2, 1.1, 2.3 Para ello usamos la cuasidesviación típica muestral: n i=1 s = (x i x) 2 = 1.196. n 1 Calculamos el estadístico del contraste: t = x µ 0 s/ n = 1.02 0 1.196/ 10 = 2.697. Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 15

Ejemplo 3.1 (refresco de cola light): Como 2.697 > t 9,0.05 = 1.833 estamos en la región crítica y rechazamos H 0 a nivel α = 0.05. t 9 0.3 0.2 0.1 4 2 2 4 Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 16

Ejemplo 3.1 (refresco de cola light): Cuál es la conclusión si fijamos α = 0.01? t 9 0.3 0.2 0.1 4 2 2 4 Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 17

El p-valor de un contraste Crítica a la selección del nivel de significación α (a) El resultado del test puede depender mucho del valor de α elegido, que es arbitrario, siendo posible rechazar H 0 con α = 0.05 y aceptarlo con α = 0.04. 0.4 0.4 0.3 0.3 0.2 0.2 0.1 Α 0,05 0.1 Α 0,04 4 2 2 4 4 2 2 4 Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 18

Crítica a la selección del nivel de significación α (b) Dar sólo el resultado del test (aceptación o rechazo) no permite diferenciar el grado de evidencia que la muestra indica a favor o en contra de H 0. 0.4 N 0,1 0.3 0.2 0.1 4 2 2 4 1,75 3,09 Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 19

A medida que el nivel de significación disminuye es más difícil rechazar la hipótesis nula (manteniendo los mismos datos). t 9 t 9 0.3 0.3 0.2 0.2 0.1 Α 0,05 0.1 Α 0,01 4 2 2 4 4 2 2 4 Hay un valor α = p a partir del cual ya no podemos rechazar H 0. Es decir si α < p ya no se rechaza H 0. A p se le llama el p-valor del contraste. El p-valor indica el punto de división entre el rechazo y la aceptación: Si α < p-valor, no podemos rechazar H 0 a nivel α. Si α > p-valor, podemos rechazar H 0 a nivel α. Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 20

Interpretación: El p-valor se interpreta como una medida de la evidencia estadística que los datos aportan a favor de la hipótesis alternativa H 1 (o en contra de H 0 ): cuando el p-valor es pequeño se considera que hay una fuerte evidencia a favor de H 1. Utilización: Es más informativo utilizar el p-valor que fijar un nivel de significación ya que proporciona una idea de hasta qué punto la información muestral soporta H 0. En general: Si p > 0.1, no hay evidencia para rechazar H 0. Si 0.01 < p < 0.1, el rechazo de H 0 dependerá de nuestro criterio y de las consecuencias que conlleve rechazar H 0. Si p < 0.01, en general se rechaza H 0. Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 21

Solución con SPSS Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 22

[Conjunto_de_datos0] C:\Documents and Settings\usuario\Mis documentos\joser\docen Resultado \estap\datos\edulcorante.sav que SPSS: Estadísticos para una muestra dulzor N Desviación Error típ. de Media típ. la media 10 1,020 1,1961,3782 Prueba para una muestra dulzor Valor de prueba = 0 95% Intervalo de confianza para la Diferencia diferencia t gl Sig. (bilateral) de medias Inferior Superior 2,697 9,025 1,0200,164 1,876 Valor de prueba: µ 0 (el valor de µ que separa H 0 de H 1 ). Por defecto µ 0 = 0. Sig (bilateral): es el p-valor del test bilateral H 0 : µ = µ 0 frente a H 1 : µ µ 0 (transparencias siguientes). Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 23

Los paquetes de software estadístico dan como resultado de un test Prueba su p-valor. T SPSS llama sig(bilateral) al p-valor. [Conjunto_de_datos0] C:\Documents and Settings\usuario\Mis documentos\jose \estap\datos\edulcorante.sav Conociendo el p-valor, el usuario puede tomar la decisión de aceptar o rechazar H 0 para cualquier α. Estadísticos para una muestra SPSS siempre calcula el p-valor Desviación para elerror contraste típ. de bilateral. Si N Media típ. la media queremos hacer un contraste unilateral, tenemos que dividir 10 1,020 1,1961,3782 entre 2 el valor calculado por SPSS. dulzor Prueba para una muestra dulzor Valor de prueba = 0 95% Intervalo de confianza para la Diferencia diferencia t gl Sig. (bilateral) de medias Inferior Superior 2,697 9,025 1,0200,164 1,876 Ejemplo 3.1 (refresco de cola light): El p-valor del contraste es 0.025/2 = 0.0125. Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 24

Ejemplo 3.1 (refresco de cola light): Esto significa: Si α < 0.0125 no podemos rechazar µ 0. Si α > 0.0125 podemos rechazar µ 0. 0.4 t 9 0.3 0.2 p 0,0125 0.1 4 2 2 4 2,697 Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 25

Mínimo Máximo Rango 231,00 Comparación de dos Amplitud intercuartil medias (muestras 161,50 Ternera 401,1500 22,90510 independientes) 380,5000 10492,871 Media Mediana Varianza Desv. típ. Mínimo Máximo Ejemplo 3.2: Se ha considerado la cantidad Rango de calorías y de 392,00sodio Amplitud intercuartil 158,75 en salchichas Resumen del procesamiento de de varias los casos marcas de dos tipos: ternera y pavo. 357 588 102,43472 253 645 sodio tipo Pavo Ternera Casos Válidos Perdidos Total N Porcentaje N Porcentaje N Porcentaje 16 100,0% 0,0% 16 100,0% 20 100,0% 0,0% 20 100,0% 600,00 Descriptivos sodio tipo Pavo Ternera Media Mediana Varianza Desv. típ. Mínimo Máximo Rango Amplitud intercuartil Media Mediana Varianza Desv. típ. Mínimo Máximo Rango Amplitud intercuartil Estadístico Error típ. 460,8125 21,79435 469,5000 7599,896 87,17738 357 588 231,00 161,50 401,1500 22,90510 380,5000 10492,871 102,43472 253 645 392,00 158,75 sodio Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 26 500,00 400,00 300,00 Pavo tipo Ternera

En estas muestras las salchichas de pavo tienen más sodio en media. Pero las dos muestras se solapan bastante. Son las diferencias muestrales estadísticamente significativas? Aportan evidencia estos datos para afirmar que el contenido medio poblacional de sodio de las salchichas de pavo es distinto al de las salchichas de ternera? X 1,..., X n1 es una muestra de N(µ 1, σ) Y 1,..., Y n2 es una muestra de N(µ 2, σ) Supuestos necesarios: Las muestras proceden de dos poblaciones normales. Las varianzas son desconocidas pero iguales. Las dos muestras son independientes. Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 27

Hipótesis que queremos contrastar (α = 0.05) H 0 : µ 1 = µ 2 frente a H 1 : µ 1 µ 2 Región crítica (formulario) x ȳ R = > t s 1 p n 1 + 1 n1 +n 2 2,α/2. n 2 Estimador combinado de la varianza s 2 p = (n 1 1)s 2 1 + (n 2 1)s 2 2 n 1 + n 2 2 Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 28

Con los datos del ejemplo, x ȳ = 460.81 401.15 = 59.66 s 2 p = 15 7599.89 + 19 10492.871 34 = 9216.556 y s p = 96 t = x ȳ s p 1 n 1 + 1 n 2 = 59.66 96 1/16 + 1/20 = 59.66 32.2 = 1.853 t 34,0.025 2.04 Como 1.853 < 2.04, no podemos rechazar H 0. Las diferencias encontradas en las cantidades medias de sodio de las dos muestras no son significativas al nivel α = 0.05. Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 29

Comparación de dos medias (muestras independientes con SPSS) Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 30

Estadísticos de grupo sodio Desviación Error típ. de la media tipo N Media típ. Pavo 16 460,8125 87,17738 21,79435 Ternera 20 401,1500 102,43472 22,90510 Prueba de muestras independientes Prueba de Levene para la igualdad de varianzas F Sig. t gl Prueba T para la igualdad de medias Error típ. Sig. Diferencia de la 95% Intervalo de confianza (bilateral) de medias diferencia para la diferencia sodio Se han asumido varianzas iguales No se han asumido varianzas iguales Inferior Superior,008,930 1,853 34,073 59,66250 32,2003-5,77649 125,10149 1,887 33,84,068 59,66250 31,6170-4,60214 123,92714 El p-valor es 0.073. Esto significa que se puede rechazar H 0 si α > 0.073. Al nivel α = 0.05 no podemos rechazar. Error típico de la diferencia: s p 1/n1 + 1/n 2. Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 31

Ejemplo 3.4: Queremos comparar la media de dos poblaciones normales. Para ello, obtenemos dos muestras aleatorias independientes con los siguientes resultados: Prueba T Muestra 1 230 235 238 242 242 246 Muestra 2 232 234 239 245 248 253 Introducimos los datos en SPSS con el resultado siguiente: [Conjunto_de_datos0] C:\Documents and Settings\usuario\Mis documentos\joser\docencia\estap\datos\salida-2medias.sav Estadísticos de grupo Datos Muestra 1,00 2,00 N Desviación Error típ. de Media típ. la media 6 5,74166 6 241,8333 8,23205 3,36072 Prueba de muestras independientes Datos Se han asumido varianzas iguales No se han asumido varianzas iguales Prueba de Levene para la igualdad de varianzas F Sig. Prueba T para la igualdad de medias Diferencia Error típ. de 95% Intervalo de confianza para la diferencia t gl Sig. (bilateral) de medias la diferencia Inferior Superior 1,601,234 -,732 10,481-3,00000-12,12963 6,12963 -,732 8,934,483-3,00000 4,09742-12,27950 6,27950 Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 32

Ejemplo 3.4: (a) Calcula la media de la muestra 1 (b) Calcula el error típico de la media de la muestra 1 (c) Calcula un IC de nivel 95 % para µ 1 (d) Cuánto vale el error típico de la diferencia? (e) Cuánto vale el p-valor del contraste de H 0 : µ 1 = µ 2 frente a H 1 : µ 1 µ 2? (f) Cuánto vale el p-valor del contraste de H 0 : µ 2 µ 1 frente a H 1 : µ 2 > µ 1? Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 33

Comparación de dos medias (datos emparejados) Ejemplo 3.3: Se usan cinco dosis de una sustancia ferrosa para determinar si existen diferencias entre llevar a cabo un análisis químico de laboratorio o un análisis de fluorescencia por rayos X para determinar el contenido de hierro. Cada dosis se divide en dos partes iguales a las que se aplica cada uno de los dos procedimientos. Los resultados obtenidos son los siguientes: Dosis 1 2 3 4 5 Rayos X 2.0 2.0 2.3 2.1 2.4 Análisis Químico 2.2 1.9 2.5 2.3 2.4 Aportan los datos evidencia suficiente a nivel α = 0.05 para afirmar que el contenido medio de hierro detectado cuando se utiliza el análisis químico es diferente del contenido medio detectado cuando se utilizan rayos X? Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 34

Parámetros: µ 1 es el contenido medio detectado por rayos X µ 2 es el contenido medio detectado por análisis químico. Hipótesis: Cuando las muestras no son independientes, en lugar de contrastar H 0 : µ 1 = µ 2 frente a H 1 : µ 1 µ 2, se contrasta H 0 : µ = 0 frente a H 1 : µ 0, donde µ es el valor esperado de las diferencias d i = x i y i. Dosis 1 2 3 4 5 x i 2.0 2.0 2.3 2.1 2.4 y i 2.2 1.9 2.5 2.3 2.4 d i 0.2 0.1 0.2 0.2 0 Con estos datos: d = 0.1 y s d = 0.1414. Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 35

Suponemos que la diferencia D = X Y sigue una distribución N(µ, σ) con µ y σ desconocidos. Región crítica (formulario): R = { } d S d / n > t n 1;α/2. Mirando en las tablas t 4;0.025 = 2.776. Por otra parte, d S d / n = 0.1 0.1414/ 5 = 1.5811. Como 1.5811 < 2.776, los datos disponibles no permiten afirmar a nivel 0.05 que los dos métodos proporcionan cantidades medias de hierro diferentes. Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 36

Comparación de dos medias (datos emparejados) con SPSS) Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 37

Par 1 X AQ Estadísticos de muestras relacionadas Desviación Error típ. de Media N típ. la media 2,1600 5,18166,08124 2,2600 5,23022,10296 Correlaciones de muestras relacionadas Par 1 X y AQ N Correlación Sig. 5,789,113 Prueba de muestras relacionadas Diferencias relacionadas Desviación Error típ. de 95% Intervalo de confianza para la diferencia Media típ. la media Inferior Superior t -,10000,14142,06325 -,27560,07560-1,581 Prueba de muestras relacionadas gl Sig. (bilateral) 4,189 Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 38

Contrastes para una proporción Ejemplo 3.5: En un estudio, 1000 personas siguieron una dieta de adelgazamiento durante 3 meses. De las 1000 personas, 791 perdieron más de 3 kg de peso. Permiten los datos afirmar, con el nivel de significación α = 0.01, que más del 70 % de la población perdería más de 3 kg de peso de seguir la misma dieta durante el mismo tiempo? Hipótesis: H 0 : p 0.7 frente a H 1 : p > 0.7, donde p es la proporción poblacional que pierde peso. Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 39

Región crítica (formulario): ˆp p 0 R = p 0 (1 p 0 ) n > z α En este caso, n = 1000, p 0 = 0.7, ˆp = 0.791 y z 0.01 = 2.33. ˆp p 0 p 0 (1 p 0 ) n = 0.791 0.7 0.7 0.3 1000 = 6.28 Por lo tanto, podemos rechazar H 0 y afirmar que más del 70 % de la población perdería más de 3 kg de peso de seguir la misma dieta durante el mismo tiempo con un nivel de significación α = 0.01. Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 40

Comparación de dos proporciones Ejemplo 3.6: Se ha llevado a cabo un estudio para determinar si un medicamento dirigido a reducir el nivel de colesterol reduce también la probabilidad de sufrir un infarto. Para ello, a hombres de entre 45 y 55 años se les asignó aleatoriamente uno de los dos tratamientos siguientes: 2051 hombres tomaron un medicamento para reducir el nivel de colesterol 2030 hombres tomaron un placebo Durante los cinco años que duró el estudio, 56 de los hombres que tomaron el medicamento, y 84 de los que tomaron el placebo, sufrieron infartos. Podemos afirmar a nivel 0.05 que el medicamento es efectivo? Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 41

Parámetros: p 1 : Probabilidad de sufrir un infarto si se toma el medicamento. p 2 : Probabilidad de sufrir un infarto si se toma el placebo. Estimadores de los parámetros: ˆp 1 = 56 2051 = 0.0273 y ˆp 2 = 84 2030 = 0.0414 Hipótesis: H 0 : p 2 p 1 frente a H 1 : p 2 > p 1. Estimación de la probabilidad de infarto si fuese p 1 = p 2 (es decir, cuando H 0 es cierta pero es difícil distinguir H 0 de H 1 ): p = Numero total de infartos 56 + 84 = Numero total de personas 2051 + 2030 = 0.0343 Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 42

Región crítica (formulario) ˆp 2 ˆp 1 R = ( ) > z α p(1 p) 1 + 1 n1 n2 Con los datos del ejemplo: ˆp 2 ˆp 1 ( ) = 0.0141 p(1 p) 1 + 1 0.0343 0.9657 ( 1 2051 + 1 ) = 2.47 2030 n1 n2 z 0.05 = 1.64 Como 2.47 > 1.64, podemos rechazar H 0 y afirmar que el medicamento es efectivo a nivel α = 0.05. Estadística Aplicada (NHyD). Profesora: Amparo Baíllo Tema 3: Contrastes de hipótesis 43