TEMA 8: INFERENCIA ESTADÍSTICA

Documentos relacionados
INFERENCIA ESTADÍSTICA

Teoría de muestras 2º curso de Bachillerato Ciencias Sociales

ESTADÍSTICA. Población Individuo Muestra Muestreo Valor Dato Variable Cualitativa ordinal nominal. continua

EJERCICIOS DE SELECTIVIDAD

Tema 8. Muestreo. Indice

= P (Z ) - P (Z ) = P (Z 1 25) P (Z -1 25)= P (Z 1 25) [P (Z 1 25)] = P (Z 1 25) [1- P (Z 1 25)] =

Contraste de hipótesis Tema Pasos del contraste de hipótesis. 1.1 Hipótesis estadísticas: nula y alternativa. 1.3 Estadístico de contraste

Teorema Central del Límite (1)

Teoría de muestras. Distribución de variables aleatorias en el muestreo. 1. Distribución de medias muestrales

Estadística y sus aplicaciones en Ciencias Sociales 6. Prueba de hipótesis. Facultad de Ciencias Sociales, UdelaR

Estadística y sus aplicaciones en Ciencias Sociales 5. Estimación. Facultad de Ciencias Sociales, UdelaR

Universidad Rafael Belloso Chacín (URBE) Cátedra: Fundamentos de Estadística y Simulación Básica Semestre Profesor: Jaime Soto

EJERCICIOS DE ESTADÍSTICA:

Tema 9: Contraste de hipótesis.

a. N(19 5, 1 2) P(19 X 21) = P( Z ) = = P = P P = = P P = P = = = El 55 72% no son adecuados.

Matemáticas 2.º Bachillerato. Intervalos de confianza. Contraste de hipótesis

Estructura de este tema. Tema 3 Contrastes de hipótesis. Ejemplo

Tema 8: Contraste de hipótesis

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 2011 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS

2.- Tablas de frecuencias

Pruebas de Hipótesis H0 : μ = 6 H1 : μ 6 α = 0.05 zα/2 = 1.96 (6-1,96 0,4 ; 6+1,96 0,4) = (5,22 ; 6,78) 5,6 Aceptamos la hipótesis nula H 0 2.

Inferencia estadística Selectividad CCSS Andalucía. MasMates.com Colecciones de ejercicios

INFERENCIA ESTADISTICA

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN

INFERENCIA DE LA PROPORCIÓN

Introducción a la Inferencia Estadística

Distribuciones muestrales. Distribución muestral de Medias

INFERENCIA ESTADISTICA

Ejemplos Resueltos Tema 4

Proyecto Tema 8: Tests de hipótesis. Resumen teórico

EJERCICIOS UNIDAD 10: MUESTREO E INFERENCIA ESTADÍSTICA

Tema 5. Contraste de hipótesis (I)

Contrastes de hipótesis. 1: Ideas generales

Estadística I Tema 7: Estimación por intervalos

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E

Contrastes de hipótesis estadísticas. Contrastes paramétricos

Germán Jesús Rubio Luna Catedrático de Matemáticas del IES Francisco Ayala

UNIVERSIDAD TECNICA PARTICULAR DE LOJA ESTADISTICA Y PROBABILIDAD ENSAYO N 8

INFERENCIA ESTADÍSTICA: CONTRASTES DE HIPÓTESIS

Edad (en años) Más de 57 Nº de personas

Problemas Prueba de significación de la hipótesis nula Vicente Manzano-Arrondo, 2013

CURSO DE MÉTODOS CUANTITATIVOS I

INTERVALOS DE CONFIANZA. La estadística en cómic (L. Gonick y W. Smith)

PROBLEMAS DE ESTIMACIÓN PROPUESTOS EN SELECTIVIDAD

Contrastes de hipótesis paramétricos

CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS

Problemas propuestos en pruebas de Selectividad de Madrid desde 2007 hasta 2014 Estadística: Resolución de los ejercicios propuestos

PLAN DE TRABAJO 9 Período 3/09/07 al 28/09/07

4. Prueba de Hipótesis

Muestreo de variables aleatorias

R E S O L U C I Ó N. a) El intervalo de confianza de la media poblacional viene dado por: I. C. z

Matemática. Desafío. GUÍA DE EJERCITACIÓN AVANZADA Cálculo de medidas de dispersión y muestreo GUICEN041MT22-A16V1

CONTRASTE SOBRE UN COEFICIENTE DE LA REGRESIÓN

Métodos Estadísticos de la Ingeniería Tema 11: Contrastes de Hipótesis Grupo B

TAMAÑO DE MUESTRA EN LA ESTIMACIÓN DE LA MEDIA DE UNA POBLACIÓN

Estadística II / PRUEBAS DE HIPOTESIS. Una hipótesis estadística es una afirmación o conjetura acerca de una o mas poblaciones.

CAPÍTULO I. INTRODUCCIÓN. Cuando se requiere obtener información de una población, y se desean obtener los mejores

Tema 5. Muestreo y distribuciones muestrales

INFERENCIA ESTADÍSTICA

TEMA 2: Estimadores y distribuciones en el muestreo. Alfredo García Hiernaux. Grupos 69 y 73 Estadística I. Curso 2006/07

Sesión 13. Introducción a la Prueba de Hipótesis. Estadística II Equipo Docente: Iris Gallardo - Andrés Antivilo Francisco Marro

OPCIÓN A. La empresa A (x) tiene 30 trabajadores, la B (y) 20 trabajadores y la C (z) 13 trabajadores.

Estadísticas Pueden ser

Probabilidad y Estadística

EJERCICIOS DE PRUEBA DE HIPOTESIS

1 Introducción. 2 Modelo. Hipótesis del modelo MODELO DE REGRESIÓN LOGÍSTICA

ESTADISTICA Y PROBABILIDAD ESTADÍSTICA

Inferencia estadística Selectividad CCSS Castilla-La Mancha. MasMates.com Colecciones de ejercicios

ANÁLI L S I I S S I S D E E D ATOS

Curso: Inferencia Estadística (ICO 8306) Profesores: Esteban Calvo Ayudantes: José T. Medina DISEÑO DE MUESTREO Y APLICACIONES

Elementos de Probabilidad y Estadística. Primer Examen. Parte 2

Tema 13: Distribuciones de probabilidad. Estadística

El primer paso en la realización de una investigación es planear las hipótesis de investigación. Definamos el concepto de hipótesis:

MATERIA: ESTADÍSTICA EJEMPLOS DE POSIBLES PREGUNTAS DE EXAMEN. a. Cuáles son las escalas en que pueden estar los datos en un análisis estadístico.

MODELO DE RESPUESTAS Objetivos 2, 3, 4, 5, 6, 7, Y 8.

AGRO Examen Parcial 2. Nombre:

Contraste de hipótesis paramétricas

Podemos definir un contraste de hipótesis como un procedimiento que se basa en lo observado en las muestras y en la teoría de la probabilidad para

Distribución Muestral.

1. Ejercicios. 2 a parte

CONTRASTE DE HIPÓTESIS

Curso de Estadística Aplicada a las Ciencias Sociales. Tema 12. Contraste de hipótesis. Introducción. Introducción

Práctica 5 ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA CONTRASTE DE HIPÓTESIS

Prueba de Hipótesis. Bondad de Ajuste. Tuesday, August 5, 14

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 2004 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS

para una muestra Ref: Apuntes de Estadística, Mtra Leticia de la Torre Instituto Tecnológico de Chiuhuahua

Conceptos del contraste de hipótesis

Pregunta 1. Pregunta 2. Pregunta 3. Pregunta 4. Pregunta 5. Pregunta 6. Pregunta 7. Comenzado el lunes, 25 de marzo de 2013, 17:24

Contrastes de Hipótesis paramétricos y no-paramétricos.

Tipos de Muestreo. Juan José Hernández Ocaña

9.1. Nociones básicas.

c. Calcule la varianza de las medias muestrales

Grado en Ingeniería Informática Estadística Tema 5: Teoría Elemental del Muestreo e Inferencia Paramétrica Ángel Serrano Sánchez de León

Tema. Introducción Pearson Prentice Hall. All rights reserved

Cap. 5 : Distribuciones muestrales

Ejercicio 1(10 puntos)

PRÁCTICA 8: CONTRASTES DE HIPÓTESIS PARAMÉTRICOS

en Enfermería del Trabajo

Pruebas de hipótesis

Transcripción:

TEMA 8: INFERENCIA ESTADÍSTICA 1. Conceptos básicos 2. Distribución en el muestreo: Intervalo característico, Teorema Central del Límite. 3. Estimación de parámetros: Intervalos de confianza 4. Contrastes de hipótesis 1. CONCEPTOS BÁSICOS PARA MUESTREO E INFERENCIA ESTADÍSTICA La inferencia estadística trata de llegar a conocer o explicar el comportamiento de la población mediante los datos obtenidos de una muestra. Población: es el conjunto homogéneo de personas, animales o cosas sobre el que se va a realizar el estudio. Individuo: es cada uno de los elementos de la población. Muestra: es un subconjunto de la población. Tamaño de la muestra: es el número de individuos que la forman. Para poder realizar una buena inferencia estadística es necesario que la muestra elegida sea representativa, es decir, que tenga las mismas características que la población (al menos respecto la variable que vamos a estudiar). Ante la importancia de la elección de la muestra tendremos que: - Utilizar la técnica de muestreo que consideremos más apropiada (método elegido para obtener la muestra) - Tomar el tamaño de la muestra en función del margen de error que estemos dispuestos a aceptar. Trabajaremos con técnicas de muestreo aleatorio es decir, todos los individuos de la población tendrán la misma probabilidad de ser escogidos. Dentro de los muestreos aleatorios podemos distinguir entre: - Muestreo con reemplazamiento si una vez elegido un elemento se devuelve al colectivo, lo que supone que puede ser elegido de nuevo. - Muestreo sin reemplazamiento si una vez elegido un elemento se separa del colectivo para que no pueda ser elegido de nuevo. Si bien los dos métodos son distintos, cuando el tamaño de la población es muy grande, ambos métodos llegan a las mismas conclusiones (si el tamaño de la muestra significa más del 10% del tamaño de la población la diferencia entre ambos métodos puede ser muy apreciable). 1/16

Las técnicas más utilizadas de muestreo aleatorio son las siguientes: (llamamos N al tamaño de la población y n al tamaño de la muestra) - Muestreo aleatorio simple: Se realiza tomando n elementos al azar de la población que constituirán la muestra. Podemos distinguir entre muestreo aleatorio simple con reemplazamiento y sin reemplazamiento. - Muestreo sistemático: Supongamos que los elementos de la población están numerados y ordenados del 1 al N. Dicha población la podemos dividir en n subconjuntos, cada uno de ellos con N/n elementos. Tomamos aleatoriamente un elemento de los enumerados, y lo llamamos x o, después se toman los siguientes elementos x o +N/n, x o +2 N/n., x o +3 N/n, x o +4 N/n,... Si N/n no es entero, se redondea al entero menor. - Muestreo estratificado: Se divide la población en estrato o subgrupos homogéneos de tamaños: N 1, N 2, N 3,...N t. De cada estrato se elige una muestra aleatoria simple de tamaños n 1, n 2,... n t, de forma que n 1 + n 2 +...+ n t = n y N 1 + N 2 +...+N t = N. Si los n i se obtienen de manera proporcional al tamaño del correspondiente estrato, obtendremos un muestreo aleatorio estratificado con afijación proporcional; si todos los n i son iguales a n/t, obtendremos un muestreo aleatorio estratificado con afijación igual. EJERCICIOS DE MUESTREO 1.- En la siguiente tabla tenemos la distribución de 800 parcelas según el tamaño y si poseen chalet o no: si no Pequeño 80 80 Mediano 160 80 grande 240 160 Sinos planteamos elegir una muestra de 20 parcelas para actualizar el precio de los solares, indica como elegir las muestras, en el supuesto de muestreo aleatorio sin reemplazamiento: a) Entre todas las parcela. b) Eligiendo parcelas de tipo mediano. c) En proporción a la estratificación respecto del tamaño. Solución: Suponemos todas las parcelas ordenadas del 1 al 800 (de menor a mayor tamaño). a) Utilizamos la función RAN# de la calculadora que genera números aleatorios entre 0 y1. Para generar un número aleatorio entre 1 y 800 tecleamos la expresión 1+800 Shift RAN# y tomamos la parte entera del resultado. Repetimos el proceso 20 veces para obtener las 20 parcelas seleccionadas y tenemos: 2/16

653, 697, 594,687, 381,102,702,664,153, 65,114, 245,756,453,94,241,75, 465, 23, 775. Nota: Como el muestreo es sin reemplazamiento, si algún número saliera repetido lo volveríamos a calcular. b) Como las 20 parcelas han de ser de tamaño mediano, hay 240 parcelas de tamaño mediano numeradas del 161 al 400. Para obtener 20 números aleatorios entre 161 y 400 repetimos el siguiente proceso 20 veces: 161+240 Shift RAN#, y tomamos la parte entera. Nota: Para obtener un número aleatorio de un intervalo [a,b] se teclea a+(b-a+1) Shift RAN# y se toma la parte entera del número obtenido. c) Consideramos la estratificación respecto al tamaño: Como tenemos 160 parcelas pequeñas y queremos tomar una muestra de tamaño 20, debemos tomar 160 20/800 = 4 parcelas de tamaño pequeño. Generamos 4 números aleatorios del intervalo [1,160] con el sistema anteriormente explicado: 103, 116, 46, 89. Tenemos 240 parcelas numeradas de 161 a 400, debemos tomar 240 20/800 = 6 parcelas de este tamaño (con el procedimiento anterior). Como hay 400 parcelas grandes numeradas entre 401 y 800, debemos tomar 400 20/800 = 10 parcelas de este tamaño con el procedimiento anterior. 2. Un centro de secundaria tiene un equipo de fútbol sala y un equipo de baloncesto. Los integrantes de cada uno de los equipos son : Fútbol sala: Pepe, Juana, Ana, Javier Joaquín, Juanjo, Vicente, Marta y Daniel Baloncesto: Jorge, Antonio, Asunción, Enrique, Mario, Ramón, Isabel y Maite Un canal de televisión invita a tres estudiantes del equipo de fútbol sala y a dos del equipo de baloncesto a participar en uno de sus programas. Utiliza el muestreo aleatorio simple para seleccionar a los cinco estudiantes invitados. Explica con todo detalle el procedimiento que sigues para dicha selección. Solución: Utilizamos un muestreo aleatorio simple para seleccionar a los tres alumnos del equipo de fútbol sala, para lo cual numeramos aleatoriamente a los componentes de este equipo (del 1 al 9) y generamos tres números aleatorios del intervalo [1,9] con la calculadora. 3/16

Con el mismo método escogemos los dos alumnos del equipo de baloncesto: los numeramos aleatoriamente del 1 al 8 y generamos dos números aleatorios del intervalo [1,8] con la calculadora. 3. En cierto barrio se quiere hacer un estudio para conocer mejor el tipo de actividad de ocio que gusta más a los habitantes. Para ello van a ser encuestados 100 individuos elegidos al azar. Explica que procedimiento de selección sería más apropiado utilizar: muestreo con o sin reposición. Por qué? Como los gustos cambian con la edad y se sabe que en el barrio viven 2.500 niños, 7.000 adultos y 500 ancianos, posteriormente se decide elegir la muestra anterior utilizando un muestreo estratificado. Define los estratos y determina el tamaño de la muestra correspondiente a cada estrato. Solución: Considero que es más adecuado el muestreo aleatorio sin reemplazamiento, para evitar encuestar dos veces a la misma persona. Los estratos en esta población están claramente definidos: 1 er estrato: formados por los 2.500 niños. 2º estrato: formado por los 7.000 adultos. 3 er estrato: formado por los 500 ancianos La muestra correspondiente al primer estrato estará formada por 2.500 100/10.000 = 25 niños La muestra correspondiente al segundo estrato estará formada por 7.000 100/10.000 =70 adultos La muestra correspondiente al tercer estrato estará formada por 500 100/10.000 = 5 ancianos. 4. Deseamos realizar una encuesta sobre el porcentaje de ciudadanos que están a favor de la labor del Ayuntamiento en el ámbito de infraestructuras. Para ello decidimos seleccionar una encuesta de 1000 personas de forma aleatoria por medio de un muestreo estratificado proporcional. Consideramos tres estratos: los individuos que viven en el centro, los que viven en la periferia y los residentes en las pedanías que dependen del Ayuntamiento. Si sabemos que en la zona centro hay un censo de 60.000 habitantes, en la periferia de 100.000 y en las pedanías de 40.000, qué cantidad de encuestados se deben seleccionar de cada estrato? 4/16

Solución: Encuestaremos a 60.000 1000/200.000 = 300 habitantes de zona céntrica, a 100.000 1.000/200.000 = 500 de la periferia y a 40.000 1.000/200.000 = 200 de las pedanías 5. Los siguientes datos corresponden a los salarios mensuales, en miles de pesetas de un grupo de trabajadores de un hospital: 100, 110, 120, 150, 90, 80, 115, 110, 125, 600 a) Calcular el porcentaje de salarios de esta muestra que están en el intervalo b) Razonar si se deben de utilizar estos datos con el fin de estimar la media salarial de todos los trabajadores españoles. Solución: x, x 100 110 120 150 90 80 115 110 125 600 a) x 160 10 2 2 2 2 2 2 2 2 2 2 100 110 120 150 90 80 115 110 125 600 10 21845 147'8 ( x, x ) (12'2,307'8) El intervalo contiene al 90% de los datos. 2 160 2 21845 b) Esta no es una muestra representativa de la población ya que el tamaño de la misma es muy pequemos para estimar la media de los salarios españoles, además todos los salarios de la muestra corresponden a un mismo sector profesional. 6. Indica cómo podríamos obtener una muestra de 500 estudiantes de un universidad de 3.000 matriculados mediante: a) un muestreo aleatorio simple; b) un muestreo sistemático; c) un muestreo estratificado, tomando como estratos las facultades de letras(1.500 estudiantes), ciencias (900 estudiantes),y otras (600 estudiantes). Solución: a) Como todos los estudiantes tiene un nº de matrícula, podemos generar 500 números aleatorios del intervalo [1,3.000],que corresponderán a las 500 matrículas de los alumnos que compondrán la muestra. Si algún número apareciera repetido deberíamos anularlo y generar otro en su lugar, para que ningún elemento de la muestra apareciera repetido. b) Calculamos 3.000/500 = 6, generamos un número aleatorio del intervalo[1,6], supongamos que hemos obtenido el número 4. En este caso la muestra estará compuesta por los 5/16

alumnos de número de matrícula: 4, 4+6=10, 4+12 = 16, 4+18 = 22, 4+ 24= 28,... hasta completar los 500 elementos de la muestra. c) De las facultades de letras escogeremos aleatoriamente 1.500 500/3.000 = 250 estudiantes, de la facultad de ciencias 900 500/3.000 = 150 estudiantes y los restantes de la muestra de las otras facultades. 7. Una determinada revista deportiva quiere hacer una encuesta para seleccionar al deportista del año. Si decide preguntar a 100 de sus lectores, cómo podría obtener un muestreo aleatorio? Y uno no aleatorio? Solución: Para obtener un muestreo aleatorio podemos escoger aleatoriamente 25 puntos de venta de la revista y en cada uno de ellos seleccionar a cuatro lectores (también aleatoriamente). Un muestreo no aleatorio podría consistir en escoger los 100 lectores del mismo punto de venta, de esta manera todos los lectores no tendrían igual probabilidad de ser elegidos. 2. DISTRIBUCIÓN EN EL MUESTREO: Un estadístico (muestral) es una medida (variable aleatoria), derivada de una muestra, con el objetivo de estimar o inferir una característica (parámetro) de la población. Si consideremos todas las posibles muestras de tamaño n en una población, para cada muestra podemos calcular un estadístico (media, desviación típica, proporción,...) que variará de una a otra. Este estadístico es una variable aleatoria que sigue una determinada distribución. Así obtenemos una distribución del estadístico que se llama distribución muestral. 2.1. INTERVALO CARACTERÍSTICO Se llama intervalo característico de una variable que sigue una distribución N(0,1) correspondiente a una probabilidad p al intervalo ( -K,K) tal que P[-K<X<K]=p. Hallar el intervalo característico de una distribución normal N(0, 1) correspondiente a la probabilidad p = 0.9. 6/16

El nivel de confianza (p) se designa mediante 1 - α. El nivel de significación se designa mediante α. El valor crítico (k) como z α/2. P(Z>z α/2) = α/2 P[-z α/2 < z < z α/2] = 1- α Valores críticos 1 - α α/2 z α/2 0.90 0.05 1.645 0.95 0.025 1.96 0.99 0.005 2.575 En una distribución N(μ, σ ) el intervalo característico correspondiente a una probabilidad p = 1 - α es (μ - z α/2 σ, μ + z α/2 σ ) 1 - α α/2 z α/2 Intervalos característicos 0.90 0.05 1.645 (μ - 1.645 σ, μ + 1.645 σ) 0.95 0.025 1.96 (μ - 1.96 σ, μ + 1.96 σ ) 0.99 0.005 2.575 (μ - 2.575 σ, μ + 2.575 σ ) 7/16

2.2 TEOREMA CENTRAL DEL LÍMITE Si una población tiene media μ y desviación típica σ, y tomamos muestras de tamaño n (n>30, ó cualquier tamaño si la población es "normal"), las medias de estas muestras siguen aproximadamente la distribución: Consecuencias: 1. Permite averiguar la probabilidad de que la media de una muestra concreta esté en un cierto intervalo. 2. Permite calcular la probabilidad de que la suma de los elementos de una muestra esté, a priori, en un cierto intervalo. 3. Inferir la media de la población a partir de una muestra. Ejemplo: Las bolsas de sal envasadas por una máquina tienen μ = 500 g y σ = 35 g. Las bolsas se empaquetaron en cajas de 100 unidades. a) Calcular la probabilidad de que la media de los pesos de las bolsas de un paquete sea menor que 495 g. b) Calcular la probabilidad de que una caja 100 de bolsas pese más de 51 kg. 8/16

3. ESTIMACIÓN DE PARÁMETROS Es el procedimiento utilizado para conocer las características de un parámetro poblacional, a partir del conocimiento de la muestra. Con una muestra aleatoria, de tamaño n, podemos efectuar una estimación de un valor de un parámetro de la población; pero también necesitamos precisar un: Intervalo de confianza Se llama así a un intervalo en el que sabemos que está un parámetro, con un nivel de confianza específico. Nivel de confianza Probabilidad de que el parámetro a estimar se encuentre en el intervalo de confianza. Error de estimación admisible Que estará relacionado con la amplitud del intervalo de confianza. 3.1. ESTIMACIÓN DE LA MEDIA DE LA POBLACIÓN Intervalo de confianza para la media El intervalo de confianza, para la media de una población, con un nivel de confianza de 1- α, siendo x la media de una muestra de tamaño n y σ la desviación típica de la población, es: El error máximo de estimación es: Cuanto mayor sea el tamaño de la muestra, n, menor es el error. Cuanto mayor sea el nivel de confianza, 1-α, mayor es el error. Tamaño de la muestra 9/16

Si aumentamos el nivel de confianza, aumenta el tamaño de la muestra. Si disminuimos el error, tenemos que aumentar el tamaño de la muestra. Ejemplo: El tiempo que tardan las cajeras de un supermercado en cobrar a los clientes sigue una ley normal con media desconocida y desviación típica 0,5 minutos. Para una muestra aleatoria de 25 clientes se obtuvo un tiempo medio de 5,2 minutos. a) Calcula el intervalo de confianza al nivel del 95% para el tiempo medio que se tarda en cobrar a los clientes. b) Indica el tamaño muestral necesario para estimar dicho tiempo medio con un el error de ± 0,5 minutos y un nivel de confianza del 95%. El tamaño de la muestra debe ser n 4 3.2. ESTIMACIÓN DE UNA PROPORCIÓN Si en una población, una determinada característica se presenta en una proporción p, la proporción p', de individuos con dicha característica en las muestras de tamaño n, se distribuirán según: Intervalo de confianza para una proporción 10/16

El error máximo de estimación es: Ejemplo: En una fábrica de componentes electrónicos, la proporción de componentes finales defectuosos era del 20%. Tras una serie de operaciones e inversiones destinadas a mejorar el rendimiento se analizó una muestra aleatoria de 500 componentes, encontrándose que 90 de ellos eran defectuosos. Qué nivel de confianza debe adoptarse para aceptar que el rendimiento no ha sufrido variaciones? p = 0.2 q = 1 - p =0.8 p'= 90/ 500 = 0.18 E = 0.2-0.18 = 0.02 P (z α/2 > 1.12) = 1 P (z α/2 1.12) = 1 0.8686 = 0.1314 0.8686-0.1314 = 0.737 Nivel de confianza: 73.72% 4. CONTRASTES DE HIPÓTESIS Un test estadístico es un procedimiento para, a partir de una muestra aleatoria y significativa, extraer conclusiones que permitan aceptar o rechazar una hipótesis previamente emitida sobre el valor de un parámetro desconocido de una población. La hipótesis emitida se designa por H 0 y se llama HIPÓTESIS NULA. La hipótesis contraria se designa por H 1 y se llama HIPÓTESIS ALTERNATIVA. 11/16

Pasos para realizar un contraste de hipótesis 1. Enunciar la hipótesis nula H 0 y la alternativa H 1. Bilateral H 0 =k H 1 k Unilateral H 0 k H 0 k H 1 < k H 1 > k 2. A partir de un nivel de confianza 1 - α o el de significación α. Determinar: El valor z α/2 (bilaterales), o bien z α (unilaterales) La zona de aceptación del parámetro muestral (x o p'). 3. Calcular: x o p', a partir de la muestra. 4. Si el valor del parámetro muestral está dentro de la zona de la aceptación, se acepta la hipótesis con un nivel de significación α. Si no, se rechaza. 4.1. CONTRASTE BILATERAL Se presenta cuando la hipótesis nula es del tipo H 0 : μ = k (o bien H 0 : p = k) y la hipótesis alternativa, por tanto, es del tipo H 1 : μ k (o bien H 1 : p k). El nivel de significación α se concentra en dos partes (o colas) simétricas respecto de la media. La región de aceptación en este caso no es más que el correspondiente intervalo de probabilidad para x o p', es decir: 12/16

o bien: Ejemplo: Se sabe que la desviación típica de las notas de cierto examen de Matemáticas es 2,4. Para una muestra de 36 estudiantes se obtuvo una nota media de 5,6. Sirven estos datos para confirmar la hipótesis de que la nota media del examen fue de 6, con un nivel de confianza del 95%? 1. Enunciamos las hipótesis nula y alternativa: H 0 : μ = 6 La nota media no ha variado. H 1 : μ 6 La nota media ha variado. 2. Zona de aceptación Para α = 0.05, le corresponde un valor crítico: z α/2 = 1.96. Determinamos el intervalo de confianza para la media: (6-1,96 0,4 ; 6+1,96 0,4) = (5,22 ; 6,78) 3. Verificación. Valor obtenido de la media de la muestra: 5,6. 4. Decisión Aceptamos la hipótesis nula H 0, con un nivel de significación del 5%. 4.2. CONTRASTE UNILATERAL Caso 1 La hipótesis nula es del tipo H 0 : μ k (o bien H 0 : p k). La hipótesis alternativa, por tanto, es del tipo H 1 : μ < k (o bien H 1 : p < k). Valores críticos 1 - α α z α 0.90 0.10 1.28 0.95 0.05 1.645 0.99 0.01 2.33 13/16

El nivel de significación α se concentra en una parte o cola. La región de aceptación en este caso será: o bien: Ejemplo: Un sociólogo ha pronosticado, que en una determinada ciudad, el nivel de abstención en las próximas elecciones será del 40% como mínimo. Se elige al azar una muestra aleatoria de 200 individuos, con derecho a voto, 75 de los cuales estarían dispuestos a votar. Determinar con un nivel de significación del 1%, si se puede admitir el pronóstico. 1. Enunciamos las hipótesis nula y alternativa: H 0 : p 0.40 La abstención será como mínimo del 40%. H 1 : p < 0.40 La abstención será como máximo del 40%. 2. Zona de aceptación Para α = 0.01, le corresponde un valor crítico: z α = 2.33. Determinamos el intervalo de confianza para la media: 3. Verificación. 4. Decisión Aceptamos la hipótesis nula H 0. Podemos afirmar, con un nivel de significación del 1%, que la La abstención será como mínimo del 40%. 14/16

Caso 2 La hipótesis nula es del tipo H 0 : μ k (o bien H 0 : p k). La hipótesis alternativa, por tanto, es del tipo H 1 : μ > k (o bien H 1 : p > k). El nivel de significación α se concentra en la otra parte o cola. La región de aceptación en este caso será: o bien: Ejemplo: Un informe indica que el precio medio del billete de avión entre Canarias y Madrid es, como máximo, de 120 con una desviación típica de 40. Se toma una muestra de 100 viajeros y se obtiene que la media de los precios de sus billetes es de 128. Se puede aceptar, con un nivel de significación igual a 0,1, la afirmación de partida? 1. Enunciamos las hipótesis nula y alternativa: H 0 : μ 120 H 1 : μ > 120 2. Zona de aceptación Para α = 0.1, le corresponde un valor crítico: z α = 1.28. Determinamos el intervalo de confianza: 3. Verificación. Valor obtenido de la media de la muestra: 128. 4. Decisión No aceptamos la hipótesis nula H 0. Con un nivel de significación del 10%. 15/16

4.3. ERRORES DE TIPO I Y ERRORES DE TIPO II Error de tipo I. Se comete cuando la hipótesis nula es verdadera y, como consecuencia del contraste, se rechaza. Error de tipo II. Se comete cuando la hipótesis nula es falsa y, como consecuencia del contraste se acepta. H 0 Verdadera Falsa Aceptar Decisón correcta Probabilidad = 1 - α Decisión incorrecta: ERROR DE TIPO II Rechazar ERROR DE TIPO I Probabilidad = α Decisión correcta La probabilidad de cometer Error de tipo I es el nivel de significación α. La probabilidad de cometer Error de tipo II depende del verdadero valor del parámetro. Se hace tanto menor cuanto mayor sea n. 16/16