TEMA III. INFERENCIA ESTADISTICA

Documentos relacionados
DISTRIBUCIÓN DE LA MEDIA MUESTRAL. (a) Las muestras de tamaño n obtenidas en una población de media y desviación típica,

MUESTREO Y ESTIMACIÓN ESTADÍSTICA

INFERENCIA ESTADÍSTICA Y ESTIMACIÓN

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 2013 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS

UNIDAD 3.- INFERENCIA ESTADÍSTICA I

) se obtiene un valor específico del estimador que recibe el nombre de estimación del parámetro poblacional θ y lo notaremos por = g ( x 1

CONTRASTE DE HIPÓTESIS

En el tema anterior se estudió que muchas decisiones se toman a partir de resultados muestrales. Por ejemplo:

Contrastes de hipótesis

Paso 2: Elegir un estadístico de contraste. Como queremos hacer un contraste de hipótesis para la media, el estadístico de contraste adecuado es:

12 I N F E R E N C I A E S T A D Í S T I C A II (CONTRASTE DE HIPÓTESIS)

Práctica 7 CONTRASTES DE HIPÓTESIS

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E

Tema 4. Estimación de parámetros

Resumen Tema 2: Muestreo aleatorio simple. Muestreo con probabilidades desiguales.

Ejercicios de intervalos de confianza en las PAAU

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 2012 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS

1. Intervalos de Conanza

Problemas de Estimación de Una y Dos Muestras. UCR ECCI CI-1352 Probabilidad y Esradística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

CONTRASTE DE HIPÓTESIS

SESION 15 DISTRIBUCIONES DE MUESTREO

TEST DE HIPÓTESIS. a la hipótesis que se formula y que se quiere contrastar o rechazar. Llamamos hipótesis alternativa, H

UNIDAD 4.- INFERENCIA ESTADÍSTICA II

Estimación de Parámetros

Bloque 3 Tema 12 PRUEBAS ESTADÍSTICAS PARA EL CONTRASTE DE HIPÓTESIS: PRUEBAS PARAMÉTRICAS

IntroducciónalaInferencia Estadística

EJERCICIOS TEMA 8. INFERENCIA ESTADISTICA

Test de Hipótesis. Material Preparado por Hugo Delfino

Curso de Estadística Aplicada a las Ciencias Sociales. Tema 11. Estimación de una media. Introducción. Introducción (2) Introducción

PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

Tema 8. Sesiones 15 y 16 Guía de clase 8. CONTRASTE DE HIPOTESIS

EJERCICIOS RESUELTOS TEMA 8

Guía 1 Matemática: Estadística NM 4

Estadística Teórica II

Prueba A = , = [ 7.853, 8.147]

PROBLEMAS DE LOS TEMAS 5, 6 Y 7 PROPUESTOS EN EXÁMENES DE ESTADÍSTICA EMPRESARIAL (ANTIGUA LICENCIATURA ADE)

Ejercicios resueltos de Muestreo

INFERENCIA ESTADÍSTICA: ESTIMACIÓN DE PARÁMETROS. INTERVALOS DE CONFIANZA

Objetivo. 1. Intervalos y test (una sola muestra) Práctica 7: Intervalos de conanza y contrastes de hipótesis I. M. Iniesta Universidad de Murcia

Técnicas Cuantitativas II Muestra y Estadísticos Muestrales. TC II Muestra y Estadísticos Muestrales 1 / 20

Métodos estadísticos y numéricos Estimación por Intervalos de confianza 1 PROBLEMAS RESUELTOS DE ESTIMACIÓN POR INTERVALOS DE CONFIANZA

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E.

Mirando las gráficas, justifica estas afirmaciones: Cuantos más dados intervienen, más se parece la distribución de sus promedios a la curva normal.

EJERCICIO 1 EJERCICIO 2

LAS MUESTRAS ESTADÍSTICAS

INTERVALOS DE CONFIANZA

En esta tema sentaremos las bases del muestreo estadístico y estudiaremos las distribuciones de algunos estadísticos a partir de una muestra.

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 2009 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS

Formulas. Población infinita. Población finita

INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA DISTRIBUCIÓN EN EL MUESTREO

CLAVES DE CORRECCIÓN GUÍA DE EJERCITACIÓN FACTORES Y PRODUCTOS PREGUNTA ALTERNATIVA Nivel

INFERENCIA ESTADÍSTICA. TEST DE HIPÓTESIS. TIPOS DE ERRORES

IES Fco Ayala de Granada Soluciones Germán-Jesús Rubio Luna INTERVALOS DE CONFIANZA PARA PROPORCIONES (2007)

MATEMÁTICAS. TEMA Inferencia Estadística.

Intervalos de Confianza basados en una muestra. Instituto de Cálculo

Preguntas más Frecuentes: Tema 2

PRUEBAS DE HIPÓTESIS.

Muestreo e Intervalos de Confianza

Intervalos de confianza para la media

PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA. Esquema del procedimiento de Prueba de Hipótesis

Distribuciones en el muestreo, EMV

Determinación del tamaño de una muestra (para dos o más muestras)

CAPÍTULO 8: INTERVALOS DE CONFIANZA PARA PROPORCIONES Y MEDIAS

8.1 Al finalizar el tema el alumno debe conocer Características de la estimación utilizando los contrastes o test de hipótesis.

Estimación de parámetros. Biometría

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E.

Intervalos de Confianza basados en una sola muestra. Denotaremos al parámetro de interés con la letra θ y con θ un estimador para θ.

CAPÍTULO 6 DISTRIBUCIONES MUESTRALES

LAS MUESTRAS ESTADÍSTICAS

Trabajo Especial Estadística

IES Fco Ayala de Granada Sobrantes 2014 (Modelo 5 ) Soluciones Germán-Jesús Rubio Luna

Para estimar su media poblacional (µ) se toma una muestra de 20 cigarrillos, las medias de la. σ 20

Tema 9. Inferencia Estadística. Intervalos de confianza.

CAPÍTULO 6 DISTRIBUCIONES MUESTRALES

MATEMÁTICAS 2º BACH. CC. SS. 4 de abril de 2006 Probabilidades

MEDIDAS DE TENDENCIA CENTRAL. _ xi

1.1 INTERVALOS DEL 95% DE CONFIANZA PARA LA MEDIA DE UNA POBLACIÓN NORMAL VARIANZA CONOCIDA

ESTADÍSTICA INFERENCIAL. MUESTREO

Objetivos. 1. Inferencia Estadística. INFERENCIA ESTADÍSTICA Tema 3.1: Muestreo. M. Iniesta Universidad de Murcia

Muestreo Estratificado.

Capítulo 4 (Continuación) MÉTODOS ESTADÍSTICOS. Autor: José María García Palanco

INTERVALOS DE CONFIANZA Y TAMAÑO MUESTRAL. 1. Una muestra aleatoria de 9 tarrinas de helado proporciona los siguientes pesos en gramos

ESTADÍSTICA UNIDIMENSIONAL

IES Fco Ayala de Granada Modelo 5 del 2015 (Soluciones) Germán-Jesús Rubio Luna SELECTIVIDAD ANDALUCÍA MATEMÁTICAS CCSS MODELO 5 DEL 2015 OPCIÓN A

UNIVERSIDAD DE ATACAMA

Probabilidad y Estadística 2003 Intervalos de Confianza y Test de Hipótesis paramétricos

SOLUCIONES DE LA SEGUNDA PRUEBA DE EVALUACION CONTINUA (PEC 2)

EXAMEN DE TÉCNICAS PARA EL ANÁLISIS DEL MERCADO. 3-Julio-2014.

ANDALUCÍA / JUNIO 04. LOGSE / MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES / EXAMEN COMPLETO OPCIÓN A

Distribuciones de probabilidad

- estimación de parámetros, - intervalos de confianza y

Tema 2. Medidas descriptivas de los datos

Muestreo sistemático

Tema 10. Muestreo. Intervalos de confianza Problemas Resueltos

IES Fco Ayala de Granada Sobrantes de 2002 (Modelo 1) Solución Germán-Jesús Rubio Luna

Población Joven Adulta Total A favor En contra Total

TEMA 5: Gráficos de Control por Atributos. 1. Gráfico de control para la fracción de unidades defectuosas

Sobrantes de 2004 (Septiembre Modelo 3) Soluciones Germán-Jesús Rubio Luna OPCIÓN A

Transcripción:

TEMA III. INFERENCIA ESTADISTICA I. Objetivos. La iferecia estadística es la parte de la estadística que tiee por objetivo iferir propiedades de las poblacioes a partir de las muestras. Estas iferecias uca puede darse co carácter absoluto puesto que los parámetros poblacioales (como, por ejemplo, la media y la proporció) so geeralmete descoocidos. Por ello, a la hora de extrapolar resultados para las poblacioes sólo podremos hacerlo co cierto ivel de cofiaza o de sigificació. El camio a seguir será el siguiete: e primer lugar tomar muestras, e segudo, calcular co los datos obteidos parámetros tales como la media, proporció y desviació típica de la variable estadística de la que se pretede estudiar y, por último, iferir a partir de los resultados características de la població. Para ello será ecesario admiitir que las poblacioes sigue uos patroes coocidos y que las muestras posee ciertas propiedades que veremos a lo largo del tema. Al resultado de la iferecia se le llama estimació, y esta puede ser de tres tipos: Estimació Putual. Cuado se toma como valor del parámetro poblacioal descoocido el obteido para la muestra. Estimació por Itervalos. Se da u itervalo detro del cuál puede ecotrarse el parámetro poblacioal descoocido. Test de Hipótesis. Permite probar si determiadas afirmacioes respecto del valor de los parámetros poblacioales descoocidos so ciertas o falsas co u ivel de cofiaza dado. Y dado que todo empieza co la toma de ua muestra, es importate elegirla bie, o sólo co esmero, sio atediedo a u riguroso setido de equidad. Veamos qué queremos decir. II. Teoria de muestras. La mayoria de las situacioes reales o permite hacer estudios sobre poblacioes eteras. Por ejemplo, si deseamos coocer la iteció de voto e ciertas eleccioes geerales o es posible pregutar a todos los idividuos co derecho a voto; tampoco sería viable, por ejemplo, tomar todos los estudiates de ua regió para hacer u estudio completo sobre los aspectos que les atañe. E ambos casos, y e muchos otros, es ecesario tomar muestras. Las muestras elegidas debe ser de tal aturaleza que sea posible iferir a partir de ellas características de toda la població. Ha de ser represetativas de la població. - 36 -

Por ejemplo, si deseamos hacer u estudio sobre la altura media de la població de Cáceres tal vez o covedría elegir ua muestra etre los asistetes a u partido del Cáceres C.B., ya que puede que el balocesto guste más a las persoas más altas. Si hacemos u estudio sobre la proporció de ecias de las dehesas extremeñas ifectadas por la efermedad de la seca (u hogo que ataca las raíces), la muestra debería coteer ecias de toda la geografía extremeña, pues de lo cotrario estariamos limitado el estudio a u úico tipo de suelo, de codicioes medioambietales, etc, que tal vez o represete al cojuto de la població de quercus de la regió. Etedemos por muestreo el proceso seguido para la extracció de ua muestra. Existe dos tipos: a) Muestreo probabilístico o aleatorio. Se da cuado todos los idividuos de ua població tiee las mismas probabilidades de ser elegidos para ua muestra. Observar que para que se de este tipo de muestreo u mismo idividuo de la població debe teer la posibilidad de ser elegido más de ua vez e ua misma muestra. Y esto es así porque de lo cotrario se modificaria las probabilidades de ser elegidos los demás idividuos. Veámoslo co u ejemplo: supogamos que de 120 idividuos seleccioamos ua muestra de 30. La probabilidad que tiee u idividuo para ser seleccioado e primer lugar es 1/120, si o retoráramos al idividuo seleccioado a la població la probabilidad de ser elegido el siguiete ya o sería 1/120, sio 1/119, co lo que modificaríamos la probabilidad de elecció de los demás idividuos a partir del primero. Para que las probabilidades se matega, el idividuo seleccioado ha de volver a la població después de cada elecció (muestreo co reemplazamieto) por lo que puede ser seleccioado uevamete. Existe tres tipos de muestreo probabilístico: Muestreo aleatorio simple o de afijació igual. Se realiza tomado elemetos al azar co reemplazamieto. Por ejemplo: asigamos u úmero a cada uo de los 120 idividuos del ejemplo aterior, los escribimos e u trozo de papel y los metemos e u sombrero. Sacamos u úmero del sombrero, lo aotamos y volvemos a meter el úmero seleccioado e el sombrero (recuerda, muestreo co reemplazamieto para que o se modifique las probabilidades). Repetimos la operació hasta seleccioar los 30 idividuos de la muestra. Muestreo sistemático. Se obtiee eligiedo el primer idividuo al azar y los -1 restates se elige de k e k a partir de este, siedo k el cociete N/. Por ejemplo: los úmeros e el sombrero del ejemplo aterior os sirve. Sacamos u úmero, que resulta ser el 34. Como deseamos seleccioar 30 idividuos de 120, y 120/30=4, seleccioamos los idividuos de 4 e 4 desde el que ocupa el lugar 34. Así tomariamos los idividuos cuyos úmeros so: 34, 38, 42, 46, 50,...,110, 114, 118, 2, 6,...22, 26 y 30. Observar que este tipo de muestreo vulera el pricipio de equiprobabilidad ya que igú idividuo de la població puede ser seleccioado más de ua vez para la misma muestra. Si embargo cuado la població es muy grade i se ota! ya que la probabilidad de que u idividuo "se repita" es muy remota, y además tiee la vetaja de ser u método de elecció mucho meos costoso e tiempo (y a veces e diero) que el muestreo aleatorio simple. No obstate, si e la selecció se observara algú tipo de regularidad ideseable para uestro estudio, este tipo de muestreo debe descartarse. - 37 -

Muestreo estratificado o de afijació proporcioal. Se utiliza cuado la població se divide e subpoblacioes co uas características determiadas. Por ejemplo, si los 120 idividuos so los alumos de u cetro de eseñaza secudaria cuya procedecia es diversa, puede que afecte a uestro estudio el hecho de que resida e pueblos distitos. Así los 30 idividuos de la muestra deberíamos tomarlos proporcioalemete al úmero de idividuos que proviee de cada pueblo. Para ello: se divide la població e estratos o subgrupos homogéeos de tamaños: N 1, N 2,... N i. De cada estrato se elige ua muestra aleatoria simple de tamaños 1, 2,... i, de forma que N = N 1 + N 2 +... +N i y = 1 + 2... + i y que verifique la codició de proporcioalidad, es decir: i = $ N i N Siguiedo co el ejemplo aterior: si los 120 alumos procede de cuatro pueblos distitos: 20 de u pueblo A, 32 de u pueblo B, 60 de u pueblo C, y los 8 restates de u pueblo D aplicado el muestreo estratificado tomariamos los 30 idividuos de esta maera: 1 = 30$ 20 del pueblo A 2 = 30$120 = 5 120 32 = 8 del pueblo B 3 = 30$ 120 60 = 15 del pueblo C. 4 = 30$ 8 120 = 2 del pueblo D. b) Muestreo o aleatorio o o probabilístico. Se da cuado los idividuos de la població o tiee las mismas posibilidades de ser elegidos. Es el que suele utilizarse e los medios periodísticos (sobre todo la televisió). A meos que provega de fuetes acreditadas (el CIS, Sigma 2, etc) o suele teer valor estadístico alguo, y lo mejor es o hacerles el meor caso, pues además acostumbra a ser sesgados, tedeciosos y moralistas. - 38 -

Ejercicios. 1. E ua ciudad se quiere hacer ua ecuesta para coocer el porcetaje de ciudadaos que aprueba la gestió del ayutamieto e cuestioes medioambietales (limpieza de calles, cotamiació, cuidado de parque, etc.) Se pretede que la muestra sea represetativa por sexo y edad; para la edad se establece tres estratos: de 10 a 25 años (jóvees), de 25 a 60 años (adultos) y mayores de 60. El úmero de persoas de cada grupo es: 3.000, 8.500 y 2.500 respectivamete. Por sexo, la distribució es de 6.800 hombres y 7.200 mujeres, que se supoee proporcioales a cada grupo de edad. Si el tamaño de la muestra es de 500 persoas, determia, redodeado si es preciso, el tamaño muestral correspodiete a cada estrato. 2. E cierta cadea de cetros comerciales trabaja 150 persoas e el departameto de persoal, 450 e el departameto de vetas, 200 e el departameto de cotabilidad y 100 e el departameto de ateció al cliete. Co objeto de realizar ua ecuesta laboral, se quiere seleccioar ua muestra de 180 trabajadores. a) Qué tipo de muestreo deberíamos utilizar para la selecció de la muestra si queremos que icluya a trabajadores de los cuatro departametos mecioados? b) Qué úmero de trabajadores tedríamos que seleccioar e cada departameto atediedo a u criterio de proporcioalidad? (Selectividad, Juio de 2005) 3. E cierta empresa hay 2100 empleados, de los cuales 100 so directivos, 320 so admiistrativos, 420 so técicos y el resto es persoal obrero. El gerete desea estimar la proporció de empleados que está a favor de realizar ciertos cambios e el horario de trabajo. Para ello, seleccioa a través de muestreo estratificado aleatorio co afijació proporcioal, ua muestra de 210 empleados cosiderado como estratos las diferetes clses de persoal (directivo, admiistrativo, técico y obrero). Qué úmero de directivos, admiistrativos, téicos y persoal obrero hay e la muestra? (Selectividad, Septiembre de 2004) 4. Ua biblioteca pública está orgaizada e cico seccioes (e el cuadro adjuto se idica el úmero de libros existetes e cada secció). Co objeto de estimar el porcetaje de libros de edició española, se quiere seleccioar ua muestra de u 5 % del úmero total de libros, a través de u muestreo estratificado aleatorio, cosiderado como estratos las seccioes. Determiar el úmero de libros que habría que seleccioar e cada secció si: a) cosideramos afijació igual. b) Cosideramos afijació proporcioal. (Selectividad, Juio 98) Secció 1 500 Secció 2 860 Secció 3 1.200 Secció 4 700 Secció 5 740-39 -

III. Propiedades de las muestras. Distribució muestral de Medias y Proporcioes. Ates de ver qué hacer co las muestras, mecioaremos,si demostració, alguas propiedades de éstas que e gra parte respoderá a la preguta que se platea. E primer lugar, dada ua població de N idividuos de la que tomamos muestras de tamaño, el úmero de muestras distitas que se puede formar es por regla geeral eorme!: si las muestras se toma co reemplazamieto (cada idividuo puede ser elegido más de ua vez e cada muestra) este úmero es de N. E el caso de que las muestras sea si reeemplazamieto (u mismo idividuo o puede aparecer dos o más veces e ua misma muestra) el úmero se reduce cosiderablemete, pero au así siguie siedo astroómico: N = N!!(N )! Medias Pues bie, si elegimos ua muestra de ua població e muestreo co reemplazamieto, ésta dará u valor medio x 1 de la variable que se esté estudiado (pesos, alturas, etc), otra muestra dará otro valor x 2, y así sucesivamete. Supogamos ahora que calculamos la media de las muestras y su desviació típica, a las que desigaremos, respectivamete, por x y x. Estos dos parámetros muestrales verifica las siguietes propiedades: La media muestral es igual a la media de la població. Es decir, si es la media para la variable x de la població, etoces se cumple: x = x 1 + x 2 +... + x i +... N = La desviació típica muestral es igual a la desviació típica de la població dividida por la raíz cuadrada (tamaño de la muestra). Es decir, si es la desviació típica de la població, etoces se cumple: x = Si la població de partida se distribuye segú ua ormal tamaño se distribuye segú ua ormal N,, las muestras de N, Cuado el muestreo es si reemplazamieto las cosas cambia poco: la media muestral sigue siedo la misma que la poblacioal y la desviació típica muestral es ahora: - 40 -

x = $ N N 1 pero, como el úmero de idividuos de ua població suele ser mucho mayor que el de la muestra, el térmio (N )/(N 1) tiede a 1 y x es prácticamete igual a / E el caso e el que la població de partida o se distribuya segú ua ormal, lo cierto es que sus muestras, cuado el tamaño de estas es de por lo meos de 30 idividuos, sí lo hace. Esto es justamete lo que establece el teorema cetral del límite: Si ua muestra aleatoria de tamaño procede de ua població co media y desviació típica y el tamaño de la muestra es m30, la media muestral se distribuye tambié segú ua ormal de media y desviació típica x d N, Proporcioes E el caso de las proporcioes (proporció de idividuos a favor de ua propuesta, de ecias efermas e las dehesas extremeñas, etc) recordar que su estudio podía realizarse mediate distribucioes biomiales de parámetros y pdb(, p) : = úmero de esayos, de idividuos e la muestra o tamaño de é p = probabilidad o proporció de idividuos de la muestra co la caraceter stica dese Ua muestra dará ua proporció a la que desigaremos por ; otra muestra distita tomará u uevo valor p 2 ; y así sucesivamete. Se comprueba que la media de las proporcioes coicide co la proporció, p, de la població Y así, para muestras suficietemete grades (es aceptado el valor m30), el úmero de idividuos co co ua característica determiada se ajustará -segú la aproximació de biomiales a ormales vista e el tema aterior- a la districució ormal: B(, p)dn(p, pq ) Y por tato, si más que dividir por, la proporció muestral, p, se ajustará a la distribució ormal: pdn p, pq p 1-41 -

Ejercicios. 1. Sea ua població formada por cuatro estudiates cuyas otas e el último último exame fuero: 8, 9, 5 y 6. a) Calcula la media y la desviació típica de la població. b) Obté todas las muestras posibles co reemplazamieto de tamaño 2 y calcula la media y la desviació típica muestral. c) Comprueba que la media muestral coicide co la media de la població y la desviació típica muesta, x, es igual a, siedo la desviació típica poblacioal. 2. E el último año, el peso de los recié acidos e ua materidad se ha distribuido segú ua ley ormal de media = 3.100 g y desviació típica. a) Cuál es la probabilidad de que u recié acido pese más de 3.130 g? b) Qué distribució seguirá las muestras de tamaño 100 de recié acidos? c) Cuál será la probabilidad de que la media de ua muestra de 100 recié acidos sea superior a 3.130 g? 3. Supogamos que la estatura media de las alumas de segudo de bachillerato es de 165 cm, co desviaicó típica de 8 cm. a) Halla los parámetros de las medias muestrales de tamaño = 36 y = 64. b) Cuál es la probabilidad de que ua aluma supere los 167 cm de altura? Yde que ua uestra de 36 alumas de ua media igual o superior a los 167 cm de altura? Y si la muestra es de 64 alumas? c) Tiee algo de extraño que ua aluma supere los 170 cm de altura? Y de que ua muestra de 36 alumas de ua media de altura igual o superior a los 170 cm de altura? Justifica gráficamete las respuestas. 4. Supogamos que el porcetaje de familias extremeñas co u solo hijo es del 18 %. Cosideremos ua muestra de 1.000 familias. Cuál es la probabilidad de que al meos el 20 % de estas familias tega u solo hijo? 5. Si el 60 % de liceciados de ua facultad ecuetra trabajo el primer año después de acabar la carrera y seleccioamos al azar a 25 de estos estudiates, qué probabilidad hay de que al meos 15 de ellos ecuetre trabajo el primer año? - 42 -

IV. Iferecia Estadística Llegamos, por fí, a la meta de todo el estudio que se ha hecho sobre probabilidad, distribucioes y teoria de muestras. Hemos seleccioado bie la muestra, calculado sus parámetros (media o proporció, segú la variable estudiada, desviació típica) y ahora os toca respoder a la preguta: qué hacer co los valores obteidos? La respuesta es: estimar valores para la població. La estimació puede realizarse de dos maeras distitas, que recibe los ombres de estimació putual y por itervalos de cofiaza. Más tarde, el test de hipótesis os permitirá decidir, a partir de los resultados de la muestra, si los valores media o proporció poblacioal puede ser aceptados o deberá ser revisados. Estimació Putual. Cosiste e estimar para la població el mismo resultado que el obteido para la muestra. Por ejemplo: Si seleccioada ua muestra de 81 escolares de cierta localidad, se ha calculado ua estatura media de 159 cm, estimaríamos que la media de estatura de todos los escolares de esa ciudad es de 159 cm. Si seleccioada ua muestra aleatoria de 200 coductores se ha determiado que el 20 % lleva cadeas e sus vehículos para preveir la evetualidad de ieve e la carretera, estimaríamos como proporció para la població de coductores que lleva cadeas e u 20 % (o 0.2 si se da e térmios de proporció). E todos los casos, admitimos que las poblacioes sigue modelos ormales de distribució o bie, si o es este el caso, las sigue las muestras (recuerda que e este último caso el tamaño muestral debe ser m30). Esta aparete obviedad merece u cometario (leer opcioalmete, de ahí la letra más chiquita): Se deomia estimador a todo parámetro poblacioal que puede ser estimado a través de las muestras. So estimadores: la media, la proporció y la desviació típica de las muestras. Para que u estimador sea u bue estimador debe cumplir tres requisitos: ser cetrado o isesgado, eficiete y cosistete. U estimador es cetrado o isesgado cuado o tiee tedecia a decatarse por u lado u otro de la distribució. Observa que tato la media como la proporció muestrales cumple este requisito. E efecto, tato ua como otra sigue distribució ormales cuyo puto cetral es la propia media y proporció poblacioal: - 43 -

x = + p pq p = p p + pq Por tato, el úmero de muestras co u valor mayor y meor que el cetral ( y p) es el mismo, puesto que las distribucioes so simétricas respecto de dicho valor. Si embargo la desviació típica muestral o es u estimador isesgado, tiede a decatarse hacia u lado de la distribució. Esta es la razó de que la desviació típica de la muestra o sea u bue estimador de la desviació típica de la població. E su lugar se utiliza la llamada cuasi-desviació típica, cocepto del que se hablará más adelate. U estimador es eficiete si su desviació típica es lo más pequeña posible. Es evidete que tato la media como la proporció muestral verifica esta codició: mietras que, por ejemplo, la desviació típica de la població es, la de las muestras es mucho más pequeña pues se la divide por. Esto hace que las campaas de Gauss de las muestras sea más esbelta y estrecha que las de sus respectivas poblacioes. Por último, u estimador es cosistete si al aumetar el tamaño de la muestra, el valor medio de la distribució muestral tiede al parámetro estimado. Pues bie, dado que al aumetar, las desviacioes típicas muestrales dismiuye, es evidete que las medias muestrales se va cocetrado e toro al puto cetral y por tato va tedieto al valor real de la media de la població,. Estimació por itervalos de cofiaza. Se trata de otra maera de realizar ua estimació. E lugar de u valor para la media o la proporció, se calcula u itervalo e el que co cierto ivel de cofiaza o de sigificació se ecotrará el parámetro poblacioal que se desea estimar. es el ivel de sigificació y 1 es el ivel de cofiaza. Suele darse e tatos por cieto multiplicado por 100 ambos iveles. El procedimieto es el siguiete: - 44 -

Supogamos que a partir de los resultados extraídos de la muestra deseamos calcular u itervalo, co u ivel de cofiaza del 100$(1 ) % (los más frecuetes so 90, 95 y 99 %), detro del cuál se ecotrará la media de la població. Procederemos de la siguiete maera: E la distribució ormal N(0, 1) buscaremos u itervalo cetrado e el puto 0 detro del cuál se ecuetra el 100$(1 ) % de la distribució. Fuera de él se ecotrará el 100$ % restate, y como este último se reparte etre las dos colas de ésta, habrá e cada cola u 100$ 2 %. Desigaremos este itervalo por z,. Gráficamete: 2 z 2 1 2 z 2 0 z 2 2 El siguiete paso cosiste e obteer los valores equivaletes a z y e la 2 z 2 distrució de uestro problema - N(, ) para ua media o N(p, pq ) para ua proporció-, a través de la expresió que tipifica la variable: z 2 = x dode x es la media muestral. Se preseta los siguietes casos... 1º. Itervalo para media co coocida. La media de la població desigualdad: estará compredida etre dos valores que verifique la z 2 [ x [ z 2 Y desarrollado la desigualdad aterior: z 2 $ [ x [z 2 $ x z 2 $ [ [ x + z 2-45 - $

Así pues, el itervalo para la media será: ( x z 2 $, x + z 2 $ ) Gráficamete: 1 2 x z 2 $ x x + z 2 2 $ 2º. Itervalo para la media co descoocida. La primera tetació es sustituir e el itervalo aterior por la desviació típica muestral, que habitualmete es desigada por s. Si embargo -puede que esto te cueste más seguirlo- así como el valor medio de las medias muestrales es igual a la media poblacioal,, el valor medio de las desviacioes típicas muestrales o es igual a la desviació típica de la població! sio que, e térmios de variaza, verifica la relació: 2 = 1 $ s2 Al térmio 1 $ s2 2 se le deomia cuasi-variaza, y se deota por s 1, y a su raíz cuadrada cuasi-desviació típica, s 1. Así es que: Y así, sustituyedo 2 s 1 = 1 $ s2 = 2 por s 1, el itervalo queda: ( x z 2 $ s 1, x + z 2 $ s 1 ) Bie. E los exámees de selectividad hace otar esta peculiaridad dado como dato la cuasi-desviació típica (o cuasi-variaza) y o la desviació típica. No obstate, para muestras suficietemete grades ( m30) el error es pequeño si se sutituye por la desviació típica muestral, s. El itervalo que se utiliza es etoces: ( x z 2 $ s, x + z 2 $ s ) - 46 -

3º. Itervalo para la proporció. Dado que las proporcioes co tamaños muestrales ormales del tipo: m30 sigue distribucioes N p, pq El itervalo para la proporció poblacioal, p, de determiada característica si el resultado para la muestra ha sido p, queda: p z 2 $ pq, p + z 2 $ pq Gráficamete: 1 2 p z 2 $ pq p p 2 p + z 2 $ pq V. Error y Tamaño de la muestra. Dado que como estimació putual damos el valor obteido para las muestras ( x o p), los valores poblacioale ( y p), que os so descoocidos, se ecuetra e algua lugar detro del itervalo a la derecha o a la izquierda de aquellos valores co u ivel de cofiaza del 100$(1 ) %. Así pues, el máximo error cometido e dichas estimacioes será la mitad de la achura del itervalo, esto es: error para la media: E = z 2 $ s error para la proporció: E = z 2 $ pq Por otra parte, observa que el error siempre dismiuye al aumetar el tamaño de la muestra. Podríamos así pregutaros por el úmero de idividuos ecesarios e la muestra para que el error o supere cierta catidad E. Si más que despejar de las expresioes ateriores, se llega a las fórmulas: - 47 -

Tamaño muestral para medias: = z $ s 2 E 2 Tamaño muestral para proporcioes: = z 2 2 pq $ E 2 TABLA RESUMEN Estimació Putual Estimació por Itervalos: coocida Estimació por Itervalos: descoocida Error Máximo Tamaño de la muestra Media Se toma el valor medio de la muestra ( x z 2 $, x + z 2 ( x z 2 $ s 1, x + z 2 E = z 2 = z 2 $ s $ s E 2 $ ) $ s 1 ) Proporcioes Se toma la proporció muestral p z 2 $ pq, p + z 2 E = z 2 = z 2 $ pq 2 pq $ E 2 $ pq TABLA SELECTIVIDAD (Es la que da siempre e los exámees de selectividad, y su lectura es algo distitita de la tradicioal de la distribució ormal. E la parte baja icluye datos para valores muy pequeños de ) - 48 -

Ejemplos 1.- Para ua muestra de 400 persoas elegidas a azar segú muestreo aleatorio se obtuvo ua reta per cápita de 21 500. Se sabe de estudios ateriores que la desviació típica es de 4.200. Calcula: a) La estimació que dariamos de la reta per cápita media de esa població. b) El itervalo de cofiaza para la reta per cápita co ua cofiaza del 99 %. c) El itervalo de cofiaza co u ivel de sigificació del 5%. d) el error máximo cometido e los itervalos b) y c). e) el míimo tamaño muestral co ua cofiaza del 90 % para que el error máximo cometido e la estimació o supere los 300 2. Para ua muestra de 30 alumos se obtuvo ua media e el último exame de selectividad de matemáticas de x = 4, 65, co ua desviació típica de s = 1, 92. Determiar el itervalo de cofiaza para la calificaicó media e matemáticas de los alumos de selectividad. iterpreta el resultado. 3. E ua muestra de 120 alumos elegidos al azar de diversos istitutos se pregutó si poseía o o ordeador. Las respuestas fuero: sí, 80 alumos; o, 40 alumos. Determiar: a) La estimació que darias de la proporció de alumos de la població estudiatil que posee ordeador. b) El itervalo de cofiaza co u ivel de sigificació del 12 % para la proporció estudiatil que posee ordeador. c) El error máximo cometido al 12 % de ivel de sigificació e la estimació aterior. Ejercicios 4. E ua ciudad, e la que vive 5000 familias, se desea estimar el gasto medio semaal por familia e alimetació. Para ello, se seleccioa ua muestra aletoria de 200 familias a las que se les preguta por su gasto semaal e alimetació. A patir de la iformació recogida, se obtiee u gasto medio semaal de 85, siedo la cuasivariaza 81 euros 2. Determiar: a) El error máximo que cometeríamos, co ua cofiaza del 99 %, si estimamos e 85 euros el gasto medio semaal e alimetació para ua familia de esa ciudad. b) El úmero de familias que tedríamos que seleccioar para coseguir, co ua cofiaza del 99 %, u error máximo iferior a 0.5 euros e la estimació del gasto medio semaal e alimetació para ua familia de esta ciudad. (Selectividad, Septiembre de 2003) 5. E ua muestra aleatoria de 2000 coductores se seleccioó ua muestra de 200. A los coductores seleccioados se les pregutó si llevaba e sus vehículos cadeas para - 49 -

utilizar e caso de que hubiese ieve e las carreteras. A patir de la iformació recogida se obtuvo el siguiete itervalo de cofiaza al 95 % para la proporció de coductores de esa població que llevaba e sus vehículos cadeas para la ieve: (0.172, 0.228). Determiar, justificado la respuesta: (a) La estimació putual que daríamos para proporció de coductores de esta població que lleva e su vehículo cadeas para la ieve. (b) El error máximo que estaríamos cometiedo, co ua cofiaza del 95 % co dicha estimació. (Selectividad, Septiembre de 2007) 6. A partir de la iformació sumiistrada por ua muestra aleatoria de 100 familias de cierta ciudad se ha determiado el itervalo de cofiaza al 98 % (42, 58) para el gasto medio mesual por familia (e euros) e electricidad. Determiar justificado las respuestas: a) La estimació putual que daríamos para el gasto medio mesual por familia e electricidad e esa ciudad. b) Qué úmero de familias tedríamos que seleccioar al azar como míimo para garatizaros, co ua cofiaza del 99 %, ua estimació de dicho gasto medio co u error máximo o superior a 3 euros? (Selectividad, Juio de 2000) 7. E el Juzgado de cierta ciudad se presetaro e el año 2005 u total de 5500 deucias. Se seleccioó ua muestra de u 5 % de ellas. Etre las deucias seleccioadas se determió que 55 había sido producidas por violecia doméstica. Determiar, justificado la respuesta: (a) La estimació putual que podríamos dar para el porcetaje de deucias por violecia doméstica e esa ciudad e el año 2005. (b) El error máximo que cometeríamos co dicha estimació putual co u ivel de cofiaza del 99 %. (Selectividad, Juio de 2005) 8. E ua població de estudiates de bachillerato se quiere estimar la proporció de estudiates que tiee posibilidad de coectarse a iteret desde su domicilio. Se seleccioa al azar ua muestra de 300 estudiates de dicha població y a partir de la iformació obteida co ellos, se determia el itervalo de cofiaza (0.22, 0.28) para dicha proporció co ua cofiaza del 99%. Teiedo e cueta esta iformació, cotestar justificado las respuestas: a) Qué estimació putual daríamos para la proporció de estudiates de esa població que puede coectarse a iteret desde su domicilio? - 50 -

b) Qué úmero de estudiates tedríamos que seleccioar al azar co objeto de coseguir, co ua cofiaza del 99 %, u error máximo e la estimació de dicha proporció meor que 0.05? (Selectividad, Juio de 2002) 9. E ua població escolar se ha comprobado que la estatura sigue u modelo Normal de probabilidad. A partir de ua muestra de 81 escolares de dicha població se ha calculado ua estatura media de 159 cm y ua cuasivariaza de 169 cm 2. Teiedo e cueta esta iformació: a) Determiar el error máximo que cometeríamos, co ua cofiaza del 99 %, si estimamos e 159 cm la estatura media e esa població escolar. b) Podríamos rechazar co u ivel de sigificació del 5 %, la hipótesis de que la estatura media e esa població es de 160 cm? Justificar las respuestas. (Selectividad, Juio de 2004) 10. A ua muestra de 300 estudiates de bachillerato de determiada provicia se les pregutó si utilizaba habitualmete la bicicleta para acudir a su Istituto. Sabiedo que se obtuvo 90 respuestas afirmativas, determiar, justificado la respuesta: (a) El itervalo de cofiaza al 95 % para el porcetaje de estudiates de bachillerto de esa provicia que utiliza habitualmete la bicicleta para acudir al Istituto. (b) El error máximo que cometeríamos, co ua cofiaza del 95 %, si estimamos que dicho porcetaje es del 30 %. (Selectividad, Juio de 2007) 11. E cierta empresa hay 2100 empleados, de los cuales 100 so directivos, 320 so admiistrativos, 420 so técicos y el resto es persoal obrero. El gerete desea estimar la proporció de empleados que esta a favor de realizar ciertos cambios e el horario de trabajo. Para ello, seleccioa a través de muestreo estratificado aletorio co afijació proporcioal, ua muestra de 210 empleados cosiderado como estratos las diferetes clases de persoal (directivo, técico y obrero). Tras realizar la correspodiete cosulta a las persoas seleccioadas, obtiee respuesta (afirmativa o egativa) de todas ellas. Sabiedo que 4 directivos, 12 admiistrativos, 7 técicos y 26 obreros le respodiero que o está a favor de realizar dichos cambios, determiar: (a) El úmero de directivos, admiistrativos, técicos y obreros que hay e la muestra seleccioada. (b) La estimació que daríamos para la proporció de empleados de esa empresa que está a favor de realizar los cambios. (c) El error máximo que cometeríamos, co ua cofiaza del 95 %, co la estimació ateiror. Justificar las respuetas. (Selectividad, Septiembre de 2004) - 51 -

VI. Test de Hipótesis O Cotraste de Hipótesis, cosiste e cotrastar el valor de cierto parámetro (media y proporció) coocido de ua població co el obteido a través de ua muestra. Los hay de dos tipos: Uilateral y Bilateral auque aquí sólo trataremos el bilateral. Todo cotraste costa de dos hipótesis: H 0 o hipótesis ula H 1 o hipótesis alterativ H 0 es la hipótesis que co aterioridad al cotraste tomamos como verdadera; H 1 la hipótesis a cotrastar. será Supoemos como siempre que las poblacioes sigue modelos ormales de probabilidad o bie las sigue las muestras para tamaños m30. 1º. Cotraste para la media E estudios previos se determió que el tiempo de espera (e miutos) hasta ser atedido e cierto servicio de urgecias de u hospital era de 15 mi. Para cotrastar este dato se tomó ua muestra de 100 persoas que fuero atedidas e dicho servicio, obteiédose como valor medio 14,25 mi y ua desviació típica de 2,5 mi. A teor del resultado de la muestra, Podemos decir co u 95 % de cofiaza que el tiempo medio de espera ha cambiado o el resultado se debe simplemete al azar? Tomamos como hipótesis ula y alterativa las siguietes: H 0 : el tiempo medio de espera sigue siedo de 15 mi: = 15 H 1 : el tiempo medio de espera ha cambiado, ya o es de 15 mi:!15 Ahora, si tomamos como cierto que el tiempo medio de espera sigue siedo de 15 miutos, las muestras de tamaño 100 de esa població se ajustará a la distribució ormal: N, = N 15, 2, 5 100 = N(15, 0, 25) dode se ha sustituido por la desviació típica de la muestra s = 2, 5. (E los problemas de Selectividad da como dato la cuasi-desviació típica, s 1. Telo e cueta). Y el itervalo de cofiaza co ua cofiaza del 95 % es: z 2 $, + z 2 $ = 15 1, 96$ 2, 5 100, 15 + 1, 96$ 2, 5 100-52 - = (14, 51, 15 mi.

A la zoa que queda detro de dicho itervalo se la llama zoa de aceptació y la que queda fuera de rechazo. Ver figura: 14, 51 15 15, 49 Cuya iterpretació es la siguiete: el 95 % de las muestras da u tiempo medio de espera detro de la zoa de aceptació, y sólo el 5 % la da e la zoa de rechazo. Ello quiere decir que si e la muestra -que hemos tomado aleatoriamete- el tiempo medio de espera está e esta última zoa ello se debe, co toda probabilidad, o al azar sio al hecho de que realmete dicho tiempo se ha modificado. E uestro caso, el tiempo medio de espera obteido e la muestra es de 14,25 mi, que como se ve está e la zoa de rechazo 14, 25 15 Nuestra decisió es: rechazamos la hipótesis ula, H 0, y aceptamos la alterativa, H 1. Es decir, co u 95 % de cofiaza (o u 5 % de sigificació) afirmamos que el tiempo medio de espera ha cambiado. Si valor obteido e la muestra hubiera quedado detro de la zoa de aceptació, habriamos aceptado la hipótesis ula,, y rechazado la alterativa,. H 0 H 1 Por último, el 95 % de cofiaza suele cosiderarse el umbral del que se obtiee u bue ivel de certeza. No obstate, puede tomarse valores mayores, cuado sea ecesario, por las características del problema, dispoer de ua certeza mayor. - 53 -

2º. Cotraste para la proporció. El plateamieto es e todo aálogo al aterior. El 68 % de los alumos que saliero de la ESO e Extremadura obtuviero el título de Educació Secudaria e 2005 (datos aproximados). Ese mismo año, e u istituto de la regió, obtuviero el título 150 alumos de los 200 que cocluyero la etapa (datos ivetados). Es posible afirmar co u 99 % de cofiaza que la proporció de los que obtuviero el título e ese istituto es distita que e el resto de la regió? Tomamos uestras hipótesis ula y alterativa: H 0 : La proporció sigue siedo del 68 % p = 0.68 H 1 : La proporció ha cambiado p!0.68 Bie. Como sabemos, la proporció de idividuos de ua muestra se ajusta a ua ormal del tipo: N p, pq Así es que, admitiedo la hipótesis de etrada, H 0, las muestras de 200 alumos cuya proporció de titulados es del 68 % se ajusta a la ormal: N 0.68, 0.68$0.32 200 = N(0.68, 0.033) El 99 % de las muestras se ecuetra e el itervalo: p z 2 $ pq, p + z 2 $ pq = (0.68 0.085, 0.68 + 0.085) = (0.595, 0.765) siedo z 2 = 2.576 que será el itervalo correspodiete a la zoa de aceptació. La proporció de alumos que obtuviero el título e la muestra ha dado como resultado el valor: p = 150 200 = 0.75 Puesto que dicho valor se ecuetra detro de la zoa de aceptació, deberemos afirmar, co u 1 % de sigificació, que los resultados se ecuetra detro de los parámetros poblacioales y rechazar por tato la hipótesis alterativa, H 1, la cuál os diría que e este istituto los resultados so distitos. Observa, si embargo, que si el ivel de sigificació hubiera sido, por ejemplo, del 10 % (90 % de cofiaza), el itervalo de cofiaza seria (haz los cálculos): (0.623, 0.734) - 54 -

Y el valor de la muestra quedaria e la zoa de rechazo, lo que os llevaria a cocluir que e ese istituto los resultados so distitos (tal vez mejores) que e el resto de la regió. No obstate, el error -la icertidumbre- e este caso e la decisió es mayor que e el aterior. Pero es este otro tema que merece ueva discusió e otro lugar y co otros profesores. Ejercicios. 1. E ua població escolar se ha comprobado que la estatura sigue u modelo Normal de probabilidad. A partir de ua muestra de 81 escolares de dicha població se ha calculado ua estatura media de 159 cm y ua cuasivariaza de 169 cm 2. Teiedo e cueta esta iformació: a) Determiar el error máximo que cometeríamos, co ua cofiaza del 99 %, si estimamos e 159 cm la estatura media e esa població escolar. b) Podríamos rechazar, co u ivel de sigificació del 5 %, la hipótesis de que la estuatura media e esa població es de 160 cm? Justificar las respuesta. (Selectividad, Juio de 2004) 2. El gerete de ua empresa seleccioa aleatoriamete etre sus trabajadores ua muestra de 169 y aota elúmero de horas de trabajo que cada uo de ellos ha perdido por causa de accidetes laborales e el año 2001. A partir de la iformació obteida determia, e esos 169 trabajadores, u úmero medio de horas perdidas por accidetes laborales e el 2001 de 36.5 horas. Sabiedo que: i=169 (x i 36.5) 2 = 15970.5 i=1 dode x i represeta el úmero de horas perdidas por el i-ésimo trabajdor, i = 1,..., 169. Podríamos rechazar co u ivel de sigificació del 1 %, la hipótesis de que el úmero medio de horas perdidas a causa de accidetes laborales e esa empresa durate el año 2001 fue de 35 horas? Y para u ivel de sigificació del 5 %? Justifica las resuestas. (Slectivdad, Septiembre de 2002) 3. A partir de los datos recogidos sobre ua muestra aleatoria de 121 pequeñas y mediaas empresas de ua regió se ha calculado, para el año 2000, u beweficio medio de 89 milloes de euros co ua cuasivariaza de 30.25 euros 2. Cotestar, justificado las respuestas: a) Podríamos rechazar (co u ivel de sigificació del 0.001) la afirmació de que los beeficios medios e la pequeña y mediaa empresa de dicha regió so de 90 milloes de euros? b) Qué ocurriría para el ivel de sigificació 0.05? (Selectividad, Juio de 2000) - 55 -

- 56 -