Muestreo Estratificado.



Documentos relacionados
Resumen Tema 2: Muestreo aleatorio simple. Muestreo con probabilidades desiguales.

En el tema anterior se estudió que muchas decisiones se toman a partir de resultados muestrales. Por ejemplo:

INFERENCIA ESTADÍSTICA CONCEPTOS BÁSICOS

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 2013 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS

Intervalos de confianza Muestras grandes

MUESTREO Y ESTIMACIÓN ESTADÍSTICA

) se obtiene un valor específico del estimador que recibe el nombre de estimación del parámetro poblacional θ y lo notaremos por = g ( x 1

UNIDAD 3.- INFERENCIA ESTADÍSTICA I

Problemas de Estimación de Una y Dos Muestras. UCR ECCI CI-1352 Probabilidad y Esradística Prof. M.Sc. Kryscia Daviana Ramírez Benavides

DISTRIBUCIÓN DE LA MEDIA MUESTRAL. (a) Las muestras de tamaño n obtenidas en una población de media y desviación típica,

MUESTREO ESTRATIFICADO. TECNICAS DE MUESTREO II

Tema 14: Inferencia estadística

R E S O L U C I Ó N. a) La distribución de las medias muestrales es: N, N 8'1, N 8'1, 0'3. Como el nivel de confianza es del 97%, podemos calcular

Técnicas Cuantitativas II Muestra y Estadísticos Muestrales. TC II Muestra y Estadísticos Muestrales 1 / 20

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 2017 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS

Formulas. Población infinita. Población finita

INTRODUCCION Teoría de la Estimación

Ejercicios resueltos de Muestreo

CLAVES DE CORRECCIÓN GUÍA DE EJERCITACIÓN FACTORES Y PRODUCTOS PREGUNTA ALTERNATIVA Nivel

Muestreo sistemático

EJERCICIOS RESUELTOS TEMA 8

UNIVERSIDAD DE ATACAMA

Introducción a la Inferencia Estadística. Material Preparado por Olga Susana Filippini y Hugo Delfino

Distribuciones en el muestreo, EMV

PROBLEMAS RESUELTOS SELECTIVIDAD ANDALUCÍA 2010 MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES TEMA 6: TEORÍA DE MUESTRAS

Ejercicios de intervalos de confianza en las PAAU

PRUEBAS DE HIPÓTESIS.

MEDIDAS DE DISPERSIÓN.

Intervalos de Confianza basados en una muestra. Instituto de Cálculo

Topografía 1. II semestre, José Francisco Valverde Calderón Sitio web:

Ejercicio 1: Un embalaje contiene 9 cajas de CDs. Las 9 cajas tienen la siguiente composición:

UNIDAD 4.- INFERENCIA ESTADÍSTICA II

Tema 4. Estimación de parámetros

Guía 1 Matemática: Estadística NM 4

Capítulo 3. El modelo de regresión múltiple. Jorge Feregrino Feregrino. Econometría Aplicada Utilizando R

EJERCICIOS TEMA 8. INFERENCIA ESTADISTICA

MEDIDAS DE TENDENCIA CENTRAL

Estadística Teórica II

Muestreo estratificado

3.1. Muestreo aleatorio sin reposición Muestreo aleatorio con reposición (muestreo aleatorio simple)

Qué es la estadística?

Estadística y sus aplicaciones en Ciencias Sociales Práctico 4 - Solución Curso ) Como se trata de muestreo sin reposición, se tiene C 5 3

FÍSICA GENERAL 2º CUATRIMESTRE 2014 TT.PP. LABORATORIOS- TEORIA DE ERRORES. (Algunos conceptos importantes)

Reserva Primera de 2017 (Modelo 3) Solución Germán-Jesús Rubio Luna OPCIÓN A

PRUEBAS DE ACCESO A LA UNIVERSIDAD L.O.G.S.E

Transcripción:

Muestreo Estratificado. 1.- Itroducció: Para aplicar este diseño, se precisa que la població esté dividida e subpoblacioes, estratos, que o se solape. Se seleccioa ua muestra probabilística e cada estrato y se trabaja de maera idepediete etre estratos. Razoes de la popularidad de este método: Permite realizar estimacioes de precisió expecifica e cada estrato; E u experimeto, los aspectos prácticos relacioados co la respuesta, la medida o la iformació auxiliar puede diferir cosiderablemete de ua subpoblació a otra. Existirá razoes admiistrativas, divisió territorial,.... Cuestioes técicas que platea este muestreo: i) Costrucció de Estratos: os objetivos del estudio y los recursos dispoibles cotestará las siguietes cuestioes Qué características utilizar para dividir la població e estratos?; Cómo se idetificará los estratos?; Cuátos estratos debe haber?. E particular, los estratos debe estar costituidos por uidades lo más homogeeas posibles; E el caso límite de estricta homogeeidad bastaría seleccioar ua sola uidad e cada estrato ii) Elecció de ua muestra y métodos de estimació e cada estrato; El proceso de muestreo se realizará de maera idepediete e cada estrato Vetajas de este diseño: i) Si las medicioes detro de cada estrato soomogées, la estratificació producirá u límite más pequeño para el error de estimació que el m.a. ii) Se puede reducir el costo por observació al estratificar la població e grupos coveietes. iii) Permite obteer estimacioes de parámetros poblacioales para subgrupos de la població. Ejemplos: Ciudades Familias urbaas i) El I.P.C. se obtiee a partir de ecuestas a: Empresas de biees y sevicios Biees y servicios específicos ii) Ua empresa de publicidad desea determiar cuáto debe emplear e publicidad televisiva e u muicipio, para lo que decide realizar ua ecuesta por muestreo para estimar el úmero medio de horas semaales que se ve la televisió e los hogares del muicipio. Éste comprede dos pueblos, A y B, y u área rural. El pueblo A circuda ua fábrica y los hogares so de trabajadores co iños e edad escolar. El B es u suburbio de ua ciudad vecia co muchos jubilados y pocos iños. El A tiee 155 hogares, el B tiee 62 y el área rural 9. 2.- Notació y Defiicioes: Defiició: Dada ua població U y 1,..., y N, se etiede por estratificació ua partició de U e subpoblacioes llamadas estratos, U 1 y 11,...,y 1N1 y k / k U 1,..., U y 11,..., y 1N y k / k U, verificádose que N 1...N N. 1

Notació: Muestra total s s 1...s / s i muestra e el estrato i-ésimo. Parámetros: y k y k N h y Uh h N k U N h k U h y N Uh W h y Uh / W h N h N Tamaño relativo de la muestra e el estrato h: f h N h.- Estimadores. -estimador: tamaño relativo del estrato. h ; Puesto que la selecció e los distitos estratos se realiza de maera idepediete 1,..., so idepedietes. Var Var h Var Var h Nota: Este método teie gra aplicació ya que o precisa que el diseño muestral sea el mismo e cada estrato,.1 Muestreo Aleatorio Simple e los estratos: i) st Var st Var st y k N h ; k s h N h 2 1 f h N h 2 1 f h ii) P st W h P h ; h 2 ; S h 2. 2 1 f VarP st W h h 2 1 f VarP st W h h N h P1 P N h 1 1 P h 1 P h ;..2 Muestreo Aleatorio Simple co reemplazamieto e los estratos: st y k N h ; k s h N h 2 Var st Var st h 2 ; N h 2 2 S h 2

4.- Afijacioes: a obteció del tamaño muestral se realiza e base a las codicioes del experimeto o a la fijació de la precisió deseada. a afijació trata de repartir el tamaño muestral etre los estratos. Factores geerales a teer e cueta: Tamaño del estrato; Variabilidad etre estratos; Costo que tiee medir ua observació e cada estrato. 4.1 Afijació Uiforme: i) Coocido : Se asiga el mismo úmero de uidades muestrales a cada estrato,, por tato favorece la represetació de los estratos pequeños y perjudica la de los grades. ii) Cosideració de costes: Fijado C C 0 C C 0 4.2 Afijació Proporcioal. Se precisa coocer N h,..., ; i) Coocido : N h N h W h. Por tato, todos los elemetos de la població tiee la misma probabilidad de aparecer e la muestra. Nota: Esta afijació es óptima siempre que la variabilidad de la respuesta e los estratos sea casi la misma. ii) Cosideració de costes: Ejercicio Fijado C C 0 C C 0 iii) Proporcioal al total: Si la variable Y es positiva W h y k U h y k ; Esta afijació es óptima si CV Uh costate e todos los estratos. 4. Afijació de Míima Variaza, supoiedo m.a.s. e todos los estratos: i) Coocido : Cosiste e determiar los,..., de forma que para u tamaño de muestra fijo la variaza del estimador sea míima mi Var h Si N h h N h h ; U ; Observacioes: 1- os valores de so proporcioales a los productos N h h y cuado h h W h. Por esto se dice que es la afijació de míima variaza, si todos los estratos tiee la misma variabilidad respecto de la característica e estudio. es

2- Esta afijació tiee el icoveiete de que precisa estimar mayor úmero de características poblacioales: h,...,. - a utilidad de esta afijació reside e los casos e los que hay gra diferecia e la variabilidad de la respuesta etre estratos ii) Cosideració de costes: Fijado C C 0 : mi Var C 0 C ; Si st C C0 No fijado C : W h h W h h mi Var C 0 ; Si st W h h Fijado B y K,el error de estimació para ua cofiaza dada), y o fijado C : mi Var V o ; V o B k 2 Si st W h h K 2 1 N W h h W h h 2 h?. 4.4 Afijació óptima correlada.. Cuáto valdrá?. Qué pasa si cte. Sea X ua v.a. altamete correlada co Y, la variable de iterés. Supogamos que se cooce XUh. Se toma: N h XU h Ejercicio: Justificar por qué es razoable esta solució N h XUh 5.- Determiació de fijados B y K : N, h 1 N h 1 Supogamos m.a.s. e los estratoṡ: 4

st : st : P st : h 2 K 2 2 h N h N h 2 h 2 K 2 h 2 N h l K 2 N h N h 1 P h 1 P h W h P h 1 P h N N h N h 1 ; Si Afijació Proporcioal: Si Míima Variaza: W h N h h N h h Ejercicio: Ua empresa de publicidad desea determiar cuáto debe emplear e publicidad televisiva e u muicipio, para lo que decide realizar ua ecuesta por muestreo para estimar el úmero medio de horas semaales que se ve la televisió e los hogares del muicipio. Éste comprede dos pueblos, A y B, y u área rural. El pueblo A circuda ua fábrica y los hogares so de trabajadores co iños e edad escolar. El B es u suburbio de ua ciudad vecia co muchos jubilados y pocos iños. El A tiee 155 hogares, el B tiee 62 y el área rural 9. Ua ecuesta previa sugiere que las variazas de los estratos so 1 2 25, 2 2 225, 2 100. Estimar la media poblacioal seleccioado el tamaño de muestra e cada estrato para cometer u error de estimació iferior a 2 horas co ua cofiaza del 95% y uas fraccioes de tamaños muestrales w i 1 ; i 1,2,. Si ademas se sabe que el coste por observació e cada pueblo es de 9 euros y e el área rural de 16 euros, ecotrar los tamaños de muestra que permita estimar a la empresa, co u coste míimo, el tiempo medio que se ve la televisió. 6.- Comparacioes e la precisió de los estimadores. i) Cosideremos muestreo aleatorio co reemplazamieto e cada estrato: Var stco Var co Afijació Proporcioal W 2 h h 2 Afijació Proporcioal W 2 h h ii) Cosideremos m.a.s. e cada estrato: Var st Afijació Proporcioal Var 1 f 2 1 f W h h 2 W hy h y 2. Afijació Proporcioal Var st 1 f N 1 N h y h y 2 1 N N Coclusioes: a) Si las medias de los estratos so iguales o casi iguales, puede ocurrir que el diseño estratificado co afijació proporcioal de resultados meos precisos que m.a.s. Qué pasa si y h y h?. b) a afijació de míima variaza siempre proporcioa u estimador más preciso que la afijació proporcioal; si h h, coicide los errores de muestreo. 5

7.- Ejercicios. 7.1 El servicio cultural de la Juta de Castilla y eó desea coocer qué servicio presta las bibliotecas existetes e la Comuidad y la utilizació que de ellas hace los ciudadaos. Por ello, de las N217 bibliotecas existetes (N 1 11 públicas y N 2 86 privadas) se elige e cada estrato, cada semaa y de forma aleatoria, a ua de ellas y se aota el úmero de libros prestados e dicha semaa. Se observa que al fial del año se prestaro u total de 11.60 libros e las 52 bibliotecas públicas seleccioadas y 14.41 libros e las respectivas bibliotecas privadas. as respectivas variabilidades muestrales fuero, e las bibliotecas públicas, s 1 2 1.415,2 y e las privadas s 2 2 12.978,5 a) Es el muestreo e cada estrato co o si reposició?. b) Determiar el úmero promedio estimado de libros que presta ua biblioteca Castellao-eoesa e ua semaa. Hallar u itervalo de cofiaza del 95%. ( ). c) a Juta desea tambié coocer cuál es la proporció de bibliotecas que presta e promedio más de 00 libros por semaa. E las públicas, sólo 8 de las 52 bibliotecas prestaro e la semaa observada más de 00 libros, mietras que 29 bibliotecas privadas sobrepasaro esta cifra. Dar ua estimació del porcetaje de bibliotecas que e promedio presta más de 00 libros por semaa y hallar la variaza estimada correspodiete. Solució: a) El muestreo debe ser co reposició. b) 2 st W h y h 11 Var st 2 217 S h 2 49.12 1160 52 86 217 1441 52 241.7; Itervalo de cofiaza del 95% 241.7 1.96 49.12. c) P st W h P h 11 VarP st 2 1 P h 1 P h 0.0017. 2 217 8 86 52 217 24 0.14; 52 Itervalo de cofiaza del 95% 0.14 1.96 0017. 7.2 Ua escuela desea estimar la calificació promedio que puede ser obteida e u exame de compresió de lectura por estudiates de 6º de E.G.B. os alumos de la escuela so agrupados e estratos, los que aprede rápido e el estrato I, los que aprede leto e el estrato III y el resto e el estrato II. a escuela decide esta estratificació porque de esta maera se reduce la variabilidad e las calificacioes del exame. El 6º curso de E.G.B. cotiee 55 alumos e el estrato I, 80 e el estrato II y 65 e el estrato III. El exame se aplica a la muestra de 50 alumos utilizado afijació proporcioal, y se obtiee los siguietes resultados: Estrato I Estrato II Estrato III y i : 79.71 64.75 7.44 s 2 i : 105.14 158.2 186.1 a) Estimar la calificació promedio para este curso. b) Habría sido coveiete utilizar afijació de míima variaza?. c) Ecotrar el tamaño de muestra requerido para estimar la calificació promedio, co u límite de.92 putos para el error de estimació (co ua cofiaza del 95%). Usar 6

asigació proporcioal. d) Repetir el apartado c) usado ahora la asigació de míima variaza. Comparar los resultados co los del apartado c). Solució: Afijació proporcioal i 50 a) Estimadores: st W hh ; Var st N i N 1 1.75 14 2 20 20 16.25 16 1 f h S h 2 / W h N h Estimacioes: st W hy h 59.98; Var st 2.28; B 1.96 2.28 2.96 Itervalo de cofiaza del 95% 59.98 2.96 b) Para resolver esta cuestió lo que se debería hacer es u cotraste de homogeeidad de las variazas etre estratos. Si o la respuesta se basa e la comparació visual de s 2 i :105.14, 158.2, 186.1. c) Afijació proporcioal N h Como el parámetro de iterés es 1 55 9 200 2 1 11 N W h / h 1,2,; h 2 K 2 2 h N h d) Afijació de míima variaza implica estimar Como el parámetro de iterés es W h h 2 K 2 2 h N h N h h N h h N h 2 K 2 2 h N h estimació 2.05 w 1 0.2 w 2 0.41 w 0.6 1.7 2 1 w 1 7 2 1 w 2 1 11 w 12 7. Ua empresa de publicidad desea determiar cuáto debe emplear e publicidad televisiva e u muicipio, para lo que decide realizar ua ecuesta para estimar el úmero medio de horas semaales que se ve la televisió e los hogares del muicipio. Éste comprede dos pueblos, A y B, y u área rural. El pueblo A circuda ua fábrica y los hogares so de trabajadores co iños e edad escolar. El B es u suburbio de ua ciudad vecia co muchos jubilados y pocos iños. El A tiee 155 hogares, B 62 y el área rural 9. Ua ecuesta previa sugiere que las variazas de los estratos so 2 1 25, 2 2 225, 2 100. Estimar la media poblacioal seleccioado el tamaño de muestra e cada estrato para cometer u error de estimació iferior a 2 horas co ua cofiaza del 95% y uas fraccioes de tamaños muestrales w i 1 ; i 1,2,. 7

Solució: Fórmula geeral N h 2 h 2 K 2 h 2 N h ; E este caso ; w i 1 i1,2, ; 1 2 25, 2 2 225, 2 100, N 1 155,.N 2 62, N 9 6991.275 12.225 56.7, es decir 57 i w i 19; i 1,2, 8.- Programas. Obteció del tamaño de muestra fijado u error de estimació B y ua cofiaza k: Programa estrap.m: Permite obteer el tamaño de muestra fijado el error de estimació, por ejemplo B 0.05 y la cofiaza, por ejemplo k 1.96. El diseño cosiderado es muestreo estratificado co estratos y m.a.s. e cada estrato. Se supoe que la afijació es proporcioal. El objetivo es estimar ua proporció poblacioal P. fuctio [, h]estrap(b,k,ni) max(size(ni)) Ni2Ni-1 NiNi./Ni2 Nsum(Ni) WiNi/N aux1wi.*ni*0.25 0.25*sum(aux1)/((B^2/k^2)0.25*(sum(aux1)/N)) h*wi Resolució co MATAB del ejercico 7.1: Programa estra71.m: %Datos: %Tamaños de los estratos [Bibliotecas Públicas, Privadas] Ni[11 86] %Tamaños de muestra [Bibliotecas Públicas, Privadas] i[52 52] %Total de libros prestados [Bibliotecas Públicas, Privadas] ti[1160 1441] %Cuasiariazas muestrales si2[1415.2 12978.5] %Solucio apartado b) %Número medio de libros prestado por semaa muiti./i %Pesos relativos de los estratos Nsum(Ni) WiNi/N %Estimació de la media muestsum(wi.*mui) %Estimació del error de muestreo Wi2Wi.^2 varmusum((wi2.*si2)./i) 8

errormusqrt(varmu) %Itervalo de cofiaza del 95% icmu[muest-1.96*errormu, muest1.96*errormu] %Solucio apartado c) %Numero de semaas que presta mas de 00 libros [Bibliotecas Públicas, Privadas] Ai[8 29] PiAi./i %Estimació de la proporcio Pestsum(Wi.*Pi) %Estimacio del error de muestreo sp2pi.*(1-pi) varpsum((wi2.*sp2)./(i-1)) errorpsqrt(varp) %Itervalo de cofiaza del 95% icp[pest-1.96*errorp, Pest1.96*errorp] 9