Muestreo Estratificado. 1.- Itroducció: Para aplicar este diseño, se precisa que la població esté dividida e subpoblacioes, estratos, que o se solape. Se seleccioa ua muestra probabilística e cada estrato y se trabaja de maera idepediete etre estratos. Razoes de la popularidad de este método: Permite realizar estimacioes de precisió expecifica e cada estrato; E u experimeto, los aspectos prácticos relacioados co la respuesta, la medida o la iformació auxiliar puede diferir cosiderablemete de ua subpoblació a otra. Existirá razoes admiistrativas, divisió territorial,.... Cuestioes técicas que platea este muestreo: i) Costrucció de Estratos: os objetivos del estudio y los recursos dispoibles cotestará las siguietes cuestioes Qué características utilizar para dividir la població e estratos?; Cómo se idetificará los estratos?; Cuátos estratos debe haber?. E particular, los estratos debe estar costituidos por uidades lo más homogeeas posibles; E el caso límite de estricta homogeeidad bastaría seleccioar ua sola uidad e cada estrato ii) Elecció de ua muestra y métodos de estimació e cada estrato; El proceso de muestreo se realizará de maera idepediete e cada estrato Vetajas de este diseño: i) Si las medicioes detro de cada estrato soomogées, la estratificació producirá u límite más pequeño para el error de estimació que el m.a. ii) Se puede reducir el costo por observació al estratificar la població e grupos coveietes. iii) Permite obteer estimacioes de parámetros poblacioales para subgrupos de la població. Ejemplos: Ciudades Familias urbaas i) El I.P.C. se obtiee a partir de ecuestas a: Empresas de biees y sevicios Biees y servicios específicos ii) Ua empresa de publicidad desea determiar cuáto debe emplear e publicidad televisiva e u muicipio, para lo que decide realizar ua ecuesta por muestreo para estimar el úmero medio de horas semaales que se ve la televisió e los hogares del muicipio. Éste comprede dos pueblos, A y B, y u área rural. El pueblo A circuda ua fábrica y los hogares so de trabajadores co iños e edad escolar. El B es u suburbio de ua ciudad vecia co muchos jubilados y pocos iños. El A tiee 155 hogares, el B tiee 62 y el área rural 9. 2.- Notació y Defiicioes: Defiició: Dada ua població U y 1,..., y N, se etiede por estratificació ua partició de U e subpoblacioes llamadas estratos, U 1 y 11,...,y 1N1 y k / k U 1,..., U y 11,..., y 1N y k / k U, verificádose que N 1...N N. 1
Notació: Muestra total s s 1...s / s i muestra e el estrato i-ésimo. Parámetros: y k y k N h y Uh h N k U N h k U h y N Uh W h y Uh / W h N h N Tamaño relativo de la muestra e el estrato h: f h N h.- Estimadores. -estimador: tamaño relativo del estrato. h ; Puesto que la selecció e los distitos estratos se realiza de maera idepediete 1,..., so idepedietes. Var Var h Var Var h Nota: Este método teie gra aplicació ya que o precisa que el diseño muestral sea el mismo e cada estrato,.1 Muestreo Aleatorio Simple e los estratos: i) st Var st Var st y k N h ; k s h N h 2 1 f h N h 2 1 f h ii) P st W h P h ; h 2 ; S h 2. 2 1 f VarP st W h h 2 1 f VarP st W h h N h P1 P N h 1 1 P h 1 P h ;..2 Muestreo Aleatorio Simple co reemplazamieto e los estratos: st y k N h ; k s h N h 2 Var st Var st h 2 ; N h 2 2 S h 2
4.- Afijacioes: a obteció del tamaño muestral se realiza e base a las codicioes del experimeto o a la fijació de la precisió deseada. a afijació trata de repartir el tamaño muestral etre los estratos. Factores geerales a teer e cueta: Tamaño del estrato; Variabilidad etre estratos; Costo que tiee medir ua observació e cada estrato. 4.1 Afijació Uiforme: i) Coocido : Se asiga el mismo úmero de uidades muestrales a cada estrato,, por tato favorece la represetació de los estratos pequeños y perjudica la de los grades. ii) Cosideració de costes: Fijado C C 0 C C 0 4.2 Afijació Proporcioal. Se precisa coocer N h,..., ; i) Coocido : N h N h W h. Por tato, todos los elemetos de la població tiee la misma probabilidad de aparecer e la muestra. Nota: Esta afijació es óptima siempre que la variabilidad de la respuesta e los estratos sea casi la misma. ii) Cosideració de costes: Ejercicio Fijado C C 0 C C 0 iii) Proporcioal al total: Si la variable Y es positiva W h y k U h y k ; Esta afijació es óptima si CV Uh costate e todos los estratos. 4. Afijació de Míima Variaza, supoiedo m.a.s. e todos los estratos: i) Coocido : Cosiste e determiar los,..., de forma que para u tamaño de muestra fijo la variaza del estimador sea míima mi Var h Si N h h N h h ; U ; Observacioes: 1- os valores de so proporcioales a los productos N h h y cuado h h W h. Por esto se dice que es la afijació de míima variaza, si todos los estratos tiee la misma variabilidad respecto de la característica e estudio. es
2- Esta afijació tiee el icoveiete de que precisa estimar mayor úmero de características poblacioales: h,...,. - a utilidad de esta afijació reside e los casos e los que hay gra diferecia e la variabilidad de la respuesta etre estratos ii) Cosideració de costes: Fijado C C 0 : mi Var C 0 C ; Si st C C0 No fijado C : W h h W h h mi Var C 0 ; Si st W h h Fijado B y K,el error de estimació para ua cofiaza dada), y o fijado C : mi Var V o ; V o B k 2 Si st W h h K 2 1 N W h h W h h 2 h?. 4.4 Afijació óptima correlada.. Cuáto valdrá?. Qué pasa si cte. Sea X ua v.a. altamete correlada co Y, la variable de iterés. Supogamos que se cooce XUh. Se toma: N h XU h Ejercicio: Justificar por qué es razoable esta solució N h XUh 5.- Determiació de fijados B y K : N, h 1 N h 1 Supogamos m.a.s. e los estratoṡ: 4
st : st : P st : h 2 K 2 2 h N h N h 2 h 2 K 2 h 2 N h l K 2 N h N h 1 P h 1 P h W h P h 1 P h N N h N h 1 ; Si Afijació Proporcioal: Si Míima Variaza: W h N h h N h h Ejercicio: Ua empresa de publicidad desea determiar cuáto debe emplear e publicidad televisiva e u muicipio, para lo que decide realizar ua ecuesta por muestreo para estimar el úmero medio de horas semaales que se ve la televisió e los hogares del muicipio. Éste comprede dos pueblos, A y B, y u área rural. El pueblo A circuda ua fábrica y los hogares so de trabajadores co iños e edad escolar. El B es u suburbio de ua ciudad vecia co muchos jubilados y pocos iños. El A tiee 155 hogares, el B tiee 62 y el área rural 9. Ua ecuesta previa sugiere que las variazas de los estratos so 1 2 25, 2 2 225, 2 100. Estimar la media poblacioal seleccioado el tamaño de muestra e cada estrato para cometer u error de estimació iferior a 2 horas co ua cofiaza del 95% y uas fraccioes de tamaños muestrales w i 1 ; i 1,2,. Si ademas se sabe que el coste por observació e cada pueblo es de 9 euros y e el área rural de 16 euros, ecotrar los tamaños de muestra que permita estimar a la empresa, co u coste míimo, el tiempo medio que se ve la televisió. 6.- Comparacioes e la precisió de los estimadores. i) Cosideremos muestreo aleatorio co reemplazamieto e cada estrato: Var stco Var co Afijació Proporcioal W 2 h h 2 Afijació Proporcioal W 2 h h ii) Cosideremos m.a.s. e cada estrato: Var st Afijació Proporcioal Var 1 f 2 1 f W h h 2 W hy h y 2. Afijació Proporcioal Var st 1 f N 1 N h y h y 2 1 N N Coclusioes: a) Si las medias de los estratos so iguales o casi iguales, puede ocurrir que el diseño estratificado co afijació proporcioal de resultados meos precisos que m.a.s. Qué pasa si y h y h?. b) a afijació de míima variaza siempre proporcioa u estimador más preciso que la afijació proporcioal; si h h, coicide los errores de muestreo. 5
7.- Ejercicios. 7.1 El servicio cultural de la Juta de Castilla y eó desea coocer qué servicio presta las bibliotecas existetes e la Comuidad y la utilizació que de ellas hace los ciudadaos. Por ello, de las N217 bibliotecas existetes (N 1 11 públicas y N 2 86 privadas) se elige e cada estrato, cada semaa y de forma aleatoria, a ua de ellas y se aota el úmero de libros prestados e dicha semaa. Se observa que al fial del año se prestaro u total de 11.60 libros e las 52 bibliotecas públicas seleccioadas y 14.41 libros e las respectivas bibliotecas privadas. as respectivas variabilidades muestrales fuero, e las bibliotecas públicas, s 1 2 1.415,2 y e las privadas s 2 2 12.978,5 a) Es el muestreo e cada estrato co o si reposició?. b) Determiar el úmero promedio estimado de libros que presta ua biblioteca Castellao-eoesa e ua semaa. Hallar u itervalo de cofiaza del 95%. ( ). c) a Juta desea tambié coocer cuál es la proporció de bibliotecas que presta e promedio más de 00 libros por semaa. E las públicas, sólo 8 de las 52 bibliotecas prestaro e la semaa observada más de 00 libros, mietras que 29 bibliotecas privadas sobrepasaro esta cifra. Dar ua estimació del porcetaje de bibliotecas que e promedio presta más de 00 libros por semaa y hallar la variaza estimada correspodiete. Solució: a) El muestreo debe ser co reposició. b) 2 st W h y h 11 Var st 2 217 S h 2 49.12 1160 52 86 217 1441 52 241.7; Itervalo de cofiaza del 95% 241.7 1.96 49.12. c) P st W h P h 11 VarP st 2 1 P h 1 P h 0.0017. 2 217 8 86 52 217 24 0.14; 52 Itervalo de cofiaza del 95% 0.14 1.96 0017. 7.2 Ua escuela desea estimar la calificació promedio que puede ser obteida e u exame de compresió de lectura por estudiates de 6º de E.G.B. os alumos de la escuela so agrupados e estratos, los que aprede rápido e el estrato I, los que aprede leto e el estrato III y el resto e el estrato II. a escuela decide esta estratificació porque de esta maera se reduce la variabilidad e las calificacioes del exame. El 6º curso de E.G.B. cotiee 55 alumos e el estrato I, 80 e el estrato II y 65 e el estrato III. El exame se aplica a la muestra de 50 alumos utilizado afijació proporcioal, y se obtiee los siguietes resultados: Estrato I Estrato II Estrato III y i : 79.71 64.75 7.44 s 2 i : 105.14 158.2 186.1 a) Estimar la calificació promedio para este curso. b) Habría sido coveiete utilizar afijació de míima variaza?. c) Ecotrar el tamaño de muestra requerido para estimar la calificació promedio, co u límite de.92 putos para el error de estimació (co ua cofiaza del 95%). Usar 6
asigació proporcioal. d) Repetir el apartado c) usado ahora la asigació de míima variaza. Comparar los resultados co los del apartado c). Solució: Afijació proporcioal i 50 a) Estimadores: st W hh ; Var st N i N 1 1.75 14 2 20 20 16.25 16 1 f h S h 2 / W h N h Estimacioes: st W hy h 59.98; Var st 2.28; B 1.96 2.28 2.96 Itervalo de cofiaza del 95% 59.98 2.96 b) Para resolver esta cuestió lo que se debería hacer es u cotraste de homogeeidad de las variazas etre estratos. Si o la respuesta se basa e la comparació visual de s 2 i :105.14, 158.2, 186.1. c) Afijació proporcioal N h Como el parámetro de iterés es 1 55 9 200 2 1 11 N W h / h 1,2,; h 2 K 2 2 h N h d) Afijació de míima variaza implica estimar Como el parámetro de iterés es W h h 2 K 2 2 h N h N h h N h h N h 2 K 2 2 h N h estimació 2.05 w 1 0.2 w 2 0.41 w 0.6 1.7 2 1 w 1 7 2 1 w 2 1 11 w 12 7. Ua empresa de publicidad desea determiar cuáto debe emplear e publicidad televisiva e u muicipio, para lo que decide realizar ua ecuesta para estimar el úmero medio de horas semaales que se ve la televisió e los hogares del muicipio. Éste comprede dos pueblos, A y B, y u área rural. El pueblo A circuda ua fábrica y los hogares so de trabajadores co iños e edad escolar. El B es u suburbio de ua ciudad vecia co muchos jubilados y pocos iños. El A tiee 155 hogares, B 62 y el área rural 9. Ua ecuesta previa sugiere que las variazas de los estratos so 2 1 25, 2 2 225, 2 100. Estimar la media poblacioal seleccioado el tamaño de muestra e cada estrato para cometer u error de estimació iferior a 2 horas co ua cofiaza del 95% y uas fraccioes de tamaños muestrales w i 1 ; i 1,2,. 7
Solució: Fórmula geeral N h 2 h 2 K 2 h 2 N h ; E este caso ; w i 1 i1,2, ; 1 2 25, 2 2 225, 2 100, N 1 155,.N 2 62, N 9 6991.275 12.225 56.7, es decir 57 i w i 19; i 1,2, 8.- Programas. Obteció del tamaño de muestra fijado u error de estimació B y ua cofiaza k: Programa estrap.m: Permite obteer el tamaño de muestra fijado el error de estimació, por ejemplo B 0.05 y la cofiaza, por ejemplo k 1.96. El diseño cosiderado es muestreo estratificado co estratos y m.a.s. e cada estrato. Se supoe que la afijació es proporcioal. El objetivo es estimar ua proporció poblacioal P. fuctio [, h]estrap(b,k,ni) max(size(ni)) Ni2Ni-1 NiNi./Ni2 Nsum(Ni) WiNi/N aux1wi.*ni*0.25 0.25*sum(aux1)/((B^2/k^2)0.25*(sum(aux1)/N)) h*wi Resolució co MATAB del ejercico 7.1: Programa estra71.m: %Datos: %Tamaños de los estratos [Bibliotecas Públicas, Privadas] Ni[11 86] %Tamaños de muestra [Bibliotecas Públicas, Privadas] i[52 52] %Total de libros prestados [Bibliotecas Públicas, Privadas] ti[1160 1441] %Cuasiariazas muestrales si2[1415.2 12978.5] %Solucio apartado b) %Número medio de libros prestado por semaa muiti./i %Pesos relativos de los estratos Nsum(Ni) WiNi/N %Estimació de la media muestsum(wi.*mui) %Estimació del error de muestreo Wi2Wi.^2 varmusum((wi2.*si2)./i) 8
errormusqrt(varmu) %Itervalo de cofiaza del 95% icmu[muest-1.96*errormu, muest1.96*errormu] %Solucio apartado c) %Numero de semaas que presta mas de 00 libros [Bibliotecas Públicas, Privadas] Ai[8 29] PiAi./i %Estimació de la proporcio Pestsum(Wi.*Pi) %Estimacio del error de muestreo sp2pi.*(1-pi) varpsum((wi2.*sp2)./(i-1)) errorpsqrt(varp) %Itervalo de cofiaza del 95% icp[pest-1.96*errorp, Pest1.96*errorp] 9