Capítulo 1 Muestreo sistemático El muestreo sistemático es u tipo de muestreo que es aplicable cuado los elemetos de la població sobre la que se realiza el muestreo está ordeados Este procedimieto de muestreo se basa e tomar muestras de ua maera directa y ordeada a partir de ua regla determiística, tambié llamada sistemática Cocretamete, a partir de ua sola uidad que se seleccioa e primer lugar, el resto de uidades de la muestra viee determiadas automáticamete al aplicarle a dicha uidad ua regla selecció sistemática Bajo este procedimieto de muestreo, por ejemplo, seleccioamos cada vigésimo ombre de ua lista, cada decimoseguda casa de u lado de ua calle, cada quicuagésima pieza de ua líea de motaje, etc E este capítulo cosideramos el diseño muestral sistemático más secillo llamado muestreo sistemático uiforme de paso k La obteció de ua muestra sistemática de tamaño de ua població de N elemetos se cosigue siguiedo el siguiete procedimieto 1 Coseguir u listado ordeado de los N elemetos de la població Determiar el tamaño muestral 3 Defiir el tamaño del salto sistemático k dado por k = N/ 4 Elegir u úmero aleatorio δ etre 1 y k (δ=arrraque aleatorio) Este umero permite obteer la primera uidad muestral 5 A partir de la posició δ, dado u salto de k uidades, obtedremos la seguda uidad de la muestra u δ+k y de esta forma, saltado de k e k uidades, el resto de la muestra estará formada por las uidades u δ+k, u δ+3k,, u δ+( 1)k Ejemplo 1 Cosideramos ua població de 5000 agricultores perteecietes a ua determiada zoa y de la que se pretede extraer ua muestra sistemática de 10 agricultores El procedimieto a seguir es el siguiete: Defiir el tamaño del salto sistemático k = 5000/10 = 500 1
Seleccioa u umero aleatorio r etre 1 y 500, (por ejemplo 96) Seleccioar los restates elemetos de la muestra, 96, 96+500=596, 596+500=1096, 1596, 096, 596, 3096, 3596, 4096, 4596 E realidad, bajo muestreo sistemático, clasificamos las uidades de la població e zoas o filas de tamaño k, las umeramos de izquierda a derecha empezado por la primera uidad de la primera fila y pasado a a primera uidad de la siguiete fila ua que se haya agotado la fila aterior Ua vez umeradas las N = k uidades podemos expresarlas de la siguiete forma: ij 1 3 j k 1 u 1 u u 3 u j u k u k+1 u k+ u k+3 u k+j u k+k 3 u k+1 u k+ u k+3 u k+j u k+k i u (i 1)k+1 u (i 1)k+ u (i 1)k+3 u (i 1)k+j u (i 1)k+k u ( 1)k+1 u ( 1)k+ u ( 1)k+3 u ( 1)k+j u ( 1)k+k Co estas especificacioes, el espacio muestral esta formado por las siguietes k muestras posibles: (S 1 ) = {u 1, u 1+k, u 1+k,, u 1+( 1)k } (S ) = {u, u +k, u +k,, u +( 1)k } (S k ) = {u k, u k+k, u k+k,, u k+( 1)k } Cada ua de estas muestras tiee probabilidad igual a 1/k = /N de ser seleccioada Las probabilidades de iclusió de primer y segudo orde correspodiete a este diseño muestral so π i = s S;u i s p(s) = 1 k =, i = 1,,, N, N para la probabilidad de primer orde y { 1/k si ui y uj esta e la misma muestra π ij = P [(u i, u j ) s] 0 e otro caso Ejemplo Dada la població siguiete u i u 1 u u 3 u 4 u 5 u 6 u 7 u 8 u 9 X i 1 3 5 4 6 7 3 se desea obteer ua muestra sistemática de tamaño 3 Determiar el espacio muestral
3 1 Teemos el listado ordeado de los 9 elemetos Tamaño muestral = 3 3 El tamaño del salto sistemático es k = N/ = 9/3 = 3 4 Elegir u umero aleatorio r etre 1 y 3 Para r = 1, se tiee que la muestra viee dada por {u 1, u 1+3, u 1+6 } Para r =, se tiee que la muestra viee dada por {u, u +3, u +6 } Para r = 3, se tiee que la muestra viee dada por {u 3, u 3+3, u 3+6 } A diferecia de los que puede ocurrir e el muestreo aleatorio, igua sucesió grade de elemetos queda si represetació E cosecuecia, si los elemetos cosiderados e el orde e que aparece e la lista tiee a formar grupos o zoas de elemetos parecidos respecto de la característica que se estudia, el muestreo sistemático puede ser mas represetativo que el muestreo aleatorio simple E el muestreo sistemático existe, pues u efecto que podemos llamar de extesio o estratificació si cada grupo de k elemetos cosecutivos a partir del primero se cosidera como u estrato Debe teerse e cueta, si embargo, que e el muestreo estratificado aleatorio la selecció se efectúa idepedietemete e cada estrato, mietras que e el muestreo sistemático todos los elemetos seleccioados ocupa el mismo lugar o umero de orde detro de cada grupo de k elemetos El efecto aterior sera beeficioso para la represetatividad de la muestra cuado hay rachas o estratos sucesivos costituidos por elemetos iguales o parecidos etre si Por el cotrario, si e la ordeació de elemetos poblacioales existe cierta periodicidad y k es igual al periodo o múltiplo de éste, la represetatividad dismiuye E el ejemplo aterior apreciamos que el tamaño del salto sistemático es u umero etero, pero que ocurre si este tamaño k o es etero? Ua alterativa para solucioar este problema cosiste e cosiderar el listado ordeado de todos los elemetos de la població como circular (es decir, el elemeto N + 1 coicide co el elemeto 1) E este caso el procedimieto se desarrolla de la siguiete maera Defiir el tamaño del salto sistemático, k, como el etero mas cercao a N/ Elegir u umero aleatorio, r, etre 1 y k Seleccioar los elemetos de la lista: r, r + k, r + k,, r + ( 1)k teiedo e cueta que la lista es circular Las vetajas e icoveietes de este método de muestreo so, e resume: Vetajas
4 Extiede la muestra a toda la població Recoge el posible efecto de estratificació debido al orde e que figura las uidades de la població No preseta problemas de calculo algebraico El error de muestreo suele ser iferior que e muestreo aleatorio simple o icluso que e estratificado Icoveietes La posibilidad de aumeto de la variaza si existe periodicidad e la població El problema teórico que se preseta e la estimació de las variazas No hay idepedecia e la selecció de uidades e las distitas zoas, ya que las uidades extraídas e cada zoa depede de la seleccioada e la primera zoa E geeral sólo hay selecció aleatoria para la primera uidad de la muestra 11 Estimadores lieales isesgados Las estimacioes del total, media, proporció y total de clase poblacioales so los siguietes: Total θ = X X stm = N x j, siedo x j la media de la muestra sistemática j resultate a partir del puto de arraque j, m j Media θ = X Xstm = x j, siedo x j la media de la muestra sistemática siedo x j la media de la muestra sistemática j resultate a partir del puto de arraque j, m j Proporció θ = P P stm = P j, siedo P j la proporció de la muestra sistemática j resultate a partir del puto de arraque j, m j Total de clase θ = A Âstm = N P j, siedo P j la proporció de la muestra sistemática j resultate a partir del puto de arraque j, m j
5 Ejemplo 3 Dada la població siguiete u i u 1 u u 3 u 4 u 5 u 6 u 7 u 8 u 9 X i 1 3 5 4 6 7 3 se desea obteer ua muestra sistemática de tamaño 3 Determiar la distribució de probabilidad del estimador del total y el de la media Solució Las muestras posibles so (1,, ), (3, 4, 7) y (5, 6, 3) siedo la probabilidad de cada ua de ellas k = 1/3 Se tiee que: S(X) P (X) Xstm = N Xj Xstm = Xj (1,,) 1/3 15 5/3 (3,4,7) 1/3 4 14/3 (5,6,3) 1/3 4 14/3 La distribució de probabilidad e el muestreo de estos estimadores viee dado por: P ( X stm = 15) = 1 3, P ( X stm = 4) = 3 P ( Xstm = 5/3) = 1 3, P ( Xstm = 14/3) = 3 Además dicho estimador es isesgado ya que: E( X stm ) = 15 1 3 + 4 3 = 99 3 = 33 = X E( Xstm ) = 5 1 3 3 + 14 3 3 = 33 9 = X 1 Variaza de los estimadores Bajo muestreo sistemático las variazas de los estimadores de los parámetros viee dadas por las siguietes expresioes: Para la media, V ( Xstm ) = 1 k ( Xj X), j=1 dode el ídice j idica que se trata de la muestra sistemática asociada al j-ésimo puto de arraque y la expresió Xj deota la media de la muestra sistemática asociada al j-ésimo puto de arraque Para el total, V ( X stm ) = N k ( Xj X), j=1
6 Para la proporció, V ( P stm ) = 1 k ( P j P ), j=1 siedo P j la proporció de la muestra sistemática asociada al j-ésimo puto de arraque Para el total de clase V ( Ā stm ) = N k ( P j P ) Ejemplo 4 Cosiderado el Ejemplo 3, calcular la variaza del estimador X stm cosiderado la defiició y la fórmula dada e la teoría Para ello, otar que E[ Xstm ] = 5 9 + 8 9 = 33 9, y por lo tato, aplicado la defiició de variaza de variable aleatoria es j=1 V ar( Xstm ) = E[ X stm] (E[ Xstm ]) ( ) ( ) ( ) 5 1 14 = 3 3 + 33 3 3 9 = Aplicado la fórmula de la variaza para muestreo aleatorio simple, se tiee que V ar( Xstm ) = 1 ( Xj k X) j=1 ( (5 = 1 3 3 33 ) ( 14 + 9 3 33 ) ) 9 = 13 Descomposició de la variaza Vamos a realizar la siguiete descomposició de la suma de cuadrados para el aálisis de la variaza poblacioal (X ij X) = + (X ij Xj ) + (X ij Xj )( Xj X) ( Xj X)
7 El térmio (X ij Xj ), represeta la variació detro de las muestras Por el cotrario, el térmio ( Xj X), represeta la variació etre muestras Si defiimos la cuasivariaza etre las k muestras posibles, o cuasivariaza itermuestral, como Sbs = 1 ( Xj k 1 X), (11) y la cuasivariaza detro de las muestras o cuasivariaza itramuestral como Sws = 1 (X ij Xj ), (1) N k se tiee e cueta la siguiete divisió de la cuasivariaza poblacioal, (N 1)S = (k 1)S bs + (k( 1))S ws Segú esta omeclatura, podemos expresar las variazas de los estimadores de la siguiete forma: V ( Xsmt ) = 1 k ( Xj X) j=1 = 1 ( Xj k X) = k 1 k = S bs ( 1 1 k ) S bs = (1 k ) S bs (1 = ) S bs N = (1 f)s bs V ( X smt ) = N ( Xj k X) = N ( Xj k X) = N k S bs(k 1) = N (1 f) S bs
8 Se observa que las variazas de los estimadores aumeta cuato aumeta la cuasivariaza itermuestral Sbs Por lo tato, para coseguir ua mayor eficiecia e el estimador, la variació etre muestras debe ser lo más pequeña posible, es decir, que haya homogeeidad detro de las muestras y que todas las posibles muestras sea lo más parecidas etre sí Por otra parte, V ( Xsmt ) = (1 f) S bs = k 1 k S bs = (N 1)S (N k)sws N = N 1 N S N k N = σ 1 S ws ( V ( X smt ) = N σ 1 S ws S ws = σ k k Sws Por lo tato, la variaza de los estimadores será meor cuato mayor sea la cuasivariaza itramuestral S ws Por lo tato, coviee que la variació detro de la muestras sea lo más grade posible, es decir, que haya heterogeeidad etre las muestras E el caso del estimador del total de clase y de la proporció, se obtiee expresioes similares del tipo ) dode, e este caso, V ( Xsmt ) = (1 f) S bs V ( X smt ) = N (1 f) S bs V ( P ) = σ 1 S ws ( V (Â) = N σ 1 S ws Sws = 1 (A ij P j ), Sbs = 1 (P j P ) N k k 1 ), Ejemplo 5 Cosideramos el ejemplo 3 para el cual habíamos obteido la distribució e el muestreo para el estimador de la media y del total y la variaza del estimador V ar( X stm ) = 15 3 + 4 33 = 16 3 Si embargo, las variazas tambié puede calcularse a partir de las fórmulas deducidas para la descomposició de la variaza La cuasi-variaza etre las 3 muestras posibles, o cuasivariaza itermues-
9 tral, viee dado por Sbs 1 = ( Xj k 1 X) [ 1 ( 5 = 3 1 3 33 ) ( 14 + 9 3 33 ) ] 9 = 3 ( 5 3 33 ) ( 14 + 3 9 3 33 ) = 18 9 Aálogamete, la cuasivariaza itramuestral, o cuasivariaza detro de las muestras, viee dada por S ws = = 1 (X ij Xj ), N k 1 9 3 [ (1 5/3) + ( 5/3) + (3 14/3) + (4 14/3) + (7 14/3) + (5 14/3) + (6 14/3) + (3 14/3) ] = 14 6, y fialmete la cuasivariaza poblacioal es igual a S = 1 (X ij N 1 X) = 3 8 Y comprobamos que se cumple la igualdad (N 1)S = (N k)s ws + (k 1)S bs Además, utilizado la expresió para la variaza del estimador mediate la cuasivariaza itermuestral se tiee que V ar( X stm ) = N (1 3 9 )9 3 = 16, que coicide co el valor obteido aplicado la defiició de variaza de variable aleatoria 131 Comparació co el muestreo aleatorio simple La cuasivariaza itermuestral permite comparar el muestreo sistemático co el muestreo aleatorio simple Así, debido a que teemos las siguietes expresioes V ar( X) = (1 f) S, V ar( Xsmt ) = (1 f) S bs,
10 se tiee que el muestreo aleatorio simple tiee más (meos) precisió que el muestreo sistemático cuado S < Sbs (S > Sbs ) y coicide e precisió cuado S = Sbs Aálogamete, teemos que V ar( X) = N (1 f) S, V ar( X smt ) = N (1 f) S bs Ejemplo 6 Comparar el muestreo sistemático dado e el Ejemplo 3 co el realizado mediate muestreo aleatorio simple E este caso particular, se tiee que la cuasivariaza itermuestral S bs viee dada por S bs = 9 y la cuasi-variaza poblacioal es de S = 4 Como S < S bs, etoces el muestreo aleatorio simple e este caso particular tiee más precisió que el realizado mediate muestreo sistemático Pasamos ahora al problema de estimació de las variazas 14 Estimació de la variaza de los estimadores La estimació de la variaza de los estimadores es uo de los problemas que platea el uso de este método de muestreo ya que o hay u método directo para obteer dichas estimacioes a partir de ua muestra sistemática E este puto, presetamos tres métodos para aproximar la variaza de los estimadores 1 Si la ordeació de los elemetos e la població puede cosiderarse aleatoria, los resultados que proporcioar ua muestra sistemática y ua muestra aleatoria simple so similares Por tato, podemos estimar la variaza de los estimadores de los parámetros usuales como si se tratase de u muestreo aleatorio simple E el caso del estimador de la media V ( Xstm ) = (1 f) S j, dode Ŝ j es la cuasi-variaza de la muestra tomada, m j Para el resto de los estimadores se tiee que V ( X stm ) = N (1 f) Ŝ j V ( P stm ) = (1 f) P j Qj 1 V (Âstm) = N (1 f) P j Qj 1 Para detectar este aleatoriedad e la població examiamos la cuasivariaza itermuestral Sbs y si está cercaa a la cuasivariaza poblacioal podemos supoer que la població es aleatoria
11 Método de las diferecias sucesivas Se basa e utilizar la suma de los cuadrados de las diferecias etre cada dos elemetos cosecutivos de la muestra, y ajustado este resultado coveietemete por ua costate, aproximar la estimació de la variaza del estimador de la media mediate la expresió V ( Xsist ) = V ( X sist ) = 1 (1 f) (X i X i+1 ) ( 1) 1 N(N ) (X i X i+1 ) ( 1) 3 Método de las muestras iterpeetrates E ocasioes, o podemos estimar la variaza del estimador e fució de la iformació coteida e ua sola muestra sistemática Se llama muestras iterpeetrates al cojuto formado por dos o más muestras elegidas bajo el mismo esquema de muestreo de forma que cada ua de ellas proporcioa u estimador del parámetro poblacioal θ de iterés Sea θ 1, θ,, θ k, estimadores isesgados del parámetro poblacioal θ y co variaza igual a V ( θ) basados e k muestras idepedietes Su media θ c = 1 θ i, k es tambié u estimador isesgado de θ ya que E[ θ c ] = 1 k E[ θ i ] = kθ k = θ, y su variaza puede calcularse fácilmete como V ( θ c ) = 1 k V ( θ i ) = V ( θ) k Además, u estimador isesgado de esta variaza viee dada por 1 t V ( θ c ) = t(t 1) ( θ i t θ c) Para aplicar este método al muestreo sistemático, e vez de tomar ua muestra sistemática de tamaño a partir de u úico arraque aleatorio, se toma t muestras sistemáticas de tamaños /t a partir de t arraques aleatorios Ejemplo 7 Para t =, es decir, cosiderado dos muestras sistemáticas co distitos arraques, obteer las expresioes de los estimadores de los parámetros usuales y las estimacioes de sus variazas cosiderado el método de las muestras iterpeetrates
1 Para el estimador de la media X c = x 1 + x Para el estimador del total X c = N x 1 + x, V ( Xc ) = ( x 1 x ) 4, V Xc = N ( x 1 x ) 4 Para el estimador de la proporció y el total de clase basta co sustituir las medias muestrales por las proporcioes muestrales e las expresioes ateriores de la media y el total, respectivamete Ejemplo 8 E u proceso de cotrol de calidad se trata de aalizar la producció de piezas e serie de 13 máquias Para ello se cotrolaro las piezas producidas por las 13 máquias e el primer mometo de su fucioamieto La distribució de piezas producidas por cada máquia e el primer miuto de fucioamieto es: Máquia 1 3 4 5 6 7 8 9 10 11 1 13 Número piezas 5 5 4 5 4 5 4 3 4 4 3 Para estimar el úmero de piezas defectuosas e el proceso de producció se realiza u muestreo sistemático 1 e 5, es decir, se seleccioa ua de cada cico piezas empezado por la primera pieza de la primera máquia hasta que se agote sus piezas para pasar a cotiuació a la primera pieza de la seguda máquia hasta que se agote sus piezas y así sucesivamete Supoiedo que la primera pieza producida por cada máquia es defectuosa y las demás so correctas, se pide Calcular la variaza del estimador de la proporció de piezas defectuosas producidas por las máquias Existirá gaacia e precisió respecto de u muestreo aleatorio simple co fracció de muestreo del 0 %? Calcular el coeficiete de correlació itermuestral Supoiedo que la distribució de la població es aleatoria, estimar la variaza para cada muestra sistemática Co qué muestra sistemática os quedaremos que mejor represete a la producció?