APORTACIONES AL MUESTREO SUCESIVO

Metodología de Encestas Vol!, Nm 1, 1999, 19-28 APORTACIONES AL MUESTREO SUCESIVO Eva Maria Artés Rodrígez Universidad de Almería M' del Mar Reda García Antonio Arcos Cebrián Universidad de Granada RESUMEN En este trabajo se desarrolla la teoría del mestreo scesivo tilizando n estimador de razón-prodcto de doble mestreo para la parte apareada de la mestra. Se obtienen las expresiones para la fracción del apareamiento óptimo para el estimador combinado jnto con s error. Se presentan resltados para algnos casos especiales de aplicación práctica. Para evalar el estimador propesto se incle n ejemplo nmérico. Palabras clave: mestreo scesivo, fracción de apareamiento, estimador de razónprodcto, eficiencia relativa.

20 E. Ma Artés, Ma M. Reda A. Arcos Introdcción Un aspecto a destacar en las encestas continas es la estrctra de la mestra en cada ocasión. Existen varias posibilidades: l. Extraer na neva mestra en cada ocasión (mestreo repetido) 2. Utilizar la misma mestra en todas las ocasiones (mestreo panel) 3. Realizar n reemplazamiento parcial de nidades de na ocasión a otra (mestreo en ocasiones scesivas, o también Bamado mestreo rotativo cando los elementos tienen restringido el número de etapas en las qe van a formar parte de la mestra, como es el caso de la Encesta de Población Activa, de periodicidad trimestral, de la maoría de las encestas elaboradas por el Institto Nacional de Estadística español (INE). Las circnstancias de la encesta las características qe se estimar son determinantes para elegir el tipo de diseño mestra! más adecado. En las encestas mestrales es frecente la necesidad de estimar algún n''''$litip.n " poblacional en intervalos reglares de tiempo. Si existe na relación entre el valor de n elemento de la población en n período de tiempo, el valor del mismo elemento en el período entonces es posible emplear la información contenida en la mestra del período precedente, para mejorar la estimación actal del n<"''''n-,,,,'-,''' poblacional. En este sentido, para qe sea posible tilizar la información mestral precedente, se debe obtener la mestra de manera qe los elementos mestrales en los dos scesivos tengan algnos elementos comnes. Algnos motivos por los qe conviene tilizar el reemplazamiento de nidades de la mestra son: l. Redce los costes, a qe tilizar na mestra completamente neva en cada ocasión pede resltar excesivamente costoso. 2. Amenta la precisión de los estimadores. 3. La pennanencia indefinida de las mismas nidades en la mestra crear problemas redcir la eficiencia de los estimadores. Por en las encestas familiares de tipo panel se incrementan los sesgos en las estimaciones debido a la falta de colaboracíon de algnas familias qe pelrtellec:en al panel de hogares. Así, el INE tiliza plincipalmente encestas de mestreo rotativo debido a qe presenta ventajas de las dos encestas anteriores (repetidas panel). La teoría sobre mestreo scesivo desaltollada hasta el momento va a obtener el estimador óptimo combinando dos estimadores de las medias: n estimador indirecto de doble mestreo de la parte apareada de la mestra, n estimador de la media de la parte no apareada. Con frecencia disponemos de infonnación qe ha sido obtenida en la ocasión anterior sobre na variable axiliar x qe se encentra positivamente conelacionada

Aportaciones al mestreo scesivo 21 con, la variable objeto de estdio. En este contexto se ha demostrado qe el estimador combinado qe tiliza n estimador de razón para la parte apareada de la mestra tiene menor varianza qe el estimador sal siempre qe p> (e)2e ) (Sen, Sellers Smith, 1975). Otras veces se dispone de la información proporcionada por na variable z qe se encentra negativamente correlacionada con. En este caso, también se ha demostrado qe el estimador óptimo qe combina n estimador prodcto de doble mestreo para la parte apareada de la mestra na media mestral simple de la parte no apareada, tiene menor varianza qe el estimador sal siempre qe p < (-e/2e ) (Artés, Reda Arcos, 1998). Para cbrir n amplio rango de sitaciones prácticas, en este artíclo proponemos n estimador qe es aplicable cmmdo x z están positiva negativamente correlacionadas con, respectivamente (donde la variable axiliar x sele ser el valor de en la ocasión anterior). Así, generalizamos la teoría en mestreo scesivo para constrir el estimador óptimo de la media en la segnda ocasión tilizando n estimador de razón-prodcto de doble mestreo para la parte apareada de la mestra, na media simple basada en na mestra aleatoria de la parte no apareada en la segnda ocasión. La teoría ha sido aplicada para proporcionar estimaciones más precisas de las varíables analizadas en n estdio sobre hábitos de sald nivel de condición fisica en escolares llevado a cabo en los colegios de Almería capital. Teoría Spongamos qe las mestras son de tamaño n en ambas ocasiones, qe se tiliza mestreo aleatorio simple qe el tamaño de la población N es sficientemente grande como para poder ignorar el factor de corrección por finitd. Sea na mestra de tamaño n seleccionada en la primera ocasión de na población de tamaño N. Se dispone de información acerca de dos variables axiliares x z, cas medias denotamos por x z. Sea na mestra aleatoría simple de tamaño m sbmestreada de las n nidades, qe se retiene para la segnda ocasión (mestra apareada), las restantes = n-m nidades son reemplazadas por na neva selección del niverso N - m qe reslta despés de omitir las m nidades. En la segnda ocasión se considera la variable de interés, qe sponemos está correlacionada positivamente con x negativamente con z. Notación m tamaño mestral de aqellas nidades cestionadas en ambas ocasiones (mestra apareada)

22 E. MB Artés, Ma M. Reda A. Arcos = n-m Y" tamaño mestra1 de aqellas nidades cestionadas sólo en la segnda ocasión (mestra no apareada) media mestral apareada en la primera (segnda) ocasión estimando i,i(y) media mestral no apareada en la segnda ocasión estimando' Y I X YIZ le IXS p IZS coeficiente de correlación lineal de Pearson (2Px - ~1) Ll. 2 (2p z + Ll. 2) p m In, fracción de apareamiento El método Razón~Prodllcto de estimación Las partes apareada Cm nidades) no apareada ( nidades) de la mestra en la segnda ocasión proporcionan estimadores independientes ) de la media -' " poblacional en la segnda ocasión (Y). Para la parte podemos obtener n estimador mejor, -j, para la media poblacional, Y, tilizando el estimador de razón-prodcto de la técnica de doble mestreo, dado por Aplicando n razonamiento análogo al qe hace CocMan (1977) para el estimador de razón, obtenemos s varianza: S2 +~_U_(~2+~2 2p ~ +2p ~ 2p ~ ~) m nn 12 x! z2 xzl2

Aportaciones al mestreo scesivo 23 S2 S2 -+--- U ( Z Z +2p A A ) m n n- 2 xz 2 (1) Se pede obtener n estimador de la varianza sstitendo en (1) los parámetros poblacionales S2, Z, Z2' PU' A Y Az por ss correspondientes estimadores mestrales. Pesto qe el estimador directo basado en las m nidades tiene varianza m S2 V(Ym)= ~ dedcimos qe l es más preciso qe siempre qe Z - Z2 + 2pxzA Az O m m Entonces, combinando los estimadores (independientes entre sí) con m pesos új (l-új), respectivamente, lo qe se obtiene es n estimador Y2 de la población en la segnda ocasión Y dado por: - -1 - Y2 rp = w m +(l-w) de la media rp de aqí V(Yzrp) = dv(~)+(l wiv(jiit) Obtenemos el mejor estimador de Y en la segnda ocasión tilizando los valores de új qe minimicen V(Y2rp) V() W opl Como a se sabe, V() viene dada por V() V() + Ve/) m Por tanto, sstitendo en la expresión de la varianza tenemos qe Ve?) V() S2 1- m _--"-_ V(t)+V() n l-q 2 A m donde A = Z - Z2 + 2pxz AIA2' El valor óptimo de se obtiene minimizando con respecto a la variación en, viene dado por

24 n 1 r=a A E. M" Artés, Ma M. Reda '1 A. Arcos o, lo qe es lo mismo, la fracción del apareamiento óptimo vale Popt 1 Sin embargo, si se considera el estimador sal de la media de la en la segnda ocasión,, qe es la media mestral basada sólo en las n nidades mestrales de dicha ocasión, s varianza toma la sigiente expresión S2 V() n Por tanto, la ganancia en precisión, G, de Y2rp sobre viene dada por G V(jl) - V(Y2rJ V(Y2r) p(l-p)a 1 (l-p)a Por definición p o:; l. Si P = 1 (apareamiento total) ó p = O toda la mestra), la ganancia vale cero. Para calqier otro valor de p, obtendremos na ganancia positiva siempre qe se verifiqe A = Z - Z2 + 2pxz i:l l!i 2 LO. Comparación de eficiencias entre estimadores indirectos Estimador de Razón Se ha estdiado la precisión del estimador combinado de razón-prodcto con aqel qe tiliza n estimador de razón para la parte apareada de la mestra, a partir de ss varianzas siempre qe se verifiqe lo qe demestra qe el estimador combinado basado en n estimador de razónprodcto de la parte apareada de la mestra na media simple de la parte no apareada, Y2 ' es más preciso qe el correspondiente estimador qe tiliza n estimador de razón ~ara la mestra apareada, Y2r, sjetos a la anterior condición.

Aportaciones al mestreo scesivo 25 Estimador Prodcto Si se considera ahora el estimador combinado qe tiliza n estimador prodcto para la parte apareada de la mestra, Y2,haciendo so sólo de la variable axiliar z correlacionada negativamente con la vaiiable de interés, 10 comparamos con Y 2rp, obtenemos qe siempre qe se verifiqe lo qe indica qe, bajo dicha condición, el estimador qe combina n estimador de razón-prodcto para la parte apareada de la mestra na medía simple de la parte no apareada, Y 2,es más eficiente qe el correspondiente estimador qe tiliza n. rp - estimador de prodcto para la parte apareada, 2p' Caso especial Para el caso especial Pxz p = -Pz Pxz = Po ex e = ez=e tenemos qe por tanto S2 U 2- (4p +2p -2) n n 1 o donde A = 4p + 2po - 2. El valor óptimo para, en este caso, viene dado por n 1 La ganancia en precisión del estimador combinado, Y 2 ' sobre el estimador indirecto,, se pede obtener mediante la sigiente ecación rp

26 E. Ma Artés, Ma M. Reda A. Arcos G p(1-p)(4p + 2po 2) 1 - A partir de la expresión anterior dedcimos qe, para calqier valor de p (O<p<l), el estimador combinado qe tiliza n estimador de razón-prodcto para la parte apareada de la mestra, Y2,es más preciso qe el estimador sal ji rp qe Po 1 P +- 2: 2 2 Por tanto, se pede conclir qe la ganancia en precisión de Y;~ sobre ji será óptima canto maor sea la dependencia entre las variables axiliar~s x e con la variable objeto de estdio (PI crece), al mismo tiempo, canto más incorrelacionadas estén x z entre sí (Po decrece). Estdio empírico Para evalar el ben fncionamiento del método propesto se han tilizado los datos recogidos en na investigación sobre hábitos saldables nivel de condición física. Dicho estdio se ha llevado a cabo sobre na población de escolares de 6 de Edcación Primaria en los colegios de Almería capital drante los meses de Abril Jnio de 1998. Se ha pretendido desarrollar n plan de mestreo qe proporcione estimadores más precisos de las variables estdiadas. Dicho plan se ha basado en el del mestreo scesivo de la misma población, consistió en dos conjntos de mestras aleatorias 1) na mestra de 131 escolares seleccionados, en la ra ocaslon de 1998), entre los 2.211 escolares qe formaban la jyui"".avjla, na segnda mestra de 197 escolares seleccionada, en la segnda ocasión 1998) entre los 2.080 escolares qe no formaron parte de la mestra >ln,"""."" A cada niño de la mestra se le administró n cestionario sobre hábitos saldables, se evaló el nivel de condición física mediante determinados tests medidas antropométricas. Para el estdio hemos considerado la estimación comna de las múltiples variables en la m,resttgacjlon en la tomando como variables axiliares al índice de (x) al volmen máximo de de la ocasión. El pnjc ;:UUllU:n estimación ha consistido en combinar los estimadores de las dos mestras mdlep,endientes de escolares:

Aportaciones al mestreo scesivo 27 Los datos mestrales sobre el número de escolares parámetros obtenidos en las dos ocasiones han sido los sigientes: Primera ocasión (Abril 98): gran mestra de n=328. Segnda ocasión (Jnio 98): mestra apareada m= 131, mestra no apareada =197. a 1,54-3,67 P = 0,71 Y x a = 3,71 - x 21,37 P =-020 x xx ' 0z = 6,87 z= 39,4 P =-056 z ' A partir de los datos obtenemos qe lo qe spone n 24,31 % de ganancia en precisión del estimador propesto sobre el estimador sal. Se ha calclado también la fracción de apareamiento óptimo Popt 37,8% Además, en la tabla 1 podemos comprobar cómo el estimador combinado basado en n estimador de razón-prodcto de la de la mestra na media simple de la parte no apareada, Y;, es más preciso qe el correspondiente estimador qe tiliza n estimador de razón para la mestra apareada, Y;" aqel qe tiliza n estimador prodcto de la parta apareada, Y;. En la última colmna se mestra la ganancia en eficiencia alcanzada por los distftos estimadores. Tabla 1: Comparación de eficiencias entre estimadores Estimadores Variable axiliar Varianza Precisión sobre l. Directo ningna S21n 2. Prodcto Y;P z 0,92 S21n 8,42% 3. Razón 1;, x 0,89 S2/n 12,98% 4. Razón-prodcto Y;rp xz 0,8 S21n 24,31%

28 E. M 8 Artés, M 8 M. Reda A. Arcos M. Y A. (1998) Sccesive Sampling sing a Prodct Estímate. Sciences and the Envíronment Comptational Mechanics FnH,,'fJ_ tions, 85-90. Biradar, RS. A Note on an Almost Unbiased Ratio-cm-- Prodct Estimator. 249-255. A.l evolción relación de hábitos saldables nivel de condición fisica-sald en entre final de Edcación Primaria final de Edcación Secndaria Obligatoria (16 Tesis Universidad de Granada. Cochran, W.G. third edition. John Wile & New York. P.S.RS. Mdholkar, G.S. Generalized Mltivariate Estimator for the Mean of Finite Jomal American Statistical.t!~ ;~ ;IU 1009-1012. P.S.RS. ( Ratio and Estimators. En P.S.R.S. Rao A'l.JLJl"Jlll. a,,, Handbook S. 449-468. The Use of a Ratio Estímate in "'''''"'''''H