TAMAÑO DE MUESTRA PARA POBLACIONES MULTINOMIALES EN MUESTREO BIETÁPICO Svetlana Ivanovna Rudnykh. Departamento de Fíica Univeridad del Atlántico Km 7 antigua vía a Puerto Colombia, A.A. 1890, Barranquilla, Colombia, Svetarudn@hotmail.com Material Tei de Epecialización en Etadítica, Convenio Univeridad Nacional - Univeridad del Atlántico Reumen.En eta invetigación e preenta un algoritmo que permite etablecer un tamaño de muetra para poblacione multinomiale que requieren el mínimo coto para realizar un muetreo bietápico. Palabra clave: ditribución binomial, muetreo bietápico, tamaño de muetra, ditribución multinomial. Abtract. In thi reearch, I introduce an algorithm that allow etablihing an optimal ample ize for multinomial population in two-tep urvey. Key-Word: binomial ditribution, two-tep urvey, ample ize, multinomial ditribution. 1. Introducción El cálculo del tamaño de muetra para etimar parámetro de proporcione con ditribución multinomial e ha convertido en una tarea cotidiana en la invetigacione ociale (ver MEDINA 1998). Ete problema ha ido analizado, entre otro, por COCHRAN (1963), TORTORA (1978), THOMPSON (1987) y ANGERS (1974, 1984), quiene han podido aplicar u método en actividade tan diímile como control de calidad, opinión pública, antropología, teoría del juego, biología y etudio de imulación. En la etimación del número de unidade que forman parte de una muetra, debe er coniderada la varianza de la variable de interé, aí como la preciión con la que e deean obtener la etimacione y la con anza requerida, lo dominio de etudio y el equema de muetreo. Sin embargo, la forma de abordar ete problema e muy compleja y la teoría conocida hata hoy preenta olucione muy puntuale a cao particulare. En ete etudio e conideró un procedimiento de muetreo formado por do etapa (bietápico). Se upuo, ademá, que en la etapa inicial e extrae una muetra aleatoria imple in reemplazo de n UP M (Unidade Primaria de Muetreo, la cuale etán conformada a u vez por unidade de menor tamaño), de un total de N que componen la población objetivo, en una egunda etapa e extrae una muetra aleatoria imple in reemplazo de m U SM (Unidade Secundaria de Muetreo) de la M que componen cada UP M. En otra palabra, el procedimiento bietápico aquí coniderado e aplicado a una población de N UP M, en donde cada UP M tiene igual tamaño M. De aquí on extraída m USM para 52
er examinada y etimar la proporción de una caracterítica de interé (eta variable e de tipo multinomial). Bajo eta condicione, e propone un algoritmo para etimar lo tamaño de muetra (n m) de poblacione multinomiale en el muetreo bietápico. 2. Tamaño de Muetra de Poblacione Binomiale en Muetreo Bietápico El procedimiento uual para el cálculo del tamaño de muetra en el equema bietápico cuando e etima el parámetro deconocido (P ) de poblacione binomiale implica optimizar una función de coto teniendo en cuenta la retriccione contenida en la expreión que e obtenga de la varianza del etimador ( P b ). P e de ne aquí como la proporción poblacional en la i- éima UP M, o también la razón entre el número total de unidade en la i-éima UP M que poee la caracterítica de interé y M (tamaño de cada UP M). Por u parte b P = 1 n nx bp i y b P = a i m iendo a i el total de unidade USM que poeen atributo de interé y pertenecen a la UP M i: Aplicando el teorema de Madow (PÉREZ 2000) e obtiene la varianza del etimador ( b P ), cuya expreión e la iguiente: V bp Donde f 1 = n N, S2 b = NX MP i (1 P i ) = (1 f 1 ) S2 b n + (1 NX P i P 2 (N 1) f 2) S2 w nm (1) f 2 = m M y S2 w = : Una función de coto del muetreo dependiente de n y m N(M 1) e puede preentar de la iguiente forma: C = nc 1 + nmc 2 (2) donde C 1 y C 2 on lo coto de muetreo correpondiente a cada unidad primaria y ecundaria en la encueta, repectivamente. Utilizando la metodología de Lagrange e logra optimizar (minimizar) la función de coto (2) bajo la condicione de (1) y de ea forma encontrar m y n óptimo: C 1 MSw 2 m opt: = C 2 (MSb 2 Sw 2 C n = : C 1 + mc 2 53
Se oberva que el tamaño óptimo de m aumenta proporcionalmente a r C1 C 2 pero no e muy enible a pequeño cambio en C 1 C 2 también e oberva que m opt: no depende de C ni de n: 3. Tamaño de Muetra de Poblacione Multinomiale en Muetreo Monoetápico Para el cálculo del tamaño de muetra en ditribucione multinomiale e han dearrollado procedimiento que e orientan a reolver parte de lo problema teórico que comprende la etimación imultánea de lo parámetro en poblacione multinomiale, pero no logran optimizar u olucione para todo lo cao. Aí, en Anger (1984) e propone un método que conite en elegir de manera arbitraria un tamaño de muetra n y calcule lo k cociente por medio de la expreión: nd 2 i P i(1 P i ) i = 1 2 ::: k (categoría de la variable de dieño) que repreentan lo valore de la abcia, mientra que en el eje de la ordenada e ubican lo nivele de con anza (0 010) y (0 001). Poteriormente, e bucan en la grá ca propueta lo valore obtenido en el eje de la abcia, a n de identi car lo correpondiente nivele de con anza ( 0 i ) y e compara la X i con el valor de de nido por el invetigador. El criterio que e utiliza para decidir e que i la umatoria i e mayor X (menor) que, entonce el tamaño de muetra propueto e muy pequeño (grande), por lo que e deberá modi car el tamaño de muetra en múltiplo de n y continuar con el procedimiento decrito hata encontrar un intervalo (n 1 n n 2 ) que contenga el valor bucado. Cuando e logre ubicar el intervalo, el número nal de obervacione e obtiene por medio de interpolación lineal imple. Ete procedimiento permite obtener el límite empírico para el tamaño de muetra cuando e aume que lo intervalo de con anza tienen amplitude iguale y no e hacen retriccione a lo aparte de que X i =. En la propueta de Anger (ut upra), e nota que el tamaño de muetra e incrementa con el aumento del número de categoría k. Ete e un reultado irregularmente! conervativo, pueto que falla al tomar en cuenta la retricción kx P i = 1 de lo parámetro multinomiale. Para la determinación del tamaño de muetra, e requiere de nir la preciión de cada parámetro de la ditribución multinomial. Eta ituación repreenta una diferencia utantiva repecto del procedimiento tradicional, en donde generalmente e elige una variable de dieño y obre ella e determina el número de obervacione necearia para realizar la invetigación. De eta manera, uponga que e deea una preciión aboluta para cada celda entonce, e tiene que: 54
P i i = P i 2 (1=k) P i(1 P i ) n P i + i = P i + 2 (1=k) P i(1 P i ) n Depejando el valor de i en la anteriore expreione, e obtiene: 2 (1=k) i = P i(1 P i ) n y reolviendo para n e encuentra que el tamaño de muetra neceario para etimar cada celda con una preciión i e: n = max i 2 (1=k) P i(1 P i ) : En 1987, Thompon plantea que el método propueto por Anger en 1984 era el óptimo de lo procedimiento exitente, pero reultaba muy tedioo en u aplicación, por lo que propuo una manera de determinar el peor de lo cao (wort cae P i = 05) para un vector de parámetro multinomiale cuando e deean obtener intervalo de con anza imultáneo para cada uno de lo componente del vector P. Thompon (ibid) plantea que el objetivo conite en determinar el tamaño de muetra n para una variable aleatoria de una ditribución multinomial, de tal forma que la probabilidad de que toda la proporcione etimada de manera imultánea etén contenida en el intervalo ea menor que (1 i ) eto e, 2 i P r k\ jp i P i j i 1 en donde P i e la proporción de obervacione en la i-éima categoría en la población, p i la proporción obervada en la muetra, k el número de categoría y p ) i n i = P r (jz i j p = 2(1 (Z i )) Pi (1 P i ) en donde Z i e la variable normal etandarizada, la función acumulativa de probabilidad y Z i = i p n p Pi (1 P i ) : Cuando k = 2 y i = 1 = 2 e trata de una ditribución binomial y el tamaño de muetra e determina de la manera tradicional: n = Z2 P i (1 P i ) 2 i Si la proporción P i e deconocida, e utiliza el criterio de máxima varianza (wort cae) con P i = 05. 55
4. Efecto de Categoría para la Determinación de lotamaño de Muetra Para tratar de reolver la ituación que e preenta en el cálculo de tamaño de muetra en encueta compleja, en donde no e cuenta con una fórmula para la varianza de la proporcione de la categoría de la variable de interé, iguiendo la propueta de Kih (1972) al de nir un factor de ajute que a partir de una muetra aleatoria imple permite aproximare al número de eleccione necearia para un dieño de conglomerado, proporciona la mima varianza, e de ne aquí el tamaño efectivo de muetra como, n e = n 0 efdk donde n 0 e el tamaño de muetra obtenido egún el procedimiento cláico de Cochran, efdk e el efecto de dieño que, en la ituación aquí analizada, ería el efecto de k categoría. Ete efecto e exprea como la variacione de lo tamaño de muetra propueto por lo ditinto procedimiento entre el tamaño de muetra de aproximación cláica (COCHRAN 1963) (ver tabla 1). El tamaño efectivo calculado puede er interpretado como la cantidad de información contenida en una muetra multinomial. La ubvaloración de la aproximación cláica (COCHRAN 1963) en el cao de la etimación de proporcione para poblacione multinomiale con má de 2 categoría y por ende en la determinación del tamaño de muetra, e debe a la conideración no realita de que todo lo parámetro on iguale a 0.5 (peor de lo cao) y que la uma de lo mimo e igual a 1. Si en lugar de coniderar poblacione binomiale e conideran ahora poblacione multinomiale, en otra palabra, i en lugar de etimar una ola proporción interea etimar k proporcione de categoría de una variable, la varianza dentro de la unidade ecundaria aumenta. Ete aumento de la varianza e debe a la etimación imultánea de k proporcione de la variable. Por otra parte, al exprear la varianza del etimador de la proporción en el modelo binomial mediante el coe ciente de correlación intraconglomerado, e oberva que dicha varianza e igual al producto de varianza del etimador de la proporción en el muetreo aleatorio imple cuando el tamaño de muetra e mn por el factor (1 + (m 1)), que e llamado por Kih (1972) efecto de dieño. En reumen, el efecto de dieño dado por la razón entre la varianza del etimador de la proporción para el muetreo en etapa y varianza del etimador bajo el muetreo aleatorio imple depende vitalmente de m, el tamaño de muetra de unidade ecundaria, y no tanto del tamaño de muetra de unidade primaria n. En el cambio de poblacione binomiale a poblacione multinomiale iguiendo un equema bietápico el tamaño de muetra que reulta incrementado utancialmente e el de la unidade ecundaria (m), y u in uencia e puede medir por el efecto de categoría ef dk expreada de la iguiente manera: m = m 0 efdk 56
donde e el tamaño de muetra de unidade ecundaria y efdk = en en 0 donde en 0 e el tamaño de muetra propueto por Cochran (1963) de la aproximación cláica y en e el tamaño de muetra propueto por ditinto autore para poblacione multinomiale. 5. Algoritmo para el Tamaño de Muetra Lo tamaño de muetra de una población multinomial para el muetreo bietápico pueden encontrare de una manera práctica dearrollando el iguiente procedimiento: Se obtienen lo tamaño de muetra n de unidade primaria y m 0 (número de unidade ecundaria) para poblacione binomiale en muetreo bietápico. Ecoger el procedimiento de aproximación de etimadore que má e ajuta a ituación planteada en el problema que e reuelve (Tortora 1978, Anger 1984 o Thompon 1987). Luego que e ha ecogido el procedimiento, ir a la celda correpondiente en la tabla 1, de acuerdo a lo valore de y k, y localizar el valor del efecto de categoría para ete cao. Multiplicar m 0 por valor del efecto de categoría hallado en pao anterior. El reultado e aproximadamente el tamaño de muetra de la unidade ecundaria recomendado por el procedimiento ecogido. El tamaño de muetra n de unidade primaria fue el obtenido con la aproximación binomial al inicio del algoritmo. Conf Ang Thom k=3 k=4 k=5 k=6 k=7 k=8 k=9 k=10 1984 1987 0.0001 1.14 1.18 1.20 1.22 1.24 1.26 1.28 1.29 1.09 1.09 0.0005 1.17 1.21 1.25 1.28 1.30 1.32 1.34 1.36 1.11 1.11 0.001 1.19 1.24 1.28 1.31 1.34 1.36 1.38 1.40 1.12 1.12 0.005 1.25 1.32 1.37 1.42 1.45 1.48 1.51 1.54 1.16 1.16 0.010 1.30 1.38 1.44 1.49 1.53 1.57 1.60 1.63 1.19 1.19 0.020 1.36 1.46 1.53 1.59 1.64 1.69 1.73 1.76 1.23 1.23 0.025 1.39 1.49 1.57 1.63 1.69 1.74 1.78 1.82 1.24 1.24 0.050 1.49 1.62 1.73 1.81 1.88 1.95 2.00 2.05 1.33 1.33 0.075 1.58 1.74 1.87 1.97 2.05 2.13 2.20 2.26 1.41 1.41 0.100 1.67 1.86 2.00 2.12 2.22 2.31 2.38 2.45 1.49 1.49 0.20 2.05 2.34 2.57 2.76 2.92 3.06 3.18 3.30 1.82 1.82 0.30 2.52 2.95 3.29 3.58 3.82 4.03 4.22 4.38 2.24 2.24 0.40 3.18 3.82 4.33 4.75 5.11 5.42 5.70 5.95 2.83 2.86 0.50 4.20 5.17 5.95 6.59 7.14 7.63 8.06 8.44 3.74 3.88 57
Referencia [1] ANGERS, C. A Graphical Method to Evaluate Sample Size for the Multinomial Ditribution. Technometric, Vol.16, No. 3, pp. 469-471. 1974. [2] Large Sample Size for the Etimation of Multinomial Frequencie from Simulation Studie. Simulation: Oct, pp.175-178. 1984. [3] COCHRAN, W.G. Técnica de Muetreo. México D.F.: Continental, S.A. 1963. [4] KISH, L. Muetreo de Encueta. México D.F.: Trilla. 1972. [5] MEDINA, F. Tamaño Óptimo de Muetra en Encueta de Propóito Múltiple. En: CEPAL, Memoria del Taller Regional obre Plani cación de Encueta en Hogare, Santiago de Chile. 1998. [6] PÉREZ, C.). Técnica de Muetreo Etadítico. Teoría, Práctica y Aplicacione informática. México D. F.: Alfaomega. 2000. [7] THOMPSON, K.T. Sample Size for Etimating Multinomial Proportion. The American Statitician, Vol. 41, No. 1, pp. 42-46. 1987. [8] TORTORA, R.D. A Note on Sample Size Etimation for Multinomial Population. The American Statitician Vol. 32, No. 3, pp. 100-103. 1978. 58