ANÁLI L S I I S S I S D E E D ATOS

Muestreo Definición: Es la operación para tomar una muestra del Universo. El objetivo del muestreo es contar con los datos necesarios para estimar parámetros en la población, es decir, poder hacer una inferencia estadística con la mayor confiabilidad posible. Una vez definida el tamaño de la muestra (n), nos enfrentamos al problema de cómo obtener esa muestra de la forma que sea más útil para nuestros fines y por supuesto, que nos rinda la mejor relación costo-beneficio. Tipos de muestreo: Son sólo dos: Muestreo probabilístico/ Muestreo no probabilístico Probabilidad: Es la medida del grado de ocurrencia de un suceso. Siempre es un número entre 0 y 1. Se define como el cuociente entre el número de resultados favorables al suceso y el número total de resultados posibles. a_dat758/jsc

Muestreo : Es el tipo de muestreo en el que cada unidad del universo tiene una probabilidad conocida y diferente de cero, de ser incluida en la muestra. Además de estimar las características de la población, la muestra, debe proporcionar medidas de la precisión de tales estimaciones. La precisión se usa para determinar el error máximo que razonablemente puede esperarse en esas estimaciones si el procedimiento se cumple en la forma especificada y si la muestra tiene el tamaño suficiente. Muestreo No Probabilístico: La probabilidad de las unidades del universo para ser incluidas en la muestra se desconoce o, existen de antemano unidades con probabilidad cero. Este tipo de muestreo no permite la aplicación de las técnicas de la inferencia estadística para obtener conclusiones acerca del Universo. a_dat759/jsc

Tipos: ANÁLISIS DE DATOS Muestreo Aleatorio Simple (MAS) Muestreo Sistemático (MS) Muestreo Estratificado (ME) Muestreo de Conglomerados (MC) Muestreo Aleatorio Simple: Procedimiento de selección de una muestra mediante el cual cada subconjunto de tamaño n de la población tiene la misma probabilidad de ser seleccionado. Ejemplo: Suponga una situación hipotética de una población agrícola XYZ. Se han aplicado plaguicidas por mucho tiempo. Recientes hallazgos hacen sospechar la relación de uno de estos compuestos con una patología específica de la población escolar. De allí que se desea estudiar una muestra de tamaño n, de los niños entre 6 y 12 años de edad con el fin de aplicar una encuesta, realizar un examen físico y tomar una muestra de sangre para la determinación de un biomarcador a_dat760/jsc

Cont. Ej: La población de escolares en esta área agrícola es de 10.000 niños (N) y el tamaño de la muestra a seleccionar se ha establecido en 400 niños (n). El área en cuestión tiene 4 grandes zonas determinadas por su ubicación geográfica, sus características socioeconómicas y, por supuesto, diferentes niveles de exposición a los plaguicidas. En cada una de estas zonas hay 50 escuelas con un total de 50 niños cada una. Procedimiento: Es necesario contar con un marco muestral muy completo que incluya un listado de 1 a 10.000 de cada uno de los niños que asisten a las escuelas de dicha población. Hay varias opciones: 1. Hacer una ficha con cada nombre, introducir las fichas en una bolsa y, utilizando el método de lotería, sacar las 400 fichas necesarias para completar nuestra n, en un muestreo sin reemplazo. a_dat761/jsc

2. Utilizar una tabla de números aleatorios y mediante un procedimiento sin reemplazo, completar los 400 elementos necesarios. 3. Tener este marco muestral como una base de datos en un computador y solicitarle la generación de una muestra del tamaño deseado (p.ej. en stata: sample 10, by raza). Idem anterior, salvo que no es manual. Ventajas Todos los elementos tienen igual probabilidad Los cálculos matemáticos son sencillos Desventajas Se requiere un marco muestral completo y detallado La muestra puede quedar muy dispersa Puede ser necesario visitar una localidad por un solo elemento a_dat762/jsc

Muestreo Sistemático: Es aquel tipo de muestreo que nos permite obtener la muestra deseada al seleccionar aleatoriamente un elemento de los primeros k elementos en el marco muestral y después cada k-ésimo elemento hasta completar n. Cont. Ej. En el caso que nos ocupa en la población XYZ, nuestra fracción de muestreo es: n /N = 400 /10.000 = 4 /100 = 1 /25 Es decir, para completar nuestro tamaño muestral en una forma sistemática, nosotros debemos tomar uno de cada 25 escolares. Este número 25, inverso de la fracción de muestreo, es llamado k (intervalo de muestreo). Procedimiento: La muestra se extrae tomando un número al azar entre 1 y k (con la tabla de números aleatorios) el que se conoce como arranque aleatorio y, que para los efectos de este ejercicio, diremos que fue el número 11, mismo al que se le va sumando la k, hasta obtener la muestra deseada. a_dat763/jsc

Cont. Ej. ANÁLISIS DE DATOS Veamos de nuestro hipotético marco muestral numerado del 1 al 10.000; ya sabemos que debemos tomar los niños que aparezcan en la lista con los siguientes números: 11 (arranque aleatorio), 36 (arranque aleatorio más k, es decir (11+25), 61 (36+25), 86, 111, 136 y así sucesivamente hasta completar la n de tamaño 400 al llegar al niño en el marco muestral con el número 9.986, si se asume que todo se hace idealmente. Ventajas: Sólo es necesario usar la tabla de números aleatorios La probabilidad de cada elemento es conocida (n /N) Garantiza la distribución de la muestra Desventajas: Es necesario un marco muestral muy detallado No sirve si hay algún ordenamiento en el marco muestral o que se presente algún comportamiento periódico. Por ej. registros matrimoniales en que todos los números impares sean mujeres. a_dat764/jsc