Anexo I DISEÑO MUESTRAL

Documentos relacionados
LOS MEXICANOS VISTOS POR SÍ MISMOS LOS GRANDES TEMAS NACIONALES. Introducción

ENCUESTA ESTRUCTURAL DE TRANSPORTE POR CARRETERA AÑO CONTABLE 2011 INSTITUTO NACIONAL DE ESTADÍSTICAS

MUESTREO EN POBLACIONES FINITAS

Estadísticos muéstrales

Apéndice A Diseño y Cobertura de la Muestra

DISEÑO Y COBERTURA DE LA MUESTRA

( ) MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO ( mas ) y Y. N n. S y. MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO ( mas )

La adopción y uso de las TICs en las Microempresas Chilenas

METODOLOGÍA MUESTRAL ENCUESTA LONGITUDINAL DE EMPRESAS AÑO CONTABLE 2009

Diseño de la Muestra. Introducción. Tipo de muestreo y estratificación

ESTADÍSTICA. Definiciones

METODOLOGIA DE LA ENCUESTA DE SALIDA Y CONTEO RAPIDO PARA GOBERNADOR, ALCANDES Y DIPUTADO LOCAL. ESTADO ZACATECAS.

CURSO INTERNACIONAL: CONSTRUCCIÓN DE ESCENARIOS ECONÓMICOS Y ECONOMETRÍA AVANZADA. Instructor: Horacio Catalán Alonso

METODOLOGÍA MUESTRAL ENCUESTA A LAS PEQUEÑAS Y MEDIANAS EMPRESAS

Medidas de Variabilidad

METODOLOGÍA MUESTRAL. Encuesta Laboral de la Dirección del Trabajo, ENCLA 2011 (Muestra Efectiva) INSTITUTO NACIONAL DE ESTADÍSTICAS

Metodología del Índice de Excedente Bruto Unitario de la Industria Exportadora (IEBU) 1

Cada uno da lo que recibe, Y luego recibe lo que da, Nada es más simple, No hay otra norma: Nada se pierde, Todo se transforma.

A. Una pregunta muy particular que se puede hacer a una distribución de datos es de qué magnitud es es la heterogeneidad que se observa.

Población 1. Población 1. Población 2. Población 2. Población 1. Población 1. Población 2. Población 2. Frecuencia. Frecuencia

INTEGRACIÓN DE CENSOS Y ENCUESTAS DE HOGARES DIRECCIÓN GENERAL DE ESTADÍSTICA, ENCUESTAS Y CENSOS PARAGUAY

TRABAJO 1: Variables Estadísticas Unidimensionales (Tema 1).

Ejemplo: Consumo - Ingreso. Ingreso. Consumo. Población 60 familias

ESTADISTÍCA. 1. Población, muestra e individuo. 2. Variables estadísticas. 3. El proceso que se sigue en estadística

LECTURA 03: DISTRIBUCIONES DE FRECUENCIAS (PARTE II)

Estadística Descriptiva y Analisis de Datos con la Hoja de Cálculo Excel. Números Índices

Pruebas Estadísticas de Números Pseudoaleatorios

Problemas donde intervienen dos o más variables numéricas

Tema 1.3_A La media y la desviación estándar

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

EL ANÁLISIS DE LA VARIANZA (ANOVA) 2. Estimación de componentes de varianza

H 0 : La distribución poblacional es uniforme H 1 : La distribución poblacional no es uniforme

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.

3. VARIABLES ALEATORIAS.

Tema 3. Estadísticos univariados: tendencia central, variabilidad, asimetría y curtosis

COLEGIO DE POSTGRADUADOS EFICIENCIA DE LOS MÉTODOS DE ASIGNACIÓN DE NEYMAN Y PROPORCIONAL EN EL MUESTREO ALEATORIO ESTRATIFICADO

Reconciliación de datos experimentales. MI5022 Análisis y simulación de procesos mineralúgicos

ENCUESTA SOCIAL DE CANTABRIA

6 Impacto en el bienestar de los beneficiarios del PAAM

a) Qué población (la de hombres o la de mujeres) presenta un salario medio mayor? b) Qué porcentaje de varones gana más de 900?

Boletín de la Tendencia Laboral del Desarrollo Humano

Vida Util, características de la Fiabilidad e Inviabilidad y distribuciones teóricas en el terreno de la fiabilidad

Tema 6. Estadística descriptiva bivariable con variables numéricas

Dicha tabla adopta la forma del diagrama de árbol del dibujo. En éste, a cada uno de los sucesos A y A c se les ha asociado los sucesos B y B c.

Modelos unifactoriales de efectos aleatorizados

DISTRIBUCIONES BIDIMENSIONALES

Inferencia en Regresión Lineal Simple

IN540: Métodos Estadísticos para economía y gestión Profesores: Marcelo Henríquez, Felipe Avilés Auxiliares: José Miguel Carrasco

unidad 12 Estadística

Nos interesa asignar probabilidades a valores numéricos obtenidos a partir de fenómenos aleatorios, es decir a variables aleatorias.

TEMA UNIDAD III: INFERENCIA ESTADÍSTICA

PRUEBAS DE SIGNIFICACIÓN DE MEDIAS Y SUS DIFERENCIAS 1. La Significación de Medias en Muestras Grandes

ANÁLISIS DE FRECUENCIAS

Análisis de Weibull. StatFolio de Muestra: Weibull analysis.sgp

Figura 1

EXPERIMENTOS ANIDADOS O JERARQUICOS NESTED

UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO PLANTEL IGNACIO RAMÍREZ C. DE LA ESCUELA PREPARATORIA

SEMANA 5 MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN

GUÍA DE APOYO AL APRENDIZAJE N 1

SEGUNDA PARTE RENTAS FINANCIERAS

INTRODUCCIÓN. Técnicas estadísticas

Capı tulo 7. DISENO DE MUESTREO

5.0 ESTADÍSTICOS PARA DATOS AGRUPADOS.

Tema 8 - Estadística - Matemáticas CCSSI 1º Bachillerato 1

PyE_ EF1_TIPO1_

Capitalización y descuento simple

FORMA TRADICIONAL DE CÁLCULO DE DESPLAZAMIENTOS Y FUERZAS EN ESTRUCTURAS SIN MAMPOSTERÍA RESUMEN

El Instituto Nacional de Estadística, Geografía

EJERCICIOS RESUELTOS TEMA 2

Pronósticos. Humberto R. Álvarez A., Ph. D.

4º DE ESO MATEMÁTICAS-B CURSO UNIDAD 14: ESTADÍSTICA

EXPERIMENTACIÓN COMERCIAL(I)

CAPÍTULO 1: VARIABLES ALEATORIAS Y SUS DISTRIBUCIONES

Econometría. Ayudantía # 01, Conceptos Generales, Modelo de Regresión. Profesor: Carlos R. Pitta 1

Problema: Existe relación entre el estado nutricional y el rendimiento académico de estudiantes de enseñanza básica?

Reconocimiento de Locutor basado en Procesamiento de Voz. ProDiVoz Reconocimiento de Locutor 1

UNIVERSIDAD AUTÓNOMA DE YUCATÁN FACULTAD DE MEDICINA VETERINARIA Y ZOOTECNIA MÉTODOS DE MUESTREO PARA LA PRODUCCIÓN Y LA SALUD ANIMAL

Tema 1: Estadística Descriptiva Unidimensional

CÁLCULO DE INCERTIDUMBRE EN MEDIDAS FÍSICAS: MEDIDA DE UNA MASA

EJERCICIO 1 1. VERDADERO 2. VERDADERO (Esta afirmación no es cierta en el caso del modelo general). 3. En el modelo lineal general

Economía Aplicada. Estimador de diferencias en diferencias. Ver Wooldridge cap.13. Departamento de Economía Universidad Carlos III de Madrid 1 / 19

REGRESION LINEAL SIMPLE

1. Lección 7 - Rentas - Valoración (Continuación)

Para una población dada, se pueden estudiar simultáneamente dos o más caracteres cuantitativos diferentes.

CARTAS DE CONTROL. Han sido difundidas exitosamente en varios países dentro de una amplia variedad de situaciones para el control del proceso.

Apéndice A: Metodología para la evaluación del modelo de pronóstico meteorológico

Mª Dolores del Campo Maldonado. Tel: :

Variables Aleatorias

GERENCIA DE OPERACIONES Y PRODUCCIÓN DISEÑO DE NUEVOS PRODUCTOS Y SERVICIOS ESTRATEGIAS DE OPERACIONES

Para construir un diagrama de tallo y hoja seguimos los siguientes pasos:

Métodos específicos de generación de diversas distribuciones discretas

HERRAMIENTAS ESTADÍSTICAS-COMPARACIÓN DE MÁS DE DOS MUESTRAS: ANOVA (PARTE I)

Encuesta de Presupuestos de Tiempo Cálculo de Errores de Muestreo.

Oferta de Trabajo Parte 2. Economía Laboral Julio J. Elías LIE - UCEMA

Muestra: son datos de corte transversal correspondientes a 120 familias españolas.

Variables Aleatorias. Variables Aleatorias. Variables Aleatorias. Objetivos del tema: Al final del tema el alumno será capaz de:

12-16 de Noviembre de Francisco Javier Burgos Fernández

Maestría en Administración. Medidas Descriptivas. Formulario e Interpretación. Dr. Francisco Javier Cruz Ariza

Organización y resumen de datos cuantitativos

Transcripción:

Aneo I DISEÑO MUESTRAL * Cuevas, Gullermo, Dseño muestral: cultura cívca en Méco, 009, en Flores Dávla, Jula I (coord), A 50 años de la cultura cívca pensamentos y refleones en honor al profesor Sdney Verba, Semnaro naconal, Méco, UNAM-Trbunal Electoral del Poder Judcal de la Federacón, 011, pp 7 y ss 87

I Fuentes de nformacón 1 Marco muestral Se utlzó la nformacón ofcal dsponble, brndada por el Insttuto Naconal de Geografía y Estadístca (INEGI), y actualzada al 005 (de acuerdo con el II Conteo Naconal de Poblacón) En los casos en los que no se pudo contar con ese marco de referenca, se construyó un marco ad hoc a cada stuacón Respecto a los datos obtendos a partr del INEGI, se utlzó el sstema de nformacón referencada geoespacalmente ntegrada en un sstema (IRIS- SCINCE), así como los datos de poblacón desagregados a nvel de muncpo o localdad Poblacón en estudo Se consderó a todos los habtantes mayores de edad (18 años) como poblacón obetvo A cada membro selecconado en la muestra se le aplcó un cuestonaro de opnón que recopló dversas opnones y acttudes sobre cultura polítca 3 Regonalzacón Para fnes de seleccón de la muestra, el país quedará dvddo de la sguente manera: El Dstrto Federal Las Ageb s 1 que conforman al Dstrto Federal fueron estratfcadas a su vez en nveles socoeconómcos alto, medo y bao La cudad de Guadalaara Las Ageb s de la cudad tambén fueron estratfcadas en tres nveles socoeconómcos alto, medo y bao La cudad de Monterrey Las Ageb s de la cudad fueron estratfcadas en tres nveles socoeconómcos, al gual que en el caso anteror 1 Área Geoestadístca Básca Undad geográfca delmtada por el INEGI en la que las personas tenen característcas socoeconómcas parecdas 89

90 DISEÑO MUESTRAL Otras localdades de más de 400,000 habtantes Localdades de 10,000 a 399,999 habtantes Localdades de menos de 10,000 habtantes Las localdades fueron estratfcadas en tres nveles de margnacón: alto, medo y bao 4 Esquema de seleccón La seleccón de las undades de muestreo se realza a través de etapas sucesvas, y de manera ndependente para cada uno de los estratos defndos De localdades y Ageb s: En el Dstrto Federal, las cudades de Guadalaara y Monterrey: se selecconaron drectamente Ageb s, en el prmer caso 7, y 18 en el resto La seleccón se realzó después de dvdr las Ageb s en tres nveles socoeconómcos, a saber, alto, medo y bao De cada nvel socoeconómco se selecconaron 9 y 6 ageb s, respectvamente, con probabldad proporconal al número de habtantes de 18 años o más (ppt) en cada ageb, y con reemplazo En otras localdades de más de 400,000 habtantes, se selecconaron 5 localdades, con ppt, con reemplazo En cada localdad selecconada se ordenaron las Ageb s de mayor a menor nvel de margnacón (conforme a la metodología eplcada en el punto anteror), selecconando 6 de ellas de manera sstemátca, con arranque aleatoro En las localdades de 10,000 a 399,999 habtantes, se selecconaron 7 de ellas, con ppt y reemplazo Se ordenaron sus Ageb s de acuerdo con su nvel de margnacón y se selecconaron 3 de forma sstemátca, con arranque aleatoro El método que se utlzó para dvdr las ageb s es smlar al segudo por Conapo (Conseo Naconal de Poblacón) para la construccón de los índces de margnacón: se consderó el porcentae de poblacón analfabeta de 5 años y más, el porcentae de poblacón de 15 años y más sn prmara completa, el porcentae de vvendas partculares sn drenae n ecusado, el porcentae de vvendas partculares sn agua entubada en el ámbto de la vvenda, el porcentae de vvendas con algún nvel de hacnamento, el porcentae de vvendas partculares con pso de terra, y el porcentae de vvendas partculares sn refrgerador Los datos fueron obtendos por parte del SCINCE Con los datos anterores, se tomó como índce de margnacón a la prmera componente prncpal (que eplca el 55% del total de la varanza), y se dvdó el rankng en tres grupos, de acuerdo con el crtero de Dalenus

DISEÑO MUESTRAL 91 Las localdades de menos de 10,000 habtantes fueron dvddas según el índce de margnacón que Conapo les asgnó, y se elgeron 7 con índce de margnacón alto o muy alto; 7 con índce de margnacón medo; y 7 con índce de margnacón bao o muy bao La seleccón fue ppt, con reemplazo No hubo seleccón de ageb s De manzanas: En todas las localdades de 10,000 habtantes o más, adentro de cada ageb selecconada se elgeron manzanas La seleccón de las msmas fue por ppt, con reemplazo En las localdades de menos de 10,000 habtantes se elgeron 6 manzanas El método de seleccón fue sstemátco, con arranque aleatoro, realzando un conteo manual de manzanas Cuando la localdad estaba conformada por caseríos dspersos (en parte o en su totaldad), se hzo un amanzanamento vrtual, consderando a todo el caserío dsperso como una gran manzana, y selecconando vvendas drectamente La cantdad de vvendas en muestra provenentes de esa gran manzana dependó de la proporcón que representara de la localdad: cuando representaba más del 90%, se selecconaron 4 vvendas; cuando representaba más del 50% se tomaron 16 vvendas y dos manzanas en la parte no dspersa; cuando representaba más del 10% se tomaron 8 vvendas y cuatro manzanas; cuando representaba menos del 10%, la poblacón resdente de esos lugares no fue consderada como parte de la muestra De vvendas: Para las localdades con más de 10,000 habtantes, se selecconaron 4 vvendas por cada manzana selecconada El crtero se eplca en el sguente punto Para las localdades con menos de 10,000 habtantes, por cada manzana en muestra se elgeron 4 vvendas La seleccón se realzó de manera sstemátca, con arranque aleatoro, después de haber realzado un conteo de las msmas, por parte del personal de campo

9 DISEÑO MUESTRAL De ndvduos: Para cada vvenda en muestra se obtuvo la opnón de un ndvduo de 18 años cumpldos o más, el método de seleccón fue aleatoro smple, con base en una tabla de números aleatoros El cuadro resume el tamaño de muestra para cada esquema de seleccón Dervado de dcho esquema, se consderaron las sguentes undades de muestreo: Cuadro* Tamaño de muestra por etapa de muestreo Ageb s Estrato Descrpcón Localdades Manzanas Vvendas Tamaño de muestra I Dstrto Federal 1 7 4 16 II Guadalaara y Monterrey 18 4 88 III Cudades de 400,000 5 6 4 40 habtantes o más IV Cudades de 10,000 7 3 4 648 a 399,999 habtantes V Localdades de menos de 10,000 habtantes 1 6 4 504 * Cultura Cívca en Méco, 009 Dseño Muestral a) Undades Prmaras de Muestreo (UPM): en los estratos I y II son las ageb s, mentras que en el resto de los estratos, fueron las localdades b) Undades Secundaras de Muestreo (USM): en los estratos I, II y V son las manzanas, y en los otros dos estratos fueron las ageb s c) Undades Tercaras de Muestreo (UTM): en los estratos I, II y V son las vvendas, d) Undades Cuaternaras de Muestreo (UCM): para los estratos I, II y V son los ndvduos selecconados, sendo ésta la últma undad de muestreo Para los estratos III y IV fueron las vvendas e) Undades Últmas de Muestreo (UUM): en el caso de los estratos III y IV, las undades quntas y últmas de muestreo fueron los ndvduos de cada vvenda selecconada

DISEÑO MUESTRAL 93 Chapas Cuando ya había ncado el levantamento de campo se decdó aumentar el tamaño de muestra en esta entdad federatva para poder alcanzar resultados estadístcamente representatvos del estado Para ello, se realzó un dseño muestral paralelo que no nterfrera con el naconal, y que al fnal lograra ntegrarse con el resto de los resultados, al obtener 416 casos adconales El muestreo se realzó de la sguente manera: Las localdades de la entdad fueron dvddas en tres estratos: de menos de 10,000 habtantes; de 10,000 a 99,999 habtantes; de 100,000 habtantes o más De cada estrato se etraeron 6 localdades con ppt, con reemplazo En cada localdad selecconada se elgeron 3 ageb s con ppt, con reemplazo Cuando la localdad no contaba con ageb s, no fueron selecconadas En cada ageb selecconada se tomaron 4 manzanas de manera sstemátca y con arranque aleatoro Cuando no se selecconaron ageb s, se tomaron 5 manzanas, sguendo el crtero de seleccón de manzanas en caseríos dspersos eplcado con anterordad En cada manzana selecconada se consderaron vvendas en muestra, y cuando se trató de caseríos dspersos, por cada manzana se consderaron 4 vvendas La seleccón fue sstemátca, con arranque aleatoro, y sguendo el crtero de seleccón eplcado anterormente En cada vvenda selecconada, a través de una tabla de números aleatoros se elgó a un ndvduo mayor de 18 años para que contestara el nstrumento 1 Tamaño de muestra II Márgenes de error estadístco El tamaño de muestra obtendo del estudo fue de 1,896 casos (,31 s se consderan los casos adconales de Chapas Ese tamaño de muestra, como ya se ha eplcado, fue dstrbudo a dferentes estratos del país, lo cual redunda en la dsmnucón de los márgenes de error estadístcos [para ver en detalle el desglose de la muestra, por etapa de muestreo, véase cuadro])

94 DISEÑO MUESTRAL Estmacones teórcas de los márgenes de error La sguente fórmula se utlzó para la determnacón del tamaño de muestra: ( z1 α )( p)(1 p)( Deff ) n = s (1 TNR) Donde: n = Tamaño de muestra consderando que la poblacón a estmar es nfnta z1 α = Número con el que se obtene una probabldad de éto superor al (1-α)*100%, suponendo un modelo de probabldad normal estándar (en este caso, elevado al cuadrado) p = Probabldad de éto del evento Se refere a la probabldad de éto esperada En encuestas compleas, lo meor es tomar valores de p conservadores El más conservador de los valores se obtene cuando p = 05 s = Varanza estmada Nos ndca cuánto vararán nuestros resultados, dada una certeza Es decr, una vez obtendo algún resultado, cuánto se puede mover de acuerdo con la precsón deseada TNR = Tasa de no respuesta esperada Deff = Efecto de dseño por utlzar un muestreo dferente del muestreo aleatoro smple Se consderó una tasa de no respuesta nferor al 5%, y un efecto de dseño de 175, el tamaño de muestra Así, se determnó el tamaño de muestra que lograra estmacones con márgenes de error mámo de +/- tres puntos porcentuales, con un nvel de confanza del 94% 3 Estmacones muestrales de los márgenes de error A partr de los datos recabados, utlzando el módulo de muestras compleas del paquete SPSS 14, el cual consdera los estratos (utlzados en la post estratfcacón y que se detallan más adelante) y las undades prmaras de muestreo, se obtuveron los sguentes resultados:

DISEÑO MUESTRAL 95 1 Consderando las frecuencas smples de cada una de las preguntas del cuestonaro, en el 50% de los casos, la ampltud de los márgenes de error asocados (al 95% de confanza) fue menor a tres puntos porcentuales En el 86% de los casos, dcha ampltud fue menor a ses puntos porcentuales (valdando el margen de error mámo de +/- tres puntos porcentuales) Mentras que en el 95% de los casos, cada opcón de respuesta de las varables tuvo un margen de error de +/- cuatro puntos porcentuales S se estandarza la medda anteror dvdéndola entre el estmador puntual obtendo, en el 76% de las ocasones, la medda fue nferor a uno (es decr, la dferenca entre el límte superor y el nferor fue menor al estmador puntual) Los casos en que esta medda fue superor a la undad se deberon a frecuencas cuyo estmador puntual fue pequeño, así, s se descartan los estmadores puntuales nferores a 005, la medda es nferor a la undad en el 98% de los casos 3 El promedo del efecto de dseño para las tablas de frecuenca fue de 016 4 El promedo del efecto de dseño para las varables de las que se obtuveron promedos fue de 133 4 Cálculo de los ponderadores En esta seccón se ncluye la forma en que fueron calculados los ponderadores utlzados para el cálculo de los estmadores Para ello, se analzarán las probabldades de seleccón de cada una de las undades de muestreo, conforme a lo establecdo en los apartados anterores 5 Probabldad de seleccón de la localdad Sea X una localdad pertenecente a cualquera de los cnco estratos (I, II, III, IV, V) Entonces, la probabldad de seleccón de la localdad es: 1, { I, II} = PT18( ) P X =, = ( ) { III, IV} PT18 PT18( V ), = ( ) { 1 3 }, = { V} PT18 V V

96 DISEÑO MUESTRAL Donde, PT18 es la poblacón total de 18 años o más en una localdad del estrato A su vez, representa el índce de margnacón de la localdad, donde 1 es alto o muy alto, es medo, y 3 es bao o muy bao (nótese que úncamente es utlzado en el estrato V, pero se puede generalzar al resto de las localdades con la letra î, que ndca la pertenenca ndstnta a cualquer índce de margnacón) Por últmo, se mencona que ésta es la probabldad de seleccón de una vez, sn embargo, en los casos donde se hzo seleccón con reemplazo, se debe consderar que cada localdad pudo salr en más de una ocasón 6 Probabldad de seleccón de la ageb Sea X la k ésma ageb de una localdad pertenecente al ésmo k, estrato, con índce de margnacón Entonces, la probabldad de seleccón de la ageb es: P X k, PT es la poblacón total de personas de 18 años o más en la k ésma ageb del ésmo estrato, pertenecentes al nvel de margnacón r Y # AGEB es el total de ageb s de la localdad r, Donde 18( k, ) r, ( k, ) r, 18( k) PT18 r, PT, k, 6 P, { } # = III AGEB = 3 P, { } # AGEB = IV P, = { 1 3 }, = { V} { } { }, r = 1 3 = I, II 7 Probabldad de seleccón de la manzana r, Sea X kl la l ésma manzana de la k ésma ageb con índce de margnacón r (de la ageb), de una localdad pertenecente al ésmo estrato, con índce de margnacón Entonces, la probabldad de seleccón de la manzana es:

DISEÑO MUESTRAL 97 PT es la poblacón total de personas de 18 años o más en la l ésma manzana de la k ésma ageb (con nvel de margnacón r) r, del ésmo estrato A su vez, # MZ es el total de manzanas de la ageb k, (localdad) con índce de margnacón Ésta es la probabldad de seleccón en una ocasón, sn embargo, en los casos donde se hzo seleccón con reemplazo, se debe consderar que cada localdad pudo salr en más de una ocasón r, Donde 18( kl ) r, ( kl) r, 18( kl) r, ( kl) r, 18( kl) PT18 r, P k,, r = { 1 3 } = { I, II} r, PT kl PT18 r, r, P X kl P = k,, = { III, IV} r, PT kl 6 r, P, { 1 3 }, { } r # MZ k = = V k, 8 Probabldad de seleccón de la vvenda r, Sea X klm, la m ésma vvenda de la l ésma manzana de la k ésma ageb (con índce de margnacón r), de una localdad pertenecente al ésmo estrato, (con índce de margnacón ) Entonces, la probabldad de seleccón de la vvenda es: 4 r, P,, { 1 3 } {, } r # kl r = = I II VIV l k r, 4 r, P X klm, = P,, {, } r # VIV kl = III IV k l r, P,, { 1 3 }, { } r # VIV kl = = V kl r, Donde # VIV k l es el total de vvendas de la manzana l, adentro de la ageb k (con índce de margnacón r) de la localdad (con índce de margnacón )

98 DISEÑO MUESTRAL 9 Probabldad de seleccón del ndvduo r, Sea X klmn el n ésmo ndvduo de 18 años o más de la vvenda m, que pertenece a la l ésma manzana de la k ésma ageb (con índce de margnacón r) del ésmo estrato (con índce de margnacón ) Con esa notacón, la probabldad de seleccón de ese ndvduo es: 1 P X = P X r, r, klmn r, klm, N klm, r, klm, Donde N representa el total de ndvduos de 18 años o más en la vvenda m de la manzana l que se encuentra en la ageb k (con índce de margnacón r), de la localdad (con índce de margnacón ) 10 Probabldad estmada de seleccón de la vvenda Dervado del uso de un marco de muestreo de nformacón ncompleta, no se obtuvo nformacón fdedgna del número de vvendas en cada manzana selecconada Por lo anteror, se tuvo que recurrr al sguente estmador: P X v, r, k, l, m, r # VIV, k # MZ, r, k Donde v es el número de vvendas que se selecconan por manzana (que depende del estrato ), y r, # VIV es el número de vvendas en la k, ageb k, nformacón dsponble en el marco de muestreo Dcho valor fue susttudo en lugar del real para el cálculo de la probabldad de seleccón del ndvduo 11 Probabldad de seleccón en Chapas Sea X klmn la persona n ésma de la vvenda m que pertenece a la manzana l de la ageb k de la localdad del estrato Entonces, su probabldad de seleccón es:

DISEÑO MUESTRAL 99 PT ( ) 18 ( ) P X = PT18( ) PT18, 18 PT, n, k, n, kl 1, klmn # MZ # VIV N ( ) ( )( )( ), k kl, klm, Donde n, k, es el número de manzanas a selecconar de la ageb k que se encuentra en la ésma localdad y que depende del estrato Y n, kl es el número de vvendas a selecconar de esa manzana Cabe señalar que para el cálculo de la probabldad de la vvenda se recurró al estmador presentado en el punto anteror, por las msmas razones Una vez que se tene la probabldad de seleccón, consderando la probabldad de seleccón del levantamento naconal, para cada ndvduo de Chapas se tenen dos probabldades Por lo anteror, se recurró al sguente auste: [ ] = r, + r, ( 1 ) + ( 1 r, ) P P1 klmn P, klmn P1 klmn P, klmn P1 klmn P, klmn r, P es la probabldad de selecconar al ndvduo, P 1 klmn es la probabldad de seleccón conforme al dseño muestral naconal y P, klmn representa la probabldad conforme al dseño muestral de Chapas Donde [ ] 1 Probabldad de seleccón con reemplazo Cuando el dseño muestral contempla la seleccón con reemplazo para certa etapa, cada una de las undades selecconadas pudo haber saldo en más de una ocasón (por eemplo, s se selecconan tres ageb s con reemplazo, una ageb puede ser selecconada cero, una, dos o tres veces) Así, la probabldad de seleccón debe consderar esta stuacón, y no basarse en la probabldad de seleccón de una ocasón Sea una undad de muestreo que pertenece a un subconunto, del cual se harán m etraccones ndependentes, con reemplazo, y sea 0< p < 1 la probabldad de selecconar a la undad Sn pérdda de generaldad, supongamos que cada etraccón se realza en un nstante de tempo dstnto Así, la probabldad de que haya saldo en una ocasón, es la probabldad de que hubera saldo en la prmera etraccón, pero no en el resto; más,

100 DISEÑO MUESTRAL la probabldad de que no hubera saldo en la prmera etraccón, hubera saldo en la segunda, y no volvera a salr; y así, sucesvamente En fórmula, se tene: P 1 p 1 p 1 p 1 p p 1 p 1 p 1 p 1 p p m 1 veces m veces m 1 veces m veces m 1 m 1 m 1 p 1 p m p 1 p Sguendo este caso, la probabldad de que hubera saldo en dos ocasones tene que consderar la probabldad de que sea etraído en la prmera ocasón, luego sea etraído en la segunda, pero no en el resto; o ben, que sea etraído en la prmera ocasón, no en la segunda, sí en la tercera, y no en el resto Después, habrá que consderar los casos en los que no fue selecconada en la prmera ocasón, sí en la segunda, sí en la tercera, pero no en el resto; o ben, no en la prmera, sí en la segunda, no en la tercera, pero sí en el resto Sguendo ese proceso en etapas sucesvas, se llega a la sguente fórmula: P p p 1 p 1 p p 1 p p 1 p 1 p p 1 p 1 p p m veces m 3 veces m veces m sumandos 1 1 1 1 p p p p p p p 1 p p 1 p 1 p 1 p p 1 p 1 p p m 3 veces m 4 veces m 3 veces 1 1 p p p p m veces m m 1 m m 3 p 1 p 1 p p 1 p 1 1 m p 1 p m m 1 1 mm1 m p 1 p m 1 sumandos 1 p m! p 1 p! m! m m p 1 p m m p Generalzando la fórmula, se puede demostrar que sgue una dstrbucón bnomal con parámetros m (el número de repetcones) y p la probabldad de seleccón Así, la probabldad de que sea selecconada es:

DISEÑO MUESTRAL 101 m P p p m m 1 = ( 1 ) = 1 ( p ) m = 1 1 = 1 P = 0 13 Post estratfcacón Para que los datos puedan epandr a la poblacón en las proporcones que se presentan en el país, es necesaro segur un proceso de calbracón, consstente en multplcar el factor de epansón orgnal por una constante que permta alcanzar ese obetvo 1 f1 ( Xrst ) = Sea P rst el factor de epansón obtendo como el nverso multplcatvo de la probabldad de seleccón del ndvduo, que pertenece al estrato r, al seo s y al grupo qunquenal de edad t, sumado para cada ndvduo pertenecente a ese conunto (es decr, la epansón total de ese conunto) Los 19 estratos consderados en esta parte fueron los tres nveles de margnacón de las ageb s del Dstrto Federal, las cudades de Guadalaara y Monterrey; las localdades de más de 400,000 habtantes (sn consderar las tres zonas metropoltanas); las localdades de 10,000 a 399,999 habtantes (sn consderar Chapas); los tres nveles de margnacón de las localdades de menos de 10,000 habtantes (sn consderar Chapas); las localdades de Chapas de menos de 10,000 habtantes; las localdades de Chapas de 10,000 a 99,999 habtantes; cada una de las tres localdades de Chapas de 100,000 habtantes o más A su vez, los grupos qunquenales fueron: 18 a 19 años de edad; 0 a 4 años de edad, en qunquenos hasta el grupo de 60 a 64 años de edad; y, 65 años o más Sea g1 ( X rst ) = PTrst la poblacón total pertenecente al estrato r, seo s y grupo de edad t Entonces, el factor de epansón ya corregdo por las varables poblaconales es: f ( rst) ( rst ) ( rst) g X 1 = f X P 1 rst

10 DISEÑO MUESTRAL Pues, como se demuestra a contnuacón, logra la epansón deseada P r s t g X 1 g X 1 g X f f X g X r, s, t r, s, t r, s, t r, s, t 1 r, s, t r, s, t f1 X r, s, t f1 X r, s, t P r, s, t f1 X r, s, t III Referencas Almond, Gabrel y Verba, Sdney, The Cvc Culture, Poltcal Atttudes and Democracy n Fve Natons, USA, Sage Publcatons, 1989 VII Censo General de Poblacón, Méco, Dreccón General de Estadístca (ahora INEGI), 1953 Henry, Gary T, Practcal Samplng, USA, Sage Publcatons (Appled Socal Research Methods Seres Vol 1), 1990 Kalton, Graham, Introducton to Survey Samplng, USA, Sage Publcatons (Quanttatve Applcatons n the Socal Scences Vol 35), 1983 Lévy Mangn, Jean-Perre, Análss multvarable para las cencas socales, Madrd, Pearson Educacón, 003