Observatorio Social Universidad Alberto Hurtado



Documentos relacionados
análisis evolutivo de la dinámica de la pobreza podría eventualmente, ver alterada su magnitud e incidencia, frente a una actualización de la línea

Metodología Gran Encuesta Integrada de Hogares (GEIH)

Metodología básica de gestión de proyectos. Octubre de 2003

Taller Regional Las Encuestas en Hogares en América Latina: Estado de situación y prospectiva. EL Salvador SANTIAGO, DE OCTUBRE DE 2015

Encuestas Longitudinales en Chile. David Bravo Mayo 2010

BUENAS PRÁCTICAS DE UNA ENCUESTA POR MUESTREO

INFORME METODOLÓGICO ENCUESTA NACIONAL DE CAMPAMENTOS Centro de Investigación Social TECHO-Chile

Elementos requeridos para crearlos (ejemplo: el compilador)

INFORME DE RESULTADOS ENCUESTA DE PERCEPCIÓN CIUDADANA MANIZALES CÓMO VAMOS

CAPITULO III MARCO METODOLÓGICO. Desde la perspectiva de Hurtado de Barrera (2008), el tipo de

Introducción. Se debe reiterar que la relación entre la seguridad social y las pensiones es inherente a la trayectoria laboral de los individuos.

Acceso a financiamiento de los emprendedores en Chile

Anexo 1. Diseño del cuestionario

Manual del Usuario. Encuesta Nacional de Opinión Pública Universidad Diego Portales Septiembre 2013

El Mapa del Emprendimiento en Chile.

Sistemas de Gestión de Calidad. Control documental

PERFIL DEL PUESTO POR COMPETENCIAS Sepa cómo construirlo y evitar bajos desempeños posteriores

CAPITULO III A. GENERALIDADES

3. Procedimiento administrativo para la realización de auditorías a sistemas de medición de la calidad del aire.

LA FORMACIÓN EN LA EMPRESA: CÓMO SE MIDE?(*)

Informe Metodológico. Tercera Encuesta Longitudinal de Empresas INSTITUTO NACIONAL DE ESTADÍSTICAS

OncoBarómetro, Imagen social de las personas con cáncer. Resumen ejecutivo

Mediante la aplicación de la metodología a los datos disponibles para este estudio, esta

Estas visiones de la información, denominadas vistas, se pueden identificar de varias formas.

RESULTADOS CONSULTA CIUDADANA VIRTUAL. Consulta Laboral en Línea

Introducción. Ciclo de vida de los Sistemas de Información. Diseño Conceptual

Modificación y parametrización del modulo de Solicitudes (Request) en el ERP/CRM Compiere.

1. Construcción de Planes de Acción Sectoriales (PAS)

K2BIM Plan de Investigación - Comparación de herramientas para la parametrización asistida de ERP Versión 1.2

Evolución de la confianza del consumidor en la República Dominicana,

Municipio capital de provincia. Municipios con menos de habitantes. Municipios de a habitantes

DE VIDA PARA EL DESARROLLO DE SISTEMAS

Pueden participar siempre y cuando en el equipo investigador no haya académicos o expertos provenientes de estas universidades

REPORTE. Informe de encuesta sobre tabaco mentolado

PRINCIPALES RESULTADOS CASEN 2003 ACCESO A TECNOLOGÍAS DE INFORMACIÓN Y COMUNICACION

La metodologia Cuantitativa. Encuestas y muestras

Unidad 4: Ejecución de la investigación de mercado.

Ahorro de los Emprendedores

Tiempo libre y género en cifras

ENTREVISTA PARA PADRES DE FAMILIA PRÁCTICAS DE CRIANZA Y CALIDAD DE VIDA

INFORME TRIMESTRAL DE INGRESOS: Marzo 2008

El número medio de hogares en España es de , con un aumento de respecto al año anterior

GUIA SOBRE LOS REQUISITOS DE LA DOCUMENTACION DE ISO 9000:2000

MINISTERIO DEL INTERIOR Y DE JUSTICIA, MINISTERIO DE LA PROTECCIÓN SOCIAL Y DIRECCIÓN NACIONAL DE ESTUPEFACIENTES

Metodología de construcción de Indicadores MODELO 3

Guía de los cursos. Equipo docente:


CURSO COORDINADOR INNOVADOR

Chile más equitativo. Por Claudio Sapelli (*)

Gestión de la Configuración

PROTOCOLO DE EVALUACIÓN PARA LA VERIFICACIÓN DE TÍTULOS OFICIALES (GRADO Y MÁSTER)

C:\CLAUDIA\ANA\DISMUESTRA ENCO.DOC MAQ. 1

INFORME DE ANÁLISIS DE ENCUESTAS DE SATISFACCIÓN DE USUARIOS PERÍODO

LA LOGÍSTICA COMO FUENTE DE VENTAJAS COMPETITIVAS

Estadística de Movimientos Turísticos en Fronteras de Canarias (FRONTUR-Canarias).

Cumpliendo con las Necesidades de la Salud Sexual y Reproductiva de Jóvenes Vulnerables: Una Caja de Herramientas para Monitoreo y Evaluación

Pregunta: Si entre las expectativas está la construcción de un software interno de Calidad de Vida Laboral para la empresa.

EN CUATRO AÑOS NUMERO DE POBRES AUMENTO EN MÁS DE DOS MILLONES

Un Modelo de Diseño Instruccional para la Elaboración de Cursos en Línea José E. Díaz Camacho y Thalía Ramírez Velázquez Universidad Veracruzana

Planeación del Proyecto de Software:

Ciclo de vida y Metodologías para el desarrollo de SW Definición de la metodología

ESTUDIO EXPLORATORIO CON PERSPECTIVA DE GÉNERO EN RELACIÓN A LOS DERECHOS DE AUTOR DE LOS CREADORES Y CREADORAS EN CHILE


Estándares para planes de calidad de software. Escuela de Ingeniería de Sistemas y Computación Desarrollo de Software II Agosto Diciembre 2008

Como se mencionó en la parte de la teoría, no existe consenso en cuanto a la

La relación de los chilenos con la televisión e internet

Consultoría para Especialista en Información Sanitaria


ESTUDIO PRELIMINAR DE ALGUNOS FACTORES INFLUYENTES EN EL RENDIMIENTO ACADÉMICO DE ALUMNOS DEL GRUPO EXECUTIVE FISIOTERAPIA

Informe: La Pobreza a partir de la E. P. H.

Portal de Compras del Gobierno del Estado de Baja California ( A. Antecedentes

MUESTREO TIPOS DE MUESTREO

BUENAS PRÁCTICAS MODELOYAMBIENTE

1.1 Por qué utilizar esta herramienta en evaluación?

-OPS/CEPIS/01.61(AIRE) Original: español Página Estructura del programa de evaluación con personal externo

I. ESTRUCTURA DEL DEPARTAMENTO DE INDUSTRIA... 2

Seguimiento y evaluación

República de Panamá CONTRALORÍA GENERAL DE LA REPÚBLICA Dirección de Estadística y Censo DISEÑO MUESTRAL DE LA ENCUESTA DE NIVELES DE VIDA JULIO 2008

ANILLO CONICYT ANÁLISIS CONSUMO DE DROGAS

ENCUESTA DE OCUPACIÓN Y DESOCUPACIÓN EN EL GRAN SANTIAGO: REPORTE RESULTADOS TRABAJO DE CAMPO DICIEMBRE 2014

II. Estudio de satisfacción de los titulados y empleadores respecto al desempeño laboral de los profesionales de la UBB Introducción

Resumen de la Evaluación: Línea de Base para la evaluación del Programa Conectar Igualdad en la formación docente.

31 03/ 30 --~

Indicadores del Sector Público. marzo de 2011

Capítulo 2. Metodologías de selección de personal

1

Diagnóstico al Sistema Licitado de Mediación Familiar. Documento Resumen Auditoría Ernst &Young

CAPÍTULO 4 RESULTADOS DE LA INVESTIGACIÓN

CAPíTULO 11 GASTOS EN SALUD

Es de aplicación a todas aquellas situaciones en las que se necesita desplegar un objetivo para obtener una visión clara de cómo debe ser alcanzado.

INTRODUCCIÓN: Una Visión Global del Proceso de Creación de Empresas

Parte I: Introducción

Cambios en la estructura de la fuerza de trabajo (oferta)

REPUTACIÓN LO QUE TOMA AÑOS CONSTRUIR PUEDE VERSE AFECTADO CRITICAMENTE POR UN SOLO EVENTO

SOLICITUD DE DESARROLLO Y ACTUALIZACIÓN DE APLICACIONES G OBIERNO D E L A CIUDAD DE BUENOS AIRES

Empresa de telefonía celular: Transintelcel

PISA Programa Internacional de Evaluación de Estudiantes. Gobierno de Chile Agencia de Calidad de la Educación

ALGUNOS ASPECTOS DE LA ENCUESTA DE OPINIÓN QUE REALIZA FEDESARROLLO EN COLOMBIA. Jesús Alberto Cantillo V.

determinar la competencia necesaria de las personas que realizan, bajo su control, un trabajo que afecta a su desempeño ambiental;

GUIA GENERAL PARA LA EVALUACION DE PROGRAMAS

Transcripción:

Observatorio Social Universidad Alberto Hurtado La Encuesta Panel CASEN: Metodología y Calidad de los Datos Versión 1.0 Editor: José Ramón Zubizarreta Autores: Luis Bendezú, Angela Denis, Carmen Luz Sánchez, Pamela Ugalde y José Ramón Zubizarreta Director de Proyecto: José Joaquín Prieto Santiago de Chile, Noviembre de 2007 1

Observatorio Social Universidad Alberto Hurtado El Observatorio Social de la Universidad Alberto Hurtado (OSUAH) busca crear un espacio interdisciplinario de observación, reflexión e intervención social que aporten al desarrollo del país. En particular, busca contribuir de manera concreta al diseño de políticas sociales que ayuden a superar la pobreza y a avanzar hacia una sociedad más justa en todos los ámbitos. El OSUAH a través de sus cuatro unidades Unidad de Encuestas, Unidad de Investigación Social Aplicada, Unidad de Desarrollo Social, y Unidad de Comunicación y Extensión ha levantado información cuantitativa y cualitativa de calidad, y ha desarrollado estudios relevantes. En este quehacer el OSUAH se ha especializado en la producción y análisis de encuestas longitudinales, las cuáles nos permiten medir cambio de manera más rigurosa y así comprender mejor los fenómenos sociales. Entre otras, el OSUAH ha realizado la ola 2006 de la encuesta Panel CASEN y la ola 2007 de la encuesta Panel Sistema de Protección Chile Solidario. Recientemente le ha sido adjudicada la realización de la nueva encuesta Panel CASEN, que se realizará año a año con una muestra nacional de más de 7.500 hogares. En la metodología de encuestas longitudinales el OSUAH cuenta con la asesoría de investigadores y profesores del Institute of Social and Economic Research (ISER) de la Universidad de Essex, Inglaterra. En el ISER está radicado el British Household Panel Survey y, a partir de poco tiempo más, el United Kingdom Longitudinal Household Survey, que pasará a ser la encuesta de hogares tipo panel más grande del mundo. El desarrollo de la metodología de encuestas longitudinales en el OSUAH se enmarca en la Unidad de Investigación Social Aplicada (UISA), cuyo Coordinador es Juan Cristóbal Prieto (jcprieto@osuah.cl). Las bases de datos de la Panel CASEN 1996, 2001, 2006 y su documentación se encuentran disponibles en http://www.osuah.cl/encuestapanelcasen/ 2

Tabla de Contenidos 1 Introducción... 5 2 Resumen del diseño de la encuesta... 7 3 Diseño muestral... 11 3.1 Población objetivo... 11 3.2 Marco de la muestra... 11 3.3 Tipo de muestreo... 12 3.3.1 Comunas auto-representadas... 12 3.3.2 Comunas co-representadas... 13 3.3.3 Selección de hogares y personas... 13 3.4 Tamaño muestral... 13 3.5 Variables del diseño muestral en la base de datos... 14 4 La unidad de análisis de la encuesta... 15 5 Cuestionario... 17 5.1 Hoja de Ruta... 17 5.2 Módulos Temáticos... 18 5.2.1 Módulo de Residentes... 18 5.2.2 Módulo de Educación... 19 5.2.3 Módulo de Empleo... 20 5.2.4 Módulo de Ingresos y Activos financieros... 21 5.2.5 Módulo de Salud... 21 5.2.6 Módulo de Historia Laboral... 22 5.2.7 Módulo Participación... 23 5.2.8 Módulo Vivienda... 23 6 Recolección de los datos... 24 6.1 Trabajo en Terreno... 24 6.1.1 Equipo de Terreno... 24 6.1.2 Capacitación del Equipo de Terreno... 25 6.1.3 Pretest... 26 6.1.4 Fechas del Trabajo en Terreno... 27 6.1.5 Procedimientos de terreno... 27 6.1.6 Supervisión y control de calidad... 28 6.2 Resultados de la etapa de terreno... 28 7 Preparación de los datos... 29 7.1 Digitación... 30 7.2 Controles de Calidad... 30 7.2.1 Verificación de la información de cada ola... 30 7.2.2 Consolidación Información cada ola.... 31 7.2.3 Verificación de la información longitudinal... 32 8 Magnitud y naturaleza de la atrición... 34 8.1 La atrición en la muestra: análisis descriptivo... 34 8.1.1 Algunas definiciones... 34 8.1.2 Magnitud de la atrición... 35 8.2 Análisis multivariado... 37 9 Procedimientos de ajuste estadístico... 39 9.1 Construcción de los pesos... 39 3

9.1.1 Pesos para ola 1... 40 9.1.2 Pesos longitudinales... 40 9.1.3 Pesos de corte transversal... 43 9.2 Imputación... 44 9.2.1 Imputación de ingresos por Ocupación Principal... 45 9.2.2 Imputación de ingresos por Jubilación y Rentas Vitalicias... 46 9.2.3 Imputación de ingresos por Alquiler... 47 9.2.4 Imputación de las variables Sexo, Edad y Nivel Educativo... 47 9.3 Errores de medición... 47 9.4 Construcción de ingresos y Ajuste por Cuentas Nacionales... 48 10 Errores muestrales... 50 11 Acceso a los datos y a su documentación... 53 11.1 Organización de la bases de datos... 53 11.2 Documentación... 54 12 Confidencialidad de los datos... 55 13 Seguridad de los datos... 55 Bibliografía... 57 Apéndices... 58 Tabla 1: Total de Personas Encuestadas en las Tres Olas de la Encuesta... 9 Tabla 2: Distribución de la Muestra Inicial (1996) por Regiones... 14 Tabla 3: Distribución del Equipo de Terreno... 24 Tabla 4: Total de Personas en Cada Ola de la Encuesta... 36 Tabla 5: Atrición de la Muestra por Regiones... 36 Tabla 2: Distribución de la Muestra Inicial (1996) a Nivel Comunal, VIIª Región... 58 Tabla 3: Distribución de la Muestra Inicial (1996) a Nivel Comunal, VIIIª Región... 59 Tabla 4: Distribución de la Muestra Inicial (1996) a Nivel Comunal, XIIIª Región... 60 Tabla 5: Cuestionario de la encuesta Panel CASEN: Extracto de la Hoja de Ruta... 61 Tabla 6: Cuestionario de la encuesta Panel CASEN: Extracto de la Hoja de Ruta... 62 Tabla 7: Total de Hogares en Cada Ola de la Encuesta... 64 Tabla 8: Atrición de la Muestra por Región por Zona... 64 Tabla 9: Muestra Inicial versus Estructura de la Muestra de Casos de Atrición... 65 Tabla 10: Distribución de la Muestra Inicial (1996) a Nivel Comunal, XIIIª Región... 67 Tabla 11: Distribución de los Pesos de la encuesta CASEN 1996... 69 Tabla 12: Distribución de los Pesos de la encuesta Panel CASEN, 1996... 69 Tabla 13: Distribución de los Pesos de la encuesta Panel CASEN, 2001... 69 Tabla 14: Distribución de los Pesos de la encuesta Panel CASEN, 2006... 70 4

1 Introducción La ola 2006 de la encuesta Panel CASEN es un proyecto conjunto de la Fundación para la Superación de la Pobreza (FSP), el Ministerio de Planificación (Mideplan) y el Observatorio Social de la Universidad Alberto Hurtado (OSUAH). Con esta nueva medición, el objetivo principal que persiguen las tres instituciones es llevar más allá el entendimiento de las condiciones de vida de los hogares chilenos y, en particular, de los problemas de la pobreza y vulnerabilidad para diseñar mejores políticas sociales. La encuesta Panel CASEN nació en 2001 en Mideplan con el seguimiento a una muestra representativa de los hogares de las regiones III, VII, VIII y Metropolitana, a partir de la encuesta CASEN 1996. El aporte que supone la ola 2006 de la encuesta es grande en el contexto de Chile y de los países menos desarrollados, por el tamaño de su muestra y por el período de tiempo que abarca: diez años. En efecto, según Yaqub (2000) sólo 5 de 44 países de bajo desarrollo humano y 7 de los 66 países de desarrollo humano intermedio cuentan con datos de este tipo de encuestas, y ninguna de éstas cubre un período de este largo. Recuentos similares y más recientes como el de Lawson et al. (2003), del Institute of Social and Economic Research en la Universidad de Essex, 1 en Inglaterra, y del Institute of Social Research en la Universidad de Michigan, 2 en Estados Unidos, no reflejan un adelanto en estas cifras. Pero cuáles son las ventajas de los datos de las encuestas de hogares tipo panel por sobre los datos de las de corte transversal? Mediante las encuestas de hogares de corte transversal es posible obtener una "fotografía" de la población y caracterizar a los hogares en un determinado momento del tiempo. Al repetir esta fotografía una y otra vez, podemos determinar cambios brutos en el período y examinar las transformaciones en las características de los hogares en el estado de interés de estudio. No obstante, esta información no es suficiente para conocer el cambio neto ni para indagar en las causas que llevaron a los hogares a salir de ese estado o caer en él. Las encuestas de hogares tipo panel, en cambio, al tomar una "película" al nivel de la unidad de observación hacen posible que abordemos estas cuestiones. Con esta información podemos analizar los 1 Keeping Track: A guide to longitudinal resources. 2 Panel Studies Around the World. 5

factores que provocaron el cambio y obtener un enfoque dinámico de constitución de procesos más que de caracterización de determinados grupos en un punto del tiempo. En términos de Jenkins (2003) una encuesta de hogares tipo panel "permite describir fenómenos que son intrínsecamente longitudinales, entender mejor procesos socioeconómicos y comportamientos y, como resultado de esto, diseñar mejores instrumentos de política." Las ventajas de los datos de este tipo de encuestas por sobre las de corte transversal son varias: Estudiar transiciones entre estados; Analizar el efecto de determinadas intervenciones; Implementar modelos de comportamiento; Controlar por variables no observables; Controlar por efectos específicos. No obstante, las encuestas de hogares tipo panel presentan complicaciones adicionales a las de corte transversal. Entre ellas figura la no respuesta entre ola y ola, que puede afectar la representatividad de la muestra. Por otra parte, procedimientos de ajustes estadísticos como la construcción de los pesos e imputación también presentan características especiales en las encuestas de hogares tipo panel. Dada su relevancia, estos temas han de ser explicitados en documentos que hagan interlocutor entre las bases de datos y el investigador. De lo contrario los datos pueden perder sentido y resultar en una pérdida de tiempo y esfuerzo por parte del investigador, e incluso conducir a error en el análisis. El presente documento, La Encuesta Panel CASEN: Metodología y Calidad de los Datos, forma parte de un conjunto más amplio de cinco documentos que intentan responder a esta problemática. Aparte de éste, los otros documentos son: La encuesta Panel CASEN: Cuestionarios ; 6

La encuesta Panel CASEN: Libro de Códigos ; La encuesta Panel CASEN: Manual del Usuario ; Análisis de la Atrición en la Muestra de la Encuesta Panel CASEN. Este trabajo de documentación es de vital importancia para el logro de los objetivos planteados entre las instituciones a cargo de este estudio: proveer un mayor acceso a la información socioeconómica en Chile y a su documentación. Queremos destacar que este trabajo se ha visto enriquecido por los excelentes comentarios de los profesores Stephen Jenkins y Peter Lynn del ISER de la Universidad de Essex, y Steve Heeringa del ISR de la Universidad de Michigan. Por esto les estamos muy agradecidos. En el OSUAH, en particular queremos agradecer a Alina Oyarzún y Berta Teitelboim de Mideplan, y a Leonardo Moreno y Mauricio Rosenbluth de la FSP, sin los cuales este panel de hogares no se hubiera comenzado en 2001, y no se hubiera continuado en 2006. Esperamos que las ventajas de las encuestas de hogares tipo panel se maximicen en el caso de la encuesta Panel CASEN, y que su análisis contribuya al diseño de las políticas sociales y al debate público en el país. 2 Resumen del diseño de la encuesta Como se mencionó anteriormente, el principal objetivo de la encuesta Panel CASEN es entender mejor las dinámicas de cambio de las condiciones de vida de los hogares chilenos de las regiones III, VII, VIII y Metropolitana y, en particular, los problemas de pobreza y vulnerabilidad que los aquejan. La encuesta Panel CASEN se plantea como un instrumento multidisciplinario en el marco de las ciencias sociales, de manera que sirva al diseño de mejores políticas sociales. La encuesta Panel CASEN no fue concebida como tal sino hasta su segunda ola en 2001, cuando se realizó un seguimiento a una muestra de 5.209 hogares de la encuesta CASEN 7

1996, de las cuatro regiones en cuestión. Para ahondar en los factores que inciden en la reproducción y superación de la pobreza, en dicha muestra se sobre-representó a los hogares de las comunas pobres de 1996. Esto último no implica que la muestra no sea representativa de la población total de hogares de las cuatro regiones, sino simplemente que es posible obtener estimaciones más precisas para las personas en hogares con estas características en 1996. A través de las reglas de seguimiento, niveles adecuados de respuesta entre ola y ola y la construcción de pesos, la encuesta se ha mantenido representativa de la población de residentes en hogares en 1996 al cabo de diez años. Las reglas de seguimiento proveen un mecanismo para medir el cambio en la muestra y asegurar que ésta se mantenga representativa, tanto en un sentido longitudinal como de corte transversal, de la población objetivo en el tiempo. De esta manera, en una encuesta de hogares tipo panel se puede proveer representación continua de la población, al capturar cambios como los de los nacimientos, de los jóvenes que dejan el hogar de sus padres, y divorcios. 3 Para explicar en qué consisten las reglas seguimiento, es útil definir antes a los Miembros Originales de la Muestra (MOM) como a todas las personas en los hogares de la muestra inicial en 1996, y a los Miembros Temporales de la Muestra (MTM) como a las personas que en las olas posteriores a las primera pasaron a residir con un MOM en 2001 y/ó 2006. En la encuesta Panel CASEN las reglas de seguimiento consisten básicamente en encuestar en las olas posteriores a la primera a todos los MOM siempre y cuando fuera dentro de las cuatro regiones de estudio sin importar si pasaron a residir en un hogar distinto. Por otro lado, los MTM forman parte del estudio mientras residan con un MOM, sin seguirlos en caso de que pasen a formar un hogar distinto que no cuente con un MOM. Esto implica que: Si un MOM se traslada a otro hogar con una o más personas nuevas, éstas son tratadas como MTM y se recoge información de ellas mientras vivan con el MOM. 3 Fenómenos como la inmigración sólo no serían capturados por estas reglas de seguimiento. 8

Si una o más personas nuevas se trasladan a vivir con un MOM, éstas se transforman en MTM, y se recoge información de ellas mientras vivan con el MOM. Conforme a estas reglas, los totales de personas MOM y MTM que se encuestaron en cada ola de la encuesta son los siguientes: Tabla 1: Total de Personas Encuestadas en las Tres Olas de la Encuesta 25.000 Total 20.000 15.000 10.000 5.000 20.942 3.819 15.038 4.281 10.287 0 1996 2001 2006 Año MOM MTM Un total de 20.942, 18.857 y 14.568 personas fueron encuestadas en 1996, 2001 y 2006 respectivamente. Éstas corresponden a las muestras relevantes para realizar un análisis de corte transversal de la encuesta. Ahora bien, para conducir un análisis longitudinal las muestras a considerar son los MOM encuestados en 1996 y 2001, y 1996, 2001 y 2006. El tamaño total de estas muestras es de 15.038 y 10.287 personas, respectivamente. Esta disminución en el tamaño de la muestra inicial, se traduce en una atrición de un 28,2% entre 1996 y 2001, y de un 50,9% entre 1996 y 2006. Un análisis preliminar de la atrición en la muestra de la encuesta se presenta en la Sección 8. Con respecto a los cuestionarios, la estructura de éstos es esencialmente la misma a lo largo de las tres olas de la encuesta. El principal cambio que se introdujo fue en la ola 2006, con la incorporación del Módulo de Historia Laboral con preguntas retrospectivas de los años 2001 a 2006 inclusive. Los módulos que constituyen el cuestionario son los 9

siguientes: Residentes; Educación; Empleo; Ingresos; Salud; Historia Laboral; Participación; Vivienda. La recolección de los datos se realizó mediante encuestas proxy a un miembro del hogar. Preferentemente, este informante fue el jefe de hogar o su cónyuge y, en su defecto, un miembro del hogar mayor de 18 años. Como se señaló anteriormente, el trabajo en terreno de la primera ola de la encuesta, correspondió al de la encuesta CASEN 1996. Tanto este trabajo como la segunda ola fueron realizados por la Unidad de Encuestas del Departamento de Economía de la Universidad de Chile. El trabajo en terreno de la tercera ola fue realizado por el Observatorio Social de la Universidad Alberto Hurtado. 10

3 Diseño muestral La muestra inicial de la encuesta Panel CASEN fue seleccionada de la encuesta CASEN 1996 y por lo tanto comparte diversos aspectos de su diseño muestral. Las diferencias entre ambos diseños son esencialmente el tamaño de sus muestras y la sobre representación de hogares pobres en la encuesta Panel CASEN. En efecto, por una parte en la encuesta Panel CASEN no hay comunas auto-representadas, y por otra en esta encuesta se sobre representó a los hogares pobres seleccionando una mayor cantidad de hogares de las comunas pobres. Como se explica más adelante en la sección 9.1, esto se corrige mediante la construcción de pesos. Ahora pasaremos revista de los aspectos fundamentales del diseño muestral. 3.1 Población objetivo La población objetivo de la encuesta Panel CASEN son todas las personas residentes en hogares privados de las de las regiones III, VII, VIII y Metropolitana, en múltiples momentos del tiempo, correspondiendo éstos a las olas de recolección de los datos: 1996, 2001 y 2006. 3.2 Marco de la muestra Al ser la muestra de la encuesta Panel CASEN una muestra aleatoria de la encuesta CASEN 1996, se puede decir que su marco es el mismo y que corresponde a los antecedentes del Censo de Población y Vivienda del año 1992. Este marco contempla la división político-administrativa del país de regiones, provincias y comunas. Adicionalmente, establece las siguientes subdivisiones al interior de las comunas: En las zonas urbanas se distinguen los distritos censales, que se dividen en zonas censales, que se dividen en manzanas, que se dividen, por último, en sectores de 11

empadronamiento (es decir, zonas urbanas: distritos censales > zonas censales > manzanas > sectores de empadronamiento); En las zonas rurales se distinguen los distritos censales, que se dividen en localidades, que se dividen en entidades y éstas en sectores de empadronamiento (es decir, zonas rurales: distritos censales > localidades > entidades > sectores de empadronamiento). El tipo de muestreo sigue esta estratificación. 3.3 Tipo de muestreo El tipo de muestreo de la encuesta CASEN 1996 y el de la Panel CASEN es estratificado, por conglomerados, polietápico. La selección de las unidades muestrales en la encuesta CASEN 1996 se realizó de las siguientes maneras: 3.3.1 Comunas auto-representadas Para auto-representar las comunas de interés, se procedió a seleccionar dentro de cada comuna un sector de empadronamiento censal (conglomerados de viviendas) como Unidad Primaria de Muestreo (UPM). En las zonas urbanas éstos corresponden a una manzana o parte de ella. En las zonas rurales éstos corresponden como un conjunto de viviendas próximas que el encuestador pueda encuestar en un día. A continuación, dentro de la UPM seleccionada, se procedió a seleccionar como Unidad Secundaria de Muestreo (USM) una vivienda particular ocupada en forma permanente. Conforme a la estratificación geográfica descrita anteriormente, se trata de una selección bietápica en que los conglomerados son, en una primera etapa, una manzana o parte de ella, y luego una vivienda. 12

3.3.2 Comunas co-representadas En las comunas co-representadas, la selección se realizó en tres etapas. Primeramente, se seleccionó como UPM la zona urbana o rural de las comunas co-representadas. Posteriormente, dentro de cada una de las UPM seleccionadas, se seleccionó como USM un sector de empadronamiento censal (conglomerados de viviendas), que al igual que en las comunas auto-representadas, está definido en las zonas urbanas como una manzana o parte de ella y en las zonas urbanas como un conjunto de viviendas próximas tal que el encuestador pueda encuestar en un solo día. A su vez dentro de cada USM, se seleccionó como UTM una vivienda particular ocupada en forma permanente. 3.3.3 Selección de hogares y personas Tanto en el caso de las comunas auto-representadas como co-representadas, se seleccionó a todos los hogares y personas residentes en la dirección. Por consiguiente, los pesos del hogar y los de las personas son los mismos. 3.4 Tamaño muestral Para la ola 1 se seleccionaron 5.209 hogares de la encuesta CASEN 1996. Esto se traduce en una muestra de 20.942 personas. Recordemos que estos son Miembros Originales de la Muestra (MOM). Según se detalla en Teitelboim (2002) este tamaño de muestra fue determinado pensando en obtener una muestra de no menos de 4.500 hogares en la ola 2. Dado que no se contaba experiencias previas de encuestas de hogares tipo panel, se realizó una encuesta piloto para determinar este tamaño inicial. En las olas posteriores de la encuesta re-encuestaron a todos los MOM independientemente del hogar en que residieran mientras lo fuera dentro de las cuatro regiones de estudio. La distribución regional de muestra inicial a nivel de hogares y de personas se detalla en la Tabla 2 a continuación. 13

Tabla 2: Distribución de la Muestra Inicial (1996) por Regiones Región Hogares Personas III 307 1.254 VII 880 3.524 VIII 1.826 7.325 Metropolitana 2.196 8.839 Total 5.209 20.942 La distribución de la muestra inicial a nivel comunal por región se detalla en las Tabla 1 a 4 del Apéndice. 3.5 Variables del diseño muestral en la base de datos Dado este carácter complejo del diseño muestral se hacen relevantes las variables que reflejan este diseño: pesos, estratos y conglomerados. Los estratos y conglomerados del diseño corresponden a los heredados de la encuesta CASEN 1996, es decir, los estratos corresponden a las zonas urbanas y rurales de las comunas autorrepresentadas y correpresentadas según corresponda, y los conglomerados corresponden a los segmentos de dicho diseño muestral. Un análisis correcto de los datos utiliza estas variables en las estimaciones. Si bien el uso de los pesos basta para obtener los estimadores, el cálculo correcto de las desviaciones estándar necesita las variables estrato y conglomerado. Los softwares estadísticos son capaces de manejar estas variables al hacer los cálculos correspondientes. Por ello la base de datos incluye las variables del diseño muestral complejo. Sin embargo, en el análisis de sub-poblaciones es posible que no se cumpla el requisito de tener al menos dos conglomerados por estrato, de modo de poder estimar la varianza de los estimadores. En este caso, una alternativa posible es colapsar y combinar estratos de modo de poder hacer el cálculo correspondiente, aunque a costa de una sobreestimación de la varianza. Si bien las últimas versiones de los softwares permiten manejar estos casos con otros métodos, por simplicidad para el analista se incluye en la base de datos una segunda variable de estratos, que corresponde a los estratos 14

originales colapsados en 8 estratos (cruce de las 4 regiones de estudio por zona urbano rural). La construcción de pesos y su uso en el análisis se comenta más adelante. 4 La unidad de análisis de la encuesta Las ventajas de los datos longitudinales por sobre los de corte transversal son conocidas y se pueden resumir en lo siguiente: medir cambio rigurosamente. No obstante, esta misma rigurosidad exige entender bien el concepto de hogar en el tiempo. A diferencia de los individuos, los hogares pueden cambiar de "forma" y surge la pregunta de hasta que punto un hogar es comparable a otro hogar en dos momentos distintos. Se tiene que la definición de hogar es lo suficientemente precisa para un punto del tiempo, pero no a lo largo de él. En efecto, en el tiempo los hogares pueden cambiar de composición al ganar o perder miembros, al dividirse o, en el sentido contrario, al dos o más hogares pasar formar uno sólo. El definir un hogar longitudinal, por ejemplo, hogar longitudinal = hogar que se mantiene con los mismos miembros que en las olas anteriores, se dejaría fuera un número importante de casos y de información relevante. Para este ejemplo, la encuesta Panel CASEN o cualquier otro panel de hogares, pasaría a ser representativo de "los hogares de 1996 de las regiones III, VI, VII y Metropolitana que en 2001 y 2006 no cambiaron en absoluto de composición". Esto, sin lugar a dudas restringe mucho el análisis. Por otra parte, en el estudio del cambio de variables socioeconómicas de interés, como el ingreso, definir un hogar longitudinal es todavía menos recomendable si consideramos que los cambios en los ingresos de los hogares obedecen en una medida a cambios en los ingresos del trabajo y en otra a cambios demográficos en el hogar. Según Duncan (1984) una comprensión de la dinámica del bienestar de los hogares depende de la comprensión de las dinámicas de las personas que componen el hogar. 15

Al ser los hogares un concepto ambiguo en el tiempo, pero el nivel socioeconómico de ellos no, la persona es recomendable como unidad de análisis pues no cambia y puede ser asociada al bienestar socioeconómico de un hogar en el tiempo. Por estas razones se acostumbra a tomar el individuo como la unidad de análisis y el hogar como una unidad de medición. Con el individuo como unidad de análisis, los cambios en la composición del hogar se convierten en variables explicativas en modelos de cambio en el bienestar socioeconómico de hogares que son observados para esos individuos. Esto es lo que se sugiere para el análisis de la encuesta Panel CASEN. 16

5 Cuestionario Para no perder comparabilidad, el cuestionario de la encuesta Panel CASEN en la ola 2006 fue similar en estructura al cuestionario de las olas 1996 y 2001. El principal cambio que se introdujo fue la incorporación del Módulo de Historia Laboral, con preguntas retrospectivas de los años 2001 a 2006 inclusive. Para su incorporación, se eliminó un número mínimo de preguntas del Módulo de Salud que registraban un bajo rendimiento en las olas anteriores. Por otro lado, siguiendo las modificaciones en la encuesta CASEN, el módulo de ingresos también cambió en la tercera ola. Es importante que el investigador considere que el orden de las preguntas y las alternativas pueden ser distintas al momento de realizar el análisis. El cuestionario de la encuesta Panel CASEN se puede dividir adecuadamente en dos partes: la Hoja de Ruta y los Módulos Temáticos, cuyo contenido describimos a continuación. 5.1 Hoja de Ruta La Hoja de Ruta del cuestionario tiene una extensión de dos páginas, y contiene la información necesaria para ubicar a los MOM e identificarlos correctamente. Para esto, en una primera parte de la Hoja de Ruta, se encuentra el Nombre, Dirección y Teléfono de los MOM, y el protocolo para comenzar la encuesta. En una segunda parte de ésta, se encuentra la información de los MOM y la de las personas con las que vivían en 2001: Nombre, Relación con el Jefe de Hogar en noviembre de 2001, Sexo, Edad, Núcleo Familiar, Relación con el Jefe de Núcleo, Estado Civil. Cualquier persona que se haya incorporado al hogar o el cambio de domicilio de un MOM se registra a continuación, explicitando los detalles de la incorporación o cambio de domicilio. Algunos datos de la Hoja de Ruta se transcriben en la Carátula del cuestionario con los Módulos Temáticos, junto a la Fecha, Hora y Resultado de la entrevista, y el nombre del 17

Encuestador. 4 Dada la importancia crucial de la información de la Hoja de Ruta para consolidar la información de las personas en las tres olas, nuestros encuestadores completaron su información con especial cuidado. 5.2 Módulos Temáticos La parte de los Módulos Temáticos corresponde al grueso del formulario, en que se recoge información de tópicos diversos acerca del hogar. Específicamente, el instrumento de la ola 2006 consta de ocho módulos, según se indica a continuación: i. Residentes; ii. iii. iv. Educación; Empleo; Ingresos; v. Salud; vi. vii. viii. Historia Laboral; Participación; Vivienda. Los objetivos y la duración de cada uno de estos módulos se explicitan a continuación junto a algunas observaciones relevantes. 5.2.1 Módulo de Residentes 4 En las etapas posteriores de Supervisión, Digitación y Validación de la encuesta, la Carátula se completa con los nombres del Supervisor, Digitador y Codificador, además de los requerimientos de Encuesta Completa, Flujo lógico, Letra Legible e Entrevistado Idóneo. 18

Objetivos: Conocer los cambios en la estructura del hogar; Conocer los cambios en la tipología del hogar; Indagar en los motivos por cuales se integran nuevos miembros a un hogar; Conocer los cambios en el ciclo de vida del hogar; Indagar sobre la situación de los hogares en que vivieron los entrevistados durante su niñez, con el fin de medir su influencia sobre la actual situación socioeconómica que enfrentan; Conocer los cambios en el patrimonio del hogar. El tiempo promedio de aplicación de este módulo es de aproximadamente 5 minutos. 5.2.2 Módulo de Educación Objetivos: Conocer los principales cambios en los niveles de escolaridad de cada miembro del hogar; Indagar en las trayectorias educativas de los miembros del hogar, considerando la asistencia a un establecimiento educacional y el nivel educacional alcanzado; Indagar en los motivos de no asistencia y expectativas dada esa situación; Indagar sobre los cambios que se producen en el acceso a educación y el tipo de establecimiento al cual se asiste; Indagar sobre la relación existente entre el nivel de escolaridad de los padres del jefe de núcleo y su cónyuge o pareja y el nivel de escolaridad alcanzado por ellos; 19

Indagar sobre la relación existente entre el nivel de escolaridad del jefe de núcleo y su pareja y sus expectativas acerca del nivel educacional que lograrán sus hijos. El módulo educación tiene una duración promedio de aplicación de 6 minutos aproximadamente. 5.2.3 Módulo de Empleo Objetivos: Tasa de participación; Número de personas en edad activa por hogar; Cantidad de perceptores de ingresos por hogar; Tasa de dependencia; Número de ocupados por hogar; Tasa de desocupación; Número de desocupados por hogar; Proporción de ocupados en categorías ocupacionales; Proporción de los ocupados según grupos ocupacionales; Proporción de los ocupados en cada rama de la actividad económica; Proporción de ocupados cotizando en sistema previsional; Proporción de asalariados con contrato escrito de trabajo; Proporción de ocupados en pequeñas empresas; 20

Estudiar el cambio de la situación laboral de la población en el periodo 1996-2006. Este módulo tiene un tiempo promedio de aplicación de 8 minutos aproximadamente. 5.2.4 Módulo de Ingresos y Activos financieros Objetivos: Conocer la estructura de ingreso de los hogares; Ingresos de los asalariados (trabajadores dependientes en ocupación principal); Ingresos de empleadores y trabajadores por cuenta propia o independientes; Otros ingresos de origen privado; Previsión; Transferencias del estado; Indagar en la percepción de la situación económica de las personas durante el periodo 2001-2006 y para los próximos tres años; Conocer la red social a la que acuden las personas frente a un problema económico. Este módulo se realizó en un tiempo promedio de 12 minutos aproximadamente. 5.2.5 Módulo de Salud Objetivos: Conocer la red social a la que acude y acudiría frente a un problema de salud que demande gran cantidad de recursos; 21

Estimar gasto de las personas ante enfermedades de alto costo (catastróficas); Estimar impacto sobre la capacidad de trabajar; Captar la percepción de los encuestados sobre su estado de salud. Como se señaló anteriormente, el Módulo de Salud fue acortado en 2006. En parte por esto es que su tiempo de aplicación promedio asciende a 3 minutos. 5.2.6 Módulo de Historia Laboral Objetivos: Identificar la trayectoria laboral del Jefe de hogar y del Primer o Segundo Perceptor de ingresos; Estudiar el cambio de la situación laboral y ocupacional del jefe de hogar y primer ó segundo perceptor de ingresos en el periodo 2001 2006, e identificar ciertos determinantes laborales de los cambios en la situación de pobreza; Analizar los cambios de situación laboral y cómo estos se relacionan con otro tipo de crisis (hitos familiares, económicos, de salud); Analizar la cantidad y duración de periodos de cesantía; Analizar cambios de función (movilidad) dentro de una misma ocupación. Este módulo se aplica al jefe de hogar, y al primer o segundo perceptor de ingresos. Esto quiere decir que se recolectó la información, en primer lugar, del jefe de hogar, y luego, si éste era además el primer perceptor de ingresos, se encuestó también al segundo perceptor, y en los casos (menos comunes) en que el jefe de hogar no fuese el primer perceptor de ingresos, se identificó al primer perceptor y se le encuestó. Este módulo tiene una duración promedio de aplicación de 12 minutos aproximadamente. 22

5.2.7 Módulo Participación Objetivos: Indagar en la participación formal (pertenencia) e informal del Jefe de hogar en organizaciones públicas y privadas; Indagar en las motivaciones de la participación. El módulo participación se aplica únicamente al jefe de hogar, y consta de 4 preguntas, por lo que el tiempo promedio de aplicación es de aproximadamente 2 minutos. 5.2.8 Módulo Vivienda Objetivos: Caracterizar el allegamiento funcional; Conocer los cambios en la habitabilidad de las viviendas; Conocer la capacidad de los hogares de los diferentes estratos socioeconómicos para mejorar la habitabilidad de sus viviendas; Indagar sobre la percepción del entorno de su barrio o localidad. En el caso de las preguntas que indagan acerca de los aspectos de la vivienda que ocupa el hogar, el encuestador hace las preguntas al jefe de hogar, y el tiempo de aplicación promedio alcanza los 4 minutos. El tiempo total de aplicación del cuestionario de la encuesta Panel CASEN en la ola 2006 fue de aproximadamente 52 minutos. 23

6 Recolección de los datos Al igual que en las olas anteriores de la encuesta, en la tercera ola la recolección de los datos se realizó mediante encuestas proxy. Esto quiere que un sólo miembro del hogar fue encuestado entregando éste información de todo el hogar. En la medida de lo posible, este informante fue el jefe de hogar o su cónyuge, y en su defecto lo fue un miembro mayor de 18 años. 6.1 Trabajo en Terreno El trabajo en terreno de la encuesta se desarrolló en las regiones Tercera, Séptima, Octava y Metropolitana. A continuación se describen los principales aspectos del trabajo en terreno. 6.1.1 Equipo de Terreno El equipo de terreno está compuesto por Jefes Regionales, Jefes de Grupo, Encuestadores y Supervisores. La siguiente tabla describe la distribución del equipo de terreno en las diferentes regiones. Tabla 3: Distribución del Equipo de Terreno Región Sede Jefe Regional Jefes de Grupo Encuestadores Supervisores III Copiapó 1-7 1 VII Talca 1 1 12 1 VII Linares - 1 12 1 VIII Chillan 1 1 13 1 VIII Los Ángeles - 1 7 1 VIII Concepción - 1 22 3 XIII Santiago 1 2 36 4 Total 4 7 109 12 24

Todo el equipo de Jefes Regionales y Jefes de Grupo contaba con una vasta experiencia en trabajo terreno en encuestas sociales. La primera selección de Encuestadores se realizó a partir de su inscripción en la página web del OSUAH: http://www.osuah.cl/inscripcion_encuestadores.php. En esta selección se dio preferencia a aquéllos que contaban con más experiencia en encuestas de hogares similares a la implementada. 6.1.2 Capacitación del Equipo de Terreno La capacitación de los Jefes Regionales y Jefes de Grupo se realizó en Santiago, durante dos días en jornadas de ocho horas diarias. Una vez terminada esta capacitación, donde se revisaron y aclararon todas las dudas de los diferentes módulos, se fijaron las fechas de capacitación de los encuestadores en las cuatro regiones de estudio. Estas capacitaciones quedaron a cargo de cada Jefe Regional en las diferentes sedes, y se realizaron también durante dos días en jornadas de ocho horas cada una. En regiones se contó con la asistencia de personal del equipo de planta del OSUAH, que viajó a prestar colaboración y supervisar que los instructivos fueran dados de acuerdo a los parámetros establecidos. Específicamente las capacitaciones se realizaron en las siguientes fechas: Región Metropolitana: 30, 31 de Octubre y 1 de Noviembre de 2006. III Región: 30, 31 de Octubre y 1 de Noviembre de 2006. VII Región: 27, 28 y 29 de Octubre de 2006. VIII Región: 30, 31 de Octubre y 1 de Noviembre de 2006. 25

6.1.3 Pretest En Septiembre de 2006 se realizó el Pre-Test de 100 casos en Región Metropolitana (70 urbanos y 30 rurales) con la participación de 8 encuestadores. La fase de desarrollo del Pre Test es la etapa más importante previa a la aplicación del instrumento final de recolección de información. Para la Encuesta Panel 2006, el objetivo del Pre Test fue probar el cuestionario en términos de diseño, contenido y aplicación, lo que se realizó a partir del trabajo en terreno (encuestaje), la Hoja de Reporte, un Focus Group con encuestadores y análisis de frecuencias y cruces de variables de interés. Todos los elementos señalados en el objetivo intentan evaluar el diseño y contenido del instrumento de medición, para luego reparar los errores o dificultades encontradas, logrando aplicar, en la etapa de terreno final, un cuestionario limpio y depurado, que permitiera entregar resultados exentos de, en la mayor medida posible, errores de medición producto del cuestionario. El objetivo recién planteado se desarrolló a partir de los siguientes objetivos específicos: Identificar posibles dificultades de acceso a las viviendas y entrevistados, generando sugerencias para facilitar este proceso Estimar la duración promedio de la aplicación del cuestionario Evaluar la actitud, nivel de concentración y retención de los entrevistados al responder Identificar las posibles dificultades de comprensión que puedan presentar algunas preguntas, conceptos o categorías de respuesta para los entrevistados y formular recomendaciones de reemplazo y/o modificaciones Identificar problemas relativos al diseño y diagramación del cuestionario, y realizar propuestas de reemplazo y/o modificaciones Testear aspectos operativos del trabajo en terreno. 26

6.1.4 Fechas del Trabajo en Terreno El levantamiento de datos se dividió en 2 etapas: la primera se llevó a cabo desde el 4 Noviembre de 2006 hasta el 30 Diciembre del mismo año, y la segunda etapa se realizó entre el 18 de Enero y el 10 de Febrero de 2007. En esta segunda etapa del trabajo en terreno se alcanzaron los niveles de respuesta proyectados. 6.1.5 Procedimientos de terreno Dado el carácter longitudinal de la encuesta, se procedió a buscar los hogares efectivamente encuestados en 2001, para lo cuál el encuestador visitó la dirección disponible del hogar. Siempre que el hogar mantenía la dirección original se visitaba hasta que se conseguía la encuesta, en algunos casos se visitó hasta en 4 oportunidades una dirección para lograr la entrevista, sin embargo hubo otros casos en que después de reiteradas visitas no se pudo lograr la entrevista pues nunca se encontró a los moradores. En las viviendas donde se crearon hogares nuevos si estos residían en la misma dirección se procedía a encuestarlos inmediatamente, si se habían ido a una nueva dirección se preguntaba en la dirección original el paradero o nueva dirección de este hogar para ir a realizarle la encuesta, siempre y cuando la nueva dirección se encontrara en la misma región. Como estrategia de recuperar datos de hogares (originales o nuevos) que ya no residían en la dirección del año 2001 se preguntaba a los actuales moradores o vecinos si alguien conocía la nueva dirección de este hogar. De no obtener información, en algunos casos, con el nombre del Jefe de hogar se trataba de ubicar en las guías de teléfonos el número, para poder concertar una entrevista. Si ya agotando estos procedimientos no se podía obtener información de la nueva dirección del hogar el encuestador informaba a su jefe de grupo y este procedía a registrar la encuesta como no lograda. 27

Las encuestas se pagaron a $ 3.800 en la primera etapa y a $ 4.000 en la segunda y además, como incentivo extraordinario en la primera etapa, cada 5 encuestas se dio un bono de $ 1.000. En la segunda etapa este bono se incrementó a $ 2.000 por cada 5 encuestas, como método para incentivar a los encuestadores y obtener una tasa mayor de logro. 6.1.6 Supervisión y control de calidad El procedimiento de supervisión consiste en la revisión de una parte de las encuestas aplicadas por cada encuestador. Para esto el Jefe de grupo entrega al supervisor una lista de direcciones a controlar. Éste, una vez en terreno, aplica un cuestionario reducido en la dirección que le fue entregada, el cual consiste en sólo algunas preguntas de cada módulo. Terminado el control hace entrega en la oficina de su trabajo y el Jefe de Grupo procede a comparar los datos de la encuesta con los del control. Los controles en la primera etapa se realizaron desde el 11 de Noviembre al 31 de Diciembre, y en la segunda etapa entre el 20 de Enero y el 12 de Febrero del 2007. Los resultados de las supervisiones no arrojaron grandes diferencias ni falseos de encuesta, demostrando así la buena calidad de los encuestadores y el compromiso con este estudio. 6.2 Resultados de la etapa de terreno Para informar sobre el avance del trabajo de terreno se confeccionó una página Web donde los jefes regionales informaban día a día el avance de las encuestas logradas y no logradas, ingresando un código de resultado de las visitas a cada dirección. El porcentaje de logro de entrevistas fue alrededor de un 73% de la muestra, que corresponde a los hogares efectivamente encuestados el año 2001, de acuerdo a las 28

reglas de seguimiento utilizadas. Por otro lado la tasa de nacimiento de nuevos hogares fue de un 10% aproximadamente. Entre las razones más frecuentes de no logro de encuestas, está que el hogar cambió de residencia a un lugar desconocido, o que cambió a una región o comuna que no entraba en la muestra; hay que recordar que se visitó los hogares panel después de 5 años por lo que el porcentaje de pérdida de entrevistas está de acuerdo a rangos más o menos predecibles. Además un 4% de la muestra no tenía las direcciones completas, y un poco más de un 2% de los hogares fueron contactados pero no accedieron a contestar la encuesta. Otro problema para ubicar las direcciones, sobre todo en las zonas rurales, fue no contar con cartografía adecuada de ubicación de las viviendas, sólo disponíamos de croquis de la encuesta de 2001, los que en algunos casos no eran de mucha ayuda. En algunas encuestas rurales se ubicó la dirección preguntando en la localidad a encuestar por los nombres de los habitantes del hogar. 7 Preparación de los datos Es el conjunto de tareas que se realizaron con posterioridad al término del trabajo de campo, el objetivo principal de esta actividad consiste en asegurar la disponibilidad de toda la información consignada en los formularios de encuesta y que dicha información cumpla con las reglas de completitud y relaciones de consistencia que se establecen durante la ejecución de esta actividad. El producto de esta actividad está constituido por un archivo magnético con la información de las encuestas realizadas. 29

7.1 Digitación Para llevar a cabo este proceso se contó con personas de experiencia demostrable, que se han desempeñado satisfactoriamente en estudios similares tales como CASEN y versiones anteriores de esta encuesta. En cuanto a la infraestructura computacional, se contó con computadores personales para llevar a cabo esta tarea, conectados en red y un computador de características superiores, que cumple la función de servidor, y en el cual se almacenó la información digitada en un Motor de Base de Datos. Además se seleccionó en forma aleatoria un 10% de las encuestas para la realización del proceso de Re-Digitación, posteriormente se realizó un contraste con la información digitada en ambas oportunidades y se confeccionó un informe, con el propósito de conocer la calidad de la labor desempeñada por los digitadores(as). 7.2 Controles de Calidad Se realizaron todas las tareas de procesamiento de información necesarias con el propósito de disponer finalmente de información de calidad y paralelamente disponer, en cualquier instante del período de ejecución del estudio, de información acerca del estado de avance de cada proceso. 7.2.1 Verificación de la información de cada ola. Esta tarea consiste en un proceso de contraste entre los formularios de encuesta recolectados desde terreno, la información consignada en la Base de Datos y lo efectivamente digitado. Para la verificación de la información, se debió realizar previamente dos sub-tareas, a saber, la primera, fue generar un documento que describiera un conjunto de relaciones 30

entre las variables de la encuesta que se deben cumplir, y construir con estas relaciones lo que normalmente se denomina la Malla de Validación. El programa de validación no es más que el mismo programa de ingreso de la información que se potencia incorporando el módulo de validación, por lo tanto las funcionalidades disponibles para el Digitador(a) estuvieron del mismo modo disponibles para el Validador(a). Su funcionamiento consiste en la revisión secuencial de cada una de las encuestas antes digitadas, para las cuales se realiza inicialmente un chequeo de rango o recorrido de todas las variables y en caso que alguna no cumpla con lo establecido se alerta al validador, normalmente se indica marcando con un color diferente (rojo) los recuadros de ingreso de las variables cuestionadas. Una vez contrastada y corregida la respuesta con lo que indica el formulario de encuesta se procede a ejecutar idéntico proceso. En el momento en que la encuesta no indica la presencia de errores de rango se procede automáticamente con la revisión del cumplimiento de las relaciones especificadas en la Malla de Validación, este proceso normalmente se denomina chequeo de consistencias y su funcionamiento es similar al anterior. En este caso se genera una lista con todas las relaciones que no se cumplen, el Validador contrasta la información digitada con la que está en el formulario de encuesta, corrige en caso que corresponda y procede a ejecutar nuevamente el mismo proceso, hasta que la encuesta sea aprobada. 7.2.2 Consolidación Información cada ola. La consolidación de la información para las 2 primeras olas se llevó a cabo por el Centro de Microdatos de la Universidad de Chile. Sólo la consolidación de las olas 1996, y 2001 con la del 2006 se llevó a cabo por el OSUAH. El procedimiento consta de 2 partes: primero se identifican los hogares y luego se identifican individuos. 31

Para identificar los hogares de las 3 olas se genera un identificador por hogar. En este procedimiento la unidad de análisis es la encuesta. Mediante ésta se crea la variable que identifica tanto hogares antiguos (que aparecen en las encuestas anteriores), como los nuevos (hogares que se formaron a partir de los hogares de olas anteriores). Una vez que se tiene el identificador del hogar, constituido por un conjunto de variables que permanecen constantes en el tiempo, se procede a parear la información de las dos primeras olas con la del '06. Debe quedar claro que éste es un paso intermedio, ya que se tiene la información pareada por hogares, pero no a nivel de individuos. La segunda parte busca compaginar la información a nivel individual. Para lograr el matching perfecto entre los individuos del hogar, se procede a parear la información de acuerdo a 3 variables de control: nombre, sexo y edad. Para las 2 primeras variables se busca encontrar una coincidencia exacta entre las 3 olas. El control por edad se realiza buscando una consistencia en el tiempo, en otras palabras, se busca que la edad vaya aumentando en el tiempo tomando la primera ola como punto referencial. Una vez que se cuenta con la información consolidada para las 3 olas se procede al análisis longitudinal. 7.2.3 Verificación de la información longitudinal En el proceso de verificación de la información longitudinal se busca corroborar la existencia de consistencia en el tiempo entre los datos consolidados como también indicar y corregir errores cuando estos existan. El procedimiento comienza con la revisión de las partidas de preguntas que exigen una coherencia en el tiempo (edad, sexo, escolaridad, entre otras). El análisis se limita sólo a variables que objetivamente no pueden mostrar un cambio sustancial entre diferentes olas. Por lo tanto se realizan 2 tipos de análisis: primero se abordan variables que no deben cambiar en el tiempo (sexo) y luego se revisan las qué sólo pueden cambiar dentro de un rango admisible (edad, escolaridad, entre otras). El criterio para definir el rango admisible de variación se define en base al tiempo transcurrido entre olas y la variable en 32

análisis. Por ejemplo, el rango admisible para la variación de la edad entre olas adyacentes es de 4 a 6 años y el de escolaridad es de 0 a 7 años. Una vez identificados los errores se procederá a la creación de banderas (variables dummy) que le indicarán al investigador donde está presente el error (en que individuo) y en qué pregunta (por ejemplo, edad). Además para cada variable que se analizó se creó una nueva variable corregida que presenta la consistencia longitudinal deseada. El criterio de corrección se hizo en base a las olas restantes. Si una ola presenta error, se corrige mediante la consistencia que existe entre las olas restantes. Los casos que presenten incoherencia en las 3 olas se les asigna missing. Debe quedar claro que no se están corrigiendo los datos de la base original, si no que se crea una nueva variable que presenta la consistencia longitudinal deseada. Los resultados de este procedimiento son: el grado de error en la obtención de la información longitudinal entre una ola y otra, banderas que señalicen inconsistencia temporal en los datos del individuo y por último la creación de una nueva variable corregida que presenta consistencia temporal. Sin embargo, cabe destacar que las fuentes del error pueden ser diversas y están fuera del análisis de este proceso. 33