USO DE LAS TECNOLOGÍAS EN LA CAPTURA DE DATOS EN LOS CENSOS Y OTRAS OPERACIONES ESTADÍSTICAS EN EL ECUADOR. Recogida y Captura de los Datos en las DMC Programas de Capacitación en la Recogida y Captura de los Datos en las DMC Censos y Operaciones Estadísticas Sistemas de Gestión Procesamiento
RECOGIDA Y CAPTURA DE LOS DATOS EN LAS DMC. (IPC, IPP MOBILE) Características Físicas De Los Equipos Móviles Motorola MC75 (Asistente Digital Empresarial - EDA) Lectura de códigos de barras 1D y 2D Red Local Inalámbrica (WLAN) Conectividad Bluetooth e IrDA Compatibilidad con 3.5G GSM HSDPA y 3G CDMA-EVDO Rev A Servicios de datos y voz de alto rendimiento Resistente y liviano Soporta caídas hasta de 1.5 mts en concreto 2
RECOGIDA Y CAPTURA DE LOS DATOS EN LAS DMC. (IPC, IPP MOBILE) Características Físicas De Los Equipos Móviles Motorola MC75 (Asistente Digital Empresarial - EDA) Antena integrada y sellado IP-54 (Norma internacional para la humedad y polvo). Sistema Operativo Windows Mobile 6.0 Capacidad 3G WWAN Compatibilidad con GPS autónomo y asistido Pantalla VGA de alta definición de 3,5 pulgadas, Posee un procesador XScale PXA270 de 624 MHz 3
RECOGIDA Y CAPTURA DE LOS DATOS EN LAS DMC. (IPC, IPP MOBILE) Transferencia / Transmisión de datos Indicadores 4
RECOGIDA Y CAPTURA DE LOS DATOS EN LAS DMC. (IPC, IPP MOBILE) Transferencia / Transmisión de datos Indicadores 5
RECOGIDA Y CAPTURA DE LOS DATOS EN LAS DMC. (EMPLEO Y SUBEMPLEO) Transferencia / Transmisión de datos Encuestas de Hogares Transfiriere archivos del servidor a los PCs en Regionales Utiliza el servicio de correo para el envío de información Aplicativos de captura desarrollados en CsPro 4.0 Se carga los datos al EDA a través de cable 6
PROGRAMAS DE CAPACITACIÓN EN LOS CENSOS Y OPERACIONES ESTADÍSTICAS Capacitación Censal Capacitación Censal Actividad fundamental y necesaria Planeada basada necesidades reales orientadas flujo procesos y en al de Para: -Captura de datos -Codificación -Validación Midiendo : -Conocimientos -Habilidades y -Actitudes del personal que intervendrá 7
PROGRAMAS DE CAPACITACIÓN EN LOS CENSOS Y OPERACIONES ESTADÍSTICAS Niveles de Capacitación El contenido de la capacitación está enfocado en dar a conocer la metodología del procesamiento de datos que involucran todas las fases de captura, control de calidad, codificación y validación además de las respectivas prácticas. En primera instancia se procede a capacitar al personal de críticoscodificadores, a cargo del equipo técnico, el mismo que cuenta con amplia experiencia en análisis y codificación de datos. Posteriormente se procede a capacitar al resto de personal de procesamiento como: responsables de archivo, asistentes de archivo, operadores de guillotina, operadores de escáner y Verificadores En la actualidad el INEC, no cuenta con sistemas multimedia e interactivos de capacitación. La capacitación se realizo de manera presencial en cascada. 8
SISTEMAS DE GESTIÓN Censo Población y Vivienda-2010 APLICATIVO DE CONTROL Desarrollado en PowerBuilder 12.5, como herramienta de desarrollo y como motor de Base de Datos, Sybase Enterprise 15.0. Sistema de Control de Flujo Llevar un orden de todos los sectores censales en el Archivo físico Agilitar la entrega recepción de material del archivo a los diferentes procesos Controlar el flujo del material físico en cada uno de los procesos. Servir de base para el Control Cobertura de los formularios procesados. 9
SISTEMAS DE GESTIÓN Censo Población y Vivienda-2010 Reporte de toma pendiente Reporte de re investigaciones Reporte de novedades IPC Móvil Reporte de la ruta activa Reporte de control de faltantes Reporte de referenciales 10
FASES DEL PROCESAMIENTO CPV-2010 1.- PLANIFICACIÓN 9.- GENERACIÓN DE BASES DE DATOS 2.- ARCHIVO FÍSICO DE LA INFORMACIÓN CENSAL 8.- TABULACIÓN Fases del Procesamiento CPV-2010 3.- CRÍTICA- CODIFICACIÓN DE LA INFORMACIÓN 7.- VALIDACIÓN E IMPUTACIÓN 4.- CAPTURA E INGRESO DE LA INFORMACIÓN 6.- COBERTURA DE LA INFORMACIÓN CENSAL 5.- SEGURIDAD Y RESPALDO 11
FASES DEL PROCESAMIENTO CPV-2010 1. PLANIFICACION Cobertura Nacional 4.500.000 Viviendas. 41.000 viviendas por día 5 meses de trabajo 687 personas 4 Direcciones Zonales Presupuesto $ 5.874.724 12
FASES DEL PROCESAMIENTO CPV-2010 2. ARCHIVO FÍSICO DE LA INFORMACIÓN CENSAL PROCESO Estructuración por lotes (sector censal) Organización por Jurisdicción Censal (Lotes censal) Nomenclatura: provincia, cantón, parroquia, zona censal y sector censal. (180150001001) RESULTADOS Permitió un flujo adecuado entre todos los procesos No se obtuvo perdida de formularios en el proceso 13
FASES DEL PROCESAMIENTO CPV-2010 3. CRITICA- CODIFICACIÓN DE LA INFORMACIÓN Revisión manual de los cuestionarios censales (boletas) Ordenamiento de las viviendas en cada carpeta censal Revisión y corrección de la estructura interna de cada uno de los cuestionarios censales Codificación de las respuestas abiertas (variables geográficas y económicas) Revisión y corrección de la información errónea sin alterar la información original 14
GUILLOTINADO O CORTE DE FORMULARIOS CENSALES Guillotina eléctronica (Polar 78X) 4 centros de procesamiento cumple con estándares necesarios para el procesamiento 5.000 Formulario cortados por cada turno, 15.000 en un día de trabajo MATERIAL PARA EL CORTE 15
GUILLOTINADO O CORTE DE FORMULARIOS CENSALES Guillotina eléctronica (Polar 78X) 4 centros de procesamiento cumple con estándares necesarios para el procesamiento 5.000 Formulario cortados por cada turno, 15.000 en un día de trabajo MATERIAL EN PROCESO DE CORTE 16
GUILLOTINADO O CORTE DE FORMULARIOS CENSALES Guillotina eléctronica (Polar 78X) 4 centros de procesamiento cumple con estándares necesarios para el procesamiento 5.000 Formulario cortados por cada turno, 15.000 en un día de trabajo EMPACANDO MATERIAL 17
4. CAPTURA E INGRESO DE LA INFORMACIÓN Sistema de Captura Óptica mediante Scanner. INTRODUCCIÓN: Es una aplicación de software que captura y gestiona automáticamente la información contenida en los cuestionarios censales. Escanea, interpreta y verifica los impresos y, a continuación, transfiere los datos a un archivo de salida para posteriores fases. VENTAJAS La información a procesar mediante tecnología OCR a través de OMR, ICR, OBR se capturan automáticamente sin necesidad de que se introduzca a mano ni un solo dato o en casos específicos con porcentajes muy bajos. La introducción manual de datos se reduce aproximadamente en un 90% o más. Las correcciones necesarias se efectúan en un entorno cómodo, donde el cuestionario censal que se modifica se muestra directamente en la pantalla. SOFTWARE Escaneado Interpretación Verificación Transferencia (Generación de archivos) 18
4. CAPTURA E INGRESO DE LA INFORMACIÓN Sistema de Captura Óptica mediante Scanner. Entrada (Escaneo): Imágenes de cuestionarios, fax, XML, PDF, con optimización para velocidades de 90 ppm y 100 ppm (Páginas por Minutos) Scanners Canon 9080C y Canon DRC-X10 19
4. CAPTURA E INGRESO DE LA INFORMACIÓN Sistema de Captura Óptica mediante Scanner. Extracción de datos: Reconocimiento de la escritura a mano: OCR (Marcas), ICR (números, letras), OBR (códigos de barra). Validación automática contra: Reglas Bases de datos Tablas Es un proceso automático de reconocimiento de información. 20
4. CAPTURA E INGRESO DE LA INFORMACIÓN Sistema de Captura Óptica mediante Scanner. Verificación (control de calidad manual) Verificación de datos reconocidos Corrección de datos con reconocimiento incierto Corrección de datos mal interpretados Revalidación automática de cualquier corrección de operador 21
4. CAPTURA E INGRESO DE LA INFORMACIÓN Sistema de Captura Óptica mediante Scanner. Transferencia (Modulo TRANSFER): Este módulo fue desarrollado para permitir grabar la información censal de acuerdo a la estructura del cuestionario censal; se generó archivos individuales por sector censal con la siguiente nomenclatura: Provincia + Cantón + Parroquia + Zona + Sector + R(Registro).TXT Salida Distintas Base de datos Archivos planos (*.txt) 22
FASES DEL PROCESAMIENTO CPV-2010 Redes LAN independientes de la Institución Servidores Última tecnología HP G6 y G7 64 bits 5. SEGURIDAD Y RESPALDOS Acceso a Internet limitado, solo para actualizaciones Unidades de respaldo en cinta HP (Ultrium LTO 4 1.6 Gb ) Se programó respaldos periódicos automáticos 23
FASES DEL PROCESAMIENTO CPV-2010 Reportes de comparabilidad entre la base precensal y la información censal ingresada. Comparaciones a nivel de áreas de empadronamiento en la parte amanzanada y sector censal en el área dispersa. 6. COBERTURA DE LA INFORMACIÓN CENSAL Eliminación de Cuestionarios Incompletos Eliminación de Cuestionarios Duplicados Revisión de la estructura del cuestionario Generación de archivo (Provinxx.00 Validación e imputación) 24
FASES DEL PROCESAMIENTO CPV-2010 Fase delicada y critica de todo el procesamiento censal Componentes o insumos utilizados (Datos, Plan de Validación y Aplicativos) Analizar y desarrollar programas de validación e imputación 7. VALIDACIÓN E IMPUTACIÓN Depurar y generar información consistente de los datos registrados en el Cuestionario Censal Se contó con asesoría Internacional (Plan de Validación y porcentajes de Imputación) Software utilizado CsPro 4.0 (Buro de los Censos) se utilizaron matrices dinámicas que se actualizaban durante el proceso. 25
FASES DEL PROCESAMIENTO CPV-2010 Ejecutar las rutinas y módulos de tabulación. 8. TABULACIÓN Obtención de tabulados a nivel nacional, provincial y cantonal Generación de bases Insumos (Plan de Tabulación, Diccionario, Base de Datos) Software utilizado CsPro 4.0 (Buro de los Censos) La etapa de procesamiento entrega a la etapa de análisis los tabulados para la revisión definitiva 26
FASES DEL PROCESAMIENTO CPV-2010 9. GENERACIÓN DE BASES Formatos SPSS, Redatam y ASCII en el portal institucional. Insumos (Base de datos en formato original (ASCII), Diccionarios (DDF y DCF) Scripts de generación) La base original se debe encontrar ordenada en su jerarquía censal. 27
ELABORADO POR: ALFONSO SALAZAR 28