Proyecto METAMAC. Infraestructura de Datos y Metadatos Estadísticos de Canarias Introducción La Infraestructura de Datos y Metadatos de Canarias ha sido desarrollada en buena parte dentro del Proyecto SISTEMA INTEGRADO DE DATOS Y METADATOS DE LA MACARONESIA (METAMAC). Este proyecto se enmarca dentro del Plan Estratégico del ISTAC 2010-2015 que establece que su misión es proveer, con independencia técnica y profesional, información estadística de interés de la CAC atendiendo a la fragmentación del territorio y a sus singularidades y cumpliendo con los principios de pertinencia, precisión y fiabilidad, oportunidad y puntualidad, coherencia y comparabilidad, accesibilidad y claridad. En ese sentido el proyecto aborda lo indicado en el Código de Buenas Práctica de la Estadísticas Europeas, que en su principio 15 sobre accesibilidad y claridad especifica que Las estadísticas europeas deberían presentarse de forma clara y comprensible, difundirse de forma adecuada y conveniente y estar disponibles, asimismo se debería permitir el acceso a las mismas de forma imparcial, con metadatos y orientación de apoyo. Y a su vez, desarrolla dentro de la función pública estadística los principios de acceso electrónico, interoperabilidad y reutilización de la información estadística descritos en las siguientes normas: 1. LEY 11/2007 DE ACCESO ELECTRÓNICO DE LOS CIUDADANOS A LOS SERVICIOS PÚBLICOS La interoperabilidad es la capacidad de los sistemas de información y de los procedimientos a los que éstos dan soporte, de compartir datos y posibilitar el intercambio de información y conocimiento entre ellos. 2. LEY 37/2007 SOBRE REUTILIZACIÓN DE INFORMACIÓN DEL SECTOR PÚBLICO Se entiende por reutilización el uso de documentos que obran en poder de las Administraciones y organismos del sector público, por personas físicas o jurídicas, con fines comerciales o no comerciales, siempre que dicho uso no constituya una actividad administrativa pública. METAMAC ha sido un proyecto pionero internacionalmente, implantando por primera vez el estándar SDMX en su globalidad y ampliando la metadocumentación mínima exigida por dicho estándar. En ese sentido se trata de un proyecto por el que ha mostrado gran interés Oficinas Centrales de Estadística de diversos países europeos y latinoamericanos.
Financiación y empresas que ha participado METAMAC ha sido un proyecto desarrollado en el ámbito del Programa PCT-MAC 2007-2013, con la Dirección Regional de Estadística de Madeira (DREM) y el Servicio Regional de Estadística de Azores (SREA), con un periodo de ejecución de 48 meses y con un presupuesto de 820.000 euros, cofinanciados al 85% (697.000 ). La empresa que ha desarrollado el sistema es Arte Consultores, SL. Descripción general de los beneficios del proyecto Para describir las capacidades que potencialmente tiene un sistema de metadatos estadístico se va a mostrar las diferentes necesidades que tienen los distintos actores que utilizan este tipo de sistemas. Para ello será necesario categorizar los tipos de usuario de forma que dicha categoría nos ayude a identificar las necesidades de cada colectivo. En primer lugar se encuentran los usuarios de datos estadísticos que necesitan estos datos para analizarlos y estudiarlos, y cuyo objetivo final es obtener ciertas conclusiones que ayuden a realizar de forma efectiva sus tareas y responsabilidades. En segundo lugar están los productores de datos estadísticos que son las personas encargadas de la producción de los distintos datos estadísticos. Por último se ha incorporado un tercer tipo de usuario que son las herramientas software que se utilizan en la producción y utilización de datos estadísticos. Naturalmente, las necesidades de estas herramientas pueden derivarse directamente o indirectamente de las necesidades de los usuarios y los productores de datos estadísticos. Sin embargo, este tipo de herramientas juegan un papel tan importante que parece adecuado prestar especial atención a estas necesidades. 1. Las necesidades de los usuarios de datos estadísticos: Las necesidades que un usuario de datos estadístico necesita de un sistema de información estadístico se pueden reflejar describiendo el ciclo de acciones que este tipo de usuarios realiza para llevar a cabo sus tareas. Un usuario con algún tipo de pregunta o problema busca datos estadísticos de relevancia para su problema. Una vez que los identifica, el usuario decide recuperar estos datos. Posteriormente, el usuario analiza e interpreta los datos estadísticos que ha recuperado. Posiblemente, el usuario reitera parte del proceso realizando nuevas búsquedas, recuperaciones y análisis hasta obtener los datos deseados. En cada uno de los pasos que se han descrito, el usuario de datos estadístico necesita algún tipo de metadatos. La amplitud y profundidad de esos datos dependerán de los conocimientos previos del usuario y de los objetivos a alcanzar. 2. Las necesidades de los productores de datos estadísticos: Este tipo de usuarios participan en las distintas actividades definidas en un sistema de producción estadística: diseño, implementación, operación, mantenimiento, monitorización y evaluación. Todas las personas incluidas en este grupo tienen necesidades de metadatos. Un diseñador de estadísticas necesita conocer cuáles son las necesidades del usuario, cómo se han diseñado estadísticas similares en otras agencias, etc. Un proveedor que aporta datos quiere saber el propósito de la estadística y los beneficios y costes de su participación. La persona encargada de producir las estadísticas necesita saber los pasos a seguir para que el resultado sea correcto. Un auditor requiere metadatos relacionados con la funcionalidad del sistema y la retroalimentación de los usuarios. 3. Las necesidades de las herramientas software: Este tipo de herramientas necesitan metadatos para poder funcionar correctamente. Necesita descripciones formales de los datos que tiene que procesar; metadatos textuales que posibiliten mostrar información de interés a los 2
usuarios de la herramienta. Además, los usuarios de las herramientas necesitan metadatos sobre la propia herramienta para saber utilizarla apropiadamente y para poder interpretar adecuadamente el resultado de los análisis. Estándares de referencia SDMX - Statistical Data and Metadata Exchange (ISO 17369:2013) es el estándar de referencia del Proyecto METAMAC, pero también ha utilizado o implementado los siguientes: 1. Data Documentation Initiative (DDI) 2. Dublin Core Metadata Initiative (DCMI) 3. Data Catalog Vocabulary (DCAT) 4. Dataset Publishing Language (DSPL) 5. PC-Axis 6. Euro-SDMX Metadata Structure (ESMS) (release 3 March 2009) 7. Neuchâtel Terminology Model. PART II: Variables and related concepts, object types and their attributes Generic Statistical Information Model (GSIM) El Generic Statistical Information Model (GSIM) elaborado por NNUU proporciona la descripción de un conjunto de objetos de información consistentemente estandarizados. Estos objetos son las entradas y salidas en el diseño y la elaboración de estadísticas, para los que se han definido sus atributos y especificado las relaciones con otros objetos. El objetivo principal es el incremento de la extensión de la Administración digital interoperable enfocada al desarrollo de procedimientos simplificados y transparentes para los proveedores y receptores de servicios; así como la interoperabilidad transfronteriza de los servicios digitales del ISTAC como centro de investigación de la Unión Europea. 3
El GSIM es el modelo conceptual sobre el que se desarrolla el Metadata Management del Proyecto METAMAC, constituyendo un Sistema de Metadatos Estadísticos que ofrece información sobre las colecciones de resultados estadísticos y la relación entre ellos, así como sobre los procesos en los que están involucrados, describiendo cada uno de los eventos, sus componentes y cada una de las restricciones que se les aplican. Asimismo, los metadatos de la información estadística informan a los usuarios sobre los datos existentes describiendo: los conceptos, las fuentes, la calidad, su distribución, el formato, restricciones de seguridad, frecuencia de actualización, etcétera, de tal manera que sirven para describir un conjunto de datos estadísticos, contestando a las preguntas: de qué, de cuándo, de dónde, de quién son, de dónde son y el cómo se han generado los datos. Desarrollos y arquitectura Principios 1. Todos los recursos y cada una de sus versiones tienen un URI única y siempre estarán disponibles una vez publicadas. 2. Todos los recursos se sirven públicamente mediante API REST. Sistemas principales 1. Gestor de operaciones estadísticas 2. Gestor de recursos estructurales a. Gestor de organizaciones b. Gestor de temas estadísticos (categorizaciones) c. Gestor de conceptos y glosarios d. Gestor de clasificaciones y códigos e. Gestor de DSD (Dataset Structure Definition) 3. Gestor de recursos estadísticos a. Gestor de colecciones b. Gestor de datasets c. Gestor de queries 4. Gestor de indicadores estadísticos a. Gestor de sistemas de indicadores b. Gestor de indicadores 5. Registro SDMX 6. Visualizador de datasets 4
7. Widgets de información estadística Sistemas transversales, de uso común por todos los gestores desarrollados y sistemas base para futuros desarrollos dentro del ISTAC: 1. Gestor de accesos 2. Servicio de autenticación 3. Contenedor de aplicaciones 4. Servicio de avisos 5. Gestor de avisos 6. Gestor de ayudas. 5