Perspectivas del uso de la web semántica en el tratamiento de información y documentación legislativa García Marco, Francisco Javier Universidad de Zaragoza Legal Framework for the Information Society (LEFIS) Valladolid, 16 de noviembre de 2007 2007 Javier García Marco 1
Contenido Introducción El campo de acción Posibilidades La web semántica La arquitectura de la web semántica y la documentación legislativa Web semántica y Web 2.0: la web de los datos y la web social El ciclo legislativo y la web semántica Conclusiones 2007 Javier García Marco 2
Interés creciente En reuniones y revistas generales: ICW3, IP&M, etc. International Conferences on Artificial Intelligence and Law (ICAIL) Seminarios International Seminar on Law and the Semantic Web, Barcelona, Spain in November 2003 International Workshop on Legal Ontologies and web based legal Information Management, 28 June 2003, Edinburgh 2007 Javier García Marco 3
Conceptos previos Información Todo el proceso de adquisición e intercambio de mensajes de cara a la concrección de un modelo mental y, eventualmente, de una acción conjunta. Documentación Mensajes que por su valor (potencial de reutilización) han sido almacenados en un soporte permanente. Legislativa Regulaciones la vida social aprobadas por una autoridad competente y en nuestras sociedades en un proceso de participación democrática. 2007 Javier García Marco 4
Conceptos previos Interoperabilidad Combinatoriedad, integrabilidad e intercambiabilidad de sistemas que favore las alternativas y la competencia Y que requiere protocolos y formatos de intercambio comunes Web Semántica Conjunto de soluciones que permiten identificar datos interoperables dentro de ficheros publicados en la web (o una Intranet) Autorizados como estándares abiertos por el W3 Que contemplan los diferentes niveles de abstracción del procesamiento: datos, metadatos, ontologías. 2007 Javier García Marco 5
Conceptos previos Concurrencia (publicidad) Un aspecto clave de la WWW es que ningún agente posee el monolopolio de la información y de la acción comunicativa, sino que cualquier agente puede realizar comprobaciones y propuestas de forma independiente. 2007 Javier García Marco 6
La web semántica como entorno interoperable De la WWW a la SW Proyecto del W3C, descrito en Berners Lee et al., 2001, totalmente abierto La WWW maneja documentos, no automatiza el uso de la información, solo su transferencia. La swww manejará datos, para automatizar su uso, haciéndolos procesables. 2007 Javier García Marco 7
Por qué la WS Sentar las bases para una integración fuerte de la red como sistema mundial de información sin perjuicio de su dinamicidad y de su carácter distribuido. 2007 Javier García Marco 8
Arquitectura global (Tim Berners) 2007 Javier García Marco 9
Las bases conceptuales De los datos al conocimiento marcos de comprensión relaciones conocimiento información Los Institutos Universitarios de Investigación podrán ser constituidos por una o más universidades Entidades (par) Relación Cardina lidad datos Instituto Universitario, Universidad Entidad constitutiva =>1 2007 Javier García Marco 10
Razonamiento Nivel de procesamiento lógico PROLOG, etc. Lenguajes de inferencia Conocimiento Nivel de datos conectados con modelos de validez general OWL Ontologías Vocabularios Integrated Public Sector Vocabulary (IPSV) RDF-S Esquemas de metadatos Dublin Core (DC) Cómo? Mensajes Nivel de datos estructurados en documentos RDF XML Schema DTD XML Metadatos Metadato validado y tipificado Dato etiquetado DC:Title http://dublincore.org/documents/ 2002/07/31/dcmes-xml/dcmes-xmldtd.dtd <meta name="dc.title" content="e- Government Unit" /> Arquitectura de datos Dato E-Government Unit URI Documentos (ficheros) http:// www.cabinetoffice.gov.uk/egovernment/ Datos Nivel de datos elementales Unicode Caracteres 2007 Javier García Marco 11
Arquitectura de la información Información estructurada/no Los lenguajes de marcado han resuelto la oposición tradicional entre información estructurada (con metadatos) que podían gestionar las bases de datos y los programas y no estructurada (documentos brutos), convirtiendo a los documentos en información estructura y viceversa. 2007 Javier García Marco 12
Universal Resource Locators Identificar todas las ediciones de un mismo documento legal Asignar a cada una de ellas diferentes funciones: Patrón Edición enlazable Edición anotada libre Edición anotada experta Cachés, etc. Y convertirlas en un sistema de documentos fiable, seguro e interrelacionado. 2007 Javier García Marco 13
XML: Aplicaciones (1) Recuperación de información Navegación A través de sumarios (dentro de documentos) A través de referencias (entre documentos legales) Hacia recursos complementarios (diccionarios, sitios web de instituciones, literatura, etc.) Anotación Por documentalistas de cara a la recuperación Por expertos Por interesados 2007 Javier García Marco 14
XML: aplicaciones (2) Síntesis de documentos e informes a partir de un corpus distribuido Por ejemplo, legislación referida a juguetes articulada por niveles, con especificación de los artículos y con relaciones internas 2007 Javier García Marco 15
Relacionando elementos para su explotación Resource Description Framework Objetivo: relacionar dos datos etiquetados mediante triples http:// www.aragon.es/ consumo tiene como "dc:creator" a Gobierno de Aragón. Dirección General de Consumo <rdf:rdf xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/"> <rdf:description rdf:about="http://www.aragon.es/consumo" dc:creator="gobierno de Aragón. Dirección General de Consumo" dc:title="dirección General de Consumo del Gobierno de Aragón" dc:description="página principal de la Dirección General de Consumo del Gobierno de Aragón" dc:date="2000-10-12" /> </rdf:rdf> 2007 Javier García Marco 16
Arquitectura de la información Metadatos y esquemas Datos que proporcionan una comprensión universal de lo que son los datos (datos sobre datos) Alfredo es un nombre 2006-10-02 es la fecha de terminación del expediente Información sobre la información, semántica La etiqueta que describe un elemento XML es un metadato Los esquemas son conjuntos de metadatos estables y compartidos para describir datos (por ejemplo, ficha bibliográfica). Pueden ser entendidos por otros sistemas que tienen esas mismas etiquetas incorporadas. Bien porque comparten un mismo esquema de metadatos Bien porque se conectan mediante grafos RDF 2007 Javier García Marco 17
Objetivo: ficheros que especifican sistemas de triples. <rdf:rdf xml:lang="en" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"> <rdfs:class rdf:id="person"> <rdfs:comment>the class of people.</rdfs:comment> <rdfs:subclassof rdf:resource="http://www.w3.org/2000/03/example/classes#animal"/> </rdfs:class> <rdf:property ID="maritalStatus"> <rdfs:range rdf:resource="#maritalstatus"/> <rdfs:domain rdf:resource="#person"/> </rdf:property> <rdf:property ID="ssn"> <rdfs:comment>social Security Number</rdfs:comment> <rdfs:range rdf:resource="http://www.w3.org/2000/03/example/classes#integer"/> <rdfs:domain rdf:resource="#person"/> </rdf:property> <rdf:property ID="age"> <rdfs:range rdf:resource="http://www.w3.org/2000/03/example/classes#integer"/> <rdfs:domain rdf:resource="#person"/> </rdf:property> La web semántica como entorno interoperable Resource Description Framework Schema <rdfs:class rdf:id="maritalstatus"/> <MaritalStatus rdf:id="married"/> <MaritalStatus rdf:id="divorced"/> <MaritalStatus rdf:id="single"/> <MaritalStatus rdf:id="widowed"/> </rdf:rdf> 2007 Javier García Marco 18
La web semántica como entorno interoperable Dublin Core: un RDFS en acción Elementos básicos Elementos complementarios Elementos de precisión Esquemas de codificación Tipos de medios (DCMType) contributor abstract available issued Box Collection coverage accessrights bibliographiccitation isversio n O f DCMIType Dataset creat o r accrualmethod conformsto license DDC Event date accrualperiodicity created mediat o r IMT Image description accuralpolicy dateaccepted medium ISO3166 Int eract ivere source format alternative datecopyrighted modified ISO639-2 MovingImage identifier audience datesubmitted provenance LCC PhysicalObject language educationlevel references LCSH Service publisher extent replaces MESH Sofware relation hasformat requires NLM Sound rights haspart rightsholder Period StillImage source hasversion spatial Point Text subject instruction almethod tableofcontents RFC1766 title isformatof temporal RFC3066 type ispartof valid TGN isreferencedby UDC isreplacedby URI isrequiredby W3CDTF 2007 Javier García Marco 19
La web semántica como entorno interoperable Dublin Core: ejemplo <head> <title>e-government Unit</title> <meta name="author" content="e- Government Unit" /> <meta name="description" content="e- Government Unit homepage" /> <meta name="keywords" content="e- Government Unit, e-government, unit, homepage" /> <meta http-equiv="title" content="e- Government Unit" /> <meta name="dc.title" content="e- Government Unit" /> <meta name="dc.date.created" scheme="w3cdtf" content="2005-03- 01" /> <meta name="dc.description" content="e- Government Unit homepage" /> <meta name="egms.subject.keyword" scheme="curriculumonline" content="public administration" /> 2007 Javier García Marco 20
Dublin Core y XMLeg Es una estrategia que permite describir recursos de manera que pueden ser recuperados por sus características estables objeto del interés de los usuarios Pueden anidarse para describir las jerarquías de elementos XML, permitiendo su relación y estableciendo un mecanismo para su recuperación a diferentes niveles de profundidad, De cara a su posterior tratamiento 2007 Javier García Marco 21
Ontologías la configuración de un campo de investigación Fuente :SCI 2007 Javier García Marco 22
Ontologías la configuración de un campo de investigación Fuente :SCI 2007 Javier García Marco 23
Ontologías Ecología de la investigación 2007 Javier García Marco 24
Ontologías Campos de investigación 2007 Javier García Marco 25
Ontologías: concepto Un concepto ambicioso, abstracto y filosófico Representar integramente los sistemas conceptuales (Knowledge Representation) compartidos (compromiso ontológico) Interrelacionar distintos sistemas a partir de unas reglas ontológicas y lógicas comunes Fines múltiples de distinta entidad Recuperación de la información (limitado) Razonamiento automatizado (ilimitado) Incorporar la investigación en IA a la W3 2007 Javier García Marco 26
Ontologías: diversos niveles Descripción formal del vocabulario de un dominio, incluyendo las relaciones entre sus términos, con sus restricciones, etc., Wordnet Distintos niveles Definición de la jerarquía de conceptos Establecimiento de primitivos y constructos Representación de las relaciones específicas mediante axiomas más complejos 2007 Javier García Marco 27
Web Ontology Language (OWL) 2007 Javier García Marco 28
Ontologías: usos Documentación Recuperación de la información Navegación (subsumiendo alternativas como Topic Maps) Observatorios Minería de datos Razonamiento automático o supervisado 2007 Javier García Marco 29
Ontologías para la RI Aplicaciones inmediatas SKOS como herramienta para interconectar vocabularios de descripción legal para facilitar la recuperación entre sistemas. Algunas perspectivas Sería necesaria una espina que sirviera para interconectar los vocabularios diversos, aunque fuera a un nivel de generalidad más alto (lenguaje de interconexión) 2007 Javier García Marco 30
Ontologías y razonamiento Coherencia intertextual Avisar de todas las legislaciones afectadas por una que cambia de forma recursiva (en todas las relacionadas en segundo, tercer, etc., orden). Coherencia conceptual Potencial para que agentes automáticos comprueben la coherencia conceptual y avisen de cambios a legislaciones suscritas. 2007 Javier García Marco 31
Confiabilidad Textos seguros (autenticidad) Mantenimiento de fuentes autorizadas Comprobación de la integridad de las copias Responsabilidad Anotación trazable si es necesario Requiere protección de la identidad Acceso diferencial a la información Protección de la intimidad (personal) Confidencialidad (interpersonal) 2007 Javier García Marco 32
Confiabilidad: soluciones Tecnologías informáticas Encriptación Firma electrónica de doble clave Huellas digitales únicas Tecnologías sociales Códigos Terceras partes confiables 2007 Javier García Marco 33
WS + Web 2.0: bases filosóficas Dos visiones del Derecho (Benjamins) Legalista : Estatica Orientada a resultados - normas (fuentes del Derecho) Énfasis en el método: razonamiento deductivo Centrada en el método Constitucionalista Dinámica Orientada a los procesos - actos Énfasis en la toma de decisiones Centrada en las relaciones de poder La dos caras del Derecho? 2007 Javier García Marco 34
WS + Web 2.0: especialización La perspectiva legalista se centra en los contenidos y el razonamiento Mejor servida por las tecnologías de representación del conocimento y, por ende, por las de la web semántica más orientadas al procesamiento automático e inferencial. La perspectiva constitucionalista se centra en los procesos y la articulación de las relaciones de poder (al fin y al cabo relaciones sociales) Mejor servida por las tecnologías de comunicación social (web 2.0), orientadas a la potenciación de las redes sociales humanas y a su articulación 2007 Javier García Marco 35
WS + Web 2.0: complementariedad La Web Semántica legal, a pesar de su énfasis en los procesos automatizados y automatizables, es una web al servicio de redes sociales humanas La Web 2.0 requiere la racionalización de los procesos de información y asistencia automatizada en la recuperación, procesamiento e integración de la información generada. 2007 Javier García Marco 36
WS + Web 2.0: Problemas La Web 2.0 reproduce el proceso de información no estructurada característico de la Web 1.0. La web 2.0 está enormemente alejada del proyecto de la Web Semántica. En la práctica son dos proyectos independientes. Existe la posibilidad de conectar las folksonomías con los esquemas más estructurados, pero requiere no solo análisis, sino supervisión y mantenimiento. Las tecnologías de detección automática ofrecen otro acercamiento importante, pero limitado 2007 Javier García Marco 37
Ciclos de vida Un aspecto fundamental de los sistemas es el ciclo de vida, que se produce tanto en los físicoquímicos y biológicos como en los sociales. Conforman estructuras regulares aprehensibles por los seres humanos para su intervención. La asistencia a esos ciclos de vida es una cuestión fundamental de las ciencias. El ciclo de vida legislativo se parece mucho a otros ciclos sociales, como, por ejemplo, el de la evolución-revolución de la Ciencia (Toulmin, Kuhn). 2007 Javier García Marco 38
El ciclo de vida legislativo Gestación Planteamiento del problema Documentación Análisis dentro del marco legal y político Discusiones preliminares y lobbying Gestación Redacción y propuesta de borrador(es) Discusión, informes, debate y votación Nacimiento Publicación y puesta en vigor Desarrollo Aplicación Reproducción: Modificación o desarrollo de leyes, decretos, reglamentos, etc., subsidiarios Problemática Enfermedad Debate, discusión, rupturas de consensos, reequilibrio de fuerzas políticas Tratamiento Modificaciones, dictámenes interpretativos, legislación complementaria o subsidiaria Muerte Transformación, sustitución, etc. Concurrencia de múltiples actores y fuentes de información 2007 Javier García Marco 39
Fuentes que intervienen Cuerpo legislativo Legislación comparada Análisis complementarios Técnicos, sociales, demográficos, económicos En monografías, artículos, literatura gris, etc. Documentación administrativa directamente relacionada Borradores, ponencias, propuestas, actas de reuniones Impacto Medios de comunicación (prensa, TV, radio, blogs ) Encuestas Estadísticas relativas a variables sociales relevantes Sentencias Peritajes 2007 Javier García Marco 40
Tareas de carácter general Inventariar los tipos documentales por actividad Inventariar las relaciones entre los tipos documentales Crear grafos de navegación etiquetados según los tipos documentales (XLink, etc.) Desarrollar los XML Schemas para cada tipo Aplicar (y ajustar) DC para la descripción básica de los recursos de cara a su recuperación Comenzar a inventariar las relaciones (aun parciales) entre esquemas mediante RDF y, eventualmente, RDF Schemas, y desarrollar aplicaciones de interconexión 2007 Javier García Marco 41
Conclusiones Por qué la WS Más WWW Distribuida Fácil de usar (sin complicaciones técnicas) Mundial Interrelacionada Dinámica Incrementando la interoperabilidad Compartir información Integrar Mediante Procesamiento automático de datos marcados Agentes concurrentes 2007 Javier García Marco 42
Conclusiones Aplicaciones Comunicación e información Discusión entorno a la producción, uso e impacto de la documentación legislativa. Documentación y referencia Recuperación de información Navegación Conceptual A través de sumarios A través de referencias Con documentos relacionados Difusión de la información / filtrado Multilingüismo Superación de las barreras del idioma Espacialización de la información Reutilización (XSL/XSLT, etc.) y sindicación 2007 Javier García Marco 43
Conclusiones Carácter central de la IL Potencial de la información legislativa para integrar y organizar el resto de la documentación de carácter legal Por su carácter de referencia permanente Por su nivel más alto de generalidad y abstracción 2007 Javier García Marco 44
Conclusiones La cuestión social La interoperabilidad es un esfuerzo consciente y sostenido de comunidades humanas que buscan trabajar juntas Aunque se refiera a sus sistemas automatizados de información, lo social es un meta-sistema. Se requiere la construcción de proyectos y consensos, no solo de soluciones técnicas. La alianza entre científicos técnicos y sociales en torno a la informática legal es una oportunidad en esa dirección Experiencia de LEFIS El mundo de la información legislativa ofrece en este sentido grandes posibilidades de soluciones generalizables por su centralidad en la vida social. 2007 Javier García Marco 45
Conclusiones Realinear los servicios públicos La realización de la visión de la web semántica en el ámbito legislativo exige también una realineación profunda de los servicios y los agentes públicos y sociales hacia la gestión, supervisión y explotación de estas redes. 2007 Javier García Marco 46
Muchas gracias por su atención! e-mail: jgarcia/unizar.es 2007 Javier García Marco 47