SKOS y Eurovoc en los sistemas de información jurídica M. Mercedes Martínez 1, Beatriz Pérez 1, M. Luisa Alvite 2, Dámaso J. Vicente Blanco 1 1 2 Universidad de León 19 y 20 de noviembre de 2009 Índice Motivación: Nuestro contexto y el uso de Eurovoc Introducción a Eurovoc Primer análisis Introducción a SKOS Análisis y decisiones iniciales Software para tesauros Representaciones de Eurovoc con SKOS Análisis y propuesta: API para tesauros 3 1
Precedentes Prácticas docentes en la asignatura Derecho Internacional Privado Herramienta diseñada ad-hoc Conjunto de textos sobre conflicto de jurisdicción Finalidad de la aplicación: permitir a los alumnos consultar los textos seleccionados, sus relaciones, y las notas que los profesores les proporcionan 7 La herramienta docente (2) Principales características Los profesores seleccionan los textos Los profesores deciden qué comentarios y documentos verán los estudiantes 8 2
La herramienta docente (3) 9 La herramienta docente (4) La estructura de los textos está siempre disponible Profesores y estudiantes pueden navegar por ella Podrán anotar elementos del articulado Búsqueda por palabras clave Notas Notas de usuario Notas no modificables Un menú para: Abrir un texto Ver documentos relacionados y abrirlos Ver y crear notas de usuario (asociadas al documento o a elementos del articulado) 10 3
La herramienta docente (5) 11 Motivación Extensiones de la herramienta: Anotar los textos jurídicos con palabras clave (conceptos) Necesitamos: Una herramienta donde estén representados los conceptos que usan nuestros usuarios Nuestra pregunta: Ya existe alguna que podamos utilizar? Respuesta: 12 4
Índice Motivación: Nuestro contexto y el uso de Eurovoc Introducción a Eurovoc Primer análisis Introducción a SKOS Análisis y decisiones iniciales Software para tesauros Representaciones de Eurovoc con SKOS Análisis y propuesta: API para tesauros 13 Eurovoc Tesauro de la Oficina de Publicaciones de las Comunidades Europeas Estándar Multilingüe (21 lenguas oficiales) 21 campos temáticos (dominios) 127 microtesauros (subdominios) 6045 términos descriptores 7756 términos no descriptores Vivo (en constante revisión) Uso extendido Uso libre (bajo convenio) Eurovoc C.T. / Dominio nº 1... C.T. / Dominio nº 21 32 EDUCACIÓN 76 ORG. INTERNAC. Y COMUNICACIÓN Microtesauro /Subdominio... Microtesauro /Subdominio 3236 Informática y tratamiento de datos Término... Término 3027 Criminalidad informática 14 5
Eurovoc y las relaciones usadas en los tesauros 17 Índice Motivación: Nuestro contexto y el uso de Eurovoc Introducción a Eurovoc Primer análisis Introducción a SKOS Análisis y decisiones iniciales Software para tesauros Representaciones de Eurovoc con SKOS Análisis y propuesta: API para tesauros 18 6
Acceso a Eurovoc Convenio entre la UVa y la Oficina de Publicaciones de la UE CD con el tesauro en un conjunto de ficheros XML: 19 Primer análisis Cómo integrar el software que manipule el tesauro en la aplicación? Desarrollo desde cero Reutilización de software Cómo almacenar (representar) Eurovoc? 21 7
Índice Motivación: Nuestro contexto y el uso de Eurovoc Introducción a Eurovoc Primer análisis Introducción a SKOS Análisis y decisiones iniciales Software para tesauros Representaciones de Eurovoc con SKOS Análisis y propuesta: API para tesauros 23 Introducción a SKOS Integración de conocimiento usando KOS (Knowledge Organization Systems) SKOS (Simple Knowlege Organization System) Modelo de datos diseñado para compartir sistemas de organización de conocimiento en la Web [SKOSRec18Aug09] 24 8
SKOS y la codificación de tesauros para la web semántica -Economic policy -Economic cooperation -Economic integration -European economic cooperation -European industrial cooperation 25 SKOS Versión básica Conceptos identificados mediante URIs Jerarquías de conceptos Conceptos agregados bajo estructuras denominadas esquemas de conceptos (ConceptScheme) Versión avanzada Posibilidad de agrupar en colecciones (Collection) conceptos que están en distintos esquemas Posibilidad de combinar SKOS con otros modelos (clases OWL, RDF datasets, ) ex:mammals rdf:type skos:concept; skos:inscheme ex:animalthesaurus. ex:cows rdf:type skos:concept; skos:broader ex:mammals; skos:inscheme ex:animalthesaurus. ex:fish rdf:type skos:concept; skos:inscheme ex:animalthesaurus. ex:milk rdf:type skos:concept; skos:preflabel "milk"@en. ex:goatmilk rdf:type skos:concept; skos:preflabel "goat milk"@en; skos:broader ex:milk. _:b0 rdf:type skos:collection; skos:preflabel "milk by source animal"@en; skos:member ex:goatmilk. 26 9
Evolución de SKOS SKOS Simple Konwledge Organization System Reference. W3C Recommendation 18 August 2009 SKOS Simple Knowledge Organization System Reference. W3C Proposed Recommendation 15 June 2009 W3C Candidate Recommendation 17 March 2009 W3C Working Draft 29 August 2008 W3C Working Draft 9 June 2008 W3C Working Draft 25 January 2008... 2004 28 Índice Motivación: Nuestro contexto y el uso de Eurovoc Introducción a Eurovoc Primer análisis Introducción a SKOS Análisis y decisiones iniciales Software para tesauros Representaciones de Eurovoc con SKOS Análisis y propuesta: API para tesauros 30 10
Eurovoc recibido Convenio entre la Uva y la Oficina de Publicaciones de la UE CD con el tesauro en un conjunto de ficheros XML: NO SKOS 32 Decisiones iniciales Existe un software o API para tesauros? Sobre los que construir las aplicaciones que manipulen el tesauro Que soporte Eurovoc Qué formato usar para la representación de Eurovoc? a) Formato propietario XML-Eurovoc que recibimos b) SKOS 37 11
Índice Motivación: Nuestro contexto y el uso de Eurovoc Introducción a Eurovoc Primer análisis Introducción a SKOS Análisis y decisiones iniciales Software para tesauros Representaciones de Eurovoc con SKOS Análisis y propuesta: API para tesauros 39 Software para tesauros Qué queremos: Una herramienta genérica que podamos reutilizar para construir nuestras aplicaciones cuando usemos tesauros Evaluación de software: Libre distribución Criterios de evaluación: Funcionalidad Herramientas conceptuales soportadas Integrabilidad Formatos de representación de tesauros (SKOS/RDF, otros) Distribución como software reutilizable (paquetes, servicios) 40 12
Software para tesauros Pruebas realizadas Crear un tesauro Insertar conceptos, relaciones y notas Insertar un concepto simultáneamente como BT y NT del mismo concepto Buscar conceptos Importar un tesauro Exportar un tesauro Software evaluado: ThManager, TemaTres, Term Tree, PoolParty 41 Análisis Integrabilidad en el nivel de la información Prácticamente todos permiten importar / exportar tesauros RDF/SKOS no está soportado por todos, pero gana posiciones Integrabilidad del software No hay un paquete, ni API, genérica que podamos reutilizar Sólo PoolParty aborda la reutilización usando servicios web 44 13
Índice Motivación: Nuestro contexto y el uso de Eurovoc Introducción a Eurovoc Primer análisis Introducción a SKOS Análisis y decisiones iniciales Software para tesauros Representaciones de Eurovoc con SKOS Análisis y propuesta: API para tesauros 46 Representaciones de Eurovoc con SKOS Representar dominios y microtesauros con esquemas de conceptos (ConceptScheme). Enlazarlos con propiedades OWL creadas ad-hoc [Polo2008] Representar los dominios como colecciones de esquemas conceptuales (Collection) [Faro2008] Representación de la Oficina de Publicaciones de la UE 47 14
Versión Polo2008 Representar dominios y microtesauros con esquemas de conceptos (ConceptScheme). Enlazarlos con propiedades OWL creadas adhoc. Eurovoc Dominio ConceptScheme... ConceptScheme Microtesauro ConceptScheme... ConceptScheme Concepto Concept... Concept 49 Versión Faro2008 Representar los dominios como colecciones de esquemas conceptuales (Collection) Eurovoc Dominio Collection... Collection Microtesauro ConceptScheme... ConceptScheme Concepto Concept... Concept 52 15
Comparación Ambas se ajustan a los Working Draft anteriores a enero de 2009 Diferencias: Polo2008 Faro2008 Eurovoc Eurovoc ConceptScheme... ConceptScheme Collection... Collection ConceptScheme... ConceptScheme ConceptScheme... ConceptScheme Concept... Concept Concept... Concept 54 Versión de la Oficina de Publicaciones Elaboración reciente Adaptada la Recomendación SKOS de 18 de agosto de 2009 Aún no disponible 55 16
Índice Motivación: Nuestro contexto y el uso de Eurovoc Introducción a Eurovoc Primer análisis Introducción a SKOS Análisis y decisiones iniciales Software para tesauros Representaciones de Eurovoc con SKOS Análisis y propuesta: API para tesauros 56 Análisis (I) La SKOS Recommendation de agosto de 2009 y los Working Draft anteriores de SKOS difieren en la definición de los conceptos Collection y ConceptScheme La nueva versión ya no permite que una Collection tenga como elementos ConceptSchemes Consecuencia: Algunas propuestas (Faro2008) no se ajustan a la versión más reciente de SKOS Otras propuestas extienden SKOS (Polo2008). Aunque quizás ya no sea necesario? 57 17
Objetivos actuales API genérica para tesauros Software que la implemente distribuido como biblioteca Utilización de SKOS para representar Eurovoc Uso del software y el tesauro para extender la aplicación docente 59 Planificación Tareas: a) Selección de colecciones b) Representación de Eurovoc con SKOS c) API para tesauros y desarrollo del software d) Uso en la aplicación docente y pruebas e) Revisión y mejoras 60 18
SKOS y Eurovoc en los sistemas de información jurídica M. Mercedes Martínez 1, Beatriz Pérez 1, M. Luisa Alvite 2, Dámaso J. Vicente Blanco 1 1 2 Universidad de León 19 y 20 de noviembre de 2009 19