Introducción a las Bases de Datos Documentales Bases de Datos Documentales Curso 2013/2014 Miguel Ángel Rodríguez Luaces Laboratorio de Bases de Datos Universidade da Coruña
Objetivos En esta sección responderemos a estas preguntas: Para qué sirve una base de datos? Por qué no sigo utilizando el fichero de toda la vida? Por qué no utilizo Excel, que es más fácil? Qué es una base de datos documental? Qué voy a aprender a hacer el resto del curso?
Cómo empezó todo Cuando yo era (más) joven...
Cómo empezó todo Los problemas de todo eso son: Consultar el catálogo es muy costoso Mantener el catálogo es más costoso todavía Como se te caiga un cajón de fichas al suelo... Los documentos se deterioran Los lectores subrayan el libro... El vecino de arriba se olvidó de cerrar el grifo... Los bocadillos de chorizo son un riesgo... Para encontrar algo tengo que leerme todo el libro
La primera solución Usemos un ordenador para almacenar la información. Lo más cómodo sería: Usamos unas tablas (Excel) para el catálogo Escaneamos todos los libros en PDF La situación sería algo como:
La primera solución Los ficheros de Excel resultantes serían: Matrícula Usuarios
La primera solución Los ficheros de Excel resultantes serían (y 2): Catálogo Préstamo
La primera solución Esta solución presenta bastantes problemas: Redundancia: información repetida Inconsistencia: información incoherente Aislamiento: no es posible saber qué tienen otros Dificultad de acceso: Los ficheros están repartidos Consultarlos es muy complicado Integridad de la información: no hay validación Acceso concurrente: y si hay dos bibliotecarios? Atomicidad: y si tengo que cambiar dos ficheros y sólo lo hago en uno? Seguridad: y si Windows se come el fichero?
La primera solución Tener los documentos guardados como ficheros PDF en un disco duro enorme también presenta problemas: Dificultad de acceso El acceso concurrente es complicado No puedo hacer búsquedas Aislamiento No hay conexión con el catálogo Y realmente, todos los problemas de la diapositiva anterior
La solución buena La solución buena es utilizar un sistema gestor de bases de datos Contra la redundancia y el aislamiento: Centralización de los datos Contra la dificultad de acceso: Interfaces de acceso a la información Lenguajes de consulta Contra la integridad: Restricciones de integridad (validaciones) Contra los problemas de concurrencia: Gestión de usuarios y bloqueos de datos Para la seguridad: Poĺıticas de copias de seguridad
La solución buena Para almacenar los documentos, la solución buena es utilizar un SGBD documental Los PDFs no son independientes, sino que su texto está almacenado en la BD El SGBD permite hacer consultas al texto de los documentos Los PDFs se pueden localizar a partir del catálogo
Ejemplos de BD Documental Ya conocemos bastantes BD documentales: Cualquier OPAC de cualquier biblioteca http://kmelot.biblioteca.udc.es/search*spi Biblioteca Virtual Galega http://bvg.udc.es Biblioteca Digital Siglo de Oro http://www.bidiso.es Google Books http://books.google.es
Ejemplos de BD Documental BD del OPAC de la UDC
Ejemplos de BD Documental Biblioteca Virtual Galega
Ejemplos de BD Documental Biblioteca Digital Siglo de Oro
Características de las BD Doc. Podemos clasificar las BD Doc. por su contenido Referenciales: información del documento, pero no su contenido. Ej: la BD del OPAC De texto completo: contiene el texto del documento y permite búsquedas por contenido. Ej: la BD de la BVG Con reproducción del documento: contiene las páginas escaneadas. Ej: la BD de la hemeroteca de la RAG
Características de las BD Doc. En base al modelo de tratamiento documental: BD de sumarios (sin análisis del contenido) Catálogo de biblioteca (según normas internacionales) Análisis documental completo: Descriptores Palabras clave Texto completo
Características de las BD Doc. Otras clasificaciones: Por modo de acceso Por cobertura temática Por cobertura documental Etc. Una categorización completa se puede leer en el siguiente artículo. RODRÍGUEZ YUNTA, Luis. Bases de datos documentales: estructura y uso. En: MALDONADO, Ángeles (coord.). La información especializada en Internet. Madrid: CINDOC, 2001
Contenido del curso Aprenderemos a diseñar bases de datos siguiendo este proceso: Selección del dominio (minimundo) Análisis de requisitos Descripción en texto Diseño Conceptual Modelo Entidad-Relación Diagrama Entidad-Relación Diseño Lóxico Modelo Relacional Tablas: Emp(DNI, Nome, ) Dept(NumDep, Nome, ) Esquema Relacional Diseño Físico Sistema Gestor de BD Esquema Físico de la Base de Datos
docid 43 56 115 amor {15, 25} { } { } correr {200, 1303} {190, 2006} { } Zapato { } { } {115, 303} Bases de Datos Documentales Contenido del curso Aprenderemos a extraer información de la BD Lenguaje de consulta universal: SQL Aprenderemos cómo funciona una BD Documental En un lugar de La Mancha... Introducción de la información En un lugar de La Mancha... Clasificación de documentos Documentos en papel Documentos digitales Documentos clasificados Almacenamiento de la información Creación de consultas Interfaces de usuario Métodos de búsqueda Base de Datos e Índice
Contenido del curso Aprenderemos como marcar documentos para su procesado automático: XML Metadatos: Dublin Core Catálogo: MarcXML
Resumen Para qué sirve una base de datos? Para almacenar información de forma estructurada y eficiente y recuperarla de forma eficaz Por qué no sigo utilizando el fichero de toda la vida? Por qué no utilizo Excel, que es más fácil? Por que las bases de datos proporcionan muchas ventajas (sin redundancia, sin inconsistencia, múltiples usuarios, seguridad, etc.)
Resumen Qué es una base de datos documental? Una base de datos que almacena documentos. Hay muchos tipos, en función de cómo se almacena, del tipo de documento, etc. Qué voy a aprender a hacer el resto del curso? A diseñar bases de datos A extraer información de ellas Cómo funcionan las bases de datos documentales Como marcar documentos con XML
Introducción a las Bases de Datos Documentales Bases de Datos Documentales Curso 2013/2014 Miguel Ángel Rodríguez Luaces Laboratorio de Bases de Datos Universidade da Coruña