Base de Datos Distribuidas

Documentos relacionados
BASE DE DATOS DISTRIBUIDAS MIS

Sistemas Distribuidos. Bibliografía: Introducción a los Sistemas de Bases de Datos Date, C.J.

Capítulo 10. Bases de datos distribuidas

Unidad II Diseño de bases de datos distribuidas. 2.1 Consideraciones de diseño de bases de datos distribuidas.

BASES DE DATOS DISTRIBUIDAS

BASES DE DATOS AVANZADAS. Facultad de Estadística e Informática

TÍTULO: BASES DE DATOS Disponibilidad Objetivos 5 Definicion de una base de datos 9 Datos de nomina (tabla) 9 Esquema de bases de datos (mapa

Bases de Datos Distribuidas

Sistemas Gestores de Base de Datos Distribuidas

Tema 5: Conceptos de Diseño en Archivos y Bases de Datos. Ing. Elizabeth Guerrero

6.1 Base De Datos Centralizada

Bases de Datos Distribuidas -Panorama General

IFCD0111 Programación en Lenguajes Estructurados de Aplicaciones de Gestión

Bases de Datos OTROS ASPECTOS MODELO E-R

El ciclo de vida de un sistema de información

BASES DE DATOS TEMA 1 PERSPECTIVA DEL ÁREA DE BASES DE DATOS

Programación en Lenguajes Estructurados de Aplicaciones de Gestión. Certificados de profesionalidad

Bases de Datos: Bases de Datos Distribuidas. Departamento de O.E.I. - U.P.M.

BASE DE DATOS DISTRIBUIDOS

5. Bases de datos distribuidas

UNIDAD I. Universidad del Zulia Costa Oriental del Lago. Conceptos Básicos

Técnico en Sistemas de Almacenamiento

FUNDAMENTOS DE BASES DE DATOS TEMA 4. Metodología de desarrollo de Bases de Datos

BASES DE DATOS TEMA 1. Introducción a las Bases de Datos

Sistemas de Bases de Datos

Bases de Datos Distribuidas. Carlos A. Olarte BDII

Diseño y construcción de bases de datos distribuidas heterogéneas sobre Oracle y SQL Server

Definiciones Básicas

Diseño de bases de datos. Informática Aplicada Grado en GAP Fac. de Admón. y Dir. de Empresas Univ. Politécnica de Valencia

Bases de Datos Paralelas. Carlos A. Olarte BDII

Gestion y Modelación de Datos Introducción

Cliente- Servidor. Bases de Datos Distribuidas

Arquitectura de Manejadores de Base de Datos

Curso: Base de Datos Distribuidas. Unidad 1: Fundamentos de Sistemas de Base de Datos Distribuidas. M. en C. José Mario Martínez Castro

Definimos un Sistema Gestor de Bases de Datos o SGBD, también llamado DBMS (Data Base Management System) como una colección de datos relacionados entr

FUNDAMENTOS DE BASES DE DATOS TEMA 3

Bases de datos Unidad 1 Introducción a las BD. Mónica María Rojas Rincón Oficina: P19-103

Tema I: Introducción a las bases de datos. Curso Introducción a las bases de datos.

Grandes de Bases de Datos. Alta disponibilidad Implementaciones

Actividad 1.2. Cuestionario sobre SGBD (2ª parte)

Guía del Curso Curso de Bases de Datos Relacionales

Curso Developing Microsoft SQL Server 2014 Databases (20464)

Esquema Lógico F1. EXAMEN 1 de diciembre de EQUIPO (NOMBRE:cadena) CP (NOMBRE) DIRECTOR (NOMBRE:cadena) CP (NOMBRE)

Bases de Datos: Introducción

Ing. Informática. Catedrático: Lic. Angélica Avalos Cano

UNIDAD4. 1. Procedimentales 2. No Procedimentales

Concepto. 1963, en un simposio celebrado en California, USA. Conjunto de información relacionada que se encuentra agrupada ó estructurada.

1. Introducción 2. S.O. de Red. NFS 3. S.O. Distribuidos 4. Características de Diseño. Tema5: Sistemas Operativos Distribuidos

BASES DE DATOS (IG18 Semipresencial) Introducción a las Bases de Datos: Sistemas de Bases de Datos frente a Sistemas de Ficheros

Bases de Datos Especializadas

Bases de datos distribuidas Fernando Berzal,

NÚMERO DE HORAS: 160H PROGRAMACIÓN WEB EN EL ENTORNO CLIENTE OBJETIVO

MS_20464 Developing Microsoft SQL Server Databases

Bases de datos. Diseño y gestión

DIPLOMADO EN MICROSOFT SQL SERVER 2008

Introducción a las Bases de Datos

Facultad de Ingeniería Industrial y de Sistemas v1.0 MA781U PROCESOS DISTRIBUIDOS

20464 Desarrollo de bases de datos Microsoft SQL Server 2014

LENGUAJES DE DEFINICIÓN Y MODIFICACIÓN DE DATOS SQL 60h

PROCEDIMIENTOS ALMACENADOS

Sistemas de Información para la Gestión

Administración de Archivos

Unidad I. Introducción a las Bases de Datos

Qué es SGBD? Mencionar 4 tipos de SGBD. SGBD de red. Román Gutiérrez Sosa. SGBD jerárquicos. Modelo de datos relacionales.

Taxonomía de las arquitecturas

Con estas consideraciones, Flynn clasifica los sistemas en cuatro categorías:

BASES DE DATOS DISTRIBUIDAS MIS

FUNDAMENTOS DE BASE DE DATOS. Introducción

Fundamentos de Bases de Datos

ARQUITECTURAS. Carlos Reveco D. IN73J Arquitectura, Diseño y Construcción de un Negocio con Apoyo TI.

IFCD0210 Desarrollo de Aplicaciones con Tecnologías Web

Gestion y Modelación de Datos Sistemas de Información, Sistemas de BD

Mantener una base de datos de Microsoft SQL Server 2008 R2. Fabricante: Microsoft Grupo: Bases de Datos Subgrupo: Microsoft SQL Server 2008

El Sistema Gestor de Base de Datos (DBMS)

CONVENCIONES USADAS...

SGBD. Gestión y Modelación de Datos. María Constanza Pabón

Módulo 1. Introducción a la Base de Datos

Administración de un SGBD relacional

Introducción a los sistemas operativos. Ing Esp Pedro Alberto Arias Quintero

Sistemas Distribuidos. Soporte de Sistemas Operativos

Diseño de Bases de Datos Relacionales. Febrero de 2013

Transcripción:

Base de Datos Distribuidas Benjamín Martínez Martínez Benja_min_15@hotmail.com

Base de Datos Distribuidas México Db2 Monterrey Microsoft Access Red de comunicaciones Guerrero Chiapas SqlServer Oaxaca MySql Postgres

Conceptos básicos BDD Base de Datos Distribuidas Es un conjunto de múltiples bases de datos lógicamente relacionadas las cuales se encuentran distribuidas entre diferentes sitios interconectados por una red de comunicaciones SBDD Sistema de Base de Datos Distribuida Es un sistema en el cual múltiples sitios de bases de datos están ligados por un sistema de comunicaciones, de tal forma que, un usuario en cualquier sitio puede accesar los datos en cualquier parte de la red exactamente como si los datos estuvieran almacenados en su sitio propio

Continuación SMBDD Un sistema de manejo de bases de datos distribuidas Es aquel que se encarga del manejo de la BDD y proporciona un mecanismo de acceso que hace que la distribución sea transparente a los usuarios. El término transparente significa que la aplicación trabajaría, desde un punto de vista lógico, como si un solo SMBD ejecutado en una sola máquina, administrara esos datos. SBDD Un sistema de base de datos distribuida Es entonces el resultado de la integración de una base de datos distribuida con un sistema para su manejo.

Objetivos de las BDD Autonomía local. Independencia de un sitio central. Operación continua. Transparencia de Localización. Transparencia de Fragmentación Transparencia de repetición. Procesamiento distribuido de consultas. Procesamiento de transacciones distribuidas. Transparencia de "hardware". Transparencia de Sistema operativo Transparencia de red. Transparencia de SMBD

Disciplinas de estudio Los ambientes en los que se encuentra con mayor frecuencia el uso de las bases de datos distribuidas son: Cualquier organización que tiene una estructura descentralizada. Casos típicos de lo anterior son: organismos gubernamentales y/o de servicio público. La industria de la manufactura, particularmente, aquella con plantas múltiples. Por ejemplo, la industria automotriz. Aplicaciones de control y comando militar. Líneas de transportación aérea. Cadenas hoteleras. Servicios bancarios y financieros.

Arquitectura de BDD Arquitecturas de memoria compartida. Consisten de diversos procesadores los cuales accesan una misma memoria y un misma unidad de almacenamiento (uno o varios discos). Algunos ejemplos de este tipo son las computadoras Sequent Encore y los mainframes IBM4090 y Bull DPS8 (Figura 1) P 1 P n M Figura 1. Arquitectura de memoria compartida BD P n Procesador M Memoria

Continuación Arquitecturas de disco compartido Consiste de diversos procesadores cada uno de ellos con su memoria local pero compartiendo una misma unidad de almacenamiento (uno o varios discos). Ejemplos de estas arquitecturas son los cluster de Digital, y los modelos IMS/VS Data Sharing de IBM P 1 P n BD BD BD M 1 M n P n Procesador M Memoria Figura 2. Arquitectura de disco compartido

Continuación Arquitecturas nada compartido Consiste de diversos procesadores cada uno con su propia memoria y su propia unidad de almacenamiento. Aquí se tienen los clusters de estaciones de trabajo, la computadoras Intel Paragon, NCR 3600 y 3700 e IBM SP2 P 1 M 1 BD BDBD P n M n BD BDBD P n Procesador M Memoria Figura 3. Arquitectura nada compartido

Diseño de BDD

Consideraciones de Diseño de BDD Existen varios factores relacionados a la construcción de bases de datos distribuidas que no se presentan en bases de datos centralizadas. Entre los más importantes se encuentran los siguientes: 1 2 3 1 Diseño de la Base de Datos Distribuida (unidad II) Procesamiento de consultas (Unidad III) Control de concurrencia (Unidad IV) Confiablidad (Unidad IV)

Diseño de la BDD En el diseño de bases de datos distribuidas se debe considerar el problema de como distribuir la información entre diferentes sitios. Existen razones organizacionales las cuales determinan en gran medida lo anterior. Sin embargo, cuando se busca eficiencia en el acceso a la información, se deben abordar dos problemas relacionados. Primero, como fragmentar la información. Segundo, como asignar cada fragmento entre los diferentes sitios de la red.

Continuación En el diseño de la BDD también es importante considerar si la información está replicada, es decir, si existen copias múltiples del mismo dato y, en este caso, como mantener la consistencia de la información. Finalmente, una parte importante en el diseño de una BDD se refiere al manejo del directorio. Si existen únicamente usuarios globales, se debe manejar un solo directorio global. Sin embargo, si existen también usuarios locales, el directorio combina información local con información global

La organización de los sistemas de Base de Datos Distribuidas se puede analizar en 3 dimensiones: Modo de Acceso Estático Dinámico Datos y programas Datos Información Parcial Información total Nivel de Conocimiento Compartición

Nivel de conocimiento Nivel de Compartición Inexistente Compartición De datos Compartición de datos y programas Cada aplicación y sus datos se ejecutan en una máquina sin comunicación con otros programas o datos Cada máquina posee sus propias aplicaciones locales pero se comparten los datos Las aplicaciones locales en una máquina pueden invocar servicios en otras y además comparten los datos Características de acceso Estático Dinámico El modelo de acceso a los datos no varía con el tiempo El modelo de acceso a los datos varía con el tiempo Sin información Con información parcial Con información total Los diseñadores no tienen información de cómo acceden los usuarios a los datos Los diseñadores no poseen toda la información de cómo acceden los usuarios a los datos Los diseñadores poseen toda la información de cómo acceden los usuarios a los datos

Estrategias de Diseño Las estrategias son las utilizadas en una BD relacional, pero añadiendo un pasode diseño de la distribución A la hora de abordar el diseño de una Base de Datos Distribuida podremos optar principalmente por dos tipos de estrategias: la estrategia ascendente (botton-up) y la estrategia descendente(top-down)

La estrategia ascendente (botton-up). En este caso se partirá de los esquemas conceptuales locales y se trabajaría para llegar a conseguir el esquema conceptual global. Después se pasaría al diseño de distribución. Esta estrategia suele ser utilizada para integrar varias bases de datos centralizadas existentes. la estrategia descendente(top-down). Se parte de cero y se avanza en el desarrollo del trabajo. Los pasos a realizar mediante esta estrategia son: Análisis de requisitos Diseño de Vistas Diseño conceptual Diseño de la distribución Fragmentación Asignación Diseño físico Monitorización y ajuste

Diccionario de Datos Es el lugar donde se deposita información acerca de todos los datos que forman la BD. Es una guía en la que se describe la BD y los objetos que la forman. El diccionario contiene las características lógicas de los sitios donde se almacenan los datos del sistema, incluyendo nombre, descripción, alias, contenido y organización. Identifica los procesos donde se emplean los datos y los sitios donde se necesita el acceso inmediato a la información

En una BD relacional, el diccionario de datos proporciona información acerca de: La estructura lógica y física de la BD. Las definiciones de todos los objetos de la BD: tablas, vistas, índices, disparadores, procedimientos, funciones, etcétera. El espacio asignado y utilizado por los objetos. Los valores por defecto de las columnas de las tablas. Información acerca de las restricciones de integridad. Los privilegios y roles otorgados a los usuarios. Auditoría de información, como los accesos a los objetos.

Un diccionario de datos debe cumplir las siguientes características: Debe soportar las descripciones de los modelos conceptual, lógico, interno y externo de la BD. Debe estar integrado dentro del SGBD. Debe apoyar la transferencia eficiente de información al SGDB. La conexión entre los modelos interno y externo debe ser realizada en tiempo de ejecución. Debe comenzar con la reorganización de versiones de producción de la BD. Además debe reflejar los cambios en la descripción de la BD. Cualquier cambio a la descripción de programas ha de ser reflejado automáticamente en la librería de descripción de programas con la ayuda del diccionario de datos. Debe estar almacenado en un medio de almacenamiento con acceso directo para la fácil recuperación de información

Niveles de Transparencia La transparencia se puede entender como la separación de la semántica de alto nivel de un sistema de las aspectos de bajo nivel relacionados a la implementación del mismo. Un nivel de transparencia adecuado permite ocultar los detalles de implementación a las capas de alto nivel de un sistema y a otros usuarios

Niveles de Transparencia

Fragmentación de datos Horizontal Consiste del particionamiento en tuplas de una relación global en subconjuntos, donde cada subconjunto puede contener datos que tienen propiedades comunes y se puede definir expresando cada fragmento como una operación de selección sobre la relación global Vertical La fragmentación vertical es la subdivisión de atributos en grupos. Los fragmentos se obtienen proyectando la relación global sobre cada grupo

Distribución de datos Describe el proceso de decidir dónde localizar los datos. Las estrategias que se tienen son: Colocación centralizada de los datos, toda la base de datos se guarda en un sitio. Colocación particionada de los datos, la base de datos se divide en varias partes desarticuladas (fragmentos) y seguardan en varios sitios. Colocación replicada de los datos, se guardan copias de uno o más fragmentos de la base de datos en varios sitios.

Continuación La distribución de los datos se logra mediante la partición de los datos, replicación de los datos o mediante una combinación de ambas. La colocación de los datos está estrechamente relacionada en como la BD se divide o fragmenta. La colocación de los datos ve qué datos localizar y en dónde

Continuación Los algoritmos de colocación de los datos consideran varios factores, incluidos: Objetivos de desempeño y disponibilidad de los datos. Tamaño, número de filas y el número de relaciones que una entidad mantiene con otras entidades. Tipos de transacciones a ser aplicadas a la base de datos. Los atributos accesados por cada una de las transacciones.

Replicación de datos Se refiere al almacenamiento de copias de datos en sitios múltiples, puede ser para satisfacer requerimientos de información, además de mejorar la disponibilidad de los datos y el tiempo respuesta; finalmente estas copias reducen los costos de comunicación y de consulta totales Los datos replicados se someten a la regla de consistencia mutua, la cual requiere que todas las copias de fragmentos de datos sean idénticas, esto quiere decir que cuando hay una actualización de la base de datos se realiza en todos los sitios donde hay réplicas

Continuación Existen tres escenarios de replicación: Base de datos totalmente replicada, guarda varias copias de cada fragmento de la base de datos en varios sitios. No es práctica debido la cantidad de carga impuesta al sistema. Base de datos parcialmente replicada, guarda múltiples copias de algunos fragmentos de la base de datos en múltiples sitios. Se tiene un buen manejo Base de datos no replicada, guarda cada fragmento de base de datos en un solo sitio.

Procesamiento de consultas distribuidas

Metodología del procesamiento de consultas distribuidas. El procesamiento de consultas tiene como objetivo principal transformar una consulta escrita en un lenguaje de alto nivel (SQL) en una estrategia de ejecución correcta y eficiente expresada en un lenguaje de bajo nivel (algebra relacional) y ejecutar la estrategia para extraer los datos requeridos

Cuáles son las faces típicas del procesamiento de consultas? Descomposición (Análisis sintáctico y validación) Optimización Generación de código Ejecución

Cuáles son las etapas típicas de la descomposición de consultas? Análisis Normalización Análisis semántico Simplificación Reestructuración de la consulta

Estrategias de procesamiento de consultas distribuidas. El sistema debe de ser capaz de procesar consultas que hagan referencia a datos situados a mas de un nodo

Calcular una única vez las expresiones posibles Estrategias de procesamiento Realizar las operaciones de selección lo antes posible Combinar el producto cartesiano con una operación de selección subsiguiente cuyo predicado represente una condición de combinación, para formar una operación de combinación Utilizar la asociatividad de las operaciones binarias para reordenar los nodos hoja de modo que los nodos hoja con las operaciones de selección más restrictivas se ejecuten primero Realizar las operaciones de proyección lo antes posible

Benja_min_15@hotmail.com