Base de Datos Distribuidas

Documentos relacionados
Bases de Datos Distribuidas. Carlos A. Olarte BDII

BASES DE DATOS AVANZADAS. Facultad de Estadística e Informática

6.1 Base De Datos Centralizada

Bases de Datos: Bases de Datos Distribuidas. Departamento de O.E.I. - U.P.M.

BASE DE DATOS DISTRIBUIDOS

Base de Datos Distribuidas

ARQUITECTURAS. Carlos Reveco D. IN73J Arquitectura, Diseño y Construcción de un Negocio con Apoyo TI.

1. Introducción 2. S.O. de Red. NFS 3. S.O. Distribuidos 4. Características de Diseño. Tema5: Sistemas Operativos Distribuidos

Grandes de Bases de Datos. Alto desempeño Clústers

BASES DE DATOS DISTRIBUIDAS CYNTHIA ARRIETA BIAIDYS BARRAZA JOHANA GUERRERO CARY LUZ PEREA

Capítulo 10. Bases de datos distribuidas

Ing. Informática. Catedrático: Lic. Angélica Avalos Cano

Sistemas Distribuidos. Bibliografía: Introducción a los Sistemas de Bases de Datos Date, C.J.

Consistencia y Replicación

Sistemas Gestores de Base de Datos Distribuidas

BASES DE DATOS DISTRIBUIDAS

CAPITULO 6. Control de Concurrencia y Recuperación

BASES DE DATOS DISTRIBUIDAS

POLITICA DE SEGURIDAD DE LA INFORMACION INDEA INGENIERIA DE APLICACIONES S.L

Unidad II Diseño de bases de datos distribuidas. 2.1 Consideraciones de diseño de bases de datos distribuidas.

UNIDAD II: FUNDAMENTOS AVANZADOS HARDWARE PARA SERVIDORES.

BASES DE DATOS AVANZADAS. Facultad de Estadística e Informática

TEMA 10 INTRODUCCIÓN A LOS SISTEMAS OPERATIVOS DISTRIBUIDOS. Introducción Hardware Software Aspectos de diseño

Respaldos y Recuperación

TEMA 9. SISTEMAS OPERATIVOS DISTRIBUIDOS

Actividad Final HERRAMIENTAS TECNOLÓGICAS DE PRODUCTIVIDAD. Licenciatura en Educación

PROCESAMIENTO DISTRIBUIDO

Introducción a los sistemas distribuidos. Jorge Iván Meza Martínez

Diseño de Sistemas Distribuidos Máster en Ciencia y Tecnología Informática Curso Presentación e introducción

Sistemas Operativos Distribuidos. Sistemas Operativos Una visión aplicada

Instrumentación n / Ing. Quirino Jimenez D.

Proceso de Implementación de actividades de Control en las Unidades de Tecnología de la Información

Módulo 6 Sistemas de Archivos en Sistemas Distribuidos y Nombres

Replicación y sincronización de sucursales

Tema 2. GENERALIDADES SOBRE SISTEMAS OPERATIVOS 1, MAQUINA DESNUDA.

INSTITUTO POLITÉCNICO NACIONAL SECRETARÍA ACADÉMICA DIRECCIÓN DE EDUCACIÓN SUPERIOR PROGRAMA SINTÉTICO

Anexo III COBIT. Relaciones de los Objetivos de Control Dominios, Procesos y Objetivos de Control

COBIT 4.1. Adquirir e Implementar AI2 Adquirir y Mantener Software Aplicativo By Juan Antonio Vásquez

PROGRAMA DE ESTUDIOS POR COMPETENCIAS INSTALACIÓN, CONFIGURACIÓN Y COMUNICACIÓN DE SISTEMAS OPERATIVOS

Carrera: ISC. ARM ISC. Erick Dalet Villanueva Mascort. ISC. Arturo Guerra Franco. Asignaturas Temas Asignaturas Temas Sistemas Operativos.

INDICE Prefacio Capitulo 1: Introducción Parte Primeras: modelos de datos Capitulo 2: Modelos entidad-relación Capitulo 3: El modelo relacional

IMPLANTACIÓN DE SISTEMAS OPERATIVOS

Sistemas Distribuidos

COORDINACIÓN GENERAL DE TECNOLOGÍAS DE INFORMACIÓN PROCEDIMIENTO DE RESPALDO DE INFORMACIÓN DEL DEPARTAMENTO DE SISTEMAS DE INFORMACIÓN

RIESGO TECNOLÓGICO EN LA ACTIVIDAD ASEGURADORA

Pruebas de Software. Escuela de Ingeniería de Sistemas y Computación Desarrollo de Software II Agosto Diciembre 2008

REPOSITORIOS EN LA NUBE

5. Bases de datos distribuidas

GOBIERNO ELECTRÓNICO HERRAMIENTAS PARA LA CONSTRUCCIÓN DE LA BOLIVIA DIGITAL

3. MODELO DE SISTEMA DE MEMORIA ORGANIZACIONAL

COMPUTACIÓN DE ALTA PERFORMANCE 2013

El ciclo de vida de un sistema de información

Bases de Datos Paralelas. Carlos A. Olarte BDII

Actividad 1.2. Cuestionario sobre SGBD (2ª parte)

Responda a las siguientes preguntas cortas justificando

CONCEPTO DE AUDITORIA EN INFORMÁTICA

Ingeniería de Sistemas. Objetivos. Que es un Sistema? Tópicos. Ingeniería de Software y Sistemas. Problemas con la Ingeniería de Sistemas

Protocolos de bloqueo en bases de datos distribuidas

ISO GAP ANALYSIS

Capitulo 2. Políticas, Planes y Procedimientos de seguridad.

Transcripción:

Base de Datos Distribuidas Prof. José Alejandro Reyes Ortiz REPLICACIÓN

Base de datos fragmentada de un hospital

Objetivos de la sesión Al finalizar la sesión, deberán ser capaces de: Definir el concepto de replicación de base de datos distribuidas. Identificar y explicarlos tipos de replicación. Identificar y explicar las ventajas y desventajas de la replicación. Explicar los modelos de replicación activa y pasiva.

A qué se refiere la replicación En base de datos distribuidas se refiere al almacenamiento de copias en múltiples sitios (servidores) por una red de computadoras Pueden guardarse copias en varios sitios para satisfacer requerimientos de información específicos.

Cómo se lleva a cabo la replicación? Una base de datos distribuida, estádividida o fragmentada. Un tipo de fragmentación se presenta a nivel de los datos. Base de datos centralizada Base de datos distribuida C2 σ ciudad= QRO (Clientes) Clientes (C) C1 σ ciudad= MEX (Clientes) C3 σ ciudad= GDL (Clientes)

Cómo se lleva a cabo la replicación? La base de datos Clientes (C) está divida en tres fragmentos: C1, C2, C3. La replicación en una base de datos distribuida implica que C2 y C1 se almacenan en el sitio México, mientras que en Querétaro se almacenan los fragmentos C2 y C3. C2 C3 C1 C2 C3 Base de datos distribuida replicada

Regla en la replicación Los datos replicados se deben someter a la regla de consistencia mutua, la cual requiere que todas las copias de fragmentosde datos seanidénticas. Para mantener la consistencia de los datos entre replicas, se debe garantizar la actualización de la base de datos entodos los sitios donde existen replicas. Una operación read (lectura) selecciona cualquier copia (de preferencia la más cercana) para satisfacer la transacción. Una operación write (escritura) requiere que todas las copias se seleccionen y actualicen para satisfacer la regla de consistencia muta.

Tipos de replicación Una base de datos distribuida totalmente replicada guarda copias de todos los fragmento de la base de datos en múltiples sitios. Una base de datos distribuida parcialmente replicada guarda copias de algunos fragmentos de la base de datos en múltiples sitios. Una base de datos distribuida no replicada guarda cada fragmento de base de datos en un solo sitio.

C2 C3 C1 C2 C3 Base de datos distribuida parcialmente replicada C1 C2 C3 C1 C2 C3 C1 C2 C3 Base de datos distribuida totalmente replicada C2 Base de datos distribuida no replicada C1 C3

Comparación de las características en las estrategias de replicación Replicación total Replicación parcial No replicada Paralelismo Muy alto Alto Bajo Disponibilidad Muy alta Alta Baja Costo Elevado Moderado Bajo Riesgo de pérdida de datos Bajo Medio Alta Realidad Aplicación posible Realista Aplicación posible

Factores para la replicación Varios factores influyen en la decisión de utilizar replicación de datos: Tamaño de la base de datos Frecuencia de uso. Costo desempeño. Considerar el costo del software de coordinación, transacciones, replicación y software de administración de las base de datos.

Ventajas de la replicación Mayor disponibilidad. El fragmento F i sitios. puede encontrase en varios Confiabilidad. Seguir respondiendo a pesar del fallo de un sitio. Paralelismo incrementado. En caso de que el acceso al fragmento F i sea de sólo lectura, varios sitios pueden procesar, en paralelo, las lecturas que impliquen a F i. Cuantas más replicas de F i haya mayor será las disponibilidad de que los datos se encuentren en el sitio que los solicitó.

Desventajas de la replicación Sobrecarga durante la actualización. Se debe asegurar la consistencia mutua, en caso contrario, pueden producirse cómputos erróneos. Para ello, se debe propagar la actualización a todos los sitios que contienen réplicas. Mayor tiempo de procesamiento: el intercambio de mensajes hacia las réplicas y los cálculos adicionales suponen una forma de tiempo extra que debe ser considerada. Costos Costos del desarrollo de software: es necesario un software para la administración de la replicación. Costos de almacenamiento de las réplicas. Costos de procesamiento.

Disponibilidad de un Sistema de Bases de Datos Distribuidas La proporción de tiempo que un sistema está accesible con tiempos de respuesta razonables se le conoce como disponibilidad. La disponibilidad debe ser cercana al 100%. Factores de pérdida de disponibilidad Fallos en el servidor Particiones de red o desconexiones Desconexión intencionada o no intencionada.

Disponibilidad de un Sistema de Bases de Datos Distribuidas Fallos enel servidorde base de datos distribuidas Si un servidor tiene una posibilidad de fallo p del 5%, tendrá disponibilidad del 95% Si replicamos n vecesel servidor, ladisponibilidad será 1-p n Con n=2 servidores: 1-0.05 2 = 99.75%

Disponibilidad de un Sistema de Bases de Datos Distribuidas Considere una posibilidad de fallo del servidor de bases de datos del 25%. Calcular la disponibilidad de las aplicaciones en dos casos: si el número de réplicas es dos y tres respectivamente.

Disponibilidad de un Sistema de Bases de Datos Distribuidas Calcular la disponibilidad del Sistema de Bases de Datos Distribuidas de la empresa SeguridadCDMX S.A. De C.V, considerando el siguiente escenario: La empresa tiene su base de datos particionada en dos fragmentos (incidentes en proceso de investigación e casos resueltos) y con una replicación total, los cuales son asignados a los dos servidores de bases de datos con que cuenta la empresa: a) Uno creado por sus desarrolladores en las oficinas centrales. Este servidor tiene una disponibilidad del 85 % b) Un segundo servidor contratado en un proveedor en la nube, con una disponibilidad de 95 %

Tolerancia a fallos y replicación Una alta disponibilidad no implica necesariamente datos correctos. Puede haber datos no actualizados, o inconsistentes. Podemos utilizar replicación para ganar tolerancia a fallos

Requisitos de la replicación La replicación debe llevarse a cabo considerando Transparencia: los clientes no son conscientes de que hay múltiples copias del recurso al que acceden Consistencia: las operaciones sobre un conjunto de objetos replicados deben dar resultados que sigan la especificación de corrección definida para dichos objetos.

Reglas en la replicación Los datos replicados se deben someter a la regla de consistencia mutua, la cual requiere que todas las copias de fragmentosde datos seanidénticas. Para mantener la consistencia de los datos entre replicas, se debe garantizar la actualización de la base de datos entodos los sitios donde existen replicas. Una operación read (lectura) selecciona cualquier copia (de preferencia la más cercana) para satisfacer la transacción. Una operación write (escritura) requiere que todas las copias se seleccionen y actualicen para satisfacer la regla de consistencia muta.

Escenarios BD distribuida (fragmentada) y sin réplica Ejemplo: La base de datos de incidentes delictivos de la CDMX se encuentran fragmentados por la zona en que fueron cometidos (norte, sur, oriente y poniente), y cada fragmento se encuentra en solo un servidor. BD distribuida (fragmentada) y con réplica Ejemplo: La base de datos de incidentes delictivos de la CDMX se encuentran fragmentados por la zona en que fueron cometidos (norte, sur, oriente y poniente), y, al menos, un fragmento se encuentra en dos servidores.