Sistemas de memoria robustos o tolerantes a fallos. Noel Palos Pajares Rubén Suárez del Campo Jorge Martín Vázquez



Documentos relacionados
DISCOS RAID. Se considera que todos los discos físicos tienen la misma capacidad, y de no ser así, en el que sea mayor se desperdicia la diferencia.

RAID (Redundant Array of Independents Disk) Presentado por: María Veloz

Plataformas operativas de tecnologías de información. Afinación del rendimiento

13º Unidad Didáctica. RAID (Redundant Array of Independent Disks) Eduard Lara

RAID. Redundant Array of Independent Disks. Rafael Jurado Moreno Fuente: Wikipedia

No se requiere que los discos sean del mismo tamaño ya que el objetivo es solamente adjuntar discos.

RAID 0 : No redundante

Seguridad Informática: Almacenamiento de la información y copias de seguridad

Curso de seguridad informática en el entorno docente. Sesión 4. PONENTE: Jaime López Soto.

Qué es un sistema de almacenamiento RAID?

Tema 2: El hardware del servidor Profesor: Julio Gómez López

RAID= Redundant Array of Independent (or Inexpensive) Disks

Introducción Subsistemas de disco inteligentes Técnicas de entrada y salida. Storage. Esteban De La Fuente Rubio SASCO. 7 de noviembre de 2013

[TECNOLOGÍA RAID] Documentos de formación de SM Data:

Tema 3. Tecnologías y arquitecturas tolerantes a errores. Alta disponibilidad. Gestión de la redundancia, clustering.

Almacenamiento y estructura de archivos

Version 3. Capítulo 9. Fundamentos de hardware avanzado para servidores

Gestion de archivos. Problemas al almacenar datos sólo en la memoria:

CONFIGURACIONES DE ALTA DISPONIBILIDAD

Técnicas empleadas. además de los discos las controladoras.

comercio electrónico Antonio Sanz Comercio Electrónico

SISTEMAS DE ALMACENAMIENTO

Redes de Almacenamiento

Capítulo 5. Cliente-Servidor.

COMPUTACIÓN DE ALTA PERFORMANCE

Infraestructura Tecnológica. Sesión 5: Arquitectura cliente-servidor

Estructuras de Almacenamiento RAID RAID. Nivel FísicoF. Índice. Requisitos Almacenamiento. Nivel Lógico Modelo Entidad-Relación y Modelo Relacional

Computación de Alta Performance Curso 2009 TOLERANCIA A FALLOS COMPUTACIÓN DE ALTA PERFORMANCE 2009 TOLERANCIA A FALLOS

Sistemas de arreglo de discos RAID. - Alex Avila

SEMANA 12 SEGURIDAD EN UNA RED

UNIVERSIDAD TECNOLOGICA ECOTEC DIEGO BARRAGAN MATERIA: Sistemas Operativos 1 ENSAYO: Servidores BLADE

Recuperación de Información en RAIDs

INFORME DISPOSICION TRANSITORIA CUARTA DEL REAL DECRETO 1671/2009, DE 6 DE NOVIEMBRE, POR EL QUE SE DESARROLLA PARCIALMENTE LA LEY 11/2007, DE 22 DE

Redes de Altas Prestaciones

Infraestructura Tecnológica. Sesión 12: Niveles de confiabilidad

RAID. Características, ventajas y aplicaciones. Porqué utilizar RAID? Beneficios y ventajas. white paper

BACKUP SERVIDOR IPLAN INTRODUCCIÓN AL SERVICIO

Ventajas, Características y Aplicaciones de los SGBD Distribuidos.

Tema: Configuración de arreglos redundantes de discos duros (RAID).

Introducción a sistemas RAID INTRODUCCION: Que es RAID? Ventajas de los discos RAID:

La mejor opción para reparar su equipo de trabajo

Ministerio de Economía y Producción Secretaría de Hacienda NORMAS DE RESGUARDO Y RECUPERACION DE SISTEMAS (BACKUPS/RECOVERY)

TeCS. Sistema de ayuda a la gestión del desarrollo de producto cerámico

Modelo de calidad del producto software

Desarrolladores: Christian David Merino Cruz. Bryan Alexis Peraza Navas. Erik Alberto Renderos Morales.

Redes de Altas Prestaciones

RAID software: mdadm. José Domingo Muñoz Rafael Luengo. Febrero Fundamentos de Hardware

, RECUPERACIoN DE DATOS:

18. Camino de datos y unidad de control

ANÁLISIS Y GESTIÓN DEL DESARROLLO DE SOFTWARE TEMA 1: INTRODUCCIÓN AL PROCESO SOFTWARE PERSONAL

Servicios Cloud Almacenamiento en la Nube

OBJETIVOS DIRIGIDO A

MODERNIZANDO PCN Y RECUPERACION DE DESASTRES UTILIZANDO VIRTUALIZACION Y LA NUBE

RAID. Los detalles de las características segunda y tercera, cambian según los distintos niveles RAID. RAID 0 no soporta la tercera característica.

LABORATORIO 10. ADMINISTRACIÓN DE COPIAS DE SEGURIDAD EN SQL SERVER

E-learning: E-learning:

Tema 2 : Códigos Binarios

SISTEMAS DE INFORMACIÓN III TEORÍA

Proceso de Servicio de Informática y Comunicaciones

Sin embargo, con el tiempo ocurren errores en el disco duro, los datos se desorganizan y las referencias se vuelven obsoletas.

Soluciones RAID Comerciales

ESTUDIO DEL SISTEMA ESTÁTICO DE PROTECCIÓN DE UNA TURBINA A GAS

INFORME Nº GTI INFORME TÉCNICO PREVIO DE EVALUACIÓN DE SOFTWARE

EXPEDIENTE: 2/2015 ADQUISICIÓN E INSTALACIÓN DE INFRAESTRUCTURA CIENTÍFICA Y TECNOLÓGICA PARA CÉNITS PLIEGO DE PRESCRIPCIONES TÉCNICAS

Prevención de riesgos y mantenimiento del PC. I. Sensibilidad pasiva: Condiciones medioambientales. Indice de contenidos. Agentes medioambientales

Cuales son las herramientas que ofrece el sistema operativo para el mantenimiento preventivo de software?

1. CONTENIDOS DE LA MATERIA

SIIGO PYME PLUS. Proceso de Recuperación. Cartilla I

Sistemes d'emmagatzemament avançats: RAID, SAN i NAS

Los ordenadores, no son de última generación, por lo que podemos adoptar uno de los dos siguientes caminos con la máxima urgencia.

POLITICAS Y LINEAMIENTOS SOBRE EL USO DEL SOFTWARE Y EQUIPOS DE CÓMPUTO EN LA UNIVERSIDAD CATÓLICA DE MANIZALES

Utilidades de la base de datos

RAID 0, 1 y 5. RAID 0 (Data Striping)

COMO CONFIGURAR UNA MAQUINA VIRTUAL EN VIRTUALBOX PARA ELASTIX

Jorge Cossani Líder de Servicios de Datacenter 2011 IBM Corporation

PACS. Picture Archiving and Communication Systems

ARQUITECTURA DE DISTRIBUCIÓN DE DATOS

Guía de uso del Cloud Datacenter de acens

Modelos de los sistemas distribuidos. Jorge Iván Meza Martínez

TEMA 3. EL PROCESO DE COMPILACIÓN, DEL CÓDIGO FUENTE AL CÓDIGO MÁQUINA

1 El trabajo expuesto está subvencionado por el proyecto de la URJC PGRAL-2001/14

Monitorización de sistemas y servicios

Soluciones innovadoras para optimizar su infraestructura TI. Virtualización con el sistema operativo i, PowerVM y Power Systems de IBM

Sistemas RAID y Hotswap

Herramientas Software Unycop Win. Cuándo hay que hacer uso de las Herramientas Software?

Topologías de hardware de almacenamiento de datos. Administración de recursos Ing. En sistemas de Información FRBA -UTN -ARGENTINA 2010

Arquitectura de sistema de alta disponibilidad

Infraestructura Tecnológica

Prevención de riesgos y mantenimiento del PC. I. Sensibilidad pasiva: Condiciones medioambientales. Indice de contenidos. Agentes medioambientales

SEGURIDAD INFORMATICA GENERALIDADES DE LA SEGURIDAD INFORMATICA

Sistemas de Gestión de Calidad. Control documental

TALLER No. 1 Capitulo 1: Conceptos Básicos de Bases de datos

Material adicional del Seminario Taller Riesgo vs. Seguridad de la Información

UNIVERSIDAD DE BURGOS

Unidad 5. Modelo de objetos del dominio del problema. Trimestre 10-I. Universidad Autonomía Metropolitana. Unidad 5

Global File System (GFS)...

PRÁCTICA 12. Niveles RAID Meta Objetivos Desarrollo

INTERNET DATA CENTER COLOCATION

Instituto Tecnológico de Las América. Materia Sistemas operativos III. Temas Creación de RAID. Facilitador José Doñe

TOPOLOGÍAS DE RED. TOPOLOGÍA FÍSICA: Es la forma que adopta un plano esquemático del cableado o estructura física de la red.

Transcripción:

Sistemas de memoria robustos o tolerantes a fallos Noel Palos Pajares Rubén Suárez del Campo Jorge Martín Vázquez

Índice Introducción Qué son los sistemas tolerantes a fallos o robustos. Tipos de fallos y origen. Prevención y tolerancia a fallos. Fases. Tolerancia a fallos soportada por el hardware. ECC. Caso de estudio: RAID. Conclusiones finales. Bibliografía.

Introducción Trataremos el tema de los sistemas de memoria tolerantes a fallos. Muchos ámbitos de aplicación; no sólo en el sector informático podremos encontrar dichos sistemas. Sistemas hardware y software. Caso de estudio: RAID.

Definición: Sistemas tolerantes a fallos Sistemas de almacenamiento con la propiedad de funcionar aunque tengan averiado alguno de sus componentes. Confiabilidad. Atributos: Fiabilidad. Disponibilidad. Resguardo. Seguridad.

Qué es un fallo? Un fallo es cualquier defecto, ya sea físico o lógico, en cualquier componente del sistema. Latencia de un fallo. Un error es la manifestación de un fallo. Latencia de un error. Una avería es un mal funcionamiento del sist ema desde el punto de vista externo.

Tipos de fallos y origen Fallos software No es necesario reemplazar el elemento físico para corregirlo. Fallos hardware Es necesario reemplazar físicamente el componente dañado. Según su duración: Permanentes. Temporales: Transitorios. Intermitentes.

Prevención y tolerancia a fallos Se resume en prevenir, evitar, corregir o reparar los fallos.

Tolerancia a fallos. Fases Primera fase: Chequeos. De replicación. De tiempo. Estructurales. De razonabilidad. De diagnóstico. Segunda fase: Confinamiento del daño. Tercera fase: Recuperación de errores. Hacia atrás. Hacia adelante. Cuarta fase: Tratamiento de fallos.

Sistemas de prevención y tolerancia a fallos Redundancia: Emplea información, recursos o tiempo por encima de los necesarios para prevenir y tolerar fallos. Redundancia hardware. Redundancia software. Redundancia informacional. Redundancia temporal.

Redundancia software Duplicar procesos en el código de los programas, realizar comparaciones redundantes Pruebas de consistencia. Pruebas de hardware. Programación con N versiones. Medidas preventivas generales.

Redundancia informacional Incluye información adicional a los datos. Distancia de Hamming y paridad. Códigos de paridad, horizontales o verticales. Checksums: De simple precisión. De doble precisión. De Honeywell. De residuo. Códigos de Hamming.

Redundancia temporal Repetir cálculos, duplicar comparaciones Efectiva a la hora de detectar fallos transitorios. Lógica alternativa. Operandos desplazados. Operandos intercambiados. Recálculo con duplicación con comparación.

Redundancia hardware Incluye componentes redundantes para, en caso de fallo, utilizarlos hasta reparar el elemento dañado. Redundancia pasiva: Enmascaramiento de fallos. Redundancia activa: Detección y corrección de errores. Redundancia en frío. Redundancia en caliente.

Tolerancia a fallos soportada por el hardware. Redundancia modular triple, o TMR. Redundancia dinámica. Codificación redundante. Circuitos autochequeantes. Memorias ECC.

Redundancia modular triple

Circuitos autochequeantes

Memorias ECC Error Checking and Correction: Memorias capaces de detectar múltiples errores y corregir errores únicos. Redundancia del contenido. Menor rendimiento, debido a los cálculos redundantes que necesitan.

Caso de estudio: RAID Redundant Array of Independent Disks. Almacena datos en múltiples discos entre los que se distribuyen o replican datos. Implica: Mayor integridad. Mayor tolerancia a fallos. Mayor rendimiento. Mayor capacidad.

Caso de estudio: RAID Múltiples niveles (Muy conocidos: RAID 0 y RAID 1)

Caso de estudio: RAID Algunos RAID, además de incluir paridad, tienen redundancia hardware.

Caso de estudio: RAID También se pueden anidar RAIDS, para intentar mejorar el rendimiento y obtener las mejores características de varios niveles.

Caso de estudio: RAID En un sistema RAID es posible acceder a los datos aunque un disco falle. Algunos niveles mejoran el rendimiento de algunas aplicaciones. Un RAID no impide la entrada de virus o el borrado accidental de datos. No simplifican la recuperación de fallos.

Caso de estudio: RAID A la hora de implementar un RAID debemos tener en cuenta para qué tipo de sistema irá dirigido. En este trabajo nos hemos centrado en los niveles RAID con paridad y redundancia hardware: RAID 5E y RAID 6E.

Caso de estudio: RAID 5E RAID con paridad distribuida entre las distintas unidades físicas y con una unidad hardware redundante. 100% de protección de datos. Mejor rendimiento frente al RAID 5. Mayor capacidad respecto a los RAID 1 y RAID 1E.

Caso de estudio: RAID 5E Mínimo de cuatro unidades físicas. Una unidad lógica por batería de discos. No se puede compartir la unidad redundante entre distintas baterías de discos.

Caso de estudio: RAID 5E Fases a seguir para su implementación: Conexión de las cuatro unidades físicas y creación de la batería de discos. Creación de una unidad lógica en la batería de discos, dejando un espacio de reserva para la unid ad redundante.

Caso de estudio: RAID 5E División del espacio lógico en bandas. La paridad se distribuirá entre las unidades físicas. En caso de fallo, los datos se reconstruirán y ocuparán el espacio libre de la unidad redundante.

Caso de estudio: RAID 5E Esquema con un fallo en una unidad física. Al sustituir la unidad errónea, volverá al esquema original.

Conclusiones Destacamos la importancia de los sistemas tolerantes a fallos. Aumentar la seguridad de los datos y su posible recuperación. Sistema sencillo y barato: RAID.

Bibliografía Apuntes Sistemas tolerantes a fallos. Autor Sergio Arévalo, Sistemas y Co municaciones de la Universidad Rey Juan Carlos. Apuntes Tolerancia a fallos. Autor Antonio Losada Real, Sistemas de Tiemp o Real. Sistemas Tolerantes a Fallos. Universidad de Valladolid, Departamento de In formática. Tesis Doctoral Tolerancia a Fallos, en clústeres de computadores geográfic amente distribuidos, basada en la réplica de datos. Autor, Josemar Rodrígu ez de Souza. Universidad Autónoma de Barcelona. Apuntes Memoria Principal. Autor, David Miraut Andrés. Universidad Rey J uan Carlos, Departamento de Arquitectura de Computadores. Wikipedia, de donde hemos obtenido las imágenes de los distintos niveles RAID, bajo licencia Creative Commons. IBM, donde hemos obtenido las imágenes de la implementación del RAID 5E. www.ecc.com, para la obtención de información de los códigos ECC.