PVFS (Parallel Virtual File System)

Documentos relacionados
General Parallel File System

Global File System (GFS)...

Sistemas de archivos distribuidos. Alvaro Ospina Sanjuan

ARQUITECTURA DE DISTRIBUCIÓN DE DATOS

Nicolás Zarco Arquitectura Avanzada 2 Cuatrimestre 2011

Sistemas Operativos Windows 2000

Parallel Virtual File System (PVFS)

UNIVERSIDAD DE ORIENTE FACULTAD DE ICIENCIAS ECONOMICAS LAS REDES I. Licda. Consuelo Eleticia Sandoval

18 y 19 Sistemas de Archivos Distribuidos y Tarea 05

LINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN

Parallel Virtual File System (PVFS)

Módulos: Módulo 1. Hardware & Arquitectura de sistemas - 20 Horas

Introducción. Sistemas Operativos. Pedro Chávez Lugo 23 de marzo de 2010

Memoria Compartida Distribuida (DSM) Sistema de Archivos

Trabajo TICO Unidad 2: Sistemas Operativos. Guillermo Jarne Bueno.

GlusterFS. Una visión rápida a uno de los más innovadores sistema de archivos distribuido

Windows Server Windows Server 2003

Gestion de archivos. Problemas al almacenar datos sólo en la memoria:

Ingeniería de Software. Pruebas

Alumna: Adriana Elizabeth Mendoza Martínez. Grupo: 303. P.S.P. Miriam De La Rosa Díaz. Carrera: PTB. en Informática 3er Semestre.

LABORATORIO 10. ADMINISTRACIÓN DE COPIAS DE SEGURIDAD EN SQL SERVER

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Conceptos Básicos de Software. Clase III

Clientes Donantonio. Especificación de requisitos software. Juan José Amor David Escorial Ismael Olea

RAID 0 : No redundante

1.1.- Objetivos de los sistemas de bases de datos Administración de los datos y administración de bases de datos Niveles de Arquitectura

Información del Producto: XenData X1500 LTO-5 Digital Video Archive System

Funcionamiento de los Computadores:

UNIVERSIDAD TECNOLOGICA ECOTEC DIEGO BARRAGAN MATERIA: Sistemas Operativos 1 ENSAYO: Servidores BLADE

CLOUD ENIAC BACKUP. Sus datos son importantes?

Arquitectura de sistema de alta disponibilidad

Introducción a las redes de computadores

No se requiere que los discos sean del mismo tamaño ya que el objetivo es solamente adjuntar discos.

EXPEDIENTE: 2/2015 ADQUISICIÓN E INSTALACIÓN DE INFRAESTRUCTURA CIENTÍFICA Y TECNOLÓGICA PARA CÉNITS PLIEGO DE PRESCRIPCIONES TÉCNICAS

Programación estructurada (Interfaces Windows y Unix)

Accede a su DISCO Virtual del mismo modo como lo Hace a su disco duro, a través de:

1. Generalidades. M. en C. Mario Farias-Elinos

Ventajas del almacenamiento de datos de nube

CAPÍTULO 4. EL EXPLORADOR DE WINDOWS XP

BASES DE DATOS OFIMÁTICAS

Índice. agradecimientos...19

Administración de sistemas UNIX/Linux Práctica Colección de scripts para la configuración de una infraestructura de máquinas UNIX

Implementación de plataforma de virtualización con HA basada en Proxmox

CAPITULO 1. Introducción a los Conceptos Generales de Bases de Datos Distribuidas

IES Abyla. Departamento de Informática. Sistemas Operativos

Trabajo final de Ingeniería

Guia para examen de Sistemas Operativos Para primer parcial Febrero 2013 Revisión 2 Ing. Julio Cesar Gonzalez Cervantes

RODRIGO TAPIA SANTIS com) has a. non-transferable license to use this Student Guide

COLEGIO COMPUESTUDIO

Tema: INSTALACIÓN Y PARTICIONAMIENTO DE DISCOS DUROS.

Replicación de datos en PVFS2 para conseguir tolerancia a fallos

CAPITULO 9. Diseño de una Base de Datos Relacional Distribuida

4. Programación Paralela

Studium, Campus Virtual de la Universidad de Salamanca.

Características del software

Almacenamiento virtual de sitios web HOSTS VIRTUALES

Intellikon 2.2. Código de Manual: Ik22002ESP Versión del Manual: 1.0 Última revisión: 20/12/2005 Se aplica a: Intellikon 2.2.

Capítulo 6 Introducción a los Sistemas Operativos de Redes (NOS)

Utilización del sistema operativo GNU/ Linux en las netbooks

Procesos. Bibliografía. Threads y procesos. Definiciones

Sistema de marketing de proximidad

DISCOS RAID. Se considera que todos los discos físicos tienen la misma capacidad, y de no ser así, en el que sea mayor se desperdicia la diferencia.

Servidores Donantonio

Replicación de PDC s y SLAPD

Modelo de Clustering. Microsoft SQL Server

Domine Microsoft Windows Server José Luis Raya Laura Raya Miguel Á. Martínez

UNIVERSIDAD DEL QUINDIO ÁREA DE SOPORTE TECNICO INSTALACIÓN DIRECTORIO ACTIVO WINDOWS SERVER 2008 R2

Servicios de impresión y de archivos (Windows 2008)

Informática 4º ESO Tema 1: Sistemas Informáticos. Sistemas Operativos (Parte 2)

KNime. KoNstanz Information MinEr. KNime - Introducción. KNime - Introducción. Partes de la Herramienta. Editor Window. Repositorio de Nodos

Universidad Luterana Salvadoreña Cátedra: Redes I Docente: Ing. Manuel de Jesús Flores Evaluación: Defensa Final Fecha de entrega: 30/05/2015 Linux

Sistemas de Operación II

Curso de verano. Biología Computacional: Análisis masivo de datos ómicos

1. Introducción 2. Historia 3. Características clave 4. Cuestiones de diseño

Windows Server 2012: Infraestructura de Escritorio Virtual

Introducción a la Computación

Software de sistema: Programas genéricos que permiten gestionar los recursos del ordenador.

COMO CONFIGURAR UNA MAQUINA VIRTUAL EN VIRTUALBOX PARA ELASTIX

Alessandro Chacón Ernesto Level Ricardo Santana

Descripción General de Softengine Pinakes

Version 3. Capítulo 9. Fundamentos de hardware avanzado para servidores

Uso básico de la terminal

Arquitectura: Clusters

Plataforma de expediente

Hadoop. Cómo vender un cluster Hadoop?

Agente local Aranda GNU/Linux. [Manual Instalación] Todos los derechos reservados Aranda Software [1]

TALLER No. 1 Capitulo 1: Conceptos Básicos de Bases de datos

MF0952_2: Publicación de páginas web

SIEWEB. La intranet corporativa de SIE

Soluciones innovadoras para optimizar su infraestructura TI. Virtualización con el sistema operativo i, PowerVM y Power Systems de IBM

Jorge De Nova Segundo

Estrategia de Backup para los Sistemas SAP R/3 GOBERNACIÓN DE CUNDINAMARCA

Módulos: Módulo 1. El núcleo de Linux - 5 Horas

Componentes de Integración entre Plataformas Información Detallada

MANUAL DE INSTALACIÓN PLATAFORMA PROGRESA AUTOR: ASAC COMUNICACIONES DEPARTAMENTO DE DESARROLLO NOVIEMBRE DE 2007

Act 1: Revisión de Presaberes. Lectura No. 1. Título de la Lectura: El Computador

Capítulo V. Implementación

SISTEMA DE APOYO AL CUMPLIMIENTO DE LA RESOLUCIÓN N 182/2009 DE LA SECRETARÍA DE GABINETE Y GESTIÓN PÚBLICA

GUIA COMPLEMENTARIA PARA EL USUARIO DE AUTOAUDIT. Versión N 02 Fecha: 2011-Febrero Apartado: Archivos Anexos ARCHIVOS ANEXOS

Sistemas Multimedia Distribuidos. Juan A. Sigüenza Departamento de Ingeniería Informática UAM

Transcripción:

Sergio González González Instituto Politécnico de Bragança, Portugal sergio.gonzalez@hispalinux.es Jónatan Grandmontagne García Universidad de Bragança, Portugal thestalker44@hotmail.com Breve explicación del sistema PVFS, en qué consiste y sus características. 1. Introducción PVMS intenta proveer de un sistema de archivos en red distribuído de alta eficiencia y escalable, normalmente utilizado en entornos de clustering. PVFS es un proyecto de Software Libre que no requiere hardware especial o modificiciones en el núcleo para que funcione. Las características de este sistema de archivos distribuído son: Un sistema consistente de nombres Acceso transparente para las utilidades existentes (ls, cd, etc.) Distribución física de los datos a través de múltiples discos en distintos nodos Alto rendimiento en espacio de para las aplicaciones PVFS provee un mismo espacio de nombre para todo el cluster y es accesible por las utilidades habituales. PVFS se monta en todos los nodos y en el mismo directorio simultáneamente, permitiendo el acceso simultáneo a todos los ficheros del sistema PVFS, a través del mismo esquema de directorios. Una vez que el sistema está montado, podremos trabajar con las herramientas típicas, como ls, cp y rm Para conseguir un alto rendimiento en el acceso a los datos concurrentemente, PVFS distribuye los datos en múltiples nodos del cluster, denominados I/O nodes. Distribuyendo los datos en múltiples nodos, los clientes poseen diferentes rutas hacia los datos, eliminado de esta forma los cuellos de botella (bottlenecks) y mejorando o aumentando el ancho de banda para múltimples clientes. PVFS permite prescindir de las llamadas al kernel en los accesos al sistema de archivos, gracias al uso de una API nativa. Esta implementa un subconjunto de operaciones UNIX que permiten contactar directamente con los servidores PVFS. 1

Vista del sistema PVFS La imagen superior muestra como se asignan los nodos para el uso de PVFS. Estos son divididos en nodos de computación (compute nodes) donde se ejecutan las aplicaciones, y los nodos de gestión que manejan las operaciones con los metadatos y los nodos de entrada/salida (I/O) que almacenan la información. Los nodos de administración y entrada/salida también pueden ser utilizados como nodos de computación. 2. Componentes PVFS Hay cuatro grandes componentes, que son: Servidor de metadatos (mgr) Servidor de E/S (I/O) (iod) API nativa de PVFS (libpvfs) Soporte en el kernel de PVFS Los dos primeros componentes son demonios que se ejecutan en los nodos del cluster. El servidor de metadatos (mgr) gestiona los metadatos de todos los ficheros. El uso de los demonios que operan automáticamente con los metadatos, eliminan algunas de las deficiencias de otras soluciones de almacenamiento en red, las cuales tienen que implementar complejos esquemas para asegurar la consistencia en los metadatos. El segundo demonio es el servidor de E/S (I/O) (iod). Este gestiona el almacenamiento y recuperación de los datos almacenados en el disco local del nodo. Estos servidores crean los ficheros en el sistema de archivos existente en el disco local del nodo, utilizando las llamadas read(), write() y nmap() para el acceso a esos archivos. Esto significa que puedes utilizar cualquier sistema de archivos local para almacenar los datos: ext2, ext3, reiserfs, RAID. 2

Acceso a metadatos Acceso a datos La API nativa de PVFS proporciona acceso en espacio de usuario a los servidores PVFS. Esta librería maneja las operaciones necesarias para mover datos entre los buffers de usuario y los servidores PVFS, manteniendo las operaciones transparentes al usuario. Los gráficos anteriores muestran el flujo de datos en el sistema PVFS para las operaciones con metadatos (arriba) y el acceso a los datos (abajo). Para las operaciones con metadatos, las aplicaciones se comunican mediante la librería con el servidor de metadatos. Cuando se accede a los datos, el servidor de metadatos se elimina de la ruta de acceso y se contacta con los servidores de E/S. 3

Finalmente, el soporte PVFS para el kernel Linux provee la funcionalidad para montar sistemas PVFS en los nodos Linux. Esto permite a los programas existentes acceder a los datos almacenados en PVFS sin modificaciones. Flujo de datos a través del Kernel La figura anterior muestra el flujo de datos a través del kernel, cuando el soporte del núcleo está activo. 3. Interfaces de aplicacion Para que cualquier sistema pueda utilizar PVFS, existen distintas interfaces de acceso. Estas son: API nativa de PVFS Interfaz para el núcleo Linux Interfaz ROMIO MPI-IO La API nativa de PVFS provee una interfaz similar a UNIX para el acceso a los archivos almacenados en PVFS. La interfaz para el núcleo Linux permite a las aplicaciones acceder a los datos de la forma tradicional. ROMIO implementó las llamadas MPI2 I/O en una librería portable. Esto permite a los programadores de aplicaciones paralelas que utilizan MPI, el acceso a los datos de PVFS gracias a la interface MPI-IO. 4. Licencia de este documento Se otorga permiso para copiar, distribuir y/o modificar este documento bajo los términos de la Licencia de Documentación Libre GNU, versión 1.1 o cualquier versión posterior publicada por la Free Software Foundation. Puedes consultar una copia de la licencia en http://www.gnu.org/copyleft/fdl.html (http://www.gnu.org/copyleft/fdl.html) 4

Bibliografía Documentación sobre clusters [PVFS HomePage (http://www.pvfs.org/)] [ Experiences with the Parallel Virtual File System (PVFS) in Linux Clusters (http://www.linuxclustersinstitute.org/linux-hpc-revolution/archive/pdf02/13-milfeld_k.pdf)] Kent Milfeld, Avijit Purkayastha, Chona Guiang. [Beowulf PVFS (http://www.nas.nasa.gov/sc2000/gsfc/beowulf_pic2.html)] Ryan Spaulding. <rspaulding@mail.arc.nasa.gov> 5