Computación Cientíca en Clusters

Documentos relacionados

Curso de Computación Científica en Clusters

Computación de Altas Prestaciones Sin miedo, es más fácil de lo que parece. Alex Ramírez Arquitecturas Heterogeneas Barcelona Supercomputing Centrer

CAR. Responsable : María del Carmen Heras Sánchez. Asesores Técnicos : Daniel Mendoza Camacho Yessica Vidal Quintanar.

Investigación, Resultados Y beneficios. Simplificación de HPC en la educación superior e instituciones de investigación. Información general

PLIEGO DE PRESCRIPCIONES TÉCNICAS PARA LA ADQUISICIÓN DE UNA RED DE ALMACENAMIENTO CONSOLIDADO PARA LA PLATAFORMA TECNOLÓGICA EDUCAMADRID

Anexo Técnico Partida 2

PLIEGO DE PRESCRIPCIONES TÉCNICAS CONTRATO DE SUMINISTRO

Arquitecturas de Altas Prestaciones y Supercomputación

Nodos de Cálculo i7/i9. Informática Personal. Servidores para cálculo científico. Clústers de computación. Almacenamiento de Datos.

Pliego de prescripciones técnicas

CLUSTER FING: ARQUITECTURA Y APLICACIONES

Supercomputador LUSITANIA

Anexo Técnico Partida 3

PORTAFOLIO DE PRODUCTOS

Redes de Altas Prestaciones

TeraStation WS5200DN. Características y ventajas. Capacidad de almacenamiento y sistema operativos Windows para pequeñas empresas WS5200DN

Open Storage Cómo resolver las necesidades de almacenamiento con las ventajas económicas del mundo open (DOWN COST TECHNOLOGY)

ANEXO No. 1 FICHA TECNICA RFI ORACLE DATABASE APPLIANCE, DB EE Y RAC

Generaciones de computadoras

ALMACENAMIENTO NAS DE ESCALAMIENTO HORIZONTAL HÍBRIDO ISILON

PLIEGO DE PRESCRIPCIONES TECNICAS PARA LA CONTRATACION DEL SUMINISTRO DE PLATAFORMA DE SISTEMAS DE ENTORNO DE CONSOLIDACIÓN Y FORMACIÓN PARA LA

MINUTA: Taller en UAEMEX, Toluca. Construcción de Tecnología HPC

2. CARACTERÍSTICAS MÍNIMAS DEL EQUIPO OBJETO DE LA ADQUISICIÓN

CENTRO INTEGRADO POLITÉCNICO ETI DE TUDELA

DE CLUSTER A CLOUD (VISIÓN PRÁCTICA) ARCOS

EQUIPAMIENTO DE INFRAESTRUCTURA SERVIDORES PARA ACTIVA MUTUA Febrero 2011, Revisión: 1.1 PLIEGO DE CONDICIONES TÉCNICAS

En este video vamos a examinar los distintos tipos de ordenadores que podemos encontrar hoy en día.

ADENDA No. 4 PLIEGO DE CONDICIONES

Modelos de computadores paralelos

EMC ISILON S-SERIES. Especificaciones. EMC Isilon S200. EMC Isilon S210 ARQUITECTURA

EMC ISILON X-SERIES REDEFINA. Especificaciones. EMC Isilon X200. EMC Isilon X210. EMC Isilon X410 ARQUITECTURA

Virtualización Open Source. Virtulización basado en Linux para escritorios y servidores con compatibilidad para Microsoft Windows

1. Productos a entregar

2. Elementos de Arquitectura de Computadores

INSTITUTO ELECTORAL DEL ESTADO DE ZACATECAS

Anexo Técnico Partida 1

SEMINARIO PRÁCTICO Cómo elegir el sistema de cálculo científico ideal para mi investigación. Raúl Díaz

1. Productos a entregar

LOTE 1: PLATAFORMA DE CÓMPUTO DE ALTO RENDIMIENTO PARA CÁLCULO CIENTÍFICO Y PARELELO BASADO EN CLUSTER DE COMPUTADORES.

CONVOCATORIA PRIVADA ADQUISICION DE UNA SOLUCIÓN DE EQUIPOS COMPUTACIONALES DE LA MALLA COMPUTACIONAL DE LA UNIVERSIDAD DEL VALLE ADENDO 01

"Garantiza el fiel cumplimiento a la licitación pública del equipamiento informático para el proyecto FONDEQUIP EQM150093" y no otra.

EXPEDIENTE: 2/2015 ADQUISICIÓN E INSTALACIÓN DE INFRAESTRUCTURA CIENTÍFICA Y TECNOLÓGICA PARA CÉNITS PLIEGO DE PRESCRIPCIONES TÉCNICAS

ELASTIC CLOUD STORAGE (ECS) APPLIANCE

PLANIFICACIÓN DE LA DOCENCIA UNIVERSITARIA GUÍA DOCENTE. Introducción a la concurrencia

Sistemas de Información para la Gestión

La experiencia en la UC3M. Jesús Gago Mejías Servicio de Informática y Comunicaciones

Oracle Linux: Administración de Sistema NUEVO

Todo lo que necesitas saber a la hora de renovar tu data center

FUNDAMENTOS DE INFORMÁTICA. Principios Básicos de Sistemas Operativos. Definición de Sistema Operativo

LICITACIÓN PÚBLICA ADQUISICIÓN DE UNA SOLUCIÓN DE EQUIPOS COMPUTACIONALES DE LA MALLA COMPUTACIONAL DE LA UNIVERSIDAD DEL VALLE ADENDO 02

Implantación del Modelo MM5 en MX-101. Dirección de Telemática Centro de Computo

Primeros pasos con CEPH. Julio Lozano Bahilo Instituto de Física Corpuscular

Requisitos Técnicos de actualización de Cluster Heterogéneo

TEMA 4 PROCESAMIENTO PARALELO

Open Storage Cómo resolver las necesidades de almacenamiento con las ventajas económicas del mundo open (LOW COST TECHNOLOGY)

BSC MARENOSTRUM. Javier Bartolomé Rodriguez Systems Group

Estructura del Computador

Familia Dell PowerVault MD. Almacenamiento. modular. La familia de almacenamiento Dell PowerVault MD

Computación de Altas Prestaciones Sistemas computacionales

PLIEGO DE CLÁUSULAS TÉCNICAS QUE HAN DE REGIR LA CONTRATACIÓN DEL SUMINISTRO DE LOS EQUIPOS NECESARIOS E IMPLANTACIÓN DE UNA SOLUCIÓN

GOBIERNO DE LA CIUDAD AUTÓNOMA DE BUENOS AIRES SINDICATURA GENERAL DE LA CIUDAD

Medidas de Alta Disponibilidad

SIGADE 6: requisitos de hardware y software y prerrequisitos de formación

Motivaciones. Computación Cluster y Grid. Sistemas Distribuidos y Clusters. Computación con Clusters 24/02/2010

1 General Usuario... 8

ANEXO No. 3 CONDICIONES TÉCNICAS DESCRIPCIÓN GENERAL DE LA SOLUCIÓN REQUERIDA

2. UNION TEMPORAL SED INTERNACIONAL - HARDWARE ASESORIAS Y SOFTWARE. HP DX 5150 MINITORRE 1. DELL COLOMBIA INC.

IaaS PaaS SaaS. Cloud Computing. Microsoft Azure. Servicios de aplicaciones. Cómputo Virtual machines

Sistemas Operativos Distribuidos. Sistemas Operativos Una visión aplicada

PLIEGO DE PRESCRIPCIONES TECNICAS

Vamos a definir un ordenador, lo que hay en la diapositiva son ordenadores, algunos más especializados que otros, pero todos son ordenadores.

Cable Adaptador USB 3.0 con UASP a SATA III para Disco Duro de 2,5" - Cable Conversor para HDD SSD

Mejora de la infraestructura tecnológica Convocatoria a Proveedores a presentar Propuestas

Computación Cluster y Grid

Curso-Taller Programación Paralela con lenguaje C bajo Linux. MCC. Salazar Martínez Hilario

2. CARACTERÍSTICAS MÍNIMAS DEL EQUIPO OBJETO DE LA ADQUISICIÓN

Sistemas Informáticos Europeos

Sistemas operativos (Parte 4)

DATOS LIBETH ALVAREZ FANNY BRACHO GRISKA ISEA

ANEXO CONVOCATORIA 74/2016. Renglón Especificación Técnica Imagen

Optimice su presupuesto de TI en entornos empresariales críticos

HP Operations Orchestration

FSP:GA4S20ZPOESY12 FSP:GA5S20Z00ESY12 LBY:ESD-INS002PX Preparado para fuente redundante opcional FSP:GA4S20Z00ESPY4 FSP:GA5S20Z00ESPY4

Unidad II Arquitectura de Computadoras

HP StorageWorks X9000 Network Storage System. Héctor García Consultor Preventa

Technical Report TR01-SARADL-System infraestructure

La experiencia en la Universidad de Alcalá

Sistema Operativo Linux Agenda

ANEXO TÉCNICO CONVOCATORIA PÚBLICA DE MAYOR CUANTIA DESCRIPCIÓN DEL BIEN O SERVICIO (CARACTERÍSTICAS MÍNIMAS EXIGIDAS)

TEMA 9. SISTEMAS OPERATIVOS DISTRIBUIDOS

PROCESAMIENTO DISTRIBUIDO

TEMA 10 INTRODUCCIÓN A LOS SISTEMAS OPERATIVOS DISTRIBUIDOS. Introducción Hardware Software Aspectos de diseño

Dispositivos de Procesamiento y Dispositivos de Memoria. Dra. Leticia Flores Pulido Introducción a la Ingeniería en Computación

1. La importancia de la Informática

Lusitania. Pensando en Paralelo. César Gómez Martín

INTRODUCCIÓN AL CAPÍTULO 3 7. INTRODUCCIÓN A RSLINX LITE 4

Técnicas de Computación Científica

Transcripción:

Computación Cientíca en Clusters Administración de plataformas paralelas Juan Piernas Cánovas Febrero de 2010 Computación Cientíca en Clusters Febrero de 2010 1 / 25

Índice 1 Estructura del curso 2 Introducción a los clusters de ordenadores 3 Diseño de un cluster 4 Lustre Computación Cientíca en Clusters Febrero de 2010 2 / 25

Agenda Estructura del curso 1 Estructura del curso 2 Introducción a los clusters de ordenadores 3 Diseño de un cluster 4 Lustre Computación Cientíca en Clusters Febrero de 2010 3 / 25

Estructura del curso Estructura del curso Hay dos grandes bloques: Bloque I: clases presenciales + pequeños trabajos individuales de cada alumno. Compuesto por dos partes: Administración de plataformas paralelas. Programación de plataformas paralelas. Bloque II: trabajo por grupos de alumnos, tutorizado por un profesor del curso. Computación cientíca paralela. Visión integral: desde el diseño del cluster hasta su uso y programación. Computación Cientíca en Clusters Febrero de 2010 4 / 25

Estructura del curso Estructura del curso Hay dos grandes bloques: Bloque I: clases presenciales + pequeños trabajos individuales de cada alumno. Compuesto por dos partes: Administración de plataformas paralelas. Programación de plataformas paralelas. Bloque II: trabajo por grupos de alumnos, tutorizado por un profesor del curso. Computación cientíca paralela. Visión integral: desde el diseño del cluster hasta su uso y programación. Computación Cientíca en Clusters Febrero de 2010 4 / 25

Estructura del curso Administración de plataformas paralelas Introducción a los clusters de cómputo cientíco: arquitectura general, software, etc. Diseño de un cluster. Principales elementos hardware y software de los nodos de cómputo, de los nodos de almacenamiento de datos y de la red de interconexión: multiprocesamiento, sistemas RAID, redes Gigabit e Inniband, etc. Instalación desatendida de nodos: DHCP, PXE, Kickstart (Fedora), etc. Gestión centralizada de usuarios: NIS y LDAP. Conguración de un servicio NFS. Instalación y conguración de un sistema de cheros paralelo Lustre. Instalación y conguración de un sistema de colas: Torque, Maui y SunGridEngine. Instalación de MPI, de diversos compiladores de C y Fortran que soporten OpenMP y de bibliotecas optimizadas como Blas/Lapack (incluyendo las versiones paralelas de éstas). Computación Cientíca en Clusters Febrero de 2010 5 / 25

Estructura del curso Administración de plataformas paralelas Introducción a los clusters de cómputo cientíco: arquitectura general, software, etc. Diseño de un cluster. Principales elementos hardware y software de los nodos de cómputo, de los nodos de almacenamiento de datos y de la red de interconexión: multiprocesamiento, sistemas RAID, redes Gigabit e Inniband, etc. Instalación desatendida de nodos: DHCP, PXE, Kickstart (Fedora), etc. Gestión centralizada de usuarios: NIS y LDAP. Conguración de un servicio NFS. Instalación y conguración de un sistema de cheros paralelo Lustre. Instalación y conguración de un sistema de colas: Torque, Maui y SunGridEngine. Instalación de MPI, de diversos compiladores de C y Fortran que soporten OpenMP y de bibliotecas optimizadas como Blas/Lapack (incluyendo las versiones paralelas de éstas). Computación Cientíca en Clusters Febrero de 2010 5 / 25

Introducción a los clusters de ordenadores Agenda 1 Estructura del curso 2 Introducción a los clusters de ordenadores 3 Diseño de un cluster 4 Lustre Computación Cientíca en Clusters Febrero de 2010 6 / 25

Introducción a los clusters de ordenadores Introducción En muchos campos de la ciencia es necesario realizar cálculos y/o simulaciones que requieren una gran potencia de cómputo: Dinámica de partículas. Modelado del clima. Criptografía, etc. Una mayor potencia de cómputo permite: Reducir el tiempo en el que se obtienen los resultados. Mejorar la calidad de los resultados. Esta potencia es ofrecida hoy en día por los supercomputadores y, en concreto, por los grandes clusters de ordenadores (ver http://www.top500.org). Computación Cientíca en Clusters Febrero de 2010 7 / 25

Cluster Introducción a los clusters de ordenadores Conjunto de ordenadores conectados entre sí que colaboran para resolver un determinado problema. No todos los nodos desempeñan el mismo papel. Tres tipos principales: Nodo(s) de acceso o de control: administración del cluster, acceso al cluster, programación, ejecución de programas, etc. Nodos de cómputo: ejecución de código. Nodos de almacenamiento: donde residen los cheros que se procesan o almacenan resultados de la ejecución. Computación Cientíca en Clusters Febrero de 2010 8 / 25

Cluster Introducción a los clusters de ordenadores Computación Cientíca en Clusters Febrero de 2010 9 / 25

Introducción a los clusters de ordenadores Hardware de un cluster En muchos casos, el hardware (procesadores, memoria, discos duros, etc.) es muy similar al que podemos encontrar en cualquier ordenador de sobremesa. Formato especial para poder ser montados en rack. Un nodo o servidor Varios tipos de rack Redes de interconexión de alta velocidad (Gigabit, 10Gigabit, Inniband, Myrinet, etc.) ½Muy asequibles hoy en día! Computación Cientíca en Clusters Febrero de 2010 10 / 25

Introducción a los clusters de ordenadores Software de un cluster El sistema operativo es, casi siempre, Linux, en cualquiera de sus posibles distribuciones (frecuentemente, RedHat Enterprise Linux, CentOS, Fedora u OpenSUSE). Gran variedad de software cientíco y de programación disponible: MPI, OpenMP, BLAS/LAPACK, ScaLAPACK, R, Grass, Octave, Scilab, Maxima, CUDA/OpenCL, compiladores de C y Fortran (incluyendo los de Intel), etc, etc. Computación Cientíca en Clusters Febrero de 2010 11 / 25

Agenda Diseño de un cluster 1 Estructura del curso 2 Introducción a los clusters de ordenadores 3 Diseño de un cluster 4 Lustre Computación Cientíca en Clusters Febrero de 2010 12 / 25

Diseño de un cluster Diseño de un cluster Varios factores a tener en cuenta: Modelo de programación: Paso de mensajes. Memoria compartida. Carga de trabajo: Intensiva en CPU. Intensiva en comunicaciones. Intensiva en E/S. Volumen de datos. Necesidades especícas: Desarrollo de programas en CUDA. Uso de procesadores Cell BE. Uso de FPGAs, etc. Computación Cientíca en Clusters Febrero de 2010 13 / 25

Diseño de un cluster Ejemplo de construcción de un cluster Vamos a construir un cluster de propósito general con los siguientes nodos: 1 nodo de acceso al cluster. 4 nodos de almacenamiento (para un sistema de cheros Lustre de 4 1, 5 = 6TB). 16 nodos de cómputo (para un total de 32 procesadores o 128 cores). Todos los nodos tendrán una altura de 1U y se montarán en un armario rack. Es importante asegurarse de que todos los elementos hardware que deba gestionar el sistema operativo son compatibles con Linux. Computación Cientíca en Clusters Febrero de 2010 14 / 25

Diseño de un cluster Ejemplo de construcción de un cluster Precio: entre 40.000 y 60.000 euros. Puede ser mucho más barato si renunciamos a determinadas características (potencia y número de procesadores, capacidad y abilidad de los discos duros, etc.). No incluimos el coste del software (generalmente, libre). No debemos olvidar el coste del refuerzo eléctrico y del sistema de refrigeración (otros 4.0006.000 euros). Si necesitamos un SAI para el cluster, habrá que sumar otros 6.0008.000 euros. Tampoco debemos olvidar el coste de un sistema de copias de seguridad. Computación Cientíca en Clusters Febrero de 2010 15 / 25

Diseño de un cluster Características del nodo de acceso 2 procesadores (Intel Xeon o AMD Opteron). 48 GB de RAM. Tarjeta RAID con batería. 4 discos duros SATA para servidores de 500GB de capacidad (que montaremos en RAID5 para tener una capacidad efectiva de 1,5TB). 2 puertos Gigabit Ethernet: uno para el exterior y otro para la red interior. Computación Cientíca en Clusters Febrero de 2010 16 / 25

Diseño de un cluster Características de los nodos de almacenamiento 1 o 2 procesadores (Intel Xeon o AMD Opteron). 4 GB de RAM. Tarjeta RAID con batería. 4 discos duros SATA para servidores de 500GB de capacidad (que montaremos en RAID5 para tener una capacidad efectiva de 1,5TB). 2 puertos Gigabit Ethernet: uno para la red de comunicaciones y otro para la red de gestión. Tarjeta Inniband para la red de altas prestaciones. Tarjeta IPMI para la gestión remota. Computación Cientíca en Clusters Febrero de 2010 17 / 25

IPMI Diseño de un cluster Computación Cientíca en Clusters Febrero de 2010 18 / 25

Diseño de un cluster Características de los nodos de cómputo 2 procesadores (Intel Xeon o AMD Opteron). 48 GB de RAM. 1 disco duro SATA para servidores de 250GB de capacidad. 2 puertos Gigabit Ethernet: uno para la red de comunicaciones y otro para la red de gestión. Tarjeta Inniband para la red de altas prestaciones. Tarjeta IPMI para la gestión remota. Interesante conguración twin: Computación Cientíca en Clusters Febrero de 2010 19 / 25

Diseño de un cluster Características de las redes de interconexión 1 switch Gigabit Ethernet de 48 puertos. 1 switch Inband de 24 puertos. Computación Cientíca en Clusters Febrero de 2010 20 / 25

Diseño de un cluster Consideraciones nales La instalación del sistema operativo Linux en el nodo de acceso se hará de la manera tradicional. Es importante que el nodo de acceso siempre esté actualizado y que ofrezca al exterior el menor número de servicios posible (generalmente, el acceso por ssh es más que suciente). Dentro del cluster, la seguridad puede ser más laxa, siempre que un usuario no pueda interferir con el trabajo de otro Será necesario establecer un sistema de colas. Computación Cientíca en Clusters Febrero de 2010 21 / 25

Agenda Lustre 1 Estructura del curso 2 Introducción a los clusters de ordenadores 3 Diseño de un cluster 4 Lustre Computación Cientíca en Clusters Febrero de 2010 22 / 25

Lustre El sistema de cheros paralelo Lustre Sistema de cheros libre y gratuito (GPLv2) inicialmente desarrollado por ClusterFS, que fue adquirida por Sun Microsystems que, a su vez, ha sido recientemente adquirida por Oracle. Sistema de cheros POSIX (o casi): Comportamiento similar al de cualquier sistema de cheros local. Sustituto perfecto de NFS en entornos Linux distribuidos. Se basa en los Object-based Storage Devices (OSDs): los discos remotos no almacenan sectores sino objetos. Usado en muchos de los más potentes superordenadores del mundo (en junio de 2009, se usaba en 7 de los 10 más potentes). Computación Cientíca en Clusters Febrero de 2010 23 / 25

Lustre Arquitectura de Lustre Computación Cientíca en Clusters Febrero de 2010 24 / 25

Lustre Características de Lustre Los clientes se comunican directamente con los OSSs y el rendimiento escala linealmente con el número de OSSs. Dos opciones para almacenar datos en los OSSs: Cada chero en un único OSS. Cada chero repartido entre varios OSSs como en un RAID 0. Se pueden obtener decenas o cientos de GB/seg por cliente. Escalable a cientos de miles de clientes, miles de OSSs, sirviendo TB o PB de espacio en disco. Soporte para diferentes tipos de redes (GbE, Inniband, etc.) Computación Cientíca en Clusters Febrero de 2010 25 / 25