TEMA 6: COMPUTACIÓN CLUSTER

Documentos relacionados

Computación de Alta Performance Curso 2008 CLUSTERS

DE CLUSTER A CLOUD (VISIÓN PRÁCTICA) ARCOS

Computación Cluster y Grid. Computación Cluster y Grid. Cluster Computing

datos para plataformas de cómputo Red Gallega de Computación de Altas Prestaciones

Clústeres y procesamiento en paralelo XE1GNZ J O R G E F BARBOSA J ACOBO F E B R E R O DE 20 17

TEMA 1: EJECUCIÓN PARALELA: FUNDAMENTOS(II)

CLUSTERS. Antonio Antiñolo Navas ESI-UCLM. Profesor: Serafín Benito Santos. Arquitectura e Ingeniería de Computadores

UNIVERSIDAD DEL VALLE DE MÉXICO PROGRAMA DE ESTUDIO DE LICENCIATURA PRAXIS MES XXI

Arquitecturas: Clusters. Edgar Valderrama Lucio Mederos

TEMA 1: EJECUCIÓN PARALELA: FUNDAMENTOS(I)

Arquitecturas Paralelas Clusters

Nicolás Zarco Arquitectura Avanzada 2 Cuatrimestre 2011

Equilibra carga de tráfico IP entrante a través de los clústeres. Usado para aplicaciones que escalan horizontalmente (Web server, Proxy,...

Introducción. TEMA 3: Clusters de Computadores Personales

Computación de Altas Prestaciones Sin miedo, es más fácil de lo que parece. Alex Ramírez Arquitecturas Heterogeneas Barcelona Supercomputing Centrer

MPP. MIMD Computador Masivamente Paralelo

Clusters en Linux. * Jorge Castellanos - jorcas@cantv.net ** Julio Ortega - roliverio@cantv.net. * FACYT-UC Computación ** IUPSM Sistemas

Redes de Altas Prestaciones

BSC MARENOSTRUM. Javier Bartolomé Rodriguez Systems Group

TEMA 4: MP DE MEMORIA DISTRIBUIDA

Plataformas Actuales para Computación de Alto Rendimiento

TEMA 3: MP DE MEMORIA COMPARTIDA (I)

TEMA 2: PROGRAMACIÓN PARALELA (I)

Programa. Conjunto de elementos que interaccionan con una computadora ofreciendo una salida a una entrada ( programa ).

:Arquitecturas Paralela basada en clusters.

Investigación, Resultados Y beneficios. Simplificación de HPC en la educación superior e instituciones de investigación. Información general

Single System Image: Pilar de los Sistemas de Clustering

PVFS (Parallel Virtual File System)

Diseño de Sistemas Distribuidos Máster en Ciencia y Tecnología Informática Curso Presentación e introducción

Tecnología de software para sistemas de tiempo real

Mosix2: La versión grid de Mosix para Linux-2.6

Computación Distribuida

Taller de Programación Paralela

Introduccion a Sistemas Operativos. Ej: Linux

PROCESAMIENTO DISTRIBUIDO

UNIVERSIDAD DE ESPECIALIDADES ESPÍRITU SANTO

PROGRAMA DE ESTUDIO Área de Formación : Fecha de elaboración: 28 de mayo de 2010 Fecha de última actualización:

INFORMATICA III. Cap. I: Plataformas

Sistemas Distribuidos

UNIVERSIDAD DEL VALLE DE MÉXICO PROGRAMA DE ESTUDIO DE LICENCIATURA PRAXIS MES XXI

SISTEMAS OPERATIVOS. Informática Básica

Sistemas Operativos Distribuidos

Arquitecturas y Computación de Alto Rendimiento SISTEMAS PARA COMPUTACIÓN DE ALTO RENDIMIENTO. Índice

Computación Cluster y Grid

Servidores De Aplicaciones Java EE.

Cero Caídas con SUSE SAP - IBM

PROYECTO EN CURSO. Aplicaciones Web, una alternativa para la gestión de procesos dentro de una Arquitectura Distribuida.

ARQUITECTURAS PARA PROCESAMIENTO PARALELO

ANX-PR/CL/ GUÍA DE APRENDIZAJE. ASIGNATURA Computacion de alto rendimiento. CURSO ACADÉMICO - SEMESTRE Segundo semestre

Arquitecturas y Computación de Alto Rendimiento SISTEMAS PARA COMPUTACIÓN DE ALTO RENDIMIENTO. Índice

Montserrat González Ferreiro RES management engineer

Motivaciones. Computación Cluster y Grid. Sistemas Distribuidos y Clusters. Computación con Clusters 24/02/2010

Ingeniero en Informática

PROGRAMA DE CURSO. Horas de Cátedra ,5 5,5. Resultados de Aprendizaje

Linux Cluster Computing

Sistemas Operativos Distribuidos

TIER 0 TIER 1 TIER 2

Diseño de Sistemas de Tiempo-real

PROGRAMACION DISTRIBUIDA

Alta Disponibilidad. SISTEMAS DISTRIBUIDOS Departamento de Sistemas e Informática Escuela de Ingeniería Electrónica FCEIA

COMPUTACIÓN DE ALTA PERFORMANCE

RES (Red Española de Supercomputación) & PRACE

Anexo Técnico Partida 3

Diseño de sistemas de tiempo real

Evolución de los Sistemas Operativos

Oferta de Trabajos en Grupo. Arquitectura y Tecnología de Computadores

1.9 Año 2000 y años siguientes

PROCESOS E HILOS - Hilo

Ubuntu in the Clouds. Ubuntu Jaunty Jackalope Ing. Andrés E. Rodriguez Lazo

Java Básico. Introducción a Java. Copyright

Costos del Cómputo Paralelo en Clusters Heterogéneos

Objetos Distribuidos - Componentes. Middleware

Supercomputador LUSITANIA

Arquitectura de Computadoras para Ingeniería

Sistemas operativos (Parte 4)

Aplicaciones M2M, monitorización y control remoto con TSmarT

Linux Clusters Gilberto Diaz Centro de Cálculo Científico Universidad de Los Andes Mérida - Venezuela

Clusters. High Performance Cluster Computing. de Rajkumar Buyya. Sergio Romero, Febrero 2009 Arquitecturas Distribuidas

Sistemas Operativos. Introducción. Matías Zabaljáuregui

ATLANTE! i n f r a e s t r u c t u r a d e s u p e r C o m p u t a c i ó n G o b i e r n o d e C a n a r i a s!

BENEMÉRITA UNIVERSIDAD AUTÓNOMA DE PUEBLA FACULTAD CIENCIAS DE LA COMPUTACIÓN

Sistemas Operativos. Iván Bernal, PhD 4. Escuela Politécnica Nacional I.

Tema 1: Introducción a los Sistemas Distribuidos. Sistemas Distribuidos Marcos López Sanz [Curso ]

Utilización de Matlab en clusters y grids

Diseño de un simulador de dinámica molecular basado en CORBA

CLUSTER FING: ARQUITECTURA Y APLICACIONES

Construcción de clusters de computadoras de bajo costo utilizando software libre

Sistemas Distribuidos. Soporte de Sistemas Operativos

Adaptación del Driver de la Tarjeta de Red D-Link DGE-530T para GAMMA

Características técnicas del firmware de la Computadora Industrial Abierta Argentina

Supercomputación basada en estándares para el desarrollo de la I+D+I

Tema 1 Introducción a los Sistemas Distribuidos

Medidas de Alta Disponibilidad

UNIVERSIDAD AUTONOMA DE QUERETARO Facultad de Informática

TEMA 4 PROCESAMIENTO PARALELO

TEMA 3: MP DE MEMORIA COMPARTIDA (III)

Transcripción:

Grupo de Arquitectura de Computadores, Comunicaciones y Sistemas ARQUITECTURA DE COMPUTADORES II AUTORES: David Expósito Singh Florin Isaila Daniel Higuero Alonso-Mardones Javier García Blas Borja Bergua Guerra Área de Arquitectura y Tecnología de Computadores Departamento de Informática Universidad Carlos III de Madrid Julio de 2012 TEMA 6: COMPUTACIÓN CLUSTER

Índice 1. Introducción. 2. Arquitecturas cluster y componentes. 3. Middleware y Single System Image. 4. Ejemplos. 5. Referencias. 2

1. Introducción Qué es un cluster: A cluster is a type of parallel or distributed processing system, which consists of a collection of interconnected stand-alone/complete computers cooperatively working together as a single, integrated computing resource. [Buyya98] 3

Computación cluster vs. otros [Tony Cortés 03] Distancia entre nodos Cluster computing SM Parallel computing Un chip Un rack Una sala Grid computing Un edificio El Mundo 4

Evolución de la HPC [metáfora de Buyya] 1984: Mainframe Mini Computer Workstation PC Vector Supercomputer 5

Evolución de la HPC (II) [metáfora de Buyya] 1994: Mini Computer Mainframe Workstation PC Vector Supercomputer MPP 6

Evolución de la HPC (y III) [metáfora de Buyya] El presente y el futuro!: 7

Componentes de un cluster Hardware + Software: Hardware: n nodos: PCs, workstations, MPs,etc. n red: Gigabit, Myrinet, ATM, etc. Software: n Sistema Operativo.: Linux, Sun Solaris, IBM AIX, etc n Comunicación: Sockets, etc.; Light weight protocols. n Específico: cluster middleware: n Single System Image (SSI) n System Availability (SA) 8

2. Arquitecturas cluster y componentes 9

Hardware: nodos Se utilizan computadores más que arquitecturas -- convencionales : PCs Workstations MP (normalmente SMP) No se desarrollan máquinas especiales para ser nodos de un cluster! 10

Hardware: nodos Ejemplos: Intel Pentium, Xeon, etc. Sun Sparc, Ultrasparc IBM RS6000 Digital En un mismo cluster pueden coexistir diferentes arquitecturas y S.O., o ambos 11

Hardware: nodos Blue Gene / P Rack Cabled 32 Node Cards up to 64x10 GigE I/ O links System up to 256 racks Quad-Core PowerPC System-on-Chip Chip 4 processors Compute Card 1 chip, 20 DRAMs 13.6 GF/s 8 MB EDRAM 12 Node Card 32 Compute Cards up to 2 I/O cards 13.6 GF/s 2 or 4 GB DDR2 435 GF/s 64 or 128 GB 14 TF/s 2 or 4 TB up to 3.56 PF/s 512 or 1024 TB Ultrascale capacity machine ( cluster buster ): run 4,096 HTC jobs on a single rack. The system scales from 1 to 256 racks: 3.56 PF/s peak 12

Hardware: redes Algunos ejemplos: Ethernet Fast Ethernet Gigabit Ethernet SCI ATM Myrinet HIPPI FiberChannel 13

Hardware: redes (Blue Gene /L) 14

Hardware: redes Toro 3D - Comunicaciones Árbol - Comunicaciones colectivas - E/S Ethernet Red de control 15

Hardware: redes 3D Torus

Hardware: protocolos de comunicación Protocolos tradicionales ( pesados ): TCP/IP Protocolos especiales ( ligeros ): Active Messages (U. Berkeley) VMMC (Virtual-Memory Mapped Communication) U-net (U. Cornell) XTP (U. Virginia) etc. 17

Software SS. OO. habituales: Linux: Beowulf Solaris: Berkeley NOW Windows NT: HPVM etc. Entornos de programación: Threads MPI PVM 18

Software: organización jerárquica del Blue Gene Nodos de cómputo: dedicados a la ejecución de aplicaciones de usuarios. Simple compute node kernel (CNK) Nodos de E/S: ejecutan Linux y proporcionan servicios del S.O: ficheros, sockets, ejecución procesos, señales, depurado y terminación. Nodos de servicio: implemente los servicios de gestión del S.O. (heart beating, monitorización, reiniciado del nodo) transparentes a las aplicaciones. 19

Software: organización jerárquica de Blue Gene Componentes: E/S, nodos de servicio, CNK Processing sets (psets): 1 nodo de E/S+ varios nodos de cómputo 8, 16, 64, 128 NCs Agrupación lógica Proximidad física de los componentes => comunicaciones rápidas Job: colección de N procesos de cómputo Espacio de direcciones privado. Comunicador MPI MPI: ranks 0, N-1 20

CNK Consume 1MB Espacio de memoria Único espacio de memoria 511/1023MB Dos espacios de memoria de 255/511MB No memoria virtual ni páginas Carga en modo push: 1 NC lee el ejecutable del sistema de ficheros y se lo envía a los otros procesadores. Única imagen cargada. 21

CNK No planificación (único proceso). No gestión de memoria (No se usa la TLB) No hay servicios de E/S locales. Nivel de usuario hasta que: Se realiza llamada al sistema. Interrupciones hardware: timer (solicitada por la aplicación), eventos anormales. Llamada al sistema Simple: Se gestiona localmente: alarmas, obtener hora, medida tiempo. Compleja: enviada a los nodos de E/S. 22

Nodo de E/S Niveles completos del protocolo TCP/IP Sistemas de ficheros soportados: NFS, GPFS, Lustre, PVFS Proceso principal: Control y demonio de E/S (CIOD) Ejecución de un trabajo Job manager envía solicitud al nodo de servicio. Nodo de servicio contacta con el demonio de E/S (CIOD) CIOD envía el ejecutable a todos los procesos en el pset 23

Llamadas de sistema 24

Software Compiladores: Java C, C++ Otros: depuradores herramientas para análisis de rendimiento herramientas de visualización etc. 25

4. Middleware Qué es el middleware de un cluster: Interface entre las aplicaciones y el hardware con su S.O. Capas de middleware: n SSI (Single System Image) n SA (System Availability): n detección y recuperación frente a errores n tolerancia a fallos 26

SSI Concepto: Single System Image (SSI) es la ilusión que presenta un conjunto de recursos como uno solo y más potente. SSI hace aparecer al cluster como una máquina única para el usuario y sus aplicaciones. Un cluster sin SSI no es un cluster! 27

SSI: beneficios Ventajas del empleo de SSI: Se pueden usar los recursos del sistema de manera transparente. Migración de procesos y equilibrado de carga entre los nodos. Mejora la fiabilidad y disponibilidad de recursos. Mejora el tiempo medio de respuesta y el rendimiento. Simplifica la gestión del sistema. Proporciona independencia del hardware. 28

SSI: servicios Entre otros, son deseables los siguientes: único... 1. punto de entrada 2. jerarquía de archivos 3. punto de control 4. espacio de memoria 5. gestor de trabajos 6. interfaz de usuario 7. espacio de E/S [SIO] 8. espacio de procesos [SPP] 29

SSI: a qué nivel implementarlo Nivel de aplicación Nivel de Kernel del S.O. Nivel Hardware 30

SCO NonStop Cluster for UnixWare http://www.sco.com/products/clustering/ nodo: monoproc. o SMP nodo: monoproc. o SMP Usuarios, aplicaciones y gestión del sistema Usuarios, aplicaciones y gestión del sistema Llamadas estándar al SO Extensiones Llamadas estándar al SO Extensiones Standard SCO UnixWare with clustering hooks Modular kernel extensions Modular kernel extensions Standard SCO UnixWare with clustering hooks Hardware Hardware ServerNet Otros nodos 31

Referencias Sitios web: IEEE Task Force on Cluster Computing (TFCC): http://www.ieeetfcc.org Sitio de Rajkumar Buyya http://www.csse.monash.edu.au/~rajkumar Y los señalados sobre clusters particulares... Libros: R. Buyya, Ed., High Performance Cluster Computing, Vol. 1 System and Architecture, Vol. 2 Programming and Applications, Prentice Hall PTR, 1998. 32

Referencias (y II) G.F.Pfister, In Search of Clusters, 2nd Edition, Prentice Hall, 1998. Th. L. Sterling, J.Salmon, D. J. Becker, D. F. Savarrese, How to Build a Beowulf, The MIT Press, 1999. D.H.M. Spector, Building Linux Clusters, O'Reilly & Associates, 2000 33