Linux Week PUCP. Computación de Alto Rendimiento en Linux. rmiguel@senamhi.gob.pe



Documentos relacionados
Arquitectura: Clusters

Evaluación del rendimiento de procesadores Intel Nehalem. Modelos x7550, x5670 y x5570

Nicolás Zarco Arquitectura Avanzada 2 Cuatrimestre 2011

Desarrollo de un cluster computacional para la compilación de. algoritmos en paralelo en el Observatorio Astronómico.

FUNDAMENTOS DE COMPUTACIÓN PARA CIENTÍFICOS. CNCA Abril 2013

EVALUACIÓN COMPARADA DEL RENDIMIENTO DEL PROCESADOR INTEL 5570 (NEHALEM)

CLASIFICACION DE LAS COMPUTADORAS

Modelo de aplicaciones CUDA

Global File System (GFS)...

Supercómputo. Oscar Rafael García Regis Enrique Cruz Martínez

Capacidad de procesamiento del compilador Python para el Sistema Operativo Windows y Linux Palabras Clave:

CLUSTER FING: PARALELISMO de MEMORIA DISTRIBUIDA

Soluciones para entornos HPC

CLASIFICACIÓN DE LAS COMPUTADORAS. Ing. Erlinda Gutierrez Poma

CLUSTER FING: ARQUITECTURA Y APLICACIONES

NTRODUCCION. "Tipos de Computadoras" Tipos de Computadoras

Capítulo 5. Cliente-Servidor.

4. Programación Paralela

Intel Tera-Scale Computing Alumno: Roberto Rodriguez Alcala

Pruebas y Resultados PRUEBAS Y RESULTADOS AGNI GERMÁN ANDRACA GUTIERREZ

Introducción HPC. Curso: Modelización y simulación matemática de sistemas. Esteban E. Mocskos (emocskos@dc.uba.ar) Escuela Complutense Latinoamericana

UNIVERSIDAD TECNOLOGICA ECOTEC DIEGO BARRAGAN MATERIA: Sistemas Operativos 1 ENSAYO: Servidores BLADE

Capítulo 2 Red UDLA-P

Redes cableadas (Ethernet)

:Arquitecturas Paralela basada en clusters.

Servicios avanzados de supercomputación para la ciència y la ingeniería

CLUSTERS. Antonio Antiñolo Navas ESI-UCLM. Profesor: Serafín Benito Santos. Arquitectura e Ingeniería de Computadores

Figura 1.4. Elementos que integran a la Tecnología de Información.

Javier Pérez Mato µp para Comunicaciones Curso 2008/09 ETSIT - ULPGC

CAR.

Arquitecturas de computadoras

Introducción Componentes Básicos Concurrencia y Paralelismo Ejemplos Síntesis Lecturas Recomendadas. Arquitectura de Computadoras

GPU IMPLEMENTATIONS OF SCHEDULING HEURISTICS FOR HETEROGENEOUS COMPUTING ENVIRONMENTS

Laboratorio Nacional de Cómputo de Alto Desempeño: Fortalecimiento de la Infraestructura 2015

UNIVERSIDAD DE ORIENTE FACULTAD DE ICIENCIAS ECONOMICAS LAS REDES I. Licda. Consuelo Eleticia Sandoval

Introducción a las redes de computadores

Almacenamiento virtual de sitios web HOSTS VIRTUALES

COMO CONFIGURAR UNA MAQUINA VIRTUAL EN VIRTUALBOX PARA ELASTIX

Version 3. Capítulo 9. Fundamentos de hardware avanzado para servidores

Nuevas tendencias: Virtualización de computadores / servidores

Laboratorio Nacional de Cómputo de Alto Desempeño: Fortalecimiento de la Infraestructura 2015

Hostaliawhitepapers. Las ventajas de los Servidores dedicados. Cardenal Gardoki, BILBAO (Vizcaya) Teléfono:

Generalidades Computacionales

UAEM 2015, Estado de México

Windows 2000 Server. Manual de Windows 2000 Server

Características del software

CAPÍTULO 3: Resultados

BUSES GRUPO 8 Miguel París Dehesa Ricardo Sánchez Arroyo

Introducción a Computación

CAPITULO II MANUAL DE USUARIO

Gestión de proceso y documentos

No se requiere que los discos sean del mismo tamaño ya que el objetivo es solamente adjuntar discos.

Extractos de la conferencia: Supercomputación y Software Libre realizada por Linalco en la Universidad de Granada

Soluciones innovadoras para optimizar su infraestructura TI. Virtualización con el sistema operativo i, PowerVM y Power Systems de IBM

Unidad de disco duro frente a Kingston SSDNow V+ 200 Series 240GB: prueba comparativa...1

Tipos de computadoras

Sistema Operativo Windows

ACTIVIDAD No. 2 REPASO DE REDES INFORMATICAS

Guia para examen de Sistemas Operativos Para primer parcial Febrero 2013 Revisión 2 Ing. Julio Cesar Gonzalez Cervantes

Documentación Información técnica de Servidores Cloud Infinity+

EL CLUSTER FING: COMPUTACIÓN DE ALTO DESEMPEÑO EN FACULTAD DE INGENIERÍA

REDES DE COMPUTADORAS

Servidores blade. AGUILERA FERNANDO [Escribir el nombre de la compañía] 14/04/2011

UNIVERSIDAD CARLOS III DE MADRID

ACTIVIDADES TEMA 1. EL LENGUAJE DE LOS ORDENADORES. 4º E.S.O- SOLUCIONES.

Introducción a la Computación

Descripción. Este Software cumple los siguientes hitos:

Cloud Computing CRM y ERP

introducción Simulación de flujos de fluidos utilizando grillas de de cómputo resumen

BACKUP SERVIDOR IPLAN INTRODUCCIÓN AL SERVICIO

Infraestructura Tecnológica. Sesión 2: Mejoras adicionales al servidor de archivos

Capítulo VI. Estudio de Caso de Aplicación del Integrador de Información Desarrollado

Introducción al Cluster


ING. YURI RODRIGUEZ ALVA

Infraestructura Tecnológica. Sesión 1: Infraestructura de servidores

CLOUD COMPUTING: DE LA VIRTUALIZACIÓN DE APLICACIONES Y DE ESCRITORIO, A LA VIRTUALIZACIÓN DE SERVIDORES.

Microsoft HPC. V 1.0 José M. Cámara (checam@ubu.es)

Redes I Clase # 3. Licda. Consuelo E. Sandoval

Instalación y mantenimiento de servicios de Internet. U.T.3.- Servicio DNS

GANETEC SOLUTIONS HPC Farmacéuticas

SIGAN 1.0 SISTEMA DE INFORMACIÓN DE GESTIÓN ADMINISTRATIVA DE NÓMINA

INTRODUCCIÓN. Que es un sistema operativo? - Es un programa. - Funciona como intermediario entre el usuario y los programas y el hardware

Dirección General de Administración de Bienes y Contratación Administrativa

Administración de la memoria

Los mayores cambios se dieron en las décadas de los setenta, atribuidos principalmente a dos causas:

Familia de Windows Server 2003

Pattern Generation System Moda, Confección

Especificaciones de Hardware, Software y Comunicaciones

TEMA 4. Unidades Funcionales del Computador

Clusters en Linux. * Jorge Castellanos - jorcas@cantv.net ** Julio Ortega - roliverio@cantv.net. * FACYT-UC Computación ** IUPSM Sistemas

Implementación de algoritmos genéticos paralelos de grano burdo en redes locales de computadoras. Resumen

Autenticación Centralizada

CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK.


EMC SCALEIO SAN de servidor convergente definida por software

ATLANTE! i n f r a e s t r u c t u r a d e s u p e r C o m p u t a c i ó n G o b i e r n o d e C a n a r i a s!

15. Arquitectura de los multiprocesadores. 16. Multiprocesadores de memoria compartida. 17. Multicomputadores.

INTRODUCCION A LA COMPUTACION

Tema: INSTALACIÓN Y PARTICIONAMIENTO DE DISCOS DUROS.

Transcripción:

Linux Week PUCP 2006 Computación de Alto Rendimiento en Linux Richard Miguel San Martín rmiguel@senamhi.gob.pe

Agenda Computación Científica Computación Paralela High Performance Computing Grid Computing Referencias

Computación Científica La computación científica siempre ha cumplido un rol importante en el desarrollo de la computación como ciencia. Inicialmente se desarrolló en el ámbito de computación para cálculo intensivo. Las principales aplicaciones usadas eran compiladores como ForTran y aplicaciones desarrolladas en laboratorios de universidades y en grupos reducidos. Con el tiempo la computación científica fue abriéndose campo en otras áreas mas comerciales y en la actualidad se usa en casi todos los ámbitos.

Como ejecutar una aplicación mas rápido? Existen tres maneras de mejorar el rendimiento: Trabajar Duro. Trabajar mas rápido. Pedir Ayuda. En términos computacionales: Usar hardware mas rápido. Optimizar algoritmos y usar técnicas para resolver tareas computacionales. Múltiples computadoras para resolver una tarea especifica. Es decir COMPUTACION EN PARALELO!!!

Computación Paralela Computación Paralela es el uso de múltiples procesadores o múltiples computadores trabajando juntos para realizar una tarea común. - Cada procesador trabaja en una sección del problema. - Los procesadores intercambian datos para resolver el problema. Mesh of problem to be solved y CPU #1 works on this area exchange CPU #2 works on this area of the problem of the problem exchange exchange exchange CPU #3 works on this area exchange CPU #4 works on this area of the problem of the problem x

Computadores en Paralelo Taxonomía de Flynn nos ayuda a clasificar este tipo de computadores: Se basa en dos criterios: Data Stream Instruction Stream

Otras consideraciones Memoria: Que clase de Memoria? Red: Cuantos procesadores están interconectados? Granularidad Gruesa (Parallel Vectorial Processing) Son pocos pero poderosos (Procesadores Vectoriales) Granularidad Fina (Massively Parallel Processors) Son muchos pero no muy potentes (Procesadores RISC) Paradigma de la Programación: Que Clase de estilo de programación es posible en esta maquina?

Como esta organizada la memoria? Memoria Privada y Paso de Mensajes Multicomputadores Memoria Compartida Multiprocesadores (SMPs)

Como esta organizada la memoria? -Cada CPU tiene <1/2 de max. de ancho de banda -Dispositivos de I/O y la memoria comparten el mismo bus. -Agregar CPU puede aumentar los problemas. -No es escalable mas allá de las 2 vías. -Cuellos de botella son disminuidos o eliminados. -Agregar CPU implica agregar memoria. -Ancho de banda dedicado entre CPU y memoria. -Existe comunicación directa entre procesadores. -I/O es independiente del acceso a la memoria.

High Performance Computing Donde usarla? En problemas que signifiquen grandes retos. Simulaciones Biológicas (Bioinformática). Predicción del Tiempo y Clima. Dinámica de Fluidos. Requerimientos de Cómputo y Memoria: Una simulación usando códigos de secuencias de proteínas -> 32 GB RAM. Modelos de pronostico de Tiempo a 48 horas -> 10 15 operaciones de punto flotante (float). En modernas estaciones de trabajo (2 Gflops) se puede llegar a las 300 horas de calculo.

Unidades de Medida en High Performance Computing Velocidad del procesador: floats: operaciones de punto flotante / segundo. Megaflops / Gigaflops / Teraflops / Petaflops Velocidad de la red: 10 Mbit/100mbit / 1000 Mbit=1 Gbit Unidad de Tamaño : byte kbyte/mbyte ----> caches/ram Gigabite -----> RAM/hard disks Terabyte -----> Disks/SAN... Petabyte ------> SAN

Cluster de Computadores y su Arquitectura Definición: Es un tipo de sistema paralelo o de procesamiento distribuido, el cual consiste de un grupo de computadores independientes interconectados entre si, trabajando cooperativamente como un único recurso de computación integrado.

Clasificación de Clusters : Cuales son las Aplicaciones? Aplicaciones de Misión Critica: Sistemas de control de comando. Bancos, E- Commerce. High Availibility (HA) Clusters Aplicaciones Científicas: High Performance (HP) Clusters Clusters Paralelos (Beowulf) Aplicaciones Paralelizadas Clusters HT (High Troughput) (OpenMosix) Aplicaciones Seriales

Que se necesita para construir un cluster?

La Red en HPC Latencia Que tanto tiempo se demora en abrir el canal de comunicación?. Ancho de banda Que cantidad de datos pueden ser transmitidos en una unidad de tiempo.

Software Libre en HPC Sistema Operativo Linux Clusters Tools (ROCKS, Oscar) - http://oscar.openclustergroup.org/ - http://www.cs.wisc.edu/~zandy/rocks/ MPICH - http://www-unix.mcs.anl.gov/mpi/mpich/ OpenMosix - http://openmosix.sourceforge.net/ PVFS - http://www.parl.clemson.edu/pvfs/ Ganglia - http://ganglia.sourceforge.net/

HPC en SENAMHI Cluster Beowulf de 30 nodos. - CPU P4 2.8 Ghz. - 256 MB RAM cada nodo. - 60 GB HD cada nodo. - Red Fast Ethernet. - S.O. Red Hat Linux. Aplicación: Modelamiento climático a largo plazo mediante generación de escenarios para 50 años. Proyecto PROCLIM

Proyecto PROCLIM El SENAMHI está participando en el proyecto PROCLIM, en conjunto con otras instituciones con el objetivo de mejorar las capacidad nacional de respuesta a fenómenos climáticos que afecten a nuestro país, así como el mejoramiento del aire. La tarea del SENAMHI en este proyecto es generar escenarios climáticos que permitan prever el cambio climático en los siguientes 50 años. Para realizar esta actividad es necesario usar modelos numéricos de clima que, basándose en ecuaciones matemáticas, permiten obtener pronósticos a largo plazo.

Nuestra aplicación Modelo Numérico basado en ecuaciones diferenciales que asociadas con diferentes variables realizan un análisis del estado de la atmósfera y permite inferir pronósticos a largo plazo. Permite realizar pronósticos en dominios con muy alta resolución. Desarrollado por ATMET http://www.atmet.com Código escrito en Fortran y se encuentra paralelizado. Realiza comunicación nodo maestro nodos esclavos, internodos y bidireccional también.

Nuestra aplicación Para la paralelización del código serial este fue dividido en dos tipos: Master process: (Inicialización y todas las funciones de I/O) Node compute process: (all computation). No es necesario que los archivos de salida se almacenen en los nodos, ya que estos retornan al nodo principal. Esta centralización facilita las tareas de respaldo de datos.

Algunos resultados Forecast of winds and temperature on Piura domain for 2016 April. Forecast of winds and temperature on Mantaro domain for 2016 April.

Pruebas de Rendimiento 20 22,5 25 27,5

HPC en SENAMHI Cluster de 7 nodos. - HP DL140 2P Intel Xeon. - 1 GB RAM cada nodo. - 80 GB SATA HD cada nodo. - Red Gigabit Ethernet. - S.O. Red Hat Enterprise Linux v. 3.0. / CentOS. - SAN HP MSA1000 7 x 148 GB SCSI Aplicación: Modelamiento de sequías para cuencas prioritarias del Perú. Proyecto Sequías SENAMHI INDECI.

Grid Computing El término Grid en computación es un símil al termino malla en terminología eléctrica. Esto es, que desde cualquier punto de una red, cualquier usuario puede hacer uso de toda la potencia de esta. También se conoce como computación distribuida.

University of Texas Model Grid

Grid Computing Ventajas - Eficiente uso de recursos de computo ya que permite ahorrar dinero. - Disminuye el tiempo de respuesta para aplicaciones grandes. - Compartir recursos para acceder a mayores recursos de computo (procesamiento, memoria y almacenamiento. Desventajas - Exige tiempo dedicado a la instalación, configuración y pruebas de software. - Probables problemas de migración de aplicaciones para portarlas al Grid. - Largas sesiones de negociación y políticas de uso. - Exige entrenamiento para el personal de staff y usuarios.

Principales Proyectos de Grid Computing http://www.eurogrid.org/ http://www.teragrid.org/ http://www.eela-grid.org/ http://styx.esrin.esa.it/grid/

Software Libre en Grid Computing Sistema Operativo Linux Globus Toolkit http://www.globus.org Condor http://www.cs.wisc.edu/condor/ MPICH http://www-unix.mcs.anl.gov/mpi/mpich/

Referencias http://www.beowulf.org http://www.openmosix.org http://www.linux-ha.org/ http://www.top500.org/ http://www-1.ibm.com/grid/ http://www.gridforum.org/ http://www.sun.com/software/grid/ http://lcic.org/ http:///www.eu-eela.org/

rmiguel@senamhi.gob.pe rmiguel@usmp.edu.pe