GREASY. Paralelismo trivial en LaPalma

Documentos relacionados
Mendieta. Carlos Bederián IFEG-CONICET, FaMAF-UNC WHPC13

Gestor de Colas SGE. 1. Qué es? 2. Configuración actual en CICA 3. Comandos 4. Trabajos Paralelos 5. Entorno gráfico QMON

Realizar un respaldo de CISCO PRIME INFRASTRUCTURE 1.4 para usarlo en la versión 2.2

Curso: Uso de infraestructuras Clúster y Grid para proyectos de e-ciencia. Lanzamiento y Monitoreo de Jobs en Condor. GRID COLOMBIA - RENATA [Ciudad]

1. El entorno de desarrollo Eclipse

sudo mkdir /usr/local/pgsql/data /home/ /home/juan sudo chown juan /usr/local/pgsql/data

Uso del simulador Modelsim

Para poder instalar el producto, tendremos que obtener el instalador apropiado para nuestro entorno hardware y software.

Introducción a ZEUS. Introducción. Curso Doctorado Sistemas Multi-agente. Zeus es una herramienta de desarrollo de SMA.

Conociendo el ambiente de programación de Java. M. en C. Erika Vilches

Creación de imágenes. Pablo Sanz Mercado.

11224 Gestión Avanzada de OpenGnSys

INSTALACIÓN PHP+MYSQL CON EASYPHP

Linux Monitorización de rendimiento. Herramientas integradas en el sistema Herramientas Sysstat Monitorización de programas Monitor del sistema

Copias de seguridad con SQL Server 2005 WhitePaper Febrero de 2008

IBM SPSS Collaboration and Deployment Services (C&DS) versión 7

Introducción a OpenFoam

Los bloques DLL (Figura A.1) externos permiten al usuario escribir su propio código y

A continuación se detallan los pasos a seguir para configurar los terminales SIP de la gama A675xi en la Serie X de Aastra5000.

Monitorización SGBD PostgreSQL

MAGALLANES. deployment tool

11gR2; Reiniciar Automáticamente DB Console

MANUAL DE INSTALACIÓN DE NORTON ANTIVIRUS CORPORATE EDITION VERSION 8 y 9 (Para equipos con Windows 98, Me, 2000 y XP)

Requerimientos del sistema para la instalación. Creación y configuración de la conexión a Euskalnet Empresa

Windows Embedded Standard 7

Simulación de redes locales Ethernet utilizando NS-2

Creación de un cluster HPC con GNU/Linux

PR Plataforma JasperServer Manual de instalación para JasperServer 3.5

Edición 1 ES. Nokia y Nokia Connecting People son marcas comerciales registradas de Nokia Corporation

Manual de instalación del cliente JAVA-WS

SISTEMAS INFORMÁTICOS EN TIEMPO REAL 2º Ingeniería Industrial MANUAL DE HERRAMIENTAS SOFTWARE PARA PROGRAMACIÓN EN UNIX

Resumen. DESlock+ Guía Básica de Configuración. Requerimientos del Sistema:

Gestión de Red Gestión de Registros (logs)

Kosmo Desktop Manual de desarrollo Instalación y configuración del código fuente de Kosmo en Eclipse

Mejora tu sitio web. Rafael Sebastián Aguilar. Curso de extensión universitaria Campus de Burjasot Universidad de Valencia Febrero 2014

Gestión de Red Gestión de Registros (logs)

WDpStats Procedimiento de instalación

Configuración avanzada de IBM SPSS Modeler Entity Analytics

Fundamentos de Programación

MultiBase y Cosmos. Particularidades sobre la instalación del motor de base de datos en modo cliente servidor. BASE 100, S.A.

Configuración de BIND y DNS

# the. in the next command references the cloudera home directory # in hdfs, /user/cloudera

Para esto será necesario configurar el Servidor http en el AS/400. Veremos a configuración que requerimientos:

Plataforma de expediente

Audit. Trail Cleanup en Oracle11gr2, Oracle11gr1, Oracle10gr2

Cálculos en paralelo con FreeFem++

Realizar un Backup Programado con SQL Server 2005 WhitePaper Marzo de 2007

Grid Engine y Slurm HPC Admintech Valencia, Mayo Jesús Cuenca Senior HPC SIE

Introducción a OpenFoam Presentación general de OpenFoam

V. SERVICIOS DEL SISTEMA NIS LDAP NTP

ILUSTRACIÓN DEL PROBLEMA DE LA IDENTIFICABILIDAD EN LOS MODELOS MULTIECUACIONALES

Rendimiento y monitorización

Manual de configuración del cliente remoto de Oficina Conectada

eps Network Services Notas sobre la versión

Instalar y configurar MailStore. para Exchange Server

KASPERSKY ADMINISTRATION KIT 8.0 KASPERSKY ANTIVIRUS FOR WINDOWS WORKSTATIONS 6.0 R2 KASPERSKY ANTIVIRUS FOR WINDOWS FILE SERVERS 6.

Guía de para Utilizar Comando Batch File De Carga Múltiple

Modelo de Gobierno de Datos con SPARK

6. SISTEMAS CAD-CAM (CAM) 6.1. CONCEPTO DE CAM

HPC-Support. David Vicente BSC Support group

Microsoft HPC. V 1.0 José M. Cámara (checam@ubu.es)

Prosurv cez. Versión Guía de instalación e inicio rápido PPC Guía de instalación e inicio rápido de Prosurv cez.

Sun Grid Engine en entornos Grid. Isabel Campos BIFI

Leica icon Series. Guía de instalación y activación. Versión 1.0 Español

Servicios pensados para optimizar los procesos de comunicación de voz y SMS.

Sesión 1. Comandos básicos. Curso 09/10. Fernando Rincón Escuela Superior de Informática Universidad de Castilla-La Mancha

LABORATORIO DE CONTROL POR COMPUTADOR 4º - INGENIERIA DE TELECOMUNICACION

IMPLEMENTANDO UNA BASE DE DATOS INDEPENDIENTE EN SQL SERVER 2014

EXPORTACIÓN E IMPORTACIÓN EN OPENCMS6

Cluster Beowulf/MPI en Debian

Presentación Infraestructura Computación CloudPYME- Versión 1.0

Instalando Mass Agent para Grid Control

NetGUI: 2. Configuración de RIP en Zebra

Introducción a la Computación Distribuida y Condor

Comenzando con Drupal 8 y colaborando con el proyecto

Requerimientos del sistema para la instalación. Instalación del Software de Usuario Remoto

1 INSTALACIÓN DE LA TARJETA DE COMUNICACIONES CP5613 EN EL PC (para Windows 2000 pro)

CENTRO DE SUPERCOMPUTACIÓN

Instalación. Interfaz gráfico. Programación de Backups. Anexo I: Gestión de la seguridad. Manual de Usuario de Backup Online 1/21.

Backup & Recovery Oracle 9i. Las copias físicas offline, conocidas como Backups en frío, se realizan cuando la Base de Datos está parada.

INSTITUTO GEOFISICO DEL PERÚ CENTRO NACIONAL DE DATOS GEOFISICOS - CDNG

Instalación Hadoop. Guía para Debian y derivados

Laboratorio de Desarrollo Software

CAR. Responsable : María del Carmen Heras Sánchez. Asesores Técnicos : Daniel Mendoza Camacho Yessica Vidal Quintanar.

Enlace para bajar la herramienta: ftp://ftp.cs.stir.ac.uk/pub/staff/kjt/software/jasper-1.3.tar.gz

Guía para realizar el primer diseño con el Max+Plus II

MANUAL DE USUARIO. Webservice simple para la exportación rápida de información proveniente de una base de datos. Versión 0,1,1

Introducción. Guía detallada para la utilización de código de técnicas de ingeniería inversa en diagramas de UML con Microsoft Visio 2000

ZILOG DEVELOPER STUDIO

Hadoop. Cómo vender un cluster Hadoop?

Comisión Nacional de Bancos y Seguros

Faustino Palmero Acebedo Grupo de Física No Lineal. Universidad de Sevilla

Introducción a Linux. El regreso a los años 70: la consola (III)

Preliminares. Configuración de correo en Office 365

Guía de instalación y configuración de IBM SPSS Modeler Social Network Analysis 16

Manual de utilización del Agente de Avamar

INSTITUTO TECNOLÓGICO DE SALINA CRUZ Redes de Computadora Semestre enero junio 2015 Reporte de prácticas

SISTEMAS INFORMÁTICOS EN TIEMPO REAL 2º Ingeniería Industrial MANUAL DE HERRAMIENTAS SOFTWARE PARA PROGRAMACIÓN EN UNIX

Guía de Usuario - Módulo Carrito abandonado Pro

Transcripción:

GREASY Paralelismo trivial en LaPalma

SIMULACIONES HPC EN LAPALMA Cada subproblema interacciona con alguno o varios subproblemas Necesita una red de interconexión de alto rendimiento Ejecución en LaPalma #! /bin/bash # # @ job_name = simul01 # @ initialdir =. # @ output = simul_%j.out # @ error = simul_%j.err # @ total_tasks = 64 # @ wall_clock_limit = 72:00:00 srun./gadget2 simul01.tex

SIMULACIONES HPC EN LAPALMA (II) Lista de trabajos en el sistema de gestión de colas ~/galaxy> mnq active jobs------------------------ NAME JOBID STATE PROCS simul01 2010242 Running 64

PARALELISMO TRIVIAL (I) Tratamiento de un gran número de imágenes Pre y postprocesamiento de código paralelo Ajuste de parámetros en código serial Ejecución en LaPalma #! /bin/bash # # @ job_name = recognition # @ initialdir =. # @ output = recognition_%j.out # @ error = recognition_%j.err # @ total_tasks = 1 # @ wall_clock_limit = 00:05:00./face_recog img01.jpg

PARALELISMO TRIVIAL (II) Escribir un fichero de comandos por cada trabajo de 1 procesador Tamaño considerable de la lista de trabajos ~/face_recog> mnq active jobs------------------------ NAME JOBID STATE PROCS recognition 2010381 Running 1 recognition 2010382 Running 1 recognition 2010383 Running 1 recognition 2010384 Running 1 recognition 2010385 Running 1 recognition 2010386 Running 1 recognition 2010387 Running 1

GREASY Herramienta desarrollada por el BSC y disponible en todas las máquinas de la RES. Simplifica el paralelismo trivial agrupando múltiples tareas en un único trabajo. En un sistema como LaPalma la cola de trabajos se reduce considerablemente. 1 fichero, múltiples líneas, cada línea 1 tarea. Único fichero de registro para el conjunto de tareas. Posibilidad de indicar dependencias.

SOFTWARE GREASY Se puede encontrar en /gpfs/apps/greasy en todas las máquinas de la RES /gpfs/apps/greasy/latest /bin Programa para invocar a greasy /etc Configuración global /doc Guía de usuario /example Ficheros de ejemplo para comenzar a utilizar greasy

PRIMEROS PASOS GREASY (I) Copiar ficheros de ejemplo del directorio /example bsc_greasy.job example.txt short-example.txt Listado de tareas en short-example.txt: /bin/sleep 20 /bin/sleep 10 /bin/sleep 5

PRIMEROS PASOS GREASY (II) Fichero de comandos bsc_greasy.job : # @ total_tasks = 4 # @ wall_clock_limit = 00:05:00. FILE=short-example.txt. ################################################## # Run greasy! # ################################################## /gpfs/apps/greasy/2.1/bin/greasy $FILE Enviar trabajo a sistema de colas (SLURM) ~/greasy> mnsubmit bsc_greasy.job Submitted batch job 2010356

Trabajos en cola PRIMEROS PASOS GREASY (III) ~/greasy> mnq active jobs------------------------ NAME JOBID STATE PROCS greasy 2010356 Running 4 1 active jobs Ficheros de salida greasy-2010356.err greasy-2010356.log greasy-2010356.out

PRIMEROS PASOS GREASY (IV) Fichero de registro ~/greasy> cat greasy-2010356.log greasycolorlog Start greasing ~/greasy/short-example.txt INFO: MPI engine is ready to run with 3 workers INFO: Allocating task 1 INFO: Allocating task 2 INFO: Allocating task 3 INFO: Task 3 completed successfully on node s04c3b08. Elapsed: 00:00:05 INFO: Task 2 completed successfully on node s04c3b08. Elapsed: 00:00:10 INFO: Task 1 completed successfully on node s04c3b08. Elapsed: 00:00:20 INFO: MPI engine finished INFO: Summary of 3 tasks: 3 OK, 0 FAILED, 0 CANCELLED, 0 INVALID. INFO: Total time: 00:00:20 INFO: Resource Utilization: 58.33% Finished greasing ~/greasy/short-example.txt

FICHERO DE TAREAS El número de línea es el identificador de una tarea Se pueden incluir comentarios iniciando la línea con # Las líneas en blanco y los comentarios también consumen un identificador de tarea Se pueden indicar dependencias incluyendo al inicio de la línea: [# <lista de dependencias> #] Sólo se permiten dependencias de tareas anteriores, no posteriores Posibilidad de incluir rangos así como dependencias relativas.

DEPENDENCIAS Ejemplo de dependencias example.txt /bin/sleep 1 /usr/bin/hostname /bin/sleep 3 /bin/sleep 4 /bin/sleep 5 /bin/sleep 6 ########################################### # These Lines with dependencies are correct ########################################### [# 5 #] /bin/sleep 11 [# -1#] /bin/sleep 12 [#1-3#] /bin/sleep 13 [#1, 3-5 #] /bin/sleep 14 [##] /usr/bin/hostname

DEPENDENCIAS (II) ~/greasy> cat greasy-2010379.log greasycolorlog Start greasing ~/greasy/example.txt INFO: MPI engine is ready to run with 3 workers INFO: Allocating task 1 INFO: Allocating task 2 INFO: Allocating task 3 ERROR: Task 2 failed with exit code 32512 on node s04c4b03. Elapsed: 00:00:00 WARNING: Cancelling task 13 because of task 2 failure INFO: Allocating task 4 INFO: Task 1 completed successfully on node s04c4b03. Elapsed: 00:00:01 INFO: Allocating task 5 INFO: Task 3 completed successfully on node s04c4b03. Elapsed: 00:00:03 INFO: Allocating task 6 INFO: Task 4 completed successfully on node s04c4b03. Elapsed: 00:00:04 INFO: Allocating task 15 ERROR: Task 15 failed with exit code 32512 on node s04c4b03. Elapsed: 00:00:00

DEPENDENCIAS (III) INFO: Task 5 completed successfully on node s04c4b03. Elapsed: 00:00:05 INFO: Allocating task 11 INFO: Allocating task 14 INFO: Task 6 completed successfully on node s04c4b03. Elapsed: 00:00:06 INFO: Task 11 completed successfully on node s04c4b03. Elapsed: 00:00:11 INFO: Allocating task 12 INFO: Task 14 completed successfully on node s04c4b03. Elapsed: 00:00:14 INFO: Task 12 completed successfully on node s04c4b03. Elapsed: 00:00:12 INFO: MPI engine finished INFO: Summary of 11 tasks: 8 OK, 2 FAILED, 1 CANCELLED, 0 INVALID. INFO: Total time: 00:00:29 INFO: Resource Utilization: 64.36% INFO: Creating restart file ~/greasy/example.txt.rst... INFO: Restart file created Finished greasing ~/greasy/example.txt

FICHERO DE REINICIO (I) Permite relanzar aquellas tareas erróneas # # Greasy restart file generated at 2013-05-27 20:14:40 # Original task file: example.txt # Log file: ~/greasy/greasy-2010379.log # # Warning: Task 2 failed /usr/bin/hostname # Warning: Task 13 was cancelled due to a dependency failure [# 8 #] /bin/sleep 13 # Warning: Task 15 failed /usr/bin/hostname # End of restart file

FICHERO DE REINICIO (I) Permite relanzar aquellas tareas erróneas # # Greasy restart file generated at 2013-05-27 20:14:40 # Original task file: example.txt # Log file: ~/greasy/greasy-2010379.log # # Warning: Task 2 failed /bin/hostname # Warning: Task 13 was cancelled due to a dependency failure [# 8 #] /bin/sleep 13 # Warning: Task 15 failed /bin/hostname # End of restart file

FICHERO DE REINICIO (II) Cambiamos el fichero de tareas original por el de reinicio y volvemos a lanzar el job Start greasing ~/greasy/example.txt.rst INFO: MPI engine is ready to run with 3 workers INFO: Allocating task 8 INFO: Allocating task 12 INFO: Task 8 completed successfully on node s01c3b03. Elapsed: 00:00:00 INFO: Allocating task 10 INFO: Task 12 completed successfully on node s01c3b03. Elapsed: 00:00:00 INFO: Task 10 completed successfully on node s01c3b03. Elapsed: 00:00:13 INFO: MPI engine finished INFO: Summary of 3 tasks: 3 OK, 0 FAILED, 0 CANCELLED, 0 INVALID. INFO: Total time: 00:00:13 INFO: Resource Utilization: 33.33% Finished greasing ~/greasy/example.txt.rst

TESTING Y SOPORTE Solicitar acceso a LaPalma: cat.cluster.lapalma@iac.es Grupo de soporte de LaPalma en el IAC: res_support@iac.es Soporte software GREASY: support@bsc.es