Proyecto Grid Computing Éric Lajeunesse Olivier Piché
Definición de una GRID: DTDI Una infraestructura que permite el acceso y procesamiento concurrente de un programa entre varias entidades computacionales independientes. Es como si tuvieramos un gran computador Virtual en nuestros manos. 2
Grid Middleware Los requisitos Se le podría comparar a un sistema operativo. Ejemplos : Globus Toolkit, Legion, Boinc, etc Grid Aplicacion Las aplicaciones que van a funcionar sobre la GRID. Ejemplo : aplicación meteorologico, aplicación de simulacion, aplicaciones con gran uso de calculos, etc 3
Fases del Proyecto DTDI 4
FASE 1 (realizada) GRID versión 1 dentro de la oficina: Investigar la tecnología Grid Computing disponible Grid Middleware: Globus Toolkit 2.2 (GT 2.2) Grid Applications: Aplicación piloto Probar esta versión 1 de GRID y analizar los resultados Disponible bajo entornos Linux, Unix 5
FASE 2 GRID versión 2 dentro de la oficina: Grid Middleware: Globus Toolkit 3.0 (GT 3.0) Grid Applications Probar esta nueva versión de tecnología GRID y analizar los resultados Disponible para entornos indows, Linux, Unix 6
FASE 3-4 GRID versión 2 dentro del INEI : Instalar e implantar una aplicación practica por la GRID en el INEI Analizar y difundir resultados de esta implantación de GRID. GRID versión 2 dentro del estado : Ubicar una aplicación Piloto y las Instituciones que deseen participar. Instalar, programar, ejecutar, analizar resultados y difundir forma de trabajo del GRID 7
El Globus Toolkit 2.2 DTDI Grid Middleware Colección de servicios (herramientas) Infraestructura de bajo nivel Apoya muchos modelos de programación, herramientas, usos 8
Funcionamiento del Globus Toolkit (1) Utiliza una herramienta de seguridad : Globus Security Infrastructure (GSI) (PKI, SSL v3) Utiliza tres herramientas de servicos : Globus Resource Allocation Manager (GRAM) Metacomputing Directory Service (MDS) Grid File Transfer Protocol (GridFTP) DTDI 9
Funcionamiento del Globus Toolkit (2) Foco en la arquitectura Propone el sistema de servicios del Core como infraestructura básica Permite construir soluciones de alto nivel, dominio-especificas A p l i c a c i o n s DTDI Varios Servicios global Servicios Core Globus Local OS 10
Niveles de la Arquitectura Globus Applications DTDI GlobusView High-level Services and Tools Testbed Status DUROC MPICH-G2 Condor-G CC++ Nimrod/G globusrun Nexus Gloperf Metacomputing Directory Service Core Services Globus Security Interface Heartbeat Monitor GRAM GASS Condor LSF MPI Easy NQE Local Services AIX TCP Irix UDP Solaris 11
Aplicación piloto desarrollada PI = 3.141592... Compuesto por tres subsistemas Iniciación gridfinal init Master master orker worker (para iniciar el interfaz gráfico) (para desplegar el master y worker sobre la GRID) (coordina todos los worker) (procesa el calculo de PI) 12
Descripción del calculo de PI DTDI El calculo concretamente de la constante PI que hacemos dentro la aplicación es basado sobre la método de Monte Carlo que es la siguiente : 13
Desglose del calculo de PI N = k * n Implementación en el orker: n = tamaño del trabajo (SIZE) n1 = n2 = n3 =... = nk Implementación en el Master: k = número de trabajos (JOB) Ejemplo: 500 = 50 (JOB) * 10 (SIZE) 14
Proceso Global (1) La aplicación se divide en estas etapas cronológicamente : Iniciación (usuario). Master y orker(s) desplegados sobre la GRID. Master y orker hacen su trabajo respectivo. Fin de la aplicación. 15
Proceso Global (2) Ejemplo de la ejecución 4 maquinas 8 worker elajeunesse.inei.gob.pe maquina INIT MASTER proceso max.inei.gob.pe olivier.inei.gob.pe carlos.inei.gob.pe 16
Iniciación (1) Solamente sobre una máquina Funcion Llenar los datos del proceso de calculo de PI Buscar los maquinas disponible sobre la GRID (MDS) 17
Iniciación (2) DTDI 18
Master (1) Un proceso master es desplegado sobre una maquina de la GRID Función Coordina la evolución de cada worker Escribe los resultados y las estadísticas del proceso 19
DTDI Master (2) 20
orker El worker es transparente al usuario. Los procesos worker son desplegados sobre maquinas de la GRID Función Empieza a calcular una parte del calculo total de PI (trabajos) Manda su resultado y pide para procesar otra parte del calculo hasta que todas las partes sean culminadas. 21
Proceso Global (2) Ejemplo de la ejecución 4 maquinas 8 worker elajeunesse.inei.gob.pe maquina INIT MASTER proceso max.inei.gob.pe olivier.inei.gob.pe carlos.inei.gob.pe 22
Pruebas y análisis La distribución de la aplicación sobre la GRID disminuye el tiempo de proceso total de la aplicación Diminución del tiempo de proceso Tiempo (segunda) 900 800 700 600 500 400 300 200 100 0 817 502 367 241 0 1 2 3 4 5 Número de maquina(s) 23
Condor-G Investigación futura (1) Agrega funcionalidades a la herramienta GRAM de Globus. MPICH-G2 Permite que los usos de Message Passing Interface (MPI) funcionen con Globus. 24
Investigación futura (2) Globus Toolkit 3 (GT 3) Base del nuevo desarrollo de la GRID versión 2 Utilizará Open Grid Services Architecture (OGSA) y Java Podrá trabajar con indows NT/2000/XP Estado Actual: Versión Alpha 25
Ventajas de la GRID Poder de computación / Precio es muy barato Tiene el poder de un Supercomputador El software es gratis y usa código fuente abierto No es necesario comprar hardware adicional, para posibilitar el incremento de la potencia de computo. Funcionará con todo las arquitecturas indows, Linux, Unix, Aix,... Flexible para el desarrollador y la institución Transparente para el usuario que participa en la GRID (como orker) 26
Conclusión y recomendación DTDI El Grid computing es una tecnología muy prometedora Hay otras otras soluciones (Legion, Xtremweb, etc), pero Globus es el estandar para construir una GRID Recomendamos de seguir con las otras fases del proyecto Grid Computing 27
Preguntas y presentación de la aplicación 28