PONENCIAS. Proyecto FORMIGA: reaprovechando recursos para la investigación. FORMIGA Project: Reusing resources for research.



Documentos relacionados
Proyecto e-ca: Organización Virtual y Testbed. Susana Sánchez Expósito José Ruedas Sánchez II Reunión de e-ciencia Andaluza 16-17, Octubre 2008

Windows Server Windows Server 2003

Soluciones innovadoras para optimizar su infraestructura TI. Virtualización con el sistema operativo i, PowerVM y Power Systems de IBM

Guía de uso del Cloud Datacenter de acens

E-learning: E-learning:

Resumen de la solución SAP SAP Technology SAP Afaria. Gestión de la movilidad empresarial para mayor ventaja competitiva

D Definición de la infraestructura de soporte.

UNIVERSIDAD DE SALAMANCA

Capítulo 5. Cliente-Servidor.

Propuesta de Portal de la Red de Laboratorios Virtuales y Remotos de CEA

ADMINISTRACIÓN CENTRALIZADA DELL POWERVAULT DL2000 CON TECNOLOGÍA SYMANTEC

QUÉ ES UN SERVIDOR Y CUÁLES SON LOS PRINCIPALES TIPOS DE SERVIDORES? (PROXY, DNS, WEB, FTP, SMTP, ETC.) (DV00408A)

Seminario Electrónico de Soluciones Tecnológicas sobre VPNs de Extranets

Almacenamiento virtual de sitios web HOSTS VIRTUALES

Los mayores cambios se dieron en las décadas de los setenta, atribuidos principalmente a dos causas:

WINDOWS : TERMINAL SERVER

Curso Online de Microsoft Project

Normativa de Hosting Virtual de la Universidad de Sevilla

Información de Producto:

UT04 01 Máquinas virtuales (introducción)

Bechtle Solutions Servicios Profesionales

Descripción Plataforma Cloud del proyecto CloudPYME

Escritorios virtuales

Introducción a las redes de computadores

Pruebas y Resultados PRUEBAS Y RESULTADOS AGNI GERMÁN ANDRACA GUTIERREZ

Symantec Backup Exec System Recovery 7.0 Server Edition. Recuperación de sistemas en cuestión de minutos, en lugar de en horas o días

Educación virtual INFROMATICA ADRIAN GOMEZ ROMAN 2014/12/30

Utilización del sistema operativo GNU/ Linux en las netbooks

Instrucciones para la instalación de IBM SPSS Data Access Pack para Linux

INFORME Nº GTI INFORME TÉCNICO PREVIO DE EVALUACIÓN DE SOFTWARE

CAPÍTULO 2 DEFINICIÓN DEL PROBLEMA

Las TIC: una apuesta para la mejora de la educación en la Comunidad de Madrid

COMO CONFIGURAR UNA MAQUINA VIRTUAL EN VIRTUALBOX PARA ELASTIX

Escritorio remoto y VPN. Cómo conectarse desde Windows 7

ING. YURI RODRIGUEZ ALVA

Windows Server 2012: Infraestructura de Escritorio Virtual

Hostaliawhitepapers. Las ventajas de los Servidores dedicados. Cardenal Gardoki, BILBAO (Vizcaya) Teléfono:

Studium, Campus Virtual de la Universidad de Salamanca.

ESTRATEGIA PARA EL DESARROLLO DEL SECTOR DE TI

a) Materias de educación on-line en plataforma virtual (obligatorias, optativas y trabajo de fin del máster).

La Pirámide de Solución de TriActive TRICENTER

SIEWEB. La intranet corporativa de SIE

Oportunidad Solución Características

System Center. la plataforma para una gestión ágil de los entornos de TI IDG COMMUNICATIONS, S.A.

5 formas de mejorar su negocio con COMPUTACIÓN EN LA NUBE

Proyecto de creación de una empresa, Servicios Computacionales y Audiovisuales,

pymegnu v2.0 PRESENTACIÓN DE PRODUCTOS

Descripción. Este Software cumple los siguientes hitos:

LINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN

Análisis de Requisitos integración FORMIGA-CLOUD / DIRAC (Prototipo II)

Trabajo TP6 Sistemas Legados

CAPÍTULO 3: Resultados

LiLa Portal Guía para profesores

Estrategia de Cómputo en la Nube. Servicios en la Nube

Unidad III. Software para la administración de proyectos.

Ventajas de Linux para. las empresas

Nuevas tendencias: Virtualización de computadores / servidores

e-commerce, es hacer comercio utilizando la red. Es el acto de comprar y vender en y por medio de la red.

Arquitectura: Clusters

Reducción del Coste Total de Propiedad (TCO) en la Administración Local

Modificación y parametrización del modulo de Solicitudes (Request) en el ERP/CRM Compiere.

Configuracion Escritorio Remoto Windows 2003

CAPITULO 4. ANALISIS COMPARATIVO Y SELECCION DE LA PLATAFORMA EDUCATIVA.

Seminario Electrónico de Soluciones Tecnológicas sobre Acceso Remoto. 1 de 12

Un Sistema Distribuido para el Manejo de Correo Electrónico

El gasto total elegible de la BBPP, Centro de Supercomputación es de ,11. La ayuda FEDER, es el 80%, ,48

CAPITULO IV CONCLUSIONES Y RECOMENDACIONES

El importe de las ofertas no podrá exceder de un total de IVA incluido. En este importe se incluirá cualquier otro gasto.

2.1 Clasificación de los sistemas de Producción.

AULAS VIRTUALES EDUCATIVAS

PROYECTO. Solución Empresarial Ingeniería y Desarrollo de Software - info@solucionempresarial.com.

Vielka Mari Utate Tineo Instituto Tecnológico de las Américas ITLA. Profesor José Doñé PRATICA NO. 24, CLUSTER

Infraestructura Tecnológica. Sesión 8: Configurar y administrar almacenamiento virtual

Preguntas Frec uentes Ia a S

CAPÍTULO 1 Instrumentación Virtual

IS23 Mantenimiento de Instalaciones Informáticas Práctica 6. Acceso remoto a ordenadores tipo PC

Especificaciones de Hardware, Software y Comunicaciones

servicios públicos establecer un plan director de almacenamiento

TELEPROCESOS Y SISTEMAS DISTRIBUIDOS

Guía Rápida de Inicio

Ventajas del software del SIGOB para las instituciones

UNIVERSIDAD TECNOLOGICA ECOTEC DIEGO BARRAGAN MATERIA: Sistemas Operativos 1 ENSAYO: Servidores BLADE

REDES DE ÁREA LOCAL. APLICACIONES Y SERVICIOS EN WINDOWS

Práctica de Seguridad en Redes

SOFTWARE DE VIRTUALIZACIÓN Y SUS APLICACIONES: XEN SOBRE LINUX,

Hyper-V: Un puente entre Windows Server 2008 y SUSE Linux Enterprise 10

Q-expeditive Publicación vía Internet

INFORME Nº GTI INFORME TÉCNICO PREVIO DE EVALUACIÓN DE SOFTWARE

Comunicación interna: Intranets

ACTIVIDAD No. 2 REPASO DE REDES INFORMATICAS

INSTITUTO TECNOLÓGICO DE COLIMA LIC. EN INFORMÁTICA

LICITACIÓN N L13045 NUEVO SISTEMA LEY DE TRANSPARENCIA

Implantar Microsoft Software Updates Service (SUS)

ALOJAMIENTO DE SERVIDORES EN EL C.P.D.

WINDOWS : SERVIDOR DHCP

CÓMO CONFIGURAR DHCP EN SUSE LINUX

PRACTICA NO.24: CLUSTER

Evaluación del rendimiento de procesadores Intel Nehalem. Modelos x7550, x5670 y x5570

Creación y administración de grupos locales

Transcripción:

Proyecto FORMIGA: reaprovechando recursos para la investigación FORMIGA Project: Reusing resources for research Carlos Fernández Resumen Este proyecto persigue satisfacer la demanda creciente de recursos computacionales existente entre los investigadores de la universidad, poniendo a su disposición la potencia de cálculo disponible en las aulas de informática en los períodos en que éstas permanecen inactivas. Para la realización de este proyecto se empleará la emergente tecnología grid que permite el acceso a todos estos recursos de una forma homogénea Para la realización de este proyecto se empleará la emergente tecnología grid que permite el acceso a todos estos recursos de una forma homogénea. Palabras clave: Tecnología grid, recursos computacionales. Summary This project aims to satisfy the growing demand among university researchers for computational resources, placing the calculating power available in computer classrooms at their disposal during downtime periods. For the implementation of this project, the emergent grid technology that allows homogeneous access to all of these resources will be used. Keywords: Grid technology, computational resources. Crece la demanda de recursos computacionales requerida por los investigadores gallegos para realizar diversos proyectos de investigación en e-ciencia 1. Introducción En la actualidad muchas instituciones como las universidades disponen de aulas de informática para usos docentes, laboratorios, etc., que acumulan una gran potencia computacional. Solo la Universidad de Santiago de Compostela dispone de más de 1800 ordenadores. El Departamento de Electrónica y Computación, uno de los participantes del proyecto, dispone de más de 400 equipos en sus aulas. Durante las noches, fines de semana y períodos no lectivos todos estos recursos están siendo desaprovechados, con la consiguiente pérdida económica que esto conlleva, sobre todo si tenemos en cuenta que la vida útil de estos ordenadores es muy corta porque rápidamente quedan desfasados. Por otro lado, cada día crece la demanda de recursos computacionales requerida por los investigadores gallegos para realizar diversos proyectos de investigación en e-ciencia en áreas que van, desde la dinámica molecular y la química cuántica, hasta la nanotecnología. Estos investigadores demandan no solo un servicio High Performance Computing (HPC) para la realización de trabajos con grandes requerimientos tanto de memoria como de potencia de cálculo, sino que en muchos casos también necesitan realizar un gran número de trabajos con requerimientos mucho más modestos, demandando en este caso un servicio High Throughput Computing (HTC). Con este proyecto se pretende integrar todos los recursos disponibles en las aulas de informática, empleando la emergente tecnología grid, para facilitar de esta forma su reaprovechamiento por los propios investigadores de las universidades gallegas para la resolución de problemas científicos, aumentando su competitividad y rentabilizando aún más la inversión hecha en las aulas. 56

Como ejemplo sirva el hecho de que, durante el año 2006 se ejecutaron en las máquinas del CESGA 187752 trabajos que solicitaron un tiempo de ejecución de menos de 5 horas. Por las características de muchos de estos trabajos, considerados trabajos de HTC, podrían ser migrados a la nueva infraestructura reduciendo los tiempos de espera de las colas del CESGA y permitiendo el uso de los servidores del CESGA para tareas con mayores demandas computacionales. De este modo se lograría una mejora sustancial de los recursos computacionales disponibles a un coste muy reducido. Todo el software y documentación generada por el proyecto será Open Source y se distribuirá bajo la licencia GPL. El software se pondrá a disposición de la comunidad a través de la Forxa de Mancomun (Iniciativa galega polo software libre) para que todos los interesados puedan aprovechar los resultados del proyecto y contribuir a expandir la plataforma a otros entornos. El CESGA ya participó en el año 1998 en un innovador proyecto que buscaba la integración de clusteres dispersos basados en ordenadores de tipo 'commodity' denominado Superordenador Virtual Galego (SVG). Este tipo de sistemas es ampliamente utilizado hoy en día, y de hecho, el CESGA participó desde aquel día en varios proyectos basados en tecnología grid que, de un modo semejante persiguen el mismo objetivo. Al igual que el SVG, el grid surge también con la idea de compartir recursos dispersos para realizar cálculos computacionales. Dentro de las iniciativas grid cabe destacar el EGEE/EGEEII, actualmente el mayor grid de producción del mundo e int.eu.grid, a continuación del proyecto crossgrid. El CESGA colabora en ambos proyectos, por lo que conoce a fondo esta tecnología. Todo el software y documentación generada por el proyecto será Open Source y se distribuirá bajo la licencia GPL Actualmente, dentro de los proyectos grid, existe otra tendencia alternativa a las anteriores denominada 'Desktop computing', que trata de crear grids computacionales a partir de ordenadores no dedicados y simplificando las tareas de instalación para que cualquiera pueda aportar su ordenador cuando no esté siendo utilizado. 2. Recursos a utilizar Los ordenadores de las aulas de informática durante los períodos en que estos permanezcan inactivos, como por ejemplo por las noches o durante las vacaciones. 3. Arquitectura En los ordenadores de las aulas se han instalado máquinas virtuales que son utilizadas como nodos de cálculo (Worker Nodes, WN) y que están conectadas a un Computing Element (CE) situado en el CESGA que se encargará de recibir los trabajos y distribuirlos entre los nodos. Para la distribución de trabajos el CESGA facilita un Workload Management System (WMS) que se encarga de repartir los trabajos entre los CE disponibles. Para la distribución de trabajos el CESGA facilita un Workload Management System (WMS) que se encarga de repartir los trabajos entre los CE disponibles Para la autentificación de los usuarios se dispone de un servidor VOMS que comprueba la identidad de los usuarios a partir de sus certificados de usuario. Mediante este servidor también se puede agrupar a Proyecto FORMIGA: reaprovechando recursos para la investigación, Carlos Fdez http://www.rediris.es/rediris/boletin/85-86/ponencia7.pdf 57

los usuarios en distintas comunidades a través de la creación de diferentes Organizaciones Virtuales (VO). Esto permite hacer grupos de usuarios con intereses afines y distribuir de forma flexible los recursos disponibles entre las distintas facultades y grupos de investigación. Como se puede observar en el esquema de la Figura 1 se requiere conectividad bidireccional entre los ordenadores de las aulas y los servidores del CESGA. También se requiere de conectividad bidireccional entre las distintas aulas. FIGURA 1. DIAGRAMA DE ARQUITECTURA El servidor VOMS permite hacer grupos de usuarios con intereses afines y distribuir de forma flexible los recursos disponibles entre las distintas facultades y grupos de investigación Las máquinas virtuales tienen que estar en una red pública o en una red privada con acceso a Internet Estos requisitos se verán satisfechos mediante la utilización de una red privada virtual gestionada por el CESGA. El uso de la tecnología grid también permitirá en el futuro expandir esta infraestructura a otros campus y universidades de Galicia, de forma que estos recursos estén disponibles para todos los investigadores gallegos. Además el proyecto Formiga está asociado a otro proyecto elaborado en el CESGA denominado G-Fluxo. Este proyecto persigue la implementación de un portal web que dé soporte al envío de trabajos directamente mediante el interfaz de una página web, y sin más necesidad que la de disponer de un navegador web y conexión a internet. Actualmente estamos suministrando a los usuarios que lo solicitan máquinas virtuales configuradas como UI (User Interface). Esto tiene la ventaja de que el usuario puede lanzar los trabajos usando la consola de un Linux directamente desde su propio PC, sin necesidad de conectarse a una UI configurada en los servidores del CESGA, con lo que ganamos en simplicidad, velocidad y facilidad de uso. 4. Requerimientos Es necesario disponer del software de virtualización adecuado para cada sistema operativo, léase XEN 3.0 o superior para Linux y VmWare Player en Windows. Las máquinas virtuales tienen que estar en una red pública o en una red privada con acceso a Internet. Se tendría que configurar el dom0 para que estuviese en la misma red privada y que hiciera NAT a las VM, o poner un ordenador para que realice esta tarea. Las máquinas virtuales tienen que poder acceder a la red VPN del CESGA. 58

5. Gestión El CESGA dispone actualmente de herramientas que permiten monitorizar de forma remota la infraestructura así como realizar una contabilidad correcta del uso que se esté dando de los recursos. El CESGA se ocupará de la gestión remota de las máquinas en todos los temas relacionados con su uso en el grid. Para ello, es necesario que se hagan llegar al CESGA los horarios de las aulas para planificar su disponibilidad. La gestión física de las máquinas corresponderá al administrador del aula. En caso de que haya que resolver in situ un problema relacionado con el grid el personal del CESGA deberá poder acceder al aula en el horario previsto a tal efecto. 6. Compatibilidad La infraestructura propuesta es la primera de su tipo en España que ofrece interoperabilidad con EGEE, EELA, int.eu.grid y con la iniciativa grid española (NGI). Esta interoperabilidad se consigue gracias al empleo del middelware glite 3.1 directamente sobre la infraestructura virtual y su integración con el sitio de producción que el CESGA mantiene dentro del proyecto EGEE. El CESGA dispone de herramientas que permiten monitorizar de forma remota la infraestructura así como realizar una contabilidad correcta del uso que se esté dando de los recursos 7. Rendimiento Perdemos rendimiento si ejecutamos los trabajos en una máquina virtual y no en un equipo físico? A partir de diversas herramientas de análisis de rendimiento y comparativas de las ejecuciones de programas como el gromacs hemos llegado a la conclusión de que el rendimiento perdido debido a la ejecución en una máquina virtual frente a la ejecución en un equipo exclusivo es mínimo, del orden de un uno por ciento. Mediante el benchmark de disco IOZONE hemos comprobado que el rendimiento de las máquinas virtuales en cuanto a lectura y escritura difiere según estén alojadas en linux o en windows. Las lanzadas con VmWare tienden a aumentar el rendimiento conforme el tamaño del fichero aumenta, mientras que las lanzadas con xen tienen un comportamiento más uniforme. El rendimiento perdido debido a la ejecución en una máquina virtual frente a la ejecución en un equipo exclusivo es mínimo, del orden de un uno por ciento Las comparativas de Linpack y Gromacs han demostrado que la pérdida de rendimiento de cpu de la máquina virtual es muy poca respecto a su dom0. Proyecto FORMIGA: reaprovechando recursos para la investigación, Carlos Fdez http://www.rediris.es/rediris/boletin/85-86/ponencia7.pdf 59

8. Punto de vista del usuario Un usuario de la Universidad de Santiago de Compostela que desee lanzar sus trabajos al grid del FORMIGA debe seguir los siguientes pasos: 1) Solicitar una cuenta de usuario en el nodo de acceso al grid (User Interface). 2) Configurar la cuenta de usuario. 3) Obtener un certificado X.509 de la Autoridad Certificadora (CA) correspondiente. 4) Unirse a la Organización Virtual (VO) CESGA. 5) Autorización para usar los recursos (vía un proxy limitado en el tiempo). La reducción del tiempo de ejecución permite realizar estudios del dispositivo en donde el número de simulaciones es mayor 9. Conclusiones Este proyecto está diseñado para ampliar las capacidades de cómputo de los investigadores en la universidad. Aquellos centros que aporten ordenadores a la infraestructura siempre van a poder contar con una cantidad de recursos igual o superior a la que han aportado, de manera que esos recursos sean lo más utilizados posible. Actualmente estamos trabajando en la integración de las máquinas virtuales instaladas en los equipos de las aulas con el entorno lectivo, es decir, que las máquinas virtuales sigan trabajando todo el día, siendo detenidas en el momento en el que un usuario empiece a usar el equipo, y reanudándolas cuando termine su trabajo. Esto nos va a permitir aumentar la utilización de las aulas y evitar los tiempos muertos que se producen a lo largo del día. El proyecto Formiga aúna el intento de aumentar la capacidad de cálculo de los investigadores y el reaprovechamiento de recursos infrautilizados en los campos universitarios Decir que no solo las aulas de informática pueden ser instaladas con este software, sino que el objetivo son además todos aquellos equipos que por potencia o bajo uso no estén siendo usados al 100%. Paralelamente, el departamento de electrónica de la USC ha trabajado sobre los equipos del Formiga lanzando instancias de un simulador de nanotransistores (Monte Carlo) logrando reducir el tiempo de ejecución a la cuarta parte del tiempo de ejecución del simulador en una única máquina. Este tiempo es dos veces menor que el mejor tiempo obtenido por una versión del mismo código paralelizada con OpenMP. La reducción del tiempo de ejecución permite realizar estudios del dispositivo en donde el número de simulaciones es mayor. En definitiva el proyecto Formiga aúna el intento de aumentar la capacidad de cálculo de los investigadores y el reaprovechamiento de recursos infrautilizados en los campos universitarios. Carlos Fernández CESGA 60