Computación Distribuida



Documentos relacionados
8 de Mayo de 2003 WORKSHOP IRIS-GRID. Middleware COORDINACIÓN

Proyecto Grid Computing

La interoperabilidad se consigue mediante la adopción de estándares abiertos. Las organizaciones OASIS y W3C son los comités responsables de la

Problemas. Limitaciones de clusters. Intranet Computing. TEMA 4: Grid Computing

1 GLOSARIO. Actor: Es un consumidor (usa) del servicio (persona, sistema o servicio).

Modelos de los sistemas distribuidos. Jorge Iván Meza Martínez

Service Oriented Architecture

Gestión de datos y otros servicios en GRID

Capítulo 5. Cliente-Servidor.

GLOSARIO. Arquitectura: Funcionamiento, estructura y diseño de una plataforma de desarrollo.

Servicios Web: Orquestación y coreografías

Grid Computing. Clase 1: glite Overview. Francisco García Eijó y Alejandro Soba. Laboratorio de Sistemas Complejos Universidad de Buenos Aires

Coordinador general: José Luis Gordillo Ruiz. Informe Técnico Final.

Introducción a los Servicios Web. Ing. José Luis Bugarin ILUMINATIC SAC jbugarin@consultorjava.com

Plataformas GRID. Área de Arquitectura y Tecnología de Computadores

Tecnologías Grid Estándares grid

Arquitectura: Clusters

LINEAMIENTOS ESTÁNDARES APLICATIVOS DE VIRTUALIZACIÓN

UNIVERSIDAD AUTÓNOMA DEL CARIBE

ARQUITECTURA DE DISTRIBUCIÓN DE DATOS

JAVA EE 5. Arquitectura, conceptos y ejemplos.

ARQUITECTURAS DE PROCESOS DE NEGOCIOS INGENIERIA DE SOFTWARE ING. MA. MARGARITA LABASTIDA ROLDÁN

ANEXO 1. ANEXO TÉCNICO

PORTAL DE INTEGRACIÓN DE BANCOS DE INFORMACIÓN DISPERSOS A TRAVÉS DE WEB SERVICES Autor: Ing. Walther Antonioli Ravetto

Sistemas. Distribuidos

Grado en Ingeniería Informática

E-learning: E-learning:

Especificación de la secuencia de mensajes que se han de intercambiar. Especificación del formato de los datos en los mensajes.

UNIVERSIDAD DE ORIENTE FACULTAD DE ICIENCIAS ECONOMICAS LAS REDES I. Licda. Consuelo Eleticia Sandoval

Capas del Modelo ISO/OSI

GOBIERNO ELECTRONICO OPEN SOURCE

Grid Computing. Evolución de los sistemas. Harold Castro, Ph.D. Departamento de Sistemas y Computación

GRID COMPUTING MALLA DE ORDENADORES

SISTEMAS DE INFORMACIÓN II TEORÍA

El papel del estándar WPS en la arquitectura orientada a servicios en SIG.

Infraestructura Tecnológica. Sesión 5: Arquitectura cliente-servidor

- Capacidad para dirigir las actividades objeto de los proyectos del ámbito de la informática de acuerdo con los conocimientos adquiridos.

TIVOLI. GERZEL, Stella Maris.

Una puerta abierta al futuro

Virtualización y cloud en la DGT.

La Intranet Gubernamental como elemento clave de la Interoperabilidad

1. Instala sistemas operativos en red describiendo sus características e interpretando la documentación técnica.

Open Source Uso de hipergate como Intranet

Competencias generales vinculadas a los distintos módulos Módulo de Formación Básica

SUPLEMENTO EUROPASS AL TÍTULO

Service Oriented Architecture: Con Biztalk?

RODRIGO TAPIA SANTIS com) has a. non-transferable license to use this Student Guide

Alicia Serrano Sánchez, Francisco Sánchez Molina, David Villa Alises, Felix Jesús Villanueva Molina y Juan Carlos López López

Universidad Nacional Autónoma de México Dirección de Sistemas Dirección General de Personal

PROCEDIMIENTO ESPECÍFICO. Código G Edición 0

PERFIL TÉCNICO CONSULTOR SHAREPOINT PARA LA WEB

Software de sistema: Programas genéricos que permiten gestionar los recursos del ordenador.

Estructura de Computadores I Arquitectura de los MMOFPS

Organización. Elaboró: Ing. Ma. Eugenia Macías Ríos

BIBLIOTECA VIRTUAL DE CANARIAS. Gobierno de Canarias. Institución: Viceconsejería de Desarrollo Industrial e Innovación Tecnológica.

Suite Open Source de CRM y GroupWare Características Funcionales

PROGRAMACIÓN DE SISTEMAS INFORMATICOS. Certificado de profesionalidad IFCT0609

General Parallel File System

Introducción a las redes de computadores

Arquitectura cliente/servidor

La aplicación práctica en el mundo empresarial de los estándares Web

1. Introducción 2. Historia 3. Características clave 4. Cuestiones de diseño

Gerencia de Procesos de Negocio (Business Process Management, BPM). Lic. Patricia Palacios Zuleta

ESTADO DEL ARTE DEL GRID

Arquitecturas de computadoras

Tecnologías Grid Integración de herramientas grid

Soluciones innovadoras para optimizar su infraestructura TI. Virtualización con el sistema operativo i, PowerVM y Power Systems de IBM

Sistemas Operativos Windows 2000

Introducción. - Gráfica tomada del Artículo de José David Parra

Servicios Web Estándares, Extensiones y Perspectivas de Futuro

Estándares para el Uso de Herramientas de Desarrollo y Plataformas de Aplicaciones Web

Introducción al GRID

E-Government con Web Services

SISTEMAS DE INFORMACIÓN I TEORÍA

El gasto total elegible de la BBPP, Centro de Supercomputación es de ,11. La ayuda FEDER, es el 80%, ,48

TECNÓLOGO EN DESARROLLO DE SOFTWARE

Sistemas Ubicuos 4. Descubrimiento de servicios

Tecninorte Programación y Mantenimiento Parque Empresarial Tirso González, 22 - oficina Astillero - Cantabria

SUPLEMENTO EUROPASS AL TÍTULO

Título: Optimización de Procesos de Negocio con SOA / BPM Nombre y Apellido: Mario Bolo bolo@ar.ibm.com Fecha: 15/08/2012

Tema 5. GESTIÓN DE REDES DE TELECOMUNICACIONES

FUNDAMENTOS DE COMPUTACIÓN PARA CIENTÍFICOS. CNCA Abril 2013

Alternativas de un ISV para migrar sus productos a un entorno CLOUD Virtualización en entornos cloud

COMERCIO ELECTRÓNICO UNA INTRODUCCIÓN GENERAL

.NET y J2EE VALORACIÓN Y COMPARACIÓN DE LOS ELEMENTOS DE LAS DOS PLATAFORMAS. Definiciones...2 C# y Java...3 Similitudes...4 Ventajas...

Servicios TIC. Propuesta educación Universidad

Autenticación Centralizada

SIEWEB. La intranet corporativa de SIE

Preguntas Frec uentes Ia a S

Hyper-V: Un puente entre Windows Server 2008 y SUSE Linux Enterprise 10

IDeP. Service Oriented Network Architecture SONA. IDeP SA La Punta, San Luis, Agosto 2008

Almacenamiento virtual de sitios web HOSTS VIRTUALES

MACROPROCESO GESTIÓN TECNOLÓGICA

Arquitectura de sistema de alta disponibilidad

Transcripción:

Computación Distribuida Parte II: Computación Grid Juan Ángel Lorenzo del Castillo Grupo de Arquitectura de Computadores Departamento de Electrónica y Computación Universidad de Santiago de Compostela

Índice Supercomputación clásica Grid Computing Arquitectura de un Grid Middleware para Grid Ejemplos de infraestructuras Grid reales 2

Índice Supercomputación clásica Limitaciones de la supercomputación clásica Alternativas a la supercomputación clásica Explotación distribuida de los recursos Problemas actuales en supercomputación Grid Computing Arquitectura de un Grid Middleware para Grid Ejemplos de infraestructuras Grid reales 3

Limitaciones de la supercomputación clásica Aplicaciones que requieren potencia computacional Alto Rendimiento: Ejecución de una aplicación en menos tiempo (paralelización previa). Alta Productividad: Ejecución de un número mucho mayor de aplicaciones. Alta Disponibilidad: Sistema disponible la mayor parte del tiempo posible. Solución clásica: Computación centralizada basada en servidor. 4

Limitaciones de la supercomputación clásica Problemas de la supercomputación basada en servidor: Falta de escalabilidad Equipos muy caros Mantenimiento muy caro Las demandas de cálculo podrían ser puntuales Posibles problemas de fiabilidad 5

Alternativas a la supercomputación clásica Cluster de estaciones o computadores personales homogéneo dedicado a computación paralela Ventajas: Mejor relación coste/rendimiento (3-10 veces) Inconvenientes: Coste de las comunicaciones muy alto Bus lento Acceso secuencial al bus Sobrecarga TCP/IP Mantenimiento Modelo de programación Conclusión: Buena solución para aplicaciones HTC/HPC 6

Explotación distribuida de los recursos Cuántas horas al día permanecen desaprovechados mis recursos? Si tengo un pico de demanda de CPU puedo utilizar mis equipos distribuidos? Solución: Utilización de los equipos de una red departamental para ejecutar trabajos secuenciales o paralelos por medio de una herramienta de gestión de carga 7

Explotación distribuida de los recursos Ventajas: Aumentar el aprovechamiento de los recursos informáticos Ciclos de CPU a coste bajo Mejora de la escalabilidad Mejora de fiabilidad Facilidad de administración Facilidad de sustitución de equipos obsoletos Software disponible: Sun Grid Engine de Sun Microsystems (www.sun.com/gridware) LSF de Platform Computing (www.platform.com) Condor de la Universidad de Wisconsin (www.cs.wisc.edu/condor) 8

Explotación distribuida de los recursos Inconvenientes: No pueden gestionar recursos fuera del dominio de administración. Algunas herramientas (Condor, LSF o SGE) permiten colaboración interdepartamental asumiendo la misma estructura administrativa No respetan las políticas de seguridad y de gestión de recursos de las organizaciones Protocolos e interfaces básicos no basados en estándares abiertos El único recurso que gestionan es la CPU. Qué ocurre con los datos compartidos entre organizaciones? Por tanto: Escalabilidad limitada a la organización en picos de demanda No puedo amortizar mis recursos cuando están desaprovechados No puedo compartir recursos con otras organizaciones 9

Explotación distribuida de los recursos Situación planteada: Cómo puedo salir de los límites de mi centro o laboratorio? Puedo ceder mis recursos a otras organizaciones? Puedo compartir recursos con otras organizaciones? 10

Problemas actuales en supercomputación 1. Necesitamos más potencia de cálculo La potencia de los supercomputadores sólo crece linealmente (dos órdenes de magnitud cada 10 años, según www.top500.org) La capacidad de almacenamiento de un ordenador se dobla cada 12 meses. El ancho de banda de red, cada 9 meses. El rendimiento de un procesador, cada 18 meses. Conclusiones: Un único sistema no será capaz de analizar los datos que almacenen sus discos. Un único centro no podrá analizar el volumen de información generado. La red permitirá de forma eficiente usar recursos distribuidos. 11

Problemas actuales en supercomputación 2. Los equipos son caros y difíciles de mantener Cómo puedo amortizar la inversión realizada? 3. Qué hago si tengo un pico de demanda de cálculo y no tengo presupuesto para adquirir un supercomputador? 4. Desequilibrio de carga en el tiempo Cómo puedo conseguir una carga más homogénea? Solución: Grid Computing 12

Índice Supercomputación clásica Grid Computing Concepto Definición de Grid Beneficios del Grid Desafíos técnicos y socioeconómicos Estado actual Arquitectura de un Grid Middleware para Grid Ejemplos de infraestructuras Grid reales 13

Grid Computing Nueva tecnología cuyo objetivo es la compartición de recursos en Internet de forma uniforme, segura, eficiente y fiable. Análoga a las redes de suministro eléctrico (Power Grid): Ofrecen un único punto de acceso a un conjunto de recursos distribuidos geográficamente en diferentes dominios de administración (supercomputadores, clusters, almacenamiento, fuentes de información, instrumentos, personal, bases de datos...) La tecnología Grid es complementaria a las anteriores Permite interconectar recursos en diferentes dominios de administración respetando sus políticas internas de seguridad y su software de gestión de recursos en la Intranet. 14

Grid Computing Definición de Grid Infraestructura hardware y software geográficamente distribuida Gran escala Recursos heterogéneos Múltiples organizaciones administrativas Utiliza protocolos e interfaces estándar, abiertos y de propósito general Objetivo: proporcionar soporte computacional a un amplio rango de aplicaciones de forma transparente, de calidad, ubicuo, etc., con calidades de servicio no triviales 15

Grid Computing 16

Grid Computing Beneficios del Grid Alquiler de recursos (Utility Computing) Amortización de recursos propios Gran potencia de cálculo a precio bajo sin necesidad de adquirir equipamiento Mayor colaboración y compartición de recursos entre varios centros Creación de organizaciones virtuales Negocios basados en proveer recursos 17

Grid Computing Desafíos técnicos Recursos heterogéneos Descubrimiento, selección, reserva, asignación, gestión y monitorización de recursos Desarrollo de aplicaciones Desarrollo de modelos eficientes de uso Comunicación lenta y no uniforme Desafíos socioeconómicos Organizativos: Dominios de administración, modelo de explotación y costes, políticas de seguridad... Económicos: Precio de los recursos, oferta/demanda... 18

Grid Computing Estado Actual: Lejos de satisfacer las expectativas que la comunidad científica y la sociedad han puesto en él 19

Índice Supercomputación clásica Grid Computing Arquitectura de un Grid Esquema Middleware para Grid Ejemplos de infraestructuras Grid reales 20

Arquitectura de un Grid 21

Índice Supercomputación clásica Grid Computing Arquitectura de un Grid Middleware para Grid Globus Toolkit OGSA WSRF Componentes de Globus Toolkit 4 Ejemplos de infraestructuras Grid reales 22

Middleware Grid Globus Toolkit Estándar de facto para la implantación de infraestructuras Grid. Permite compartir recursos localizados en diferentes dominios de administración, con diferentes políticas de seguridad y gestión de recursos. Globus es... Un middleware software Un conjunto de librerías, servicios y APIs Globus no es... Una herramienta de usuario o planificador Una aplicación 23

Middleware Grid Para entender qué es el Globus Toolkit, en primer lugar es necesario especificar el contexto en el que se enmarca: OGSA + WSRF 24

Middleware Grid OGSA: Un sistema Grid está compuesto de varios subsistemas. Por ejemplo: 25

Middleware Grid OGSA: Seguridad Gestión de VOs Gestión de jobs Descubrimiento y monitorización de Recursos Workflow Gestión de Datos 26

Middleware Grid OGSA: Seguridad Gestión de VOs Gestión de jobs Descubrimiento y monitorización de Recursos Workflow Gestión de Datos 27

Middleware Grid OGSA: El Open Grid Services Architecture (OGSA) tiene como objetivo estandarizar todos los distintos servicios que se encuentran en una aplicación Grid. El proceso de estandarización lo realiza el Global Grid Forum (GGF) http://www.ggf.org 28

Middleware Grid OGSA: Qué define exactamente OGSA? Una serie de interfaces y comportamientos básicos que afrontan tareas clave en sistemas Grid Con esto se consigue que todos los servicios puedan ser accedidos de la misma manera, independientemente de la plataforma, sistema operativo, organización, etc. Qué hay debajo de OGSA? Cómo se definen los interfaces de los servicios? Cómo se realiza una petición a un servicio? 29

Middleware Grid OGSA: Teóricamente, OGSA podría basarse en cualquier middleware distribuido (CORBA, RMI, servicios Web...) Los Servicios Web son los que mejor cumplen los requisitos de OGSA. Y qué es un Servicio Web? 30

Middleware Grid OGSA: Servicio: Manifestación lógica de recursos lógicos o físicos (BBDD, programas, dispositivos, personas, etc.) y/o algún tipo de lógica de aplicación que es expuesta a la red. La interacción entre servicios se realiza mediante intercambio de mensajes Las Arquitecturas Orientadas a Servicios (SOA) permiten implementar aplicaciones distribuidas débilmente acopladas entre sí 31

Middleware Grid OGSA: Servicios Web: Basados en principios de SOA, permiten definir bloques para construir aplicaciones distribuidas débilmente acopladas SOAP: Intercambio de mensajes WSDL: Definición de interfaces para describir los contratos relativos al intercambio de mensajes Separación entre el interfaz ( lo que hace ) y la implementación ( cómo lo hace ). El interfaz está escrito en un lenguaje neutro, independiente del lenguaje de programación y de la plataforma. 32

Middleware Grid OGSA: Los Servicios Web tienen una importante carencia: generalmente son stateless (no mantienen el estado entre peticiones) y no hay ninguna manera de hacerlos stateful (con estado). Solución: Web Services Resource Framework (WSRF), que extiende los Servicios Web para hacerlos stateful, sin romper la compatibilidad con otros Servicios Web. OGSA Requiere Stateful Web Services Especifica WSRF Extiende Web Services 33

Middleware Grid OGSA + WSRF + GT4: Globus Toolkit 4 (GT4) Creado por la Alianza Globus (www.globus.org) Proporciona una serie de componentes que permiten crear sistemas y Servicios Grid. GT4 no es una implementación de OGSA. Los estándares del GGF todavía están están en fase de desarrollo. Se puede decir que GT4 cumple muchos de los requisitos de OGSA. GT4 incluye una implementación completa de WSRF Existen más implementaciones de WSRF (p.ej: WSRF.net). 34

Middleware Grid GT4: Modelo de capas 35

Middleware Grid Globus Toolkit: Componentes 36

Middleware Grid Globus Toolkit: Componentes Seguridad GSI: Globus Security Infrastructure TLS (OpenSSL) Public Key Infrastructure (PKI) + certificados X.509 Generic Security Services API (GSS-API) CAS: Community Authorization Service 37

Middleware Grid Globus Toolkit: Componentes Comunicación Globus I/O Transport Control Protocol (TCP) User Datagram Protocol (UDP) File I/O 38

Middleware Grid Globus Toolkit: Componentes Detección de fallos Globus I/O Transport Control Protocol (TCP) User Datagram Protocol (UDP) File I/O 39

Middleware Grid Globus Toolkit: Componentes Gestión de Recursos GRAM: Globus Resource Allocation Manager Gestores Locales (PBS, LoadLeveler,...) RSL (Resource Specification Language) Globus I/O 40

Middleware Grid Globus Toolkit: Componentes Descubrimiento y monitorización de Servicios MDS: Monitoring & Discovery System GIIS: Globus Index Information Service 41

Middleware Grid Globus Toolkit: Componentes Gestión de Datos RLS: Replica Location Service RFT: Reliable File Transfer GridFTP: Grid File Transfer Protocol 42

Middleware Grid Globus Toolkit: Componentes Herramientas de alto nivel Herramientas de alto nivel: Órdenes Globus MPICH-G2 Condor-G GridWay 43

Índice Supercomputación clásica Grid Computing Arquitectura de un Grid Middleware para Grid Ejemplos de infraestructuras Grid reales Introducción IrisGrid El Proyecto EGEE 44

Infraestructuras Grid reales Pero todo esto... lo utiliza alguien? 45

Infraestructuras Grid reales IrisGrid (www.rediris.es/irisgrid) Dos objetivos: Coordinar a nivel académico y científico a los grupos de investigación interesados en esta tecnología, tanto en su desarrollo, como implantación y aplicaciones. Crear la infraestructura Grid nacional que permita el uso de esta tecnología tanto a nivel de aplicabilidad en diferentes ámbitos, como a nivel de desarrollo e innovación en este campo. Pretende: Aportar los estándares, protocolos, procedimientos y guías de buenas prácticas necesarios para construir un Grid nacional de investigación coordinando a los diferentes grupos interesados. 46

Infraestructuras Grid reales EGEE (www.eu-egee.org) El problema: La ciencia se está digitalizando cada vez más y necesita tratar con cantidades cada vez mayores de datos. Las simulaciones son cada vez más detalladas. La ciencia experimental utiliza sensores muy sofisticados para realizar medidas muy precisas, lo que produce grandes cantidades de datos. 47

Infraestructuras Grid reales EGEE (www.eu-egee.org) Ejemplos de aplicación: Análisis de la Estructura Molecular Física de Altas Energías Aplicaciones Biomédicas 48

Infraestructuras Grid reales EGEE (www.eu-egee.org) Ejemplos de aplicación: Geología Observaciones de la Tierra por satélite Estudio de terremotos Astronomía Hidrología 49

Infraestructuras Grid reales EGEE (www.eu-egee.org) Objetivos: Crear y mantener una infraestructura Grid segura y robusta. Mejorar y mantener su middleware Atraer recursos y usuarios de la ciencia y la industria Estructura: 140 instituciones en 33 países, federados en Grids regionales. 14000 CPUs 5 PB de almacenamiento disponible 50

Infraestructuras Grid reales EGEE (www.eu-egee.org) Middleware de EGEE: glite Interoperabilidad y coexistencia con la infraestructura existente Robusto y tolerante a fallos Aproximación orientada a servicios Licencia Open Source 51

Infraestructuras Grid reales EGEE (www.eu-egee.org) Inconvenientes: Centrado en física de altas energías Poca heterogeneidad y autonomía Establece el middleware de usuario, middleware básico y recursos 52

Preguntas? 53