Plataformas paralelas

Documentos relacionados

15. Arquitectura de los multiprocesadores. 16. Multiprocesadores de memoria compartida. 17. Multicomputadores.

INTRODUCCION. Ing. Camilo Zapata Universidad de Antioquia

UNIVERSIDAD CARLOS III DE MADRID DEPARTAMENTO DE INFORMÁTICA INGENIERÍA EN INFORMÁTICA. ARQUITECTURA DE COMPUTADORES II 19 de junio de 2007

TOPOLOGÍAS DE RED. TOPOLOGÍA FÍSICA: Es la forma que adopta un plano esquemático del cableado o estructura física de la red.

Global File System (GFS)...

Concentradores de cableado

TEMA: Las Redes. NOMBRE Torres Castillo Ana Cristina. PROFESOR: Genaro Israel Casas Pruneda. MATERIA: Las TICS en la educación.

Redes Informáticas. Redes Informáticas Prof. Annabella Silvia Lía Llermanos

Seminario Electrónico de Soluciones Tecnológicas sobre Content Networking

TEMA 2 Componentes y estructura de una red de telecomunicación.

LAS TIC. Cintyha Lizbeth Gómez Salazar. Lic. Cruz Jorge Fernández Aramburo. 0 1 / 0 8 /

1.- FUNCION DE UNA RED INFORMATICA

FUNDAMENTOS DE COMPUTACIÓN PARA CIENTÍFICOS. CNCA Abril 2013

4. Programación Paralela

Topologias de Redes. En la actualidad, existen cinco topologías de red básicas: Malla, Estrella, Anillo, Árbol y Bus.

1. Topología de BUS / Linear Bus. 2. Topología de Estrella / Star. 3. Topología de Estrella Cableada / Star Wired Ring. 4. Topología de Árbol / Tree

Capítulo 12: Indexación y asociación

RAID 0 : No redundante

TEMA 4: SISTEMAS MULTIPROCESADOR (MEMORIA COMPARTIDA) BLOQUE 2 Arquitecturas de computación paralela

Conmutación. Conmutación telefónica. Justificación y definición.

Introducción a los protocolos de enrutamiento dinámico

3. Topologías de red. IST La Recoleta

Universidad de Antioquia Juan D. Mendoza V.

WAN y Enrutamiento WAN

DISCOS RAID. Se considera que todos los discos físicos tienen la misma capacidad, y de no ser así, en el que sea mayor se desperdicia la diferencia.

Introducción a las redes de computadores

El Protocolo IP. Tema 3. Servicio y Protocolo IP. Aplicaciones en Redes Locales 05/06

Capítulo 5. Cliente-Servidor.

Arquitectura de sistema de alta disponibilidad

INFORME TÉCNICO PREVIO DE EVALUACIÓN DE SOFTWARE

REDES AD HOC INFORME DE REDES DE COMPUTADORES I. Felipe Muñoz Jonathan Porta Matías Contreras

1. Instala servicios de configuración dinámica, describiendo sus características y aplicaciones.

No se requiere que los discos sean del mismo tamaño ya que el objetivo es solamente adjuntar discos.

Instalación y mantenimiento de servicios de Internet. U.T.3.- Servicio DNS

Redes conmutadas y de área local

Redes de comunicación

Transporte de Datos. Profesora María Elena Villapol. Comunicación de Datos

SISTEMAS DE INFORMACIÓN II TEORÍA

1. Aplicación de la conmutación de circuitos y la conmutación de paquetes. 1.1 Sistema de señalización número 7 (SS7).

GUIA No 3 PRIMER PERIODO DECIMO GRADO SELECCIÓN DE DISEÑOS

Hay dos tipos de conexiones posibles cuando se trata de redes. Punto a punto conexiones proporciona un enlace dedicado entre dos dispositivos.

Redes de Altas Prestaciones

CAPITULO 3: SISTEMAS ADICIONALES PARA EL CENTRO DE LLAMADAS DE EMERGENCIA

Introducción a las LAN, WAN y al Internetworking. Contenido

Los mayores cambios se dieron en las décadas de los setenta, atribuidos principalmente a dos causas:

PLATAFORMA DE ENVÍO DE SMS CON MÁXIMA DISPONIBILIDAD

Concepto y tipo de redes

Redes Informáticas Temas: Concepto de Red de computadoras, Propósito de la Red, Clasificación según su cobertura geográfica. Topologías.

Conclusiones. Particionado Consciente de los Datos

EXPEDIENTE: 2/2015 ADQUISICIÓN E INSTALACIÓN DE INFRAESTRUCTURA CIENTÍFICA Y TECNOLÓGICA PARA CÉNITS PLIEGO DE PRESCRIPCIONES TÉCNICAS

Define las propiedades del medio físico de transición. Un ejemplo es: CABLES, CONECTORES Y VOLTAJES.

Memoria Compartida Distribuida (DSM) Sistema de Archivos

Infraestructura Tecnológica. Sesión 5: Arquitectura cliente-servidor

FUNDAMENTOS DE REDES Y CONECTIVIDAD REDES INFORMATICAS

I. Verdadero o Falso (16 puntos)

Componentes de una Red

Examen Febrero 2002 Test Resuelto Temas 9-13

ACTIVIDAD No. 2 REPASO DE REDES INFORMATICAS

CLASIFICACION DE LAS REDES POR TOPOLOGIAS DE RED

Introducción a las Redes

Modelo de aplicaciones CUDA

ESCUELA NORMAL PROF. CARLOS A CARRILLO

1º SISTEMAS MICROINFORMÁTICOS Y REDES 1. CONTENIDOS MÍNIMOS PARA LA EVALUACIÓN POSITIVA

Jhon Jairo Padilla Aguilar, PhD.

MECANISMOS DE PROTECCIÓN Y RESTAURACIÓN

PROTOCOLOS DE ENRUTAMIENTO

Sistemas de archivos distribuidos. Alvaro Ospina Sanjuan

RESUMEN CUADRO DE MANDO

Beneficios estratégicos para su organización. Beneficios. Características V

Redes y Servicios. Módulo I. Fundamentos y modelos de red. Tema 2. Fundamentos. Parte C. Nivel de red

Efectos de los dispositivos de Capa 2 sobre el flujo de datos Segmentación de la LAN Ethernet

INGENIERÍA CIVIL I NFORMÁTICA II PROF. ING. CESAR TAMARIZ FIGUEROA

TELECOMUNICACIONES Y REDES

Redes (IS20) Ingeniería Técnica en Informática de Sistemas. CAPÍTULO 6: Estándares en LAN

ACTIVIDAD No. 2 REPASO DE REDES INFORMATICAS

Introducción a Computación

Historia y Conceptos Generales. Definción, Clasificación de Redes y Topologías

TELECOMUNICACIONES Y REDES

índice CONVENCIONES USADAs...17

Adelacu Ltda. Fono Graballo+ Agosto de Graballo+ - Descripción funcional - 1 -

TOPOLOGÍA. Bus lineal. Topología anillo. Topología doble anillo. Topología estrella. Jerarquía. Malla. Hibridas.

Solución GeoSAS. Otros módulos

DE REDES Y SERVIDORES

TELECOMUNICACIONES Y REDES

Elementos requeridos para crearlos (ejemplo: el compilador)

INFORME TECNICO PREVIO SOFTWARE DE SOPORTE ANALIZADOR DE REDES

Facultad de Ingeniería

Estructura y Tecnología de Computadores (ITIG) Luis Rincón Córcoles Ángel Serrano Sánchez de León

Diseño de Redes de Área Local

Redes ruteadas en longitud de onda (WRON) Nicolas Gorriño Castañeda

Redes Computacionales

18 y 19 Sistemas de Archivos Distribuidos y Tarea 05

SISTEMAS DE MULTIPROCESAMIENTO

Roles y Características

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Introducción Mensajes UDP. Asignación de puertos a procesos. Bibliografía [COM06] Internetworking with TCP/IP, Cap. 11.

Sistemas de Operación II

Redes de Altas Prestaciones

Transcripción:

Plataformas paralelas Curso 2011-2012

Elementos de un computador paralelo Hardware: Múltiples procesadores Múltiples memorias Redes de interconexión Software: Sistemas Operativos paralelos Programas orientados a concurrencia Objetivo: Utilizar estos elementos para Mejorar el Speed-up: T p = T s / p Abordar problemas con alta demanda de memoria

Plataformas para procesamiento paralelo Organización lógica: Visión que tiene el usuario de la máquina, desde el punto de vista del software del sistema. Organización física: La arquitectura hardware real. La Arquitectura física es, hasta cierto punto, independiente de la arquitectura lógica.

Elementos de la organización lógica Control (Taxonomía de Flynn): SISD/SIMD/MIMD/MISD. SPMD: Single Program - Multiple Data SIMD MIMD Falta de eficiencia en SIMD

Elementos de la organización lógica Dos alternativas diferenciadas: Plataformas de paso de mensajes. Plataformas con espacio de memoria compartida.

Paso de mensajes Paso de mensajes: Cada procesador tiene un espacio de memoria propio e independiente. La comunicación se produce a través de mensajes entre el procesador emisor y el receptor. Operaciones básicas: send y receive. Estándares: MPI, PVM. Ejemplos: IBM SP, SGI Origin 2000, clusters de estaciones de trabajo.

Espacio de memoria compartida Espacio de memoria compartida UMA: Acceso a memoria uniforme. NUMA: Acceso a memoria no uniforme. ccnuma: Acceso a memoria no uniforme con coherencia de cache. UMA UMA NUMA

Problema de coherencia de cache Problema de coherencia de cache en los sistemas de memoria compartida: Se debe mantener la coherencia en múltiples copias de los mismos datos. Imprescindible para mantener la semántica de los programas. Protocolos para respetar la coherencia de cache: Invalidación Actualización

Problema de coherencia de cache Invalidación Actualización

Protocolos de Invalidación / Actualización El protocolo óptimo depende de las características de cada aplicación: Frecuencia de operaciones de lectura / escritura. Problemas con compartición falsa: Líneas de cache comunes actualizadas en palabras distintas. Equilibrio entre costes de comunicación (actualización) y ciclos de espera (invalidación). Los esquemas actuales se basan en el protocolo de invalidación.

Invalidación: Coherencia de datos Compartido: Dato que está presente en la memoria cache de más de un procesador, pero que aún no ha sido modificado. No-válido: Dato en la memoria cache de un procesador, que ha sido modificado por otro. Sucio: Dato en la memoria cache de un procesador que lo ha modificado. Toda referencia a este dato será servida por este procesador, y no por la memoria principal.

Coherencia de datos: Protocolo snoopy Orientado al uso de bus común. Cada procesador mantiene la información de datos compartidos / no-válidos / sucios. Se realiza una escucha activa del bus, y cuando se detecta una escritura sobre un dato compartido, se actualiza su estado. Problema: Genera mucho tráfico en el bus, ya que cada escritura hay que declararla.

Coherencia de datos: Basado en directorio La memoria global es la que mantiene actualizada la información de datos compartidos / no-válidos / sucios. Mantiene una lista de todos los procesadores que comparten un cierto dato. Cuando un procesador modifica un dato, lo comunica a la memoria principal, y esta a los procesadores que lo comparten. Problema: La memoria principal se convierte en cuello de botella.

Organización física Arquitectura paralela ideal: PRAM (Parallel Random Access Machine). Modelos de PRAM: EREW/ERCW/CREW/CRCW (Exclusivo/Concurrente Lectura/Escritura) Resolución de escritura concurrente: Común, Arbitrario, Prioridad y Suma.

Organización física Redes de interconexión (RICs): Proporcionar conexión entre los distintos procesadores y memorias del sistemas. Tipo de redes Estática: Enlaces punto a punto Históricamente usada para conectar procesadores (memoria distribuida) Dinámica: Formada por elementos de conmutación Históricamente usada para conectar procesadores con memorias (memoria compartida)

RICs estáticas y dinámicas Estática Dinámica

Métricas de evaluación para RICs (I) Diámetro: Distancia máxima entre cualquier par de nodos. (Cuanto más pequeño mejor). Conectividad: Mínimo número de arcos que hay que eliminar para convertir la red en dos subredes desconectadas. (Cuanto más grande mejor). Ancho de Bisección: Mínimo número de arcos que hay que eliminar para dividir la red en dos mitades iguales. (Cuanto más grande mejor).

Métricas de evaluación para RICs (II) Ancho de Banda de Bisección: Mínimo volumen de comunicación permitido entre dos mitades cualesquiera de la red. (Cuanto más grande mejor). Coste: Número de enlaces en la red. (Cuanto más pequeño mejor).

Métricas y redes dinámicas El ancho de El ancho de bisección es 4, independientemente de la zona de corte

Topologías de red (I): Bus Medio compartido. La información es difundida. Diámetro: O(1). Conectividad: O(1). Ancho de bisección: O(1). Coste: O(p).

Topologías de red (II): Red matricial Basada en conmutación. Soporta conexiones simultáneas. Diámetro: O(1). Conectividad: O(1)? Ancho de bisección: O(p)? Coste: O(p 2 ).

Topologías de red (III): Multi-etapa Caso particular: Red Omega (Ω) p procesadores log p etapas p/2 conmutadores por etapa

Arquitecturas de conmutación multi-etapa Paso Red omega completa de 8 entradas y 8 salidas. 3 etapas y 4 conmutadores por etapa. Cruce

Bloqueo en conmutación multi-etapa Comparación a nivel de bit de fuente y destino. Acierto: Pasa. Fallo: Cruza Ejemplo de bloqueo en red omega: uno de los mensajes se bloquea en el enlace AB.

Topologías de red (IV): Completa y estrella Red completamente conectada (8 nodos) Red conectada en estrella (9 nodos)

Topologías de red (V): Estructuras cartesianas Arrays lineales Anillo Mallas 2-D y 3-D

Topologías de red (VI): Hipercubos Hipercubo: Malla con 2 nodos por dimensión y log p dimensiones Construcción de hipercubos a partir de otros con dimensiones inferiores.

Topologías de red (VII): Árboles Sólo hay un camino entre cada par de nodos. Casos particulares: Array lineal Estrella

Métricas de rendimiento: Resumen Resumen de características

Costes de comunicación en sistemas paralelos Paso de mensajes. El coste de comunicación de una operación de transferencia depende de: Tiempo de inicio t s : Añadir cabecera, corrección de errores, ejecución del algoritmo de enrutamiento, conexión entre fuente y destino. Tiempo de salto t h : Tiempo de desplazamiento entre dos nodos conectados directamente. Tiempo de transferencia de palabra t w : Inverso del ancho del canal de comunicación.

Store-and-forward y Cut-through Mensaje no dividido t com = t s + (m t w + t h ) l t com = t s + m l t w Dividido en 2 partes Dividido en 4 partes t com = t s + l t h + t w m

Enrutamiento Cut-through: Interbloqueos Mensaje 0 Nodo A Mensaje 0 Nodo A Mensaje 1 Nodo B Mensaje 2 Nodo C Mensaje 3 Nodo D

Modelo de coste de comunicaciones Coste del envío de un mensaje de tamaño m: t com = t s + t w m t s es mucho más grande que t h, y en la mayoría de los casos, t w m es más grande que t h l.

Mecanismos de enrutamiento Enrutamiento: Algoritmo para determinar el camino que un mensaje tomará desde la fuente hasta el destino. Varias clasificaciones: Mínimo vs. No-mínimo. Determinista vs. Adaptativo.

Enrutamiento ordenado por dimensión Orden predefinido de las dimensiones. Los mensajes se encaminan por cada dimensión, en el orden establecido, hasta que no es posible continuar: X-Y para mallas E-cubo para hipercubos

Transformaciones en la Topologías Mapeo entre redes: Util en los comienzos de la computación paralela, cuando los algoritmos dependían de las topologías. Métricas de calidad de las transformaciones: Congestión: Máximo número de enlaces de la topología inicial mapeados en un único enlace de la topología final. Dilatación: Máximo número de enlaces de la topología final, sobre los que se mapea un único enlace de la topología inicial. Expansión: Relación entre el número de nodos de ambas topologías.

Anillo a Hipercubo Los nodos del anillo se mapean al hipercubo siguiendo el código Gray reflejado. La dilatación y congestión es 1.

Malla 2-D a Hipercubo Malla 4x4 a Hipercubo 4-D Malla 2x4 a Hipercubo 3-D

Array lineal a Malla 2-D Array lineal a Malla 2-D Congestión: 1 Malla 2-D a Array lineal Congestión: 5 ( p +1)