SISTEMAS DE MULTIPROCESAMIENTO

Documentos relacionados

FUNDAMENTOS DE COMPUTACIÓN PARA CIENTÍFICOS. CNCA Abril 2013

Figura 1.4. Elementos que integran a la Tecnología de Información.

TEMA 4. Unidades Funcionales del Computador

Plataformas paralelas

Javier Pérez Mato µp para Comunicaciones Curso 2008/09 ETSIT - ULPGC

15. Arquitectura de los multiprocesadores. 16. Multiprocesadores de memoria compartida. 17. Multicomputadores.

Introducción Componentes Básicos Concurrencia y Paralelismo Ejemplos Síntesis Lecturas Recomendadas. Arquitectura de Computadoras

ARQUITECTURA DE COMPUTADORAS I. Propósito del curso : Al final del curso el estudiante: Ingeniería Ingeniería en Sistemas.

Kepler. 1. Presentación de la arquitectura. Índice de contenidos [25 diapositivas] Kepler, Johannes ( )

Taxonomía de las arquitecturas

1. Aplicación de la conmutación de circuitos y la conmutación de paquetes. 1.1 Sistema de señalización número 7 (SS7).

Con estas consideraciones, Flynn clasifica los sistemas en cuatro categorías:

UNIVERSIDAD DE ORIENTE FACULTAD DE ICIENCIAS ECONOMICAS LAS REDES I. Licda. Consuelo Eleticia Sandoval

Introducción HPC. Curso: Modelización y simulación matemática de sistemas. Esteban E. Mocskos (emocskos@dc.uba.ar) Escuela Complutense Latinoamericana

Arquitectura de Computadores

:Arquitecturas Paralela basada en clusters.

Redes I Clase # 3. Licda. Consuelo E. Sandoval

Organización de Computadoras. Turno Recursantes Clase 8

Curso de seguridad informática en el entorno docente. Sesión 4. PONENTE: Jaime López Soto.

Clasificación de Flynn de los computadores

INTRODUCCIÓN. Que es un sistema operativo? - Es un programa. - Funciona como intermediario entre el usuario y los programas y el hardware

Familia de procesadores Intel x86

Arquitectura de Computadoras. Clase 9 Procesamiento paralelo

I NTRODUCCIÓN 1. ORDENADOR E INFORMÁTICA

COMPUTADORES MULTINUCLEO. Stallings W. Computer Organization and Architecture 8ed

Concepto y tipo de redes

4. Programación Paralela

Arquitectura de Computadoras para Ingeniería

502 A I.S.C. JOSE BARDO MORENO MACHADO ENRIQUE EDUARDO MORAN PRADO EDILBERTO RASCON HERNANDEZ

EL MODELO DE ESTRATIFICACIÓN POR CAPAS DE TCP/IP DE INTERNET

CURSO: APACHE SPARK CAPÍTULO 2: INTRODUCCIÓN A APACHE SPARK.

Introducción a Computación

Arquitecturas GPU v. 2013

Componentes Internos y Externos del Ordenador. Prof: Ronald Méndez

Figura Nº 4.1 (a) Circuito MOS de canal n con Carga de Deplexion (b) Disposición como Circuito Integrado CI

Multiprocesadores y multicomputadores

Departamento de Automática

CPU. Unidad central de procesamiento

Memoria La memoria es la parte del ordenador en la que se guardan o almacenan los programas (las instrucciones y los datos).

Heterogénea y Jerárquica

Conclusiones. Particionado Consciente de los Datos

Planificación y administración de redes SNMP

ITT-327-T Microprocesadores

ACTIVIDADES TEMA 1. EL LENGUAJE DE LOS ORDENADORES. 4º E.S.O- SOLUCIONES.

Procesador Intel Core 2 Extreme de 4 núcleos Traducción de Textos Curso 2007/2008

Los mayores cambios se dieron en las décadas de los setenta, atribuidos principalmente a dos causas:

Procesador Pentium II 450 MHz Procesador Pentium II 400 MHz Procesador Pentium II 350 MHz Procesador Pentium II 333 MHz Procesador Pentium II 300 MHz

Arquitectura basica de un computador

CAPÍTULO I. Sistemas de Control Distribuido (SCD).

INDICE 2. Organización de computadoras 3. El Nivel de Lógica Digital

Componentes de un S.O.

MineSight y la Tecnología Informática de última Generación

TEMA 1. CONCEPTO DE ORDENADOR: ESTRUCTURA Y FUNCIONAMIENTO

Solución de telefonía para empresas TL Presentación de producto. Telefonía IP

SISTEMAS OPERATIVOS II

Int. a las ciencias computacionales

Arquitectura de sistema de alta disponibilidad

Palabras Clave: Vídeo en FPGA, Procesamiento en Tiempo Real RESUMEN

Detección de Presencia Serie para la Identificación de Módulos de Memoria

II.1. Situación actual 2. II.2. Necesidades requeridas 3 III. DESCRIPCIÓN DE LOS SERVICIOS A CONTRATAR 3 5 IV. ORGANIZACIÓN DE LOS TRABAJOS 6

Tema 7: Esquema del Funcionamiento de una Computadora. Escuela Politécnica Superior Ingeniería Informática Universidad Autónoma de Madrid

Unidad I Fundamentos de Sistemas Distribuidos. M.C. Juan Carlos Olivares Rojas

TRABAJO Y ENERGÍA. W = F d [Joule] W = F d cos α. Donde F y d son los módulos de la fuerza y el desplazamiento, y α es el ángulo que forman F y d.

Infraestructura Convergente (CI)

CONTROL DE ASISTENCIA DE PERSONAL

CLUSTER FING: ARQUITECTURA Y APLICACIONES

Colegio Belen COMPUTACION

Bajo coste, alta densidad, alta velocidad, bajo consumo de energía y alta fiabilidad.

Tema 5. Memorias. Estructura de Computadores. Índice. Curso

Bases de datos segmentadas y actualizadas, la base de cualquier relación comercial

Modelos de computadores paralelos

M.T.I. Arturo López Saldiña

Laboratorio de Herramientas Computacionales

Computación de Alta Performance Curso 2009 TOLERANCIA A FALLOS COMPUTACIÓN DE ALTA PERFORMANCE 2009 TOLERANCIA A FALLOS

INTRODUCCIÓN. Definiciones ORDENADOR (RAE 1992): En esta asignatura computador y ordenador tiene el mismo significado

Manual de Procedimientos

Reloj Rei-4000 para Control de Tiempo y Asistencia

Multiprocesamiento en Lenguaje C Conceptos básicos de la computación paralela

Licenciatura en Computación

Una computadora de cualquier forma que se vea tiene dos tipos de componentes: El Hardware y el Software.

Organizacion del Computador

Capital Humano. Aprovechamiento del capital humano de España en el contexto internacional. núm. Diciembre 2007

GENERALES DEL SISTEMA

Sistemas de Operación II

Arquitectura de Redes y Comunicaciones

Unidades de control electrónico (U.C.E.)

Capitulo V Administración de memoria

Sistemas electrónicos de acceso Conceptos básicos

INSTITUCIÓN EDUCATIVA JOSÉ EUSEBIO CARO ÁREA DE TECNOLOGÍA E INFORMÁTICA 2016 DOCENTE HARDWARE DE RED

Autor: Alejandro Furfaro

Digitalización de la Audiencia Nacional

Tema 3. Buses. Arquitectura de computadores. Plan 96. Curso Jerarquía de buses

Encuesta sobre utilización de la microelectrónica en la Argentina

Problemas y Soluciones para la adecuada gestión logística y de almacenes.

NTIC s I INFORMÁTICA BÁSICA. Ing. Mg. Carlos Meléndez T. cmelendez77@hotmail.com

Transcripción:

SISTEMAS DE MULTIPROCESAMIENTO Tema 1 Introducción 5º Curso de Automática y Electrónica Industrial. 1 Contenido Tema 1 Aplicaciones Incremento de las prestaciones Clasificación de los ordenadores en función del paralelismo Evolución de los ordenadores de altas prestaciones Multiprocesadores y multicomputadores 2 Tema 1 1

Aplicaciones con altas demandas de prestaciones Demandas de velocidad de procesamiento (nos centramos en esto) También demandas en cuanto a capacidad de almacenamiento 4 Aplicaciones con altas demandas de procesamiento. Multiples campos de aplicación tanto en ciencias como en ingeniería. Destacan las aplicaciones de simulación de modelos complejos. Algunos ejemplos de aplicación: Modelado de la evolución global del clima en periodos largos de tiempo. La evolución de las galaxias. La estructura atómica de los materiales. La eficiencia de la combustión en motores. El flujo del aire sobre la superficie de vehículos. Resultados de impactos. El comportamiento de dispositivos electrónicos microscópicos. 5 Tema 1 2

Aplicaciones con altas demandas de procesamiento. En Ingeniería: Industrias del petróleo (modelado de reservas) Automoción(simulaciones de impactos, fricción, eficiencia en la combustión), Aeronáutica (análisis aerodinámico, eficiencia de los motores, estructura mecánica, compatibilidad electromagnética), Farmacéutica (modelado molecular) Electrónica (CAD). 6 Areas de aplicación frente a nº de sistemas 7 Tema 1 3

Dos posibilidades para incrementar la velocidad Aumentar la velocidad de un procesador Dedicar muchos procesadores a una tarea 9 Ventajas de un sistema paralelo En cuanto al precio: Coste de incrementar la velocidad de un procesador x 10 >> Utilizar 10 procesadores En cuanto al tiempo de desarrollo: Para conseguir un procesador 10 veces más rápido que el actual más rápido es necesario esperar unos 5 años. 10 Tema 1 4

Incremento de la velocidad de los microprocesadores La velocidad de los microprocesadores ha crecido de forma exponencial. 11 Ley de Moore Predicción de Gordon Moore en 1965 (revisada en 1975). El número de transistores en un chip se duplica aproximadamente cada 2 años. Evidencia empírica Se incrementa la densidad de integración y la superficie del chip. 12 Tema 1 5

Ley de Moore Nº de componentes se duplica (aprox.) cada dos años. 13 Consecuencias de la ley de Moore El coste se reduce exponencialmente (aprox. a la mitad cada dos años). Se reduce el coste de procesamiento y de almacenamiento. Se produce la revolución de la informática. Incremento exponencial en la velocidad de procesamiento: Incremento de la velocidad de reloj Incremento del número de bits Incremento del número de elementos de procesamiento. 14 Tema 1 6

Ley de Moore (Frecuencia de reloj para los microprocesadores de Intel) 15 Ley de Moore (Datos para los microprocesadores de Intel) Microprocesador Año de introducción Transistores (Miles) Frecuencia de reloj (MHz) "4004" 1971 2.300 0.4 "8008" 1972 2.500 0.8 "8080" 1974 4.500 2 "8086" 1978 29.000 10 "Intel286" 1982 134.000 12 "Intel386" 1985 275.000 16 "Intel486" 1989 1200.000 25 "Pentium" 1993 3100.000 66 "Pentium II" 1997 7500.000 300 "Pentium III" 1999 9500.000 500 "Pentium 4" 2000 42000.000 1500 "Xeon" 2001 42000.000 1700 "Itanium" 2001 25000.000 800 "Itanium 2" 2002 220000.000 1000 "Pentium 4 Extreme Edition"2003 178000.000 3200 "Itanium 2 (9MB cache)" 2004 592000.000 1600 Fuente: www.intel.com 16 Tema 1 7

Límites de la Ley de Moore Posible límite financiero: el coste de una nueva planta de fabricación de chips se duplica en cada generación. Las prestaciones de los procesadores se alejan del crecimiento exponencial desde el año 2002. 17 Número de componentes frente a prestaciones La ley de Moore crece suave hasta el 2002, año en el que la distancia entre el crecimiento de las prestaciones y el crecimiento en el número de transistores comienza a aumentar. 18 Tema 1 8

Incremento exponencial de la velocidad de procesamiento de los ordenadores Mediante el uso de sistemas de procesamiento en paralelo 19 Evolución de las prestaciones 20 Tema 1 9

Clasificación de los ordenadores Punto de vista del procesamiento en paralelo 22 Clasificación de Flynn Basado en el concepto de corrientes de instrucciones y de datos SISD (Single Instruction stream over a Single Data stream): Única corriente de Instrucciones sobre una Única corriente de Datos. SIMD (Single Instruction stream over Multiple Data streams): Única corriente de Instrucciones sobre Múltiples corrientes de Datos. MISD (Multiple Instruction streams over a Single Data stream): Múltiples corrientes de Instrucciones sobre una Única corriente de Datos. MIMD (Multiple Instruction streams over Multiple Data stream): Múltiples corrientes de Instrucciones sobre Múltiples corriente de Datos. Número de máquinas paralelas existentes MIMD > SIMD > MISD 23 Tema 1 10

SISD (Single Instruction Stream Over A Single Data Stream ) Única corriente de Instrucciones sobre una Única corriente de Datos. Son las máquinas secuenciales convencionales. I : Corriente de Instrucciones UC : Unidad de Control D: Corriente de Datos UC : Unidad de Procesamiento UM: Unidad de Memoria E/S: Entrada y Salida I E/S I D UC UP UM 24 SIMD (Single Instruction Stream Over Multiple Data Streams ) Única corriente de Instrucciones sobre Múltiples corrientes de Datos. Procesadores Matriciales (arrays) (SIMD) Procesadores vectoriales Arquitecturas de aplicación específica EP : Elemento Procesador ML : Memoria Local Programa procedente del host I UC I EP1 EPn D D ML1 MLn Arquitectura SIMD de memoria distribuida D D Conjuntos de Datos procedentes del host 25 Tema 1 11

MISD (Multiple Instruction Streams Over A Single Data Streams) Multiples corrientes de Instrucciones sobre una única corriente de Datos Array sistólico : arrays de procesadores (MISD) Arquitecturas de aplicación específica I I Memoria (Programa, Datos) UC1 UC2 UCn I I I D D D UP1 UP2 UPn E/S D Arcquitectura MISD (array sistólico) 26 MIMD (Multiple Instruction Streams Over Multiple Data Stream) MIMD Ordenadores paralelos de propósito general I E/S UC1 I UP1 D E/S UCn I UPn D Memoria Compartida I Arquitectura MIMD de memoria compartida 27 Tema 1 12

Evolución de los sistemas de procesamiento en paralelo Reflejado en la historia de los sistemas de altas prestaciones. Asociación con distintos grados de paralelismo. Desde sistemas con pocos procesadores de tipo SIMD hasta sistemas con un número elevado de procesadores y de tipo MIMD. 29 Evolución de los sistemas de procesamiento en paralelo. Tiempos preliminares: Desde 1972 hasta 1982. Primer periodo: Primera mitad de los años 80. Segundo periodo: Segunda mitad de los años 80. Tercer periodo: Primera mitad de los años 90. Cuarto periodo: Segunda mitad de los años 90. 30 Tema 1 13

Evolución... Tiempos preliminares: Desde 1972 hasta 1982. Primeros ordenadores vectoriales Cray-1 Construido por Cray Research Inc. en 1976. 160 MFlops (64 bits) y 8 Mbytes de memoria principal. Costó 8 Millones de dólares. 1 procesador con varias unidades funcionales vectoriales y escalares. 8 Registros vectoriales de 64 64 bits. 31 Evolución Primer periodo Primera mitad de los años 80. Ordenadores vectoriales de grandes prestaciones. Dos tipos: Arquitectura paralela: Varios procesadores. Memoria compartida. Cray X-MP (Hasta: 4 proc.vec., 128 MB) Con muchas unidades aritméticas: Fujitsu VP200. 32 Tema 1 14

Evolución Segundo periodo Segunda mitad de los años 80. Dos líneas: Evolución de los ordenadores vectoriales: Cray Y-MP, Fujitsu VP2600 Máquinas masivamente paralelas (MPP): Son de tipo SIMD CM-2 33 Evolución Tercer periodo Primera mitad de los años 90. Sistemas vectoriales multiprocesadores (multivector processor): Memoria compartida: Cray J90 Memoria distribuida: VPP500 Sistemas MPP: SIMD: MP-2 MIMD: Multicomputadores, Intel Paragon, CM-5 34 Tema 1 15

Evolución Cuarto periodo Segunda mitad de los años 90. Sistemas no escalables: Multiprocesadores vectoriales de memoria compartida: Cray T90 Multiprocesadores vectoriales de memoria distribuida: Fujitsu VPP700 Sistemas escalables: Multiprocesadores: Cray T3D y Cray T3E Multicomputadores MPP: IBM SP2. 35 Evolución Últimos años Información de la lista Top500 Evolución hacia sistemas escalables Tres tipos de sistemas todos de tipo MIMD: Cluster: Multicomputador. Pocos Proc/nodo. MareNostrum Constelaciones: Multicomputador. Nº Proc./nodo > Nº nodos MPP: Sistemas masivamente paralelos. Multicomputadores y Multiprocesadores de tipo NUMA con hardware para la coherencia de cachés. 36 Tema 1 16

Evolución Últimos años Nº de Sistemas por arquitecturas en la lista Top 500 de 2004. 37 Contenido Tema 1 Aplicaciones Incremento de las prestaciones Clasificación de los ordenadores en función del paralelismo Evolución de los ordenadores de altas prestaciones Multiprocesadores y multicomputadores 38 Tema 1 17

Carácterísticas sistemas MIMD Multiples corrientes de Instrucciones sobre Múltiples corrientes de Datos. Múltiples tareas simultáneamente. Sincronización y comunicación entre las tareas en función del hardware y el software. Dos tipos: Multiprocesadores: Un único espacio de memoria Multicomputadores: Múltiples espacios de memoria 39 Clasificación de los MIMD UMA (Uniform Memory Access) MIMD Multiprocesadores (Un único espacio de memoria) Multicomputadores (Múltiples espacios de memoria) NUMA Nodo de grano Medio (Non Uniform Memory Access) Nodo de grano Fino 40 Tema 1 18

Multiprocesadores Características Un único espacio de memoria. Comunicación y sincronización mediante variables globales en memoria compartida. Tipos: UMA (Uniform Memory Access) Acceso Uniforme a Memoria NUMA (Non-Uniform Memory Access) Acceso No Uniforme a Memoria. COMA (Cache Only Memory Access) Acceso a Memoria de Sólo Caché. CC-NUMA (Cache Coherent Non-Uniform Memory Access) Acceso No Uniforme a Memoria con Coherencia de Cachés. 41 Mapa de memoria multiprocesador Todos los procesadores acceden a la memoria compartida pero puede haber memoria local privada. 42 Tema 1 19

Multiprocesadores UMA (Uniform Memory Access) Memoria Red dinámica P P P 43 Intel Pentium Pro Quad 44 Tema 1 20

Multiprocesadores NUMA (Non-Uniform Memory Access) Mem P P Caché Mem Caché Red de interconexión Este multiprocesador incluye hardware apropiado para acceso a memoria remota en un único espacio de memoria. Mem Caché Mem Caché P P 45 Cray T3E 46 Tema 1 21

Multiprocesadores: Ventajas: Programación muy similar a la programación multihilo en un uniprocesador. Para programas que utilizan mucho la memoria compartida el uso adecuado de los datos globales en la caché local puede acelerar mucho la ejecución. Los procesadores comerciales actuales suelen disponer de extensiones hardware que soportan la coherencia de memoria caché, abaratando la construcción de multiprocesadores de pocos procesadores. 47 Multiprocesadores: Desventajas: Coste del hardware, especialmente del sistema de coherencia de memoria caché. Dificultad en la escalabilidad especialmente por la coherencia de la memoria caché. 48 Tema 1 22

Multicomputadores Características Múltiples espacios de memoria. Sistemas con memoria distribuida Comunicación y sincronización mediante paso de mensajes. Clasificación en función del tamaño de grano: Multicomputadores de grano grueso. Multicomputadores de grano medio. Multicomputadores de grano fino. 49 Multicomputadores Características 2 Sistemas MIMD formados por nodos. Nodo: Ordenador individual uniprocesador de tipo SISD o SIMD o multiprocesador cuya memoria compartida es la local del nodo. 50 Tema 1 23

Multicomputadores M M P P M P Nodo M P M P Red de interconexión para paso de mensajes (Malla, anillo, toro, hipercubo, Ciclos de cubos conectados, etc.) P M P M P M P M P M 51 Generaciones de Multicomputadores 1ª Generación (1983-87): Tecnología de procesadores en tarjeta. Paso de mensajes controlado por software. Redes en hipercubo. Multicomputadores de grano grueso: Caltech Cosmic, Intel ipsc/1, NCUBE. 2ª Generación (1988-1992): Arquitecturas de red en malla, encaminadores de mensajes hardware. Entorno de programación para procesamiento distribuido de grano medio. Ejemplos: Intel Paragon, Parsys SuperNode 1000. 3ª Generación (1993-1997): Incluyen el procesador y el control de la comunicación dentro del mismo chip VLSI permitiendo ejecuciones de grano fino. Ejemplos: MIT J-Machine, Caltech Mosaic. 52 Tema 1 24

Multicomputadores de 1ª generación. Estructura de paso de mensajes: Cada nodo está conectado a sus vecinos en cada dimensión mediante FIFOs. Para enviar un mensaje a un nodo no vecino los nodos intermedios deben reenviarlo. 53 Multicomputadores de 2ª generación. La comunicación la controlan los encaminadores sin que los mensajes deban entrar en los nodos intermedios. Paragon Mesh Routing Chips Red de interconexiones del Intel Paragon. 54 Tema 1 25