Computación de Altas Prestaciones Sistemas computacionales

Documentos relacionados
Modelos de computadores paralelos

Modelado de los computadores paralelos

ALGORITMOS PARALELOS Tema 1: Introducción a la Computación Paralela

Nociones básicas de computación paralela

Arquitectura de Computadoras. Clase 9 Procesamiento paralelo

Con estas consideraciones, Flynn clasifica los sistemas en cuatro categorías:

Grupo de Computación Científica y Programación Paralela Universidad de Murcia

Arquitecturas de Altas Prestaciones y Supercomputación

Procesamiento Paralelo

Procesamiento Paralelo

EVOLUCIÓN DE LOS PROCESADORES

TEMA 2: Organización de computadores

GRADO EN INGENIERÍA DE COMPUTADORES

TEMA 10 INTRODUCCIÓN A LOS SISTEMAS OPERATIVOS DISTRIBUIDOS. Introducción Hardware Software Aspectos de diseño

TEMA 9. SISTEMAS OPERATIVOS DISTRIBUIDOS

Programación Concurrente y Paralela. Unidad 1 Introducción

Lusitania. Pensando en Paralelo. César Gómez Martín

SISTEMAS DE MULTIPROCESAMIENTO

Sistemas Operativos. Curso 2016 Introducción

GUÍA DOCENTE ABREVIADA DE LA ASIGNATURA

Memoria compartida simétrica

1. Introducción 2. S.O. de Red. NFS 3. S.O. Distribuidos 4. Características de Diseño. Tema5: Sistemas Operativos Distribuidos

Introduccion a Sistemas Operativos. Ej: Linux

Plataformas paralelas

Computación de Alta Performance Curso 2009 ARQUITECTURAS PARALELAS ARQUITECTURAS PARALELAS

07 y 08 Sistemas distribuidos y paralelos y tarea 02

Introducción a los sistemas de Multiprocesamiento Prof. Gilberto Díaz

Granularidad y latencia

Introducción a las arquitecturas paralelas

PARADIGMA y LENGUAJES DE PROGRAMACIÓN

Arquitecturas de Computadoras II

Conceptos básicos de procesamiento paralelo (1)

UNIVERSIDAD NACIONAL DE INGENIERIA FACULTAD DE ELECTROTECNIA Y COMPUTACION DEPARTAMENTO DE ARQUITECTURA Y SISTEMAS

FUNDAMENTOS DE COMPUTACIÓN PARA CIENTÍFICOS. CNCA Abril 2013

15. Arquitectura de los multiprocesadores. 16. Multiprocesadores de memoria compartida. 17. Multicomputadores.

COMPONENTES DEL PC LEONARDO OLIVARES VILLA MATEO CARDONA ARENAS

CONCEPTOS BÁSICOS DE UNA RED.

El microprocesador (CPU). Ingeniería Informática. Ing. Miguel Angel Mendoza Mendoza.

Computación de Propósito General en Unidades de Procesamiento Gráfico GPGPU. Clase 0 Lanzamiento del Curso. Motivación

Indice 1. Introducción al procesamiento paralelo 2. Estructura de los multiprocesadores de memoria compartida

Trabajo de investigación Paralelismo en el procesador

Multiplicación de Matrices en Sistemas cc-numa Multicore. Autor: Jesús Cámara Moreno Director: Domingo Giménez Cánovas

CENTRO DE INVESTIGACIÓN EN TECNOLOGÍAS DE LA INFORMACIÓN Y LAS COMUNICACIONES

Departamento de Automática

CÓMPUTO DE ALTO RENDIMIENTO EN MEMORIA COMPARTIDA Y PROCESADORES GRÁFICOS

Taller de Programación Paralela

MAGMA. Matrix Algebra on GPU and Multicore Architecture. Ginés David Guerrero Hernández

Capítulo 1 Fundamentos

Duración (en horas) Evaluación de los aprendizajes

Sistemas Operativos. Algo de Sistemas Operativos, Arquitecturas y Paralelismo

Programa Regular. Asignatura: Organización y Arquitectura de Computadoras.

GUÍA DE APRENDIZAJE ARQUITECTURAS PARALELAS

:Arquitecturas Paralela basada en clusters.

Unidad IV: Arquitectura de los Sistemas de Bases de Datos (Tema 5) GESTIÓN DE BASES DE DATOS GRADO EN INGENIERÍA INFORMÁTICA UNED

Optimización de Rutinas Multinivel de Álgebra Lineal en Sistemas Multicore

MINUTA: Taller en UAEMEX, Toluca. Construcción de Tecnología HPC

Sistemas Operativos Tema 2: Estructura del computador José Miguel Santos Alexis Quesada Francisco Santana

PROGRAMA INSTRUCCIONAL FUNDAMENTO PARA EL DISEÑO DE SISTEMAS CON MICROPROCESADORES

Generación 1. Características. Estaban construidos con electrónica de válvulas. Se programaban en lenguaje de máquina.

Intel lanza su procesador Caballero Medieval habilitado para Inteligencia Artificial

Evaluación de la resolución en paralelo de un problema estocástico de planificación minera de largo plazo

Introducción a los sistemas operativos. Ing Esp Pedro Alberto Arias Quintero

ARQUITECTURAS AVANZADAS

MICROPROCESADOR. Ing. Raúl Rojas Reátegui

Departamento Ingeniería en Sistemas de Información

Sistemas operativos (Parte 4)

UNIDAD II Metodología de programación paralela. Lic. Jesús Germán Andrés PAUTSCH - FCEQyN - UNaM

Hoja de respuestas. Examen tipo A

INTRODUCCIÓN. Que es un sistema operativo? - Es un programa. - Funciona como intermediario entre el usuario y los programas y el hardware

CARRERA DE INGENIERÍA EN SISTEMAS COMPUTACIONALES SYLLABUS ARQUITECTURA DE COMPUTADORES

Tema 2. Arquitectura de CPU avanzadas 15/03/2011

Tendencias y Evaluación

CALENDARIO EXÁMENES 2016/ GRADO EN INGENIERÍA INFORMÁTICA

Ingeniería Informática

TEMA II: ALMACENAMIENTO DE LA INFORMACIÓN

Institución Educativa Distrital Madre Laura Tecnología e Inform ática GRADO 7

Programación Paralela y Distribuida

Grado en Ingeniería Informática-Tecnologías Informáticas

GUÍA DOCENTE Arquitecturas Avanzadas de Computadores

Es todo lo tangible, material, o físico que se puede tocar del equipo de computo, por ejemplo: monitor, ratón, teclado, bocinas, gabinete.

UNIVERSIDAD TECNICA DE AMBATO NOVENO SEMESTRE INGENIERIA ROBOTICA MICROCONTROLADORES Y SU APLICACION EN ROBOTICA PROFESOR: UTA 2009 ING. G.

AC2 - Arquitectura de Computadores II

ARQUITECTURA E INGENIERÍA DE LOS COMPUTADORES (Segunda Parte)

Objetos de aprendizaje: Computadora

Objetivos Generales. Conocimientos Previos Recomendados. CONTENIDOS TEORICOS (Temporización)

Fecha de entrega: Miércoles 4 de Septiembre. Campus: Villahermosa. Carrera : Ingeniería en Sistemas Compuacionales. Nombre del maestro: Carlos Castro

Arquitecturas vectoriales, SIMD y extensiones multimedia

Objetivos. Objetivos. Arquitectura de Computadores. R.Mitnik

Ley de Amdahl Ley de Moore Prof. Gilberto Díaz

Javier Pérez Mato µp para Comunicaciones Curso 2008/09 ETSIT - ULPGC

USO DE THREADS PARA LA EJECUCIÓN EN PARALELO SOBRE UNA MALLA COMPUTACIONAL

Contenidos. Arquitectura de ordenadores (fundamentos teóricos) Elementos de un ordenador. Periféricos

Lic. Saidys Jiménez Quiroz. Área de Tecnología e Informática. Grado 6 - Cescoj

cuevogenet Paralelización en CUDA de la Dinámica Evolutiva de Redes Génicas Dirigido por: Fernando Díaz del Río José Luis Guisado Lizar

El microprocesador se compone de la unidad de control y de la unidad aritmético lógica.

INEL 4206 Microprocesadores Texto: Barry B Brey, The Intel Microprocessors: 8va. Ed., Prentice Hall, 2009

FACULTAD DE INGENIERÍA

Capítulo 4. Introducción al paralelismo y al rendimiento.

«LAS PARTES DEL CPU»

Fundamentos de Programación. Sabino Miranda-Jiménez

Transcripción:

Computación de Altas restaciones Sistemas computacionales Javier Cuenca, Domingo Giménez Departamento de Informática y Sistemas Universidad de Murcia, Spain dis.um.es/~domingo Universidad de Murcia 1

Francisco Almeida, Domingo Giménez, José Miguel Mantas, Antonio M. Vidal: Introducción a la rogramación aralela araninfo Cengage Learning, 2008 Capítulo 1: Introducción a la programación paralela Capítulo 2: Modelado de computadores paralelos 2

Motivación roblemas de alto coste computacional: Necesario abordarlos con sistemas computacionales de altas prestaciones Con programas paralelos eficientes Con nuevos sistemas: Resolución de problemas de mayor dimensión Resolución de problemas previamente intratables Universidad de Murcia 3

Contenido y organización lanificado: Sistemas computacionales (1Te+0 r+3 Tr) aradigmas de programación paralela (1 Te+0 r+0 Tr) Organización: resentación+sistemas+paradigmas: 1.5 horas Trabajo sin evaluar: lectura sobre distintos sistemas Universidad de Murcia 4

rogramación paralela Uso de varios procesadores trabajando juntos para resolver una tarea común: Cada procesador trabaja en una porción del problema Los procesos pueden intercambiar datos, a través de: la memoria (Modelo de Memoria Compartida, OpenM) por una red de interconexión (Modelo de aso de Mensajes, MI) Universidad de Murcia 5

Necesidad de la programación paralela Límites de sistemas secuenciales: Memoria Velocidad Incremento coste superior al de prestaciones Solución paralelismo: Dificultades físicas: integración, velocidades acceso Dificultades lógicas: uso, programación Universidad de Murcia 6

Necesidad de la programación paralela Sistemas paralelos permiten resolver: roblemas mayores Más rápidamente Aplicación en: roblemas de alto coste computacional roblemas de gran dimensión roblemas de tiempo real Universidad de Murcia 7

Aspectos de la programación paralela Dificultades físicas: Mayor velocidad proceso que acceso a memoria y comunicación Integración: Límites velocidad de la luz Disipación de calor Universidad de Murcia 8

Aspectos de la programación paralela Ley de Moore: el número de procesadores integrados se duplica cada 18 meses rocesadores Intel aralelismo Universidad de Murcia 9

rogramación paralela aralelismo en monoprocesadores: Segmentación encauzada. ipeline Jerarquía de memorias División de memoria en bloques aralelismo a nivel de instrucción Ejecución fuera de orden Especulación Múltiples unidades funcionales Unidades vectoriales rocesadores de E/S... 10

rogramación paralela osibilidades de computación paralela: Varios procesadores en un chip rocesadores embebidos LAN de altas prestaciones rocesadores gráficos Computación de altas prestaciones Computación grid Computación web Computación ubicua Cloud computing Móviles... Universidad de Murcia 11

rogramación paralela Concurrente: varios procesos trabajando en la resolución de un problema Heterogénea: procesadores con distintas características Adaptativa: durante la ejecución el programa se adapta al estado del sistema Distribuida: procesadores geográficamente distribuidos En la web: necesidad de herramientas específicas Cuántica o biológica? Universidad de Murcia 12

Modelos de computadores paralelos SECUENCIAL (SISD) Modelo Von Neuman Memoria Instrucciones: de memoria a procesador Datos: entre memoria y procesador rocesador 13

Modelos de computadores paralelos SIMD. Una única Unidad de Control. La misma instrucción se ejecuta síncronamente por todas las unidades de procesamiento. programa instrucciones rocesador rocesador rocesador datos 14

Modelos de computadores paralelos MIMD. Cada procesador ejecuta un programa diferente independientemente de los otros procesadores. programa instrucciones programa instrucciones programa instrucciones rocesador rocesador rocesador datos datos datos 15

Modelos de computadores paralelos M M M M M M Network Memoria distribuida cada procesador tiene su propia memoria local. Se utiliza paso de mensajes para intercambiar datos. BUS M em o ry Memoria compartida un único espacio de memoria. Todos los procesadores tienen acceso a la memoria a través de una red de conexión: Bus Red de barras cruzadas Red multietapa 16

Sistemas de memoria compartida BUS M em ory Uniform memory access (UMA) Cada procesador tiene acceso uniforme a memoria. También se llaman symmetric multiprocessors (SMs) Non uniform memory access (NUMA) El tiempo de acceso depende de dónde están los datos. El acceso local es más rápido. Más fácil y barato de escalar que SMs BUS BUS Me m o ry Me m o ry Ne tw o rk 17

Sistemas de memoria compartida NUMA: SGI Origin 2000 18

Sistemas de memoria distribuida red anillo Diámetro: p/2 Hipercubo Malla Diámetro: p Servidor Estaciones de de ficheros trabajo 19

Evolución de los sistemas paralelos TO500 20

En Murcia ersonal: Uso de OpenM y MI en monoprocesadores, bipros, quad Empresas y Administración: Redes o multiprocesadores de reducido tamaño Uso para manejo de volúmenes de datos grandes, sin programación paralela Uso de programas paralelos desarrollados por otros Ibarabi?: supercomputador MC + clusters, en 2009, computación científica+empresas Universidad: Cartagena: híbrido MC+MD, 12 nodos de 8 núcleos + 2 nodos de 16 núcleos Murcia: híbrido MC+MD, 12 nodos de 8 núcleos? Resolución de problemas científicos, uso mínimo de paralelismo Grupos de investigación: Redes de ordenadores, para computación científica o paralelismo CGUM: C bipro, cluster: 3 bipro con duales, 2 bipros; computación paralela y 21 heterogénea

Sistemas actuales y futuros Multicore Actual: Bipro y Quad Intel, también SUN, CELL, AMD,... rocesadores específicos Gráficos GU De tratamiento de señal DS FGA y heterogéneos embebidos De juegos S3 Computadores heterogéneos CU+GU Futuro: lataformas híbridas Itanium2+Xeon con MC Futuro: Híbridos con 16000+16000 Distribuidos Redes, Grid, Web 2, móviles 22