Pipeline de instrucciones
|
|
- Monica Camacho Ávila
- hace 6 años
- Vistas:
Transcripción
1 Pipeline de instrucciones Manejo de Interrupciones Tipos: - Síncronas - Asíncronas Asíncronas: No están asociadas a ninguna instrucción. Se atienden normalmente al final de la instrucción en ejecución. Permiten cierta flexibilidad. E 5 Rut. E E E E5 t INT Aceptación Síncronas: Pipeline: Interrupciones Se producen siempre en el mismo lugar, cada vez que se ejecuta el mismo programa con los mismos datos. Se dan y deben atenderse en mitad de una instrucción. Implican la detención y, en general, el reinicio de dicha instrucción. El tratamiento de la mayoría de estas excepciones requiere: Salvar el estado. Ejecutar una rutina de tratamiento. Restaurar el estado y reiniciar. Interrupciones Precisas. Las instrucciones que preceden a la que produjo la excepción se completan y las que le suceden se reinician. El mismo comportamiento que en un computador sin pipeline. Page
2 Pipeline: Interrupciones Interrupciones síncronas. Ejemplo: Fallo de página. Reinicio E 5 5 E 5 E S. O. E E5 t Fallo de página Pipeline: Excepciones Problemas que plantea el pipeline de instrucciones.. Pueden producirse varias excepciones en el mismo ciclo. Reinicio E E E E E5 t Desbord. Fallo de página Desbord. Page
3 Pipeline: Excepciones. Pueden aparecer las excepciones fuera de orden. E E E E Anotación en vector de * N N * NOP Reinicio * E5 t Fallo de página Fallo de página Exámen del vector de (trata º fp de ) después se trata Si interrupciones precisas: No siempre se pueden tratar en el instante en el que se producen. 5 Pipeline: Excepciones. En saltos retardados. Pueden tener que reiniciarse instrucciones correspondientes a distintos flujos de control. dir: bz r, $dir ld r, #[r5]... add r, r, r Reinicio de instrucciones no consecutivas. E BZ 5 E BZ E BZ E BZ E5 BZ t Fallo de página 6 Page
4 Operaciones multiciclo Operaciones enteras complejas (mult, div). Operaciones de coma flotante. Necesitan más tiempo en la etapa EJ. Cómo abordar el pipeline, considerando estas operaciones?. Prolongando la etapa EJ de estas operaciones varios ciclos. No cambia el T.ciclo. Alus especializadas vs. Alus multifunción. División de la labor de Ejecución en varias unidades independientes: enteros, coma flotante,..., algunas con pipeline. 7 Estructura del pipeline: Operaciones multiciclo EJ Enteros () MEM BI DLR MULT ()p ADF/SUBF ()p ER DIV (0)np Detección de dependencia estructural e inhibición de la entrada de nuevas instrucciones add subf div div mult 8 Page
5 Operaciones multiciclo Diferencias con el pipeline original: ) Posibilidad de dependencias estructurales (U.F. sin pipeline). Detención de las instrucciones posteriores. Parones en el pipeline y pérdida de prestaciones. E Div Div Add Sub E Div Div Add E Div Div Div Div.... Div Div Div Div E E5 0 ciclos t 9 Operaciones multiciclo ) Varias instrucciones pueden llegar a la etapa ER en el mismo ciclo parón estructural. ) Las instrucciones pueden finalizar fuera de orden. Mayor complejidad en el tratamiento de excepciones. Dos escrituras en el mismo ciclo E E E E : MUL : : : SUB finalización fuera de orden 0 Page 5
6 Operaciones multiciclo ) Pueden aparecer dependencias de datos WAW. E E E : MUL R8, R, R : R8, #0[R] E E5 Escribe R8 Escribe R8 Operaciones multiciclo 5) Los parones debidos a dependencias RAW serán más frecuentes, debido a la mayor latencia de algunas operaciones. E 5 E E E 5 : MUL R, R, R6 : F R, R, R8 : ST R, #0[R] E5 Si las dependencias se detectan en E, antes de enviar una instrucción a E han de comprobarse:»las dependencias estructurales.»las dependencias RAW y WAW. Page 6
7 Superpipeline/Hiperpipeline Gananciaideal = nº de etapas. Número elevado de etapas. Procesadores Superescalares OBJETIVO : CPIideal < Para ello es necesario realizar en un mismo ciclo: Fetch Decodificación y lectura de operandos. Ejecución. Almacenamiento de resultados. De varias instrucciones! Múltiples pipelines en paralelo. I I I I I6 I5 I8 I7 I0 I9 I I I I I I I6 I5 I I I8 I7 I6 I5 I0 I9 I8 I7 I0 I9 instrucciones por ciclo CPIideal = 0,5 I I I I I I I6 I5 I I I8 I7 I6 I5 t Page 7
8 Procesadores Superescalares Posibilidad de emitir instrucciones fuera de orden. Mejora de prestaciones. div r, r, r addf r0, r, r8 Dependencia RAW subf r, r8, r ld r5, #0(r0) Instrucciones independientes Pueden aparecer dependencias WAR. ld r7, r5, #0[r] addf r6, r, r8 div r, r, r6 subf r, r5, r Dependencia RAW WAR si subf finaliza antes que div WAR y WAW son falsas dependencias. Se resuelven mediante Renombrado de registros estático o dinámico. 5 Procesadores Superescalares Ejemplo de renombrado de registros: r <- r op r5 r <- r op r6 r <- r5 op r r <- r8 op r RAW WAR WAW 6 Page 8
9 Aplicación: Procesadores Vectoriales Problemas que requieren mucho cálculo y pueden ser formulados en términos de vectores y matrices. - Solución convencional: for (i=; i<00; i++) c[i] = a[i] + b[i] - Solución vectorial: c[i] = a[i] + b[i] (I=,00) Modelos de Ejecución: Memoria-Memoria (Primeros vectoriales) Alto ancho de banda de la memoria (CYBER: 5 bits) Registro-Registro. Registros de alta capacidad (CRAY: 6 elementos de 6 bits). Uso intensivo de pipeline aritmético 7 Procesadores Vectoriales Estructura. Procesador Escalar Datos escalares Registros Escalares PE- PE- PE-k Memoria principal Fetch Decod. Busq escalar Busq. Vectorial Procesador Vectorial Datos vectoriales Registros Vectoriales PV- PV- PV-k Unidades funcionales con pipeline. 8 Page 9
10 Procesadores SIMD (Matriciales) Estructura. Bus de datos Host E/S Datos e instrucciones Control Bus control EP-0 M-EP-0 EP- M-EP EP-n M-EP-n Illiac IV Red de interconexión La U.C. lanza la misma instrucción a todos los EP, que la ejecutan sobre sus datos locales (síncronos). 9 Características globales: Sistemas MIMD Dos o más procesadores con la misma capacidad de cálculo. Funcionamiento asíncrono. Cada procesador tiene su propia U. Control. Grado de acoplamiento.(grado de interacción entre procesadores): Débil (Multicomputadores). Moderado (NUMA) Fuerte (UMA) Escalabilidad: Escalables. No escalables. Simetría. Simétricos Asimétricos (procesadores dedicados para E/S: attached). 0 Page 0
11 Clasificación de MIMDs MULTIPROCESADORES Memoria compartida (Lógica) P0 P..... Pk Red de interconexión Comunicación a través de memoria M0 M..... Mn Espacio global de direcciones MULTICOMPUTADORES Memoria distribuida Comunicación mediante paso de mensajes Multiprocesadores Un solo espacio de direcciones lógico visible a todos los procesadores. Dependiendo de la organización física de la memoria: UMA. - Memoria física y lógica compartida - Acceso uniforme a memoria. NUMA - Memoria lógica compartida - Acceso no uniforme a memoria. Page
12 ª GENERACIÓN: UMA s con bus compartido. Multiprocesadores Problemas de latencia de memoria: Acceso de varios procesadores al mismo módulo de memoria. Retrasos introducidos por la red de interconexión y conflictos en la propia red. Cuanto mayor es el nº de procesadores, mayor será la latencia media Baja escalabilidad (6-6 procesadores) Multiprocesadores UMA: Ejemplo - CPU s de bits y 000 MIPS - Arquitectura RISC -Nº de CPU s = 0 - El 0% de las instrucciones son Load o Store: 70% Load y 0% Store Nº de Accesos a memoria por segundo y por CPU: Fetch de instrucción: Búsqueda de operando (load): x 0, x 0,7 Escritura de resultado (store): x 0, x 0, peticiones/s Ancho de banda necesario en la memoria compartida: 0 x palabras/s = palabras/s T. Acceso necesario: 0,08 ns! Page
13 Multiprocesadores UMA Para reducir tráfico, contención y latencia: Uso de memorias cache locales PROBLEMA: Coherencia de caches Por compartición de datos modificables. Por migración de procesos. SOLUCIONES: Usar la CACHE sólo para código (read-only) y datos privados. Algoritmos de coherencia: Protocolos snoopy (ej: MESI) 5 Protocolos snoopy Dotar a las Mca de la habilidad de escuchar las peticiones que van por el bus y actuar en consecuencia. Caches con write-through: Invalidación (write invalidate) Actualización(write update) Caches con copy-back: protocolos más complejos: write once MESI Invalidado AL FL AE Write invalidate AE Modificado AL AE Exclusivo AL 6 Page
14 Multiprocesadores UMA Ejemplos: Compaq Proliant 5000 Pentium Pro 00MHz.08MB Digital AlphaServer800 Alpha6 0MHz 8.67MB HP9000 K60 PA MHz.096MB IBM RS/6000 R0 8 PowerPC 60 MHz.08MB SGI Power Challenge 6 MIPS R MHz 6.8MB Sun Enterprise UltraSparc 67MHz 0.70MB 7 Multiprocesadores ª GENERACIÓN: NUMAs. Distribución física de la memoria entre los procesadores. Redes de interconexión más complejas que bus. Alta escalabilidad y no coherencia de caches. ª GENERACIÓN: CC-NUMAs. Grandes caches locales y utilización de protocolos de coherencia no snoopy (directorio). Cray TE 08 Alpha 6 50MHz 5.88MB -SMP (NUMA) Convex 6 PA MHz 65.56MB -SMP Exemplar Sequent Pent.Pro 00MHz.07MB -SMP NUMA-Q SGI 8 MR MHz.07MB -SMP Origin000 Sun Enterprise 6 UlltraSparc 50MHz 65.56MB -SMP Page
15 Diversas topologías. Redes de interconexión DINÁMICAS: Utilizadas en multiprocesadores UMA. Bus compartido Crossbar MEMORIA M-M M-M M-M M-M CPU- CPU- CPU- CPU- CPU- CPU- CPU- CPU- 9 DINÁMICAS: Red multietapa Redes de interconexión Page 5
16 Redes de interconexión ESTÁTICAS: Utilizadas en multiprocesadores NUMA Red hipercubo Malla y Toroide Page 6
Definición de prestaciones
Definición de prestaciones En términos de velocidad. Diferentes puntos de vista: Tiempo de ejecución. Productividad (throughput) Medidas utilizadas En función de la duración del ciclo de reloj y del número
Más detallesTaxonomía de las arquitecturas
Taxonomía de las arquitecturas 1 INTRODUCCIÓN 2 2 CLASIFICACIÓN DE FLYNN 3 2.1 SISD (SINGLE INSTRUCTION STREAM, SINGLE DATA STREAM) 3 2.2 SIMD (SINGLE INSTRUCTION STREAM, MULTIPLE DATA STREAM) 4 2.2.1
Más detallesCon estas consideraciones, Flynn clasifica los sistemas en cuatro categorías:
Taxonomía de las arquitecturas 1 Introducción Introducción En este trabajo se explican en detalle las dos clasificaciones de computadores más conocidas en la actualidad. La primera clasificación, es la
Más detalles1. Objetivo y evolución de los procesadores ILP.
Arquitectura de Computadores Tema 3: Procesadores ILP Índice. Objetivo y evolución de los procesadores ILP. 2. Segmentación (Pipeline).. Concepto y medida de rendimiento. i 2. Pipeline de instrucciones..
Más detalles3. SEGMENTACIÓN DEL CAUCE
3. SEGMENTACIÓN DEL CAUCE 1 SEGMENTACIÓN DEL CAUCE 1. Conceptos básicos 2. Etapas del MIPS64 3. Riesgos 4. Operaciones muticiclo 2 SEGMENTACIÓN DEL CAUCE 1. Conceptos básicos 3 Conceptos básicos Ciclo
Más detallesSegmentación del ciclo de instrucción
Segmentación del ciclo de instrucción William Stallings, Organización y Arquitectura de Computadores, Capítulo 11: Estructura y función de la CPU. John Hennessy David Patterson, Arquitectura de Computadores
Más detallesArquitectura de Computadores Problemas (hoja 4). Curso
Arquitectura de Computadores Problemas (hoja 4). Curso 2006-07 1. Sea un computador superescalar similar a la versión Tomasulo del DLX capaz de lanzar a ejecución dos instrucciones independientes por ciclo
Más detallesArquitectura de Computadoras. Clase 9 Procesamiento paralelo
Arquitectura de Computadoras Clase 9 Procesamiento paralelo Introducción al procesamiento paralelo Sea cual sea el nivel de prestaciones, la demanda de máquinas de mayor rendimiento seguirá existiendo.
Más detallesArquitectura e Ingeniería de Computadores. Examen Parcial. 7/02/2012
Apellidos Nombre Grupo: Arquitectura e Ingeniería de Computadores. Examen Parcial. 7/02/2012 Instrucciones.- Cada pregunta consta de cinco afirmaciones, y cada una de las afirmaciones puede ser cierta
Más detallesProcesadores superescalares. Introducción
Procesadores superescalares Introducción Introducción El término superescalar (superscalar) fue acuñado a fines de los 80s. Todas las CPUs modernas son superescalares. Es un desarrollo de la arquitectura
Más detalles6. PROCESADORES SUPERESCALARES Y VLIW
6. PROCESADORES SUPERESCALARES Y VLIW 1 PROCESADORES SUPERESCALARES Y VLIW 1. Introducción 2. El modelo VLIW 3. El cauce superescalar 4. Superescalar con algoritmo de Tomasulo 2 PROCESADORES SUPERESCALARES
Más detallesArquitectura de Computadoras para Ingeniería
Arquitectura de Computadoras para Ingeniería (Cód. 7526) 1 Cuatrimestre 2016 Dra. DCIC - UNS 1 Multiprocesadores 2 Clasificación de Flynn Clasificación de 1966 En función del flujo de instrucciones y datos
Más detallesCAPÍTULO 2 PROCESADORES SUPERESCALARES
CAPÍTULO 2 PROCESADORES SUPERESCALARES INTRODUCCIÓN Características de los procesadores superescalares Paralelismo Diversificación Dinamismo Arquitectura de un procesador superescalar genérico Características
Más detallesMULTIPROCESADORES COMERCIALES. José M. Cámara v. 2.0
MULTIPROCESADORES COMERCIALES José M. Cámara (checam@ubu.es) v. 2.0 ARQUITECTURA SMP AlphaServer 8400 Características generales Multiprocesador simétrico de acceso uniforme a memoria Hasta 12 CPU Alpha
Más detallesTema 1: PROCESADORES SEGMENTADOS
Tema 1: PROCESADORES SEGMENTADOS 1.1. Procesadores RISC frente a procesadores CISC. 1.2. Clasificación de las arquitecturas paralelas. 1.3. Evaluación y mejora del rendimiento de un computador. 1.4. Características
Más detallesParalelismo al nivel de instrucciones
Paralelismo al nivel de instrucciones Arquitectura de Computadoras M. C. Felipe Santiago Espinosa Mayo de 2017 Qué es la segmentación o pipelining? O Técnica para la generación de paralelismo en microprocesadores.
Más detallesArquitectura de Computadoras. Clase 4 Segmentación de Instrucciones
Arquitectura de Computadoras Clase 4 Segmentación de Instrucciones Segmentación de cauce: Conceptos básicos La segmentación de cauce (pipelining) es una forma particularmente efectiva de organizar el hardware
Más detallesArquitectura de Computadoras Trabajo Práctico N 8 Pipeline de Instrucciones 1 Primer Cuatrimestre de 2016
Departamento de Cs. e Ingeniería de la Computación Universidad Nacional del Sur Ejercicios Arquitectura de Computadoras Trabajo Práctico N 8 Pipeline de Instrucciones 1 Primer Cuatrimestre de 2016 1. La
Más detallesArquitectura de Computadoras Trabajo Práctico N 7 Pipeline de Instrucciones Primer Cuatrimestre de 2010
Departamento de Cs. e Ingeniería de la Computación Universidad Nacional del Sur Ejercicios Arquitectura de Computadoras Trabajo Práctico N 7 Pipeline de Instrucciones Primer Cuatrimestre de 2010 1. La
Más detallesModelos de computadores paralelos
Modelos de computadores paralelos Domingo Giménez Departamento de Informática y Sistemas Universidad de Murcia, Spain dis.um.es/~domingo Universidad de Murcia 1 Contenido Programación paralela Modelos
Más detallesArquitecturas Paralelas Examen de Febrero 24 Enero 2005
Universidad del País Vasco Facultad de Informática Dpto. de Arquitectura y Tecnología de Computadores Arquitecturas Paralelas Examen de Febrero 24 Enero 2005 Apellidos: Nombre: Grupo: Firma: 1 / 2 / 3
Más detallesMULTIPROCESADORES TIPOS DE PARALELISMO
Todos los derechos de propiedad intelectual de esta obra pertenecen en exclusiva a la Universidad Europea de Madrid, S.L.U. Queda terminantemente prohibida la reproducción, puesta a disposición del público
Más detallesIntroducción a la arquitectura de computadores
Introducción a la arquitectura de computadores Departamento de Arquitectura de Computadores Arquitectura de computadores Se refiere a los atributos visibles por el programador que trabaja en lenguaje máquina
Más detallesUnidad 4 - Procesamiento paralelo. Arquitectura de computadoras. D o c e n t e : E r n e s t o L e a l. E q u i p o : J e s s i c a F i e r r o
Unidad 4 - Procesamiento paralelo. D o c e n t e : E r n e s t o L e a l E q u i p o : J e s s i c a F i e r r o L u i s N a v e j a s Arquitectura de computadoras Introducción Cuestionario Conclusiones
Más detallesGRADO EN INGENIERÍA DE COMPUTADORES
GRADO EN INGENIERÍA DE COMPUTADORES Departamento Arquitecturas de Paralelas Automática Prof. Dr. José Antonio de Frutos Redondo Curso 2013-2014 Tema 4. Arquitecturas Paralelas Arquitecturas paralelas.
Más detallesEjercicios de Paralelismo a Nivel de Instrucción
Ejercicios de Paralelismo a Nivel de Instrucción J. Daniel García Sánchez (coordinador) David Expósito Singh Javier García Blas Óscar Pérez Alonso J. Manuel Pérez Lobato Arquitectura de Computadores Grupo
Más detallesAspectos avanzados de arquitectura de computadoras Pipeline. Facultad de Ingeniería - Universidad de la República Curso 2017
Aspectos avanzados de arquitectura de computadoras Pipeline Facultad de Ingeniería - Universidad de la República Curso 2017 Objetivo Mejorar el rendimiento Incrementar frecuencia de reloj? Ancho de los
Más detallesMemoria compartida simétrica
Memoria compartida simétrica Arquitectura de Computadores J. Daniel García Sánchez (coordinador) David Expósito Singh Javier García Blas Óscar Pérez Alonso J. Manuel Pérez Lobato Grupo ARCOS Departamento
Más detallesTema 7: Procesadores superescalares
Tema 7: Procesadores superescalares Arquitectura de Computadores y Sistemas Operativos I 4º Curso Plan 96 Escuela Técnica Superior Ingenieros Telecomunicaciones DISCA Tema 7: Procesadores superescalares
Más detallesTEMA 10 INTRODUCCIÓN A LOS SISTEMAS OPERATIVOS DISTRIBUIDOS. Introducción Hardware Software Aspectos de diseño
TEMA 10 INTRODUCCIÓN A LOS SISTEMAS OPERATIVOS DISTRIBUIDOS Introducción Hardware Software Aspectos de diseño 1 Introducción Aparecen en los 80 Desarrollo de Microprocesadores LAN Sistemas Distribuidos:
Más detallesTEMA 9. SISTEMAS OPERATIVOS DISTRIBUIDOS
TEMA 9. SISTEMAS OPERATIVOS DISTRIBUIDOS Introducción Hardware Software Aspectos de diseño 1 Introducción Aparecen en los 80 Desarrollo de Microprocesadores LAN Sistemas Distribuidos: Gran nº de procesadores
Más detallesDepartamento de Automática
Departamento de Automática Tema 3 Paralelismo a nivel de instrucción (I) Prof. Dr. José Antonio de Frutos Redondo Dr. Raúl Durán Díaz Curso 2010-2011 Tema 3. Paralelismo a Nivel de Instrucción I Planificación
Más detallesArquitectura de Computadores (obligatoria)
Arquitectura de Computadores (obligatoria) Profesores responsables: Pau Micó Tormos (teoría y prácticas) Despacho: F4D1 Créditos: 6 (4.5 Teoría + 1.5 Prácticas) Semestre: 3A Número de grupos de aula: 1
Más detalles#define MAX 1024 void escala_vect (float A[MAX], float B[MAX], float k) { int i; for (i=0; i < MAX; i++) B[i]=k*A[i]; }
PROBLEMA 1 Memoria Cache (10 puntos) Supongamos un sistema con un procesador que lanza direcciones de 32 bits. Dispone de dos caches, una para instrucciones y otra para datos, de 8 KBytes cada una. La
Más detallesPROBLEMAS TEMA 1: Estructuras de interconexión de un computador
PROBLEMAS TEMA 1: Estructuras de interconexión de un computador Problemas propuestos en examen 1.1 Una CPU que emplea un tamaño de palabra de 16 bits tiene un repertorio de 16 instrucciones con un formato
Más detallesMemoria Virtual. Memoria Virtual
Memoria Virtual Es el nivel de la jerarquía que maneja la cache entre memoria principal y memoria secundaria. Permite que los programas se expandan más allá de los límites de la memoria principal. Permite
Más detallesEjercicio 1. Considere el siguiente fragmento en ensamblador:
UNIVERSIDAD CARLOS III DE MADRID DEPARTAMENTO DE INFORMÁTICA GRADO EN INGENIERÍA INFORMÁTICA. ESTRUCTURA DE COMPUTADORES Para la realización del presente examen se dispondrá de 1:30 horas. NO se podrán
Más detallesMemoria compartida distribuida
Memoria compartida distribuida Arquitectura de Computadores J. Daniel García Sánchez (coordinador) David Expósito Singh Javier García Blas Óscar Pérez Alonso J. Manuel Pérez Lobato Grupo ARCOS Departamento
Más detalles2EMHWLYRV 5HIHUHQFLDV. Procesadores vectoriales
7HPD0XOWLSURFHVDGRUHV 2EMHWLYRV 5HIHUHQFLDV,QWURGXFFLyQ $UTXLWHFWXUDVFHQWUDOL]DGDVGHPHPRULDFRPSDUWLGD $UTXLWHFWXUDVGLVWULEXLGDVGHPHPRULDFRPSDUWLGD 6LQFURQL]DFLyQ 0XOWLFRPSXWDGRUHV 1 esadores vectoriales
Más detallesUNIVERSIDAD DE GUADALAJARA
UNIVERSIDAD DE GUADALAJARA CENTRO UNIVERSITARIO DE LOS ALTOS DIVISIÓN DE ESTUDIOS EN FORMACIONES SOCIALES LICENCIATURA: INGENIERÍA EN COMPUTACIÓN UNIDAD DE APRENDIZAJE POR OBJETIVOS ARQUITECTURA DE COMPUTADORAS
Más detallesTEMA 1. Arquitecturas multiprocesador: MIMD de memoria compartida (multiprocesadores) V 2.0
TEMA 1 Arquitecturas multiprocesador: MIMD de memoria compartida (multiprocesadores) V 2.0 José M. Cámara (checam@ubu.es) Multiprocesadores y multicomputadores Multiprocesadores: son sistemas formados
Más detallesContenidos. Arquitectura de ordenadores (fundamentos teóricos) Elementos de un ordenador. Periféricos
Arquitectura de ordenadores (fundamentos teóricos) Representación de la información Estructura de un microprocesador Memorias Sistemas de E/S Elementos de un ordenador Microprocesador Placa base Chipset
Más detallesEstructura de Computadores
Estructura de Computadores Tema 4. El procesador Departamento de Informática Grupo de Arquitectura de Computadores, Comunicaciones y Sistemas UNIVERSIDAD CARLOS III DE MADRID Contenido Elementos de un
Más detallesCuestionario Unidad 4: Procesamiento paralelo 2012
SEP SNEST DGEST INSTITUTO TECNOLÓGICO DE CHIHUAHUA II INGENIERÍA EN SISTEMAS COMPUTACIONALES ARQUITECTURA DE COMPUTADORAS Ing. Ernesto Leal Procesamiento paralelo ELABORADO POR: Miguel Angel Chávez Reza
Más detallesClasificación de las Arquitecturas
Clasificación de las Arquitecturas MIA José Rafael Rojano Cáceres Arquitectura de Computadoras I Por la taxonomía de Flynn 1 Flynn Flujo de datos Simple Múltiple Flujo de datos Simple Múltiple SISD MISD
Más detallesArquitectura del MIPS: Introducción
Arquitectura del MIPS: Introducción Montse Bóo Cepeda Este trabajo está publicado bajo licencia Creative Commons Attribution- NonCommercial-ShareAlike 2.5 Spain. Estructura del curso 1. Evolución y caracterización
Más detallesIndice 1. Introducción al procesamiento paralelo 2. Estructura de los multiprocesadores de memoria compartida
Tema 8: Multiprocesadores de memoria compartida y distribuida Indice 1. Introducción al procesamiento paralelo 2. Estructura de los multiprocesadores de memoria compartida 3. Medio de interconexión de
Más detallesTaller de Programación Paralela
Taller de Programación Paralela Departamento de Ingeniería Informática Universidad de Santiago de Chile March 17, 2008 Qué es paralelismo? Una estrategia compuesta de elementos de hardware y software para
Más detallesPlataformas paralelas
Plataformas paralelas Curso 2011-2012 Elementos de un computador paralelo Hardware: Múltiples procesadores Múltiples memorias Redes de interconexión Software: Sistemas Operativos paralelos Programas orientados
Más detallesEjecución serial: las tareas/instrucciones de un programa son ejecutadas de manera secuencial, una a la vez.
Paralelismo Conceptos generales Ejecución serial: las tareas/instrucciones de un programa son ejecutadas de manera secuencial, una a la vez. Ejecución paralela: varias tareas/instrucciones de un programa
Más detallesArquitecturas vectoriales, SIMD y extensiones multimedia
Arquitecturas vectoriales, SIMD y extensiones multimedia William Stallings, Organización y Arquitectura de Computadores, 5ta. ed., Capítulo 16: Procesamiento Paralelo. Andrew S. Tanenbaum, Organización
Más detallesComputación de Alta Performance Curso 2009 ARQUITECTURAS PARALELAS ARQUITECTURAS PARALELAS
Computación de Alta Performance Curso 2009 CONTENIDO Arquitecturas secuenciales y paralelas. Clasificación de Flynn. Modelo SIMD. GPUs. Modelo SISD. Modelo SIMD. Arquitectura MIMD MIMD con memoria compartida.
Más detallesArquitectura de Computadores. E.P.S. Alcoi Curso
Arquitectura de Computadores E.P.S. Alcoi Curso 2011-2012 Profesorado Profesor responsable: Pau Micó e-mail: pabmitor@disca.upv.es web: http://personales.alc.upv.es/pabmitor/ Despacho F4D1 Tutorias: bajo
Más detallesArquitectura de Computadores II Clase #16
Arquitectura de Computadores II Clase #16 Facultad de Ingeniería Universidad de la República Instituto de Computación Curso 2010 Organización general Superescalar Varios pipelines. 2 operaciones enteras,
Más detalles202 PROBLEMAS DE ARQUITECTURA DE COMPUTADORES
202 PROBLEMAS DE ARQUITECTURA DE COMPUTADORES César Represa Pérez Carmen Rodríguez Clavería Nº de Asiento Registral 00/2013/1733 Burgos, 2013 202 Problemas de Arquitectura de Computadores 2º G.I.I 202
Más detallesTema 5. Segmentación: conceptos básicos
Tema 5. Segmentación: conceptos básicos Organización de Computadores LUIS ENRIQUE MORENO LORENTE RAÚL PÉRULA MARTÍNEZ ALBERTO BRUNETE GONZALEZ DOMINGO MIGUEL GUINEA GARCIA ALEGRE CESAR AUGUSTO ARISMENDI
Más detallesARQUITECTURA DE COMPUTADORAS
2-12-2012 INSTITUTO TECNOLÓGICO DE CHIHUAHUA II ARQUITECTURA DE COMPUTADORAS Cuestionario Unidad 4 Claudia Cristina Enríquez Zamarrón 10 55 05 10 Laura Michell Montes Blanco 10 55 05 02 INTRODUCCIÓN: En
Más detallesModelado de los computadores paralelos
Modelado de los computadores paralelos Francisco Almeida, Domingo Giménez, José Miguel Mantas, Antonio M. Vidal: Introducción a la rogramación aralela, araninfo Cengage Learning, 2008 Figuras tomadas directamente
Más detallesSegmentación del ciclo de instrucción v.2016
Segmentación del ciclo de instrucción v.2016 John Hennessy & David Patterson, Arquitectura de Computadores Un enfoque cuantitativo, 4ª edición Apéndice A (Capítulos 5 y 6 de la 1ª edición) Segmentación
Más detallesMultiprocesamiento en Lenguaje C Conceptos básicos de la computación paralela
Multiprocesamiento en Lenguaje C Conceptos básicos de la computación paralela Pertinencia de la enseñanza del cómputo paralelo en el currículo de las ingenierías Conceptos básicos de la computación paralela
Más detallesTutorías con Grupos Reducidos (TGR) Sesión 2: Paralelismo a Nivel de Instrucción
Tutorías con Grupos Reducidos (TGR) Sesión 2: Paralelismo a Nivel de Instrucción ESTRUCTURA DE COMPUTADORES Grupo de Arquitectura de Computadores (GAC) Dyer Rolán García (GAC) Paralelismo a nivel de instrucción
Más detallesSistemas operativos (Parte 4)
Sistemas operativos (Parte 4) M. en C. Mario Farias-Elinos Contenido Implementación de un sistema de archivos Ejemplos de sistemas de archivos Dispositivos de I/O Multiprocesamiento 1 Operaciones con archivos
Más detallesTema 2. Arquitectura de CPU avanzadas 15/03/2011
Tema 2. Arquitectura de CPU avanzadas. Juegos CISC y RISC. Proceso paralelo. Procesadores escalares y vectoriales. Segmentación. Caches multinivel. Índice Introducción... 1 Procesadores CISC y RISC...
Más detallesArquitectura de Computadores II Clase #5
Arquitectura de Computadores II Clase #5 Facultad de Ingeniería Universidad de la República Instituto de Computación Curso 2010 Algunas ideas para mejorar el rendimiento Obvio: incrementar la frecuencia
Más detallesTEMA 3 PROCESADORES VECTORIALES
TEMA 3 PROCESADORES VECTORIALES A T 5 1 1 8 A r q u i t e c t u r a e I n g e n i e r í a d e C o m p u t a d o r e s I J u a n A n t o n i o M a e s t r o PROCESADORES VECTORIALES V e n t a j a s d e
Más detallesTema 1: PROCESADORES SEGMENTADOS
Tema 1: PROCESADORES SEGMENTADOS Tema 1: PROCESADORES SEGMENTADOS 1.1. Procesadores RISC frente a procesadores CISC. 1.2. Clasificación de las arquitecturas paralelas. 1.3. Evaluación y mejora del rendimiento
Más detallesEstructura y Tecnología de Computadores. Tema 3. Introducción a la estructura de computadores
1 Estructura y Tecnología de Computadores Módulo B. Introducción a la estructura de computadores Tema 3. Introducción a la estructura de computadores José Manuel Mendías Cuadros Dpto.. Arquitectura de
Más detallesArquitectura de Computadores Problemas (hoja 2). Curso
Arquitectura de Computadores Problemas (hoja 2). Curso 2006-07 1. El siguiente fragmento de código se ejecuta en un DLX con segmentación: SUB R1,R2,R3 ADD R4,R5,R6 SUB R5,R4,R8 ADD R7,R2,R3 ADD R9,R7,R3
Más detallesArquitectura de Computadores II Clase #3
Arquitectura de Computadores II Clase #3 Facultad de Ingeniería Universidad de la República Instituto de Computación Curso 2010 Veremos Registros Repertorio de instrucciones Modos de direccionamiento El
Más detallesDocente Cargo Carga Horaria Carlos A. Correa Profesor Titular Exclusivo 10hs
1. Carrera y Año: PROGRAMA ANALÍTICO 2010 ARQUITECTURAS AVANZADAS DE COMPUTADORAS - Licenciatura en Ciencias de la Computación 4 t año 2. Crédito Horario: - Horas áulicas por semana: 9 - Horario: Lunes:
Más detallesARQUITECTURAS PARALELAS examen de febrero de 2004
ARQUITECTURAS PARALELAS examen de febrero de 2004 1. La memoria de un procesador vectorial se direcciona al byte. Un determinado bucle utiliza la diagonal de una matriz de 128 128 elementos de 64 bits,
Más detallesTema 9. Planificación dinámica de instrucciones II: Algoritmo de Tomasulo
Tema 9. Planificación dinámica de instrucciones II: Algoritmo de Tomasulo Organización de Computadores LUIS ENRIQUE MORENO LORENTE RAÚL PÉRULA MARTÍNEZ ALBERTO BRUNETE GONZALEZ DOMINGO MIGUEL GUINEA GARCIA
Más detallesExplotación del paralelismo a nivel de instrucción
Explotación del paralelismo a nivel de instrucción Arquitectura de Computadores J. Daniel García Sánchez (coordinador) David Expósito Singh Javier García Blas Óscar Pérez Alonso J. Manuel Pérez Lobato
Más detallesTema 4 (II) El procesador
Tema 4 (II) El procesador Grupo ARCOS Estructura de Computadores Grado en Ingeniería Informática Universidad Carlos III de Madrid Contenidos 1. Técnicas de control 1. Lógica cableada 2. Lógica almacenada
Más detallesArquitectura de Computadores. Tema 4 PROCESADORES SEGMENTADOS
Arquitectura de Computadores Tema 4 PROCESADORES SEGMENTADOS 1. Arquitecturas RISC y CISC. 2. Unidad de Control monociclo y multiciclo. 3. Segmentación. 3.1. Ruta de datos del MIPS R2000. 3.2. Control
Más detallesIntroducción a las arquitecturas paralelas
Capítulo 4 Introducción a las arquitecturas paralelas Hasta este momento se ha estudiado el procesamiento a nivel del procesador. Se ha visto ya que la segmentación es un primer mecanismo de paralelismo,
Más detallesUnidad Nº II Capacidad de la unidad central. de procesamiento. Instituto Universitario Politécnico. Santiago Mariño
Instituto Universitario Politécnico Santiago Mariño Unidad Nº II Capacidad de la unidad central de procesamiento Organización de instrucción de máquina Cada instrucción requiere la información que necesita
Más detallesProcesadores segmentados. El DLX.
Procesadores segmentados. El DLX. Curso 2011-2012 Características de las Arquitecturas Tipos de Arquitectura Organización de la Memoria Direccionamiento de Memoria Operaciones en el Repertorio de Instrucciones
Más detallesEstructura de Computadores Tema 1. Introducción a los computadores
Estructura de Computadores Tema 1. Introducción a los computadores Departamento de Informática Grupo de Arquitectura de Computadores, Comunicaciones y Sistemas UNIVERSIDAD CARLOS III DE MADRID Contenido
Más detallesOrganización lógica Identificación de bloque
Cómo se encuentra un bloque si está en el nivel superior? La dirección se descompone en varios campos: Etiqueta (tag): se utiliza para comparar la dirección requerida por la CPU con aquellos bloques que
Más detallesGranularidad y latencia
Niveles de paralelismo y latencias de comunicación Niveles de paralelismo. Granularidad o tamaño de grano. Latencia de comunicación. Particionado de los programas. Empaquetado de granos. Planificación
Más detallesARQUITECTURA DE COMPUTADORAS
ARQUITECTURA DE COMPUTADORAS Información General Objetivos Al terminar el curso, el estudiante estará capacitado para: 1. Manejar medidas de performance que permitan comparar diversos sistemas de Computadora.
Más detallesSISTEMAS DE MULTIPROCESAMIENTO
SISTEMAS DE MULTIPROCESAMIENTO Tema 1 Introducción 5º Curso de Automática y Electrónica Industrial. 1 Contenido Tema 1 Aplicaciones Incremento de las prestaciones Clasificación de los ordenadores en función
Más detallesArquitectura Segmentada: Conceptos básicosb
Arquitectura Segmentada: Conceptos básicosb Diseño de Sistemas Digitales EL-3310 I SEMESTRE 2008 4 ARQUITECTURA SEGMENTADA (PIPELINING) (4 SEMANAS) 4.1 Conceptos básicos de la arquitectura segmentada Paralelismo
Más detalles5. Procesador: camino de datos y control
Fundamentos de Computadores Ingeniería de Telecomunicación Departamento de Automática Escuela Politécnica Superior Curso académico 2009 2010 Contenidos 1 Control de operaciones elementales 2 3 4 5 Objetivos
Más detallesHISTORIA DEL PIPELINE. Juan Antonio Romano Largo. Arquitectura de Computadores.
HISTORIA DEL PIPELINE CRONOLOGÍA Introducción ppo. S. XX IBM 704 1955 IBM 7030 (proyecto Stretch) 1956-1961 CDC 6600 1964 VAX 8800 1987 RISC vs CISC (MIPS vs VAX 8700) 1989 R4000 (Supersegmentado) 1991
Más detallesEjercicios del tema 4. El procesador
jercicios del tema 4. l procesador jercicio 1. Considere un procesador de 32 bits con una frecuencia de reloj de 500 MHz con la estructura del mostrado en el jercicio 3. La memoria se direcciona por bytes
Más detallesArquitectura de Computadoras
4-1 Arquitectura de Computadoras Tema 4: Arquitectura del Set de Instrucciones Eduardo Daniel Cohen dcohen@arnet.com.ar http://www.herrera.unt.edu.ar/arqcom 4-2 Arquitectura del Set de Instrucciones Indice
Más detallesARQUITECTURA DE COMPUTUTADORAS II
ARQUITECTURA DE COMPUTUTADORAS II 2 ÍNDICE Introducción 4 Objetivo general de aprendizaje 6 Mapa conceptual 7 Unidad 1. Introducción al procesamiento paralelo 8 Introducción 9 Mapa conceptual 10 1.1 Paralelismo
Más detallesIntroducción a los procesadores ILP (Instruction-Level Parallel)
Introducción a los procesadores ILP (Instruction-Level Parallel) Herramientas básicas para conseguir paralelismo entre instrucciones: Encauzamiento (pipelining) Se usa en todo procesador ILP Utilizar varias
Más detallesSegmentación del ciclo de instrucción v.2014
Segmentación del ciclo de instrucción v.2014 William Stallings, Organización y Arquitectura de Computadores, Capítulo 11: Estructura y función de la CPU. John Hennessy David Patterson, Arquitectura de
Más detallesSistema Cache. Técnicas Digitales III Ing. Gustavo Nudelman Universidad Tecnológica Nacional - Facultad Regional Buenos Aires
Sistema Cache Técnicas Digitales III Ing. Gustavo Nudelman 2012 RAM dinámica Almacena un bit como una capacidad espuria en un transistor La necesidad de conservar la carga y la lectura destructiva obliga
Más detallesTEMA 2: Organización de computadores
TEMA 2: Organización de computadores Procesadores Memorias Dispositivos de E/S 1 Computador Procesador, memoria, dispositivos de E/S CPU Unidad de control Unidad aritmética y lógica Registros Dispositivos
Más detallesObjetivos. Objetivos. Arquitectura de Computadores. R.Mitnik
Objetivos Objetivos Arquitecturas von Neumann Otras Unidad Central de Procesamiento (CPU) Responsabilidades Requisitos Partes de una CPU ALU Control & Decode Registros Electrónica y buses 2 Índice Capítulo
Más detallesEVOLUCIÓN DE LOS PROCESADORES
EVOLUCIÓN DE LOS PROCESADORES Lecturas recomendadas: * Tanembaum, A. Organización de computadoras. Cap. 1 * Stallings, W. Organización y arquitectura de computadores. Cap. 2 Arquitectura de una computadora
Más detallesARQUITECTURA SPARC: FORMATO DE INSTRUCCIÓN
ARQUITECTURA SPARC: FORMATO DE INSTRUCCIÓN De Diego Varona, Rubén Romay López, Oscar Manuel Vega Martínez, Jorge INTRODUCCIÓN La representación de la instrucción en la computadora se denomina formato.
Más detallesTEMA 1: EJECUCIÓN PARALELA: FUNDAMENTOS(I)
Grupo de Arquitectura de Computadores, Comunicaciones y Sistemas ARQUITECTURA DE COMPUTADORES II AUTORES: David Expósito Singh Florin Isaila Daniel Higuero Alonso-Mardones Javier García Blas Borja Bergua
Más detallesTEMA 2: PARALELISMO INTERNO EN SISTEMAS COMPUTADORES SEGMENTACION
SEGMENTACION SEGMENTACION SEGMENTACION I I I I I 1 2 3 4 5 IF ID EX MEM WB IF ID EX MEM WB IF ID EX MEM WB IF ID EX MEM WB IF ID EX MEM WB SEGMENTACION INTRODUCIR NUEVA INSTRUCCIÓN CADA CICLO 1 CICLO,
Más detallesHPC 101 Introducción a la computación de alto rendimiento
HPC 101 Introducción a la computación de alto rendimiento Costa Rica HPC School 2018 Prof. Alvaro de la Ossa Osegueda, Dr.rer.nat. alvaro.delaossa@ucr.ac.cr Escuela de Ciencias de la Computación e Informática,
Más detallesIntroducción a los Sistemas Multiprocesadores
Introducción a los Sistemas Multiprocesadores Multiprocesadores estilo Von Neumann Modelos de Organización Modelos de Programación Clasificación de los Multiprocesadores Por qué Sistemas Multiprocesadores?
Más detalles