TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 1

Tamaño: px
Comenzar la demostración a partir de la página:

Download "TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 1"

Transcripción

1 TEMA 3 (Segunda Parte) PARALELISMO A NIVEL DE INSTRUCCIONES (ILP) BASADO EN TÉCNICAS DINÁMICAS ÍNDICE 3.1. Técnicas de Planificación dinámica: Algoritmo del marcador, Implementación del Algoritmo de Tomasulo, Renombrado dinámico de registros Enfoques del paralelismo: procesadores superescalares y supersegmentados (superpipeline) El problema de las excepciones: interrupciones precisas Especulación hardware: buffer de reordenación Paralelismo de instrucciones disponible: en las aplicaciones: programas enteros, científicos y multimedia Procesadores reales encadenados y superescalares Organización y gestión de la memoria en procesadores avanzados. TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 1

2 Esquema simplificado: Pentium 4 Netburst (CISC) (NOTA: esto debería ir tras la página 23 de la parte 1 de este tema) > Similar a actuales Core i5 i7 > No se muestran todas las fases ni el superencad. > Búferes, colas o listas intermedias entre cada una de las fases (no se muestran todas las fases ni el superencad.) IF 20ytes por ciclo 20bytes Alineamiento DEC 4 instr. por ciclo E.E. Estaciones de Ejecución (Intel las llama RS). Las ROB hacen el papel de RS de Tomasulo 7 µops IS 4 µops por ciclo Cuello de Botella: m = 4 µops/ciclo ROB: ver especulación dinámica (más adelante) 32 E.E. EX EX 11 U.F. FP+INT+ SSE+ MEM EJERC: num máximo de instr. en vuelo? WB WB 4 resultados 4 resultados por ciclo por ciclo ROB TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 2

3 Esquema real: Intel Core i7 (CISC) EJERC: donde se ve que m=4? Más de 210 instr en vuelo: o 16 byte predecode o 18 IFU o 28 microop. o 128 ROB (RS) o 36 entradas EX TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 3

4 3.3, 3.4. Especulación y el problema de las Interrupciones Para aumentar el rendimiento es necesario emitir instrucciones más allá de los límites impuestos por los bloques básicos (saltos). BTB predice pero instrucciones predichas podrían no ser correctas (si falla predicción) deshacer lo ejecutado por ellas Especulación Existe especulación basada: 1. Solo en SW. Sólo especula con instr cuyos efectos sean fáciles de deshacer. Ver ejemplos en planificación de trazas) 2. Mixta. Cierto soporte hardware pero requiere SW para deshacer los efectos de las instrucciones. Poco usado. Ver Henn-Patt. 3. Sólo en HW. Hardware se encarga totalmente de gestionar la especulación. Es la más usada actualmente. TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 4

5 Necesidad de la Especulación HW (I): Predicción BTB La predicción es vital para el ILP: o introducir hardware especial para deshacer o, o para que lo hecho por las instrucciones no sea definitivo hasta que el salto no se haya resuelto completamente (en EX). o Peligro: Instr. que escriben: Con Reg. destino (en WB), Store (en MEM) Instr anterior Salto (mal predicho) Instr predicha 1 Instr predicha 2 Store: Instr predicha 3 Store: Instr predicha 4 Instr predicha 5 Instr predicha 6... IF IS EX WB IF IS o o o EX WB IF IS E1 E2 IF IS EX IF IF IS IS WB EX+ME EX+ME IF IS EX IF IS EX IF IF WB WB IS IS ABORTAR: Pero los WB y MEM ya han escrito! ABORTAR: Sin peligro (no han escrito en Reg ni en Mem) Son instrucciones especulativas, se está especulando con su ejecución. TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 5

6 Necesidad de la Especulación HW (II): Interrupciones Excepción, Interrupción, Trap: conceptos similares (no unívocos). Estado preciso de CPU como en procesador secuencial: cuando hay interrupción o todas las instr. anteriores a la que la genera, han finalizado completamente o todas las posteriores no han empezado (o al menos no han escrito) Procesador secuencial F1 F2 F3 F4 F1 F2 F3 F4 F1 F2 F3 F4 Llega interrupción externa Procesador con ILP Fácil cortar aquí: estado preciso IF IS o o o E1 E2 WB IF IS E1 E2 WB IF IS EX ME WB IF IS E1 E2 WB Difícil cortar aquí Tiempo (ciclos) ya han escrito! Similar si una instrucción larga genera una interrupción casi al final de su EX (ej: DIVF F1, F2, F3 con F2/F3 > ) CONCLUSIÓN: interesa que, toda instrucción termine o complete en orden. TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 6

7 Implementación de la Especulación HW Hardware de especulación para todas las instrucciones: o Todas las escrituras de MEM o WB no se hacen en el fichero de registros o en caché de datos, sino que se guardan en : o búfer de reordenación (ROB, ReOrder Buffer) Dispone de una entrada por cada instrucción emitida (como una R.S. especial sólo para el control de la especulación) En caso de acierto en la especulación se confirma, finaliza, retira o completa la instrucción (fase commit, completion CM o retired instruction RET). Es decir, se vuelca el contenido provisional de tales entradas del ROB sobre el fichero de registros o caché de datos (y se libera la entrada del ROB). Pero en caso de un error en la especulación se vacía o anula las instrucciones especulativas del ROB. ROB con número de entradas limitado (capacidad de instrucciones especulativas). o Agotamiento de entradas bloqueo total Ejemplos procesadores reales: Nº entradas ROB o Pentium 4, Core i7: 128 entradas ( muchas instr. en vuelo) o IBM Power 7: GCT de 120 entradas (20 entradas de 6 instr.). TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 7

8 Funcionamiento de la Especulación HW Es decir, el algoritmo de planif. dinámica permite ejecución fuera de orden ( out-of-order-execution ), Y el ROB restablece tal orden: finalización en orden ( in-order-completion ). De ahí el nombre de Búfer de Reordenación. Implementación del ROB: cola circular Dibujar el cronograma de esta tabla Entrada Instr. Fase por donde va Estado 1 instr 5 EX ejecutando 2 entr. libre 3 instr 1 CM entr. libre 4 instr 2 CM entr. libre 5 instr 3 IS espera dato 6 instr 4 WB ya escribió Puntero para nueva instr. Puede una instr estar en WB entre 2 CM? Desde el punto de vista del cronograma sólo hay que añadir una fase final CM (o RET) que reordena las instr para que se confirmen en orden: IF IS EX WB CM Típicamente un superescalar de grado m es capaz de completar o finalizar al menos m instr por ciclo. TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 8

9 Ejemplo Cronograma Especulación ROB Caso: interrupción (excepción aritmética) en instrucción larga Hay que invalidar todas las instr. posteriores a la larga, antes de atender a la rutina de interrupción. Instr anterior 1 Instr anterior 2 Instr larga, con excepción Instr sig. 1 Instr sig. 2 Instr sig. 3 Store: Instr sig. 4 Store: Instr sig. 5 Instr sig. 6 Instr sig IF IS EX WB CM IF IS EX WB CM IF IS E1 E2 WB IF IS E1 E2 WB Aquí se detecta la excepción IF IS D1 D2 D3 D4 ME WB CM CM IF IS E1 E2 WB IF IS E1 E2 WB IF IS E1 E2 WB IF IS EX ME IF IS EX ME IF IS EX IF IS EX Nunca harán CM. WB y MEM han escrito en ROB y se invalidan Anular las RS Bibliografía: Henn&Patt 5ª edición (inglés): 3.6 (pag 183-). TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 9

10 3.2. Resumen: Tipos de procesadores con ILP según la Arquitectura ESPECTRO de máquinas con ILP (H&P) TÉCNICAS DINÁMICAS Superescalar con planificación dinámica, sin reglas de emisión Más complejidad Más consumo Más compatibilidad Menos dependencia del compilador GPP Superescalar con planificación dinámica, pero con reglas de emisión Superescalar sin planificación dinámica, emisión dinámica (pero reglas de emisión) TÉCNICAS ESTÁTICAS Superescalar sin planificación dinámica y emisión estática VLIW puro Diferencia entre estos 2 Menos complejidad Menos consumo Menos compatibilidad Más dependencia del compilador Sist. empotrados TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 10

11 Procesadores reales con ILP según la Arquitectura Figura Hennessy Patterson Cap. 3 Ponerle nombre a cada fila TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 11

12 3.2 Enfoques del paralelismo Proc. Súperencadenado, Superpipeline o súpersegmentado Reducir τ (periodo de reloj): Más etapas (fases) Sólo emite una instrucción por ciclo de reloj. Avance tecnológico pero no arquitectónico. τ reloj Instrucciones Esquema comparativo con RISC de 5 etapas desfasadas IF1 t etapa IF2 IF1 ID1 ID2 EX1 EX2 M1 M2 IF2 IF1 WB1 ID1 ID2 EX1 EX2 M1 M2 IF2 IF1 IF ID EX ME WB WB2 WB1 ID1 ID2 EX1 EX2 M1 M2 IF2 IF ID EX ME WB WB2 WB1 ID1 ID2 EX1 EX2 M1 M2 IF ID EX ME WB WB2 WB1 IF ID EX ME WB Tiempo Realmente existen IF1, IF2, ID1, ID2,... El fabricante hablará de 10 fases y periodo τ reloj (ν=1/τ reloj ). WB2 CPI ideal = 1 CPI >= 1 IPC ideal = 1 IPC <= 1 TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 12

13 Ejemplos de Superencadenados Ej: Pentium P6 (Pentium Pro, PII y similar al PIII y Core i gama baja): IFU1 IFU2 IFU3 DEC1 DEC2 RAT ROB DIS EX RET1 RET2 IF1 IF2 IF3 IS1 IS2 IS3 IS4 IS5 EX1 WB1 WB2 Ej P4 mínimo 20 etapas (los hubo de 31 etapas : Prescott ) Algunas etapas Drive no hacen nada útil (solo trasportan la señal) EJEMPLO: Hallar la A entre RISC y la versión RISC3 (superencad. 15 etapas) Datos: frec. RISC3=2.7 frec. RISC CPI RISC3 = 1.35CPI RISC Hallar tb. Rend/Potencia entre RISC y RISC3, suponiendo Potencia proporcional a frec NOTA: Se suele usar la medida rendimiento MIPS/mW en empotrados. TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 13

14 Evolución y saturación de la frecuencia CPU Intel MHz consumía ~ 2 W Intel Core i7 (3.3GHz) consume 130 W Problema: disipar calor de un chip de 1.5 x 1.5 cm2 TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 14

15 Comparación: Rendimiento y potencia (consumo) Intel Core i7 (superescalar dinámico) con Intel Atom230 (superescalar estático) Rendimiento: barras Core i7 entre 4 a 10 veces más rápido Rend/consumo: líneas Atom230 aprox. 2 veces más eficiente TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 15

16 Desventajas Proc. Superpipeline (I) En principio Superencadenado de 10 etapas es similar a superescalar de 5 etapas. Pero El tiempo para concluir n etapas es superior al de 1 etapa original por los latches (registros temporales) CPI bloqueo, P fallo_cache, P fallo_btb, crecen Ejemplo : Superescalar Otra Load ALU Otra Superencaden. Otra Load ALU Otra Bloqueo (Latencia de acceso a memoria) por dependencia RAW IF1 IF ID EX ME WB IF ID EX ME WB IF2 IF1 IF2 IF1 τ etapa IF ID - EX ME WB IF ID - EX ME WB ID1 ID2 EX1 EX2 M1 M2 WB1 WB2 τ reloj ID1 ID2 EX1 EX2 M1 M2 WB1 WB2 IF2 ID1 ID EX1 EX2 M1 M2 WB1 IF1 IF2 ID ID2 EX1 EX2 M1 M2 Hallar A si se repiten estas 4 W B2 W B1 WB2 TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 16

17 Superescalares y Superpipeline Uniendo ambos conceptos (procesadores reales): > emitir m instrucciones por ciclo de reloj > Además etapas supersegmentadas : IF1 IF2 ID1 ID2,. τ reloj Instruccio nes Ninstr. en vuelo? IF1 IF2 ID 1 ID 2 EX 1 EX 2 M 1 M 2 IF1 IF2 ID 1 ID 2 EX 1 EX 2 M 1 M 2 WB1 WB1 IF1 IF2 ID 1 ID 2 EX 1 EX 2 M 1 M 2 IF1 IF2 ID 1 ID 2 EX 1 EX 2 M 1 M 2 WB2 WB2 WB1 WB1 IF1 IF2 ID 1 ID 2 EX 1 EX 2 M 1 M 2 IF1 IF2 ID 1 ID 2 EX 1 EX 2 M 1 M 2 W B2 W B2 W B1 W B1 IF1 IF2 ID 1 ID 2 EX 1 EX 2 M 1 M 2 IF1 IF2 ID 1 ID 2 EX 1 EX 2 M 1 M 2 WB2 WB2 WB1 WB1 Tiem po Nº instr. en vuelo : Nºfases m. Ej. Pentium4: 20 3=60 (en realidad tiene más en colas intermedias). W B2 W B2 TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 17

18 3.5 Límites del ILP (Superescalares) > Se han acercado al Data Flow Limit, límite del flujo de datos (grafo de dependencias). Aumentar m más supone: Mucha más complejidad Poco incremento de IPCreal > La complejidad de varios factores de la fase IS crece con m 2 (m = grado superescalaridad) - Superescalares Dinámicos o Número de RS proporcional a Nº instr. en vuelo = Nº fases x m o Número de CDB proporcional a m o Conclusión: Número de comparadores en RS proporcional a m 2 Miles de comparadores y siempre activos zona de mayor temperatura TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 18

19 Ejemplo: Causas bloqueos Superescalares Dinám. > Si nada lo impide se alcanza el límite IPC=IPC ideal =m > Si se agotan las R.S. o las etiquetas habrá bloqueos de emisión. Causas posibles: 1. Muchas RAW en cadena (en registros o en memoria). 2. Balanceo de UF respecto a Instrucciones o Si número de UF de un tipo < número de instrucciones/ciclo de ese tipo o Típico: Menor número de puertos al caché que instr. Ld/St 3. Muchos fallos caché (aunque sea non-blocking) 4. Muchos fallos de BTB hacen que se vacíen las RS 5. UF no segmentada (EX varios ciclos) EJEMPLOS DE BLOQUEOS Hacer un cronograma, mostrando el estacionario del bucle, para cada una de estas causas, con Alg. Tomasulo (IF IS EX WB) Notar que: Ritmo ocupación RS en IS es distinto del ritmo de liberación en WB Bloqueo total se produce si se van acumulando instrucciones hasta que se llena la cola de R.S. completamente (p.ej. en un bucle). TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 19

20 Causas limitantes del ILP en proc reales (I) Realidad: grado m superescalaridad no ha aumentado en los últimos años. o Algunas técnicas son muy sofisticadas, pero no aumentan mucho IPC p. ej. Especulación datos (predicción de valores) Ejecución ambas ramas de un salto Qué dos factores limitan más el paralelismo extraíble en benchmarks reales? o Fallos en la predicción de saltos. BTB cada vez más sofisticada, compleja y grande. o Accesos a memoria de datos (caché): Cachés muy sofisticados para reducir fallos de acceso Aunque AB altísimo Latencia de acceso decrece poco Muchos accesos (y dependencias) en memoria (CISC) Si en un PC el AB=24 GB/s y se ejecuta un programa con un 20% instr. Ld/st (cada una de 32 bits), cuál es el MIPS de pico? Comparar con MIPS pico por m=4, frec= 3 GHz TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 20

21 Causas limitantes del ILP en proc reales (II) Fallos en la predicción de saltos. INT FP Instrucciones abortadas por fallo de predicción en Intel Core i7 (benchmark SPEC 2006) TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 21

22 Causas limitantes del ILP en proc reales (III) Accesos a memoria de datos: evolución AB/latencia TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 22

23 Causas limitantes del ILP en proc reales (IV) Evolución Familia IBM Power PC TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 23

24 Estudio de ILP disponible (real) (I) Caso real: Intel Core i7 (su CPI ideal = 0.25 pues m=4) INT FP CPI para SPEC2006 (Intel Core i7): CPI mayor (y más variable) en INT que en FP Programas INT más algorítmicos / Programas FP: más vectoriales TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 24

25 Estudio de ILP disponible (teórico) (II) tmcatv FP INT doduc fpppp li espresso gcc ILP ideal ILP realizable Cuáles son muy optimistas? ILP ideal (con simulador usando una traza) ventana de infinitas instrucciones predicción saltos perfecta Toda dirección Ld/ST conocida Infinitas UF Duración toda UF=1 ciclo Cache perfecto 100 % acierto Infinita planificación estática y dinámica SOLO LIMITA LAS PRESTACIONES EL DATA FLOW LIMIT Instr emitidas/ciclo ILP para procesadores realizables Ventana de 64 instrucciones Predicción saltos: BTB 1K entradas Toda dirección Ld/ST comparada dinámicam. Emite hasta 64 inst/ciclo sin reglas emisión Duración toda UF=1 ciclo Cache perfecto 100 % acierto (64 puertos) Planificación dinámica: 64 etiq FP y 64 INT DEMASIADO OPTIMISTA... TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 25

26 Cuidar en superescalares dinámicos: o Accesos a memoria o Saltos condicionales CONCLUSIONES Usar Técnicas estáticas es otra alternativa que no debe olvidarse (VLIW). o Todavía no se ha llegado al límite del ILP extraído estáticamente o La responsabilidad de aumentar rendimiento recae actualmente cada vez más sobre programador y software Paralelismo de datos DLP: o Núcleos vectoriales. tema 4 Paralelismo de hilos y procesos TLP o Multicore, multicomputadores. tema 5 TEMA 3. ILP BASADO EN PLANIFICACIÓN DINÁMICA Sistemas Paralelos y Distribuidos 3º GIC. pág 26

6. PROCESADORES SUPERESCALARES Y VLIW

6. PROCESADORES SUPERESCALARES Y VLIW 6. PROCESADORES SUPERESCALARES Y VLIW 1 PROCESADORES SUPERESCALARES Y VLIW 1. Introducción 2. El modelo VLIW 3. El cauce superescalar 4. Superescalar con algoritmo de Tomasulo 2 PROCESADORES SUPERESCALARES

Más detalles

Explotación del paralelismo a nivel de instrucción

Explotación del paralelismo a nivel de instrucción Explotación del paralelismo a nivel de instrucción Arquitectura de Computadores J. Daniel García Sánchez (coordinador) David Expósito Singh Javier García Blas Óscar Pérez Alonso J. Manuel Pérez Lobato

Más detalles

ARQUITECTURA DE COMPUTADORAS

ARQUITECTURA DE COMPUTADORAS ARQUITECTURA DE COMPUTADORAS Información General Objetivos Al terminar el curso, el estudiante estará capacitado para: 1. Manejar medidas de performance que permitan comparar diversos sistemas de Computadora.

Más detalles

Procesadores superescalares. Introducción

Procesadores superescalares. Introducción Procesadores superescalares Introducción Introducción El término superescalar (superscalar) fue acuñado a fines de los 80s. Todas las CPUs modernas son superescalares. Es un desarrollo de la arquitectura

Más detalles

Arquitectura de Computadores II Clase #16

Arquitectura de Computadores II Clase #16 Arquitectura de Computadores II Clase #16 Facultad de Ingeniería Universidad de la República Instituto de Computación Curso 2010 Organización general Superescalar Varios pipelines. 2 operaciones enteras,

Más detalles

TEMA 3 PLANIFICACIÓN O REORDENAMIENTO (SCHEDULING) DE INSTRUCCIONES ÍNDICE

TEMA 3 PLANIFICACIÓN O REORDENAMIENTO (SCHEDULING) DE INSTRUCCIONES ÍNDICE TEMA 3 PLANIFICACIÓN O REORDENAMIENTO (SCHEDULING) DE INSTRUCCIONES ÍNDICE 3.1. CONCEPTOS FUNDAMENTALES 3.2, 3.4 PLANIFICACIÓN ESTÁTICA. DESENROLLADO DE BUCLES. 3.3. PLANIFICACIÓN DINÁMICA (Algoritmo Tomasulo).

Más detalles

TEMA 3. PLANIFICACIÓN (SCHEDULING) DE INSTRUCCIONES Arquitectura de Sistemas Paralelos 1. pág 2. direcc MEM

TEMA 3. PLANIFICACIÓN (SCHEDULING) DE INSTRUCCIONES Arquitectura de Sistemas Paralelos 1. pág 2. direcc MEM TEMA 3 PLANIFICACIÓN O REORDENAMIENTO (SCHEDULING) DE INSTRUCCIONES ÍNDICE 3.. CONCEPTOS FUNDAMENTALES 3., 3.4 PLANIFICACIÓN ESTÁTICA. DESENROLLADO DE BUCLES. 3.3. PLANIFICACIÓN DINÁMICA (Algoritmo Tomasulo).

Más detalles

Arquitectura Segmentada: Conceptos básicosb

Arquitectura Segmentada: Conceptos básicosb Arquitectura Segmentada: Conceptos básicosb Diseño de Sistemas Digitales EL-3310 I SEMESTRE 2008 4 ARQUITECTURA SEGMENTADA (PIPELINING) (4 SEMANAS) 4.1 Conceptos básicos de la arquitectura segmentada Paralelismo

Más detalles

Introducción a la arquitectura de computadores

Introducción a la arquitectura de computadores Introducción a la arquitectura de computadores Departamento de Arquitectura de Computadores Arquitectura de computadores Se refiere a los atributos visibles por el programador que trabaja en lenguaje máquina

Más detalles

Introducción PROCESADOR SUPERESCALAR. Paralelismo. Grado m: en cada ciclo se buscan/decodifican m instrucciones. supes

Introducción PROCESADOR SUPERESCALAR. Paralelismo. Grado m: en cada ciclo se buscan/decodifican m instrucciones. supes Introducción PROCESADOR SUPERESCALAR Paralelismo bus d/le eje mem es t ciclo seg =t ciclo supes Grado m: en cada ciclo se buscan/decodifican m instrucciones Introducción CICLOS POR INSTRUCCION tciclo identico

Más detalles

Procesadores Superescalares: Paralelismo Explícito a Nivel de Instrucción

Procesadores Superescalares: Paralelismo Explícito a Nivel de Instrucción Tema 8 Procesadores Superescalares: Paralelismo Explícito a Nivel de Instrucción IA-64 es una arquitectura de 64 bits desarrollada conjuntamente por Intel y HP (Hewlett- Packard). Está basado en una tecnología

Más detalles

202 PROBLEMAS DE ARQUITECTURA DE COMPUTADORES

202 PROBLEMAS DE ARQUITECTURA DE COMPUTADORES 202 PROBLEMAS DE ARQUITECTURA DE COMPUTADORES César Represa Pérez Carmen Rodríguez Clavería Nº de Asiento Registral 00/2013/1733 Burgos, 2013 202 Problemas de Arquitectura de Computadores 2º G.I.I 202

Más detalles

Plataformas de soporte computacional: arquitecturas avanzadas,

Plataformas de soporte computacional: arquitecturas avanzadas, Plataformas de soporte computacional: arquitecturas avanzadas, sesión 2 Diego. Llanos, Belén Palop Departamento de Informática Universidad de Valladolid {diego,b.palop}@infor.uva.es Índice 1. Segmentación

Más detalles

TEMA 2: PARALELISMO INTERNO EN SISTEMAS COMPUTADORES SEGMENTACION

TEMA 2: PARALELISMO INTERNO EN SISTEMAS COMPUTADORES SEGMENTACION SEGMENTACION SEGMENTACION SEGMENTACION I I I I I 1 2 3 4 5 IF ID EX MEM WB IF ID EX MEM WB IF ID EX MEM WB IF ID EX MEM WB IF ID EX MEM WB SEGMENTACION INTRODUCIR NUEVA INSTRUCCIÓN CADA CICLO 1 CICLO,

Más detalles

Qué es Pipelining? Es una técnica de implementación en la que se superpone la ejecución de varias instrucciones.

Qué es Pipelining? Es una técnica de implementación en la que se superpone la ejecución de varias instrucciones. Qué es Pipelining? Es una técnica de implementación en la que se superpone la ejecución de varias instrucciones. Aprovecha el paralelismo entre instrucciones en una corriente secuencial de instrucciones.

Más detalles

Arquitectura de Computadores. Tema 11. Pipelining Avanzado

Arquitectura de Computadores. Tema 11. Pipelining Avanzado Arquitectura de Computadores Tema 11 Pipelining Avanzado Eduardo Daniel Cohen dcohen@arnet.com.ar http://www.herrera.unt.edu.ar/arqcom 1 En qué se pone difícil Pipelining? Excepciones: hay 5 instrucciones

Más detalles

Paralelismo en monoprocesadores. Procesadores VLIW

Paralelismo en monoprocesadores. Procesadores VLIW Paralelismo en morocesadores Procesadores VLIW Profesor: Mag. Marcelo Tosini Cátedra: Arquitectura de Computadoras y técnicas Digitales Carrera: Ingeniería de Sistemas Ciclo: 4º año Arquitectura VLIW básica

Más detalles

1. Objetivo y evolución de los procesadores ILP.

1. Objetivo y evolución de los procesadores ILP. Arquitectura de Computadores Tema 3: Procesadores ILP Índice. Objetivo y evolución de los procesadores ILP. 2. Segmentación (Pipeline).. Concepto y medida de rendimiento. i 2. Pipeline de instrucciones..

Más detalles

Procesadores segmentados. El DLX.

Procesadores segmentados. El DLX. Procesadores segmentados. El DLX. Curso 2011-2012 Características de las Arquitecturas Tipos de Arquitectura Organización de la Memoria Direccionamiento de Memoria Operaciones en el Repertorio de Instrucciones

Más detalles

EVOLUCIÓN DE LOS PROCESADORES

EVOLUCIÓN DE LOS PROCESADORES EVOLUCIÓN DE LOS PROCESADORES Lecturas recomendadas: * Tanembaum, A. Organización de computadoras. Cap. 1 * Stallings, W. Organización y arquitectura de computadores. Cap. 2 Arquitectura de una computadora

Más detalles

Tecnologías y Arquitecturas

Tecnologías y Arquitecturas Tecnologías y Arquitecturas Parte II Andrés Djordjalian Seminario de Sistemas Embebidos 19 de mayo de 2011 Facultad de Ingeniería de la UBA 06:13 1 de 22 Temas de esta Clase Medición

Más detalles

Dr.-Ing. Paola Vega Castillo

Dr.-Ing. Paola Vega Castillo EL-3310 DISEÑO O DE SISTEMAS DIGITALES Dr.-Ing. Paola Vega Castillo Información n General Curso: Diseño de Sistemas Digitales Código: EL-3310 Tipo de curso: Teórico Créditos/Horas por semana: 4/4 Requisito:

Más detalles

Sistema electrónico digital (binario) que procesa datos siguiendo unas instrucciones almacenadas en su memoria

Sistema electrónico digital (binario) que procesa datos siguiendo unas instrucciones almacenadas en su memoria 1.2. Jerarquía de niveles de un computador Qué es un computador? Sistema electrónico digital (binario) que procesa datos siguiendo unas instrucciones almacenadas en su memoria Es un sistema tan complejo

Más detalles

Familia de procesadores Intel x86

Familia de procesadores Intel x86 Familia de procesadores Intel x86 Mario Medina C. mariomedina@udec.cl Intel 8086 y 8088 8086: 1978, 29K transistores 8 Registros de 16 bits Bus de datos de 16 bits Bus de dirección de 20 bits Multiplexado

Más detalles

SISTEMAS PARALELOS Y DISTRIBUIDOS. 3º GIC. PRÁCTICA 3. PLANIFICACIÓN ESTÁTICA AVANZADA. TMS320C6713

SISTEMAS PARALELOS Y DISTRIBUIDOS. 3º GIC. PRÁCTICA 3. PLANIFICACIÓN ESTÁTICA AVANZADA. TMS320C6713 SISTEMAS PARALELOS Y DISTRIBUIDOS. 3º GIC. PRÁCTICA 3. PLANIFICACIÓN ESTÁTICA AVANZADA. TMS320C6713 OBJETIVOS. En esta práctica se trata de estudiar dos de las técnicas de planificación estática más importantes:

Más detalles

PRACTICA 2 Ejercicio 3

PRACTICA 2 Ejercicio 3 PRACTICA 2 Ejercicio 3 Análisis de la Memoria Cache L1 de Datos para Procesadores Superescalares con Ejecución uera de Orden DESCRIPCIÓN GENERAL El objetivo de este ejercicio práctico consiste en obtener

Más detalles

Arquitecturas multihilo

Arquitecturas multihilo Arquitecturas multihilo Francesc Guim Ivan Rodero PID_00184816 CC-BY-NC-ND PID_00184816 Arquitecturas multihilo Los textos e imágenes publicados en esta obra están sujetos excepto que se indique lo contrario

Más detalles

Estructura de Computadores

Estructura de Computadores Estructura de Computadores Tema 4. El procesador Departamento de Informática Grupo de Arquitectura de Computadores, Comunicaciones y Sistemas UNIVERSIDAD CARLOS III DE MADRID Contenido Elementos de un

Más detalles

Arquitectura NetBurst: Pentium 4. José Ignacio Gómez Pérez

Arquitectura NetBurst: Pentium 4. José Ignacio Gómez Pérez Arquitectura NetBurst: Pentium 4 José Ignacio Gómez Pérez 1. Introducción Tras varios años sin aportar nada nuevo al mundo de la micro-arquitectura, Intel da un gran paso hacia delante con la presentación

Más detalles

Arquitectura de Computadores. Tema 4 PROCESADORES SEGMENTADOS

Arquitectura de Computadores. Tema 4 PROCESADORES SEGMENTADOS Arquitectura de Computadores Tema 4 PROCESADORES SEGMENTADOS 1. Arquitecturas RISC y CISC. 2. Unidad de Control monociclo y multiciclo. 3. Segmentación. 3.1. Ruta de datos del MIPS R2000. 3.2. Control

Más detalles

Memorias RAM. Basilio B. Fraguela Rodríguez. Copyright Basilio B. Fraguela 2006

Memorias RAM. Basilio B. Fraguela Rodríguez. Copyright Basilio B. Fraguela 2006 Memorias RAM Basilio B. Fraguela Rodríguez Evolución de la velocidad del procesador y la memoria 1000 Ley de Moore CPU µproc 60%/año 100 10 1 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 DRAM 1990

Más detalles

Planificación estática

Planificación estática Planificación estática Planificación de bloques básicos Planificación de bucles Planificación global Serafín Benito AIC: Planificación estática 1 Planificación de bloques básicos.. Técnica sencilla. Eficiencia

Más detalles

CICLOS DEL PROCESADOR

CICLOS DEL PROCESADOR UNIDAD DE CONTROL CICLOS DEL PROCESADOR Qué es un ciclo de búsqueda? Para qué sirve estudiar los ciclos de instrucción de una CPU? Para comprender el funcionamiento de la ejecución de instrucciones del

Más detalles

PRACTICA 2 Ejercicio 2

PRACTICA 2 Ejercicio 2 PRACTICA 2 Ejercicio 2 Simulación de Procesadores con Ejecución en Orden DESCRIPCIÓN GENERAL En esta práctica se utilizará el simulador KScalar y su interfaz gráfica con el objeto de estudiar el funcionamiento

Más detalles

Arquitecturas vectoriales, SIMD y extensiones multimedia

Arquitecturas vectoriales, SIMD y extensiones multimedia Arquitecturas vectoriales, SIMD y extensiones multimedia William Stallings, Organización y Arquitectura de Computadores, 5ta. ed., Capítulo 16: Procesamiento Paralelo. Andrew S. Tanenbaum, Organización

Más detalles

Arquitectura de Computadoras. Clase 5 Posibles soluciones a atascos

Arquitectura de Computadoras. Clase 5 Posibles soluciones a atascos Arquitectura de Computadoras Clase 5 Posibles soluciones a atascos Ejemplo de segmentación Notas de Clase 5 2 Atascos de un cauce (stall) Situaciones que impiden a la siguiente instrucción que se ejecute

Más detalles

Arquitectura t de Computadores Clase 10: Diseño del microprocesador monociclo pt.2

Arquitectura t de Computadores Clase 10: Diseño del microprocesador monociclo pt.2 Arquitectura t de Computadores Clase 10: Diseño del microprocesador monociclo pt.2 Departamento de Ingeniería de Sistemas Universidad id d de Antioquia i 2011 2 Unidad de control principal Mediante el

Más detalles

Paralelismo en monoprocesadores. Procesadores Superescalares

Paralelismo en monoprocesadores. Procesadores Superescalares Paralelismo en monoprocesadores Procesadores Superescalares Profesor: Mag. Marcelo Tosini Cátedra: Arquitectura de Computadoras y técnicas Digitales Carrera: Ingeniería de Sistemas Ciclo: 4º año 1 Procesadores

Más detalles

Arquitectura Von Neumann

Arquitectura Von Neumann Arquitectura Von Neumann Arquitectura Von Neumann Establecida en 1945 por Von Neumann Modelo básico de arquitectura utilizado en la mayoría de los computadores Su idea es la de conectar permanentemente

Más detalles

Ingeniería Informática. Ampliación de Estructura de Computadores. Curso 2010-11

Ingeniería Informática. Ampliación de Estructura de Computadores. Curso 2010-11 6.3.3 Riesgo de Control. Los riesgos por control en DLX son menos frecuentes que los riesgos por dependencia de datos, pero al no haber una solución tan buena como el adelantamiento de datos, se convierten

Más detalles

ADMINISTRACION DE LA MEMORIA. En memoria 1 solo proceso Desventajas:

ADMINISTRACION DE LA MEMORIA. En memoria 1 solo proceso Desventajas: ADMINISTRACION DE LA MEMORIA Función del Administrador de Memoria Registra qué parte de memoria está libre y ocupada Asigna y libera espacio en memoria a los procesos Administra el intercambio entre la

Más detalles

Procesadores Superescalares: Paralelismo Implícito a Nivel de Instrucción

Procesadores Superescalares: Paralelismo Implícito a Nivel de Instrucción Tema 7 Procesadores Superescalares: Paralelismo Implícito a Nivel de Instrucción Se denomina arquitectura superescalar a aquella implementación capaz de ejecutar más de una instrucción por ciclo de reloj.

Más detalles

TEMA 4. ARQUITECTURA IA-64

TEMA 4. ARQUITECTURA IA-64 TEMA 4. ARQUITECTURA IA-64 Stalling, W.Computer Organization and Architecture cap. 15 Intel IA-64 Architecture Software Developer s Manual Generalidades IA-64 Desarrollo conjunto Intel-HP Nueva arquitectura

Más detalles

Tema 5 Diseño del Set de Instrucciones (ISA) Arquitectura de Computadoras

Tema 5 Diseño del Set de Instrucciones (ISA) Arquitectura de Computadoras Tema 5 Diseño del Set de Instrucciones (ISA) Arquitectura de Computadoras http://www.herrera.unt.edu.ar/arqcom dcohen@herrera.unt.edu.ar Temario 1. Evolución histórica. 2. Repaso de conceptos importantes.

Más detalles

Centro Asociado Palma de Mallorca. Tutor: Antonio Rivero Cuesta

Centro Asociado Palma de Mallorca. Tutor: Antonio Rivero Cuesta Centro Asociado Palma de Mallorca Exámenes Ingeniería Computadores II Tutor: Antonio Rivero Cuesta Exámenes TEMA 1 Centro Asociado Palma de Mallorca Tutor: Antonio Rivero Cuesta Un procesador sin segmentación

Más detalles

Autor: Longinos Recuero Bustos

Autor: Longinos Recuero Bustos Actividad 1.1 Autor: Longinos Recuero Bustos Suponiendo que se aplica una mejora a una máquina de tal forma que el rendimiento es 20 veces superior al que tenía y considerando que la mejora únicamente

Más detalles

COMPUTADORES MULTINUCLEO. Stallings W. Computer Organization and Architecture 8ed

COMPUTADORES MULTINUCLEO. Stallings W. Computer Organization and Architecture 8ed COMPUTADORES MULTINUCLEO Stallings W. Computer Organization and Architecture 8ed Computador multinucleo Un computador multinúcleocombina dos o mas procesadores (llamados núcleos) en una única pieza de

Más detalles

Organización de Procesadores

Organización de Procesadores Organización de Procesadores Introducción Alejandro Furfaro Agosto de 2014 Alejandro Furfaro Organización de Procesadores Agosto de 2014 1 / 21 Temario 1 Tecnología de Integracion 2 Arquitectura de Computadores

Más detalles

Introducción a la Computación. Capítulo 10 Repertorio de instrucciones: Características y Funciones

Introducción a la Computación. Capítulo 10 Repertorio de instrucciones: Características y Funciones Introducción a la Computación Capítulo 10 Repertorio de instrucciones: Características y Funciones Que es un set de instrucciones? La colección completa de instrucciones que interpreta una CPU Código máquina

Más detalles

Ejercicios de jerarquía de memoria

Ejercicios de jerarquía de memoria Ejercicios de jerarquía de memoria J. Daniel García Sánchez (coordinador) David Expósito Singh Javier García Blas Óscar Pérez Alonso J. Manuel Pérez Lobato Arquitectura de Computadores Grupo ARCOS Departamento

Más detalles

FUNDAMENTOS DE COMPUTACION INVESTIGACION PROCESADORES DIANA CARRIÓN DEL VALLE DOCENTE: JOHANNA NAVARRO ESPINOSA TRIMESTRE II

FUNDAMENTOS DE COMPUTACION INVESTIGACION PROCESADORES DIANA CARRIÓN DEL VALLE DOCENTE: JOHANNA NAVARRO ESPINOSA TRIMESTRE II FUNDAMENTOS DE COMPUTACION INVESTIGACION PROCESADORES DIANA CARRIÓN DEL VALLE DOCENTE: JOHANNA NAVARRO ESPINOSA TRIMESTRE II 2013 Características principales de la arquitectura del procesador AMD Phenom

Más detalles

CPU MEMORIAS CACHE. Memorias caché. Memoria caché = memoria de tamaño pequeño y acceso rápido situada entre la CPU y la memoria principal.

CPU MEMORIAS CACHE. Memorias caché. Memoria caché = memoria de tamaño pequeño y acceso rápido situada entre la CPU y la memoria principal. MEMORIAS CACHE Memoria caché = memoria de tamaño pequeño y acceso rápido situada entre la CPU y la memoria principal. Tiempo ciclo memoria > tiempo de ciclo del procesador la CPU debe esperar a la memoria

Más detalles

X86 frente a PPC - Intel/AMD contra IBM

X86 frente a PPC - Intel/AMD contra IBM X86 frente a PPC - Intel/AMD contra IBM O el giro hacia RISC - Desmontando el mito del megahercio. Existen varios mitos en la informática de consumo. Uno de los más extendidos, sobre todo al usuario medio,

Más detalles

Arquitectura de Computadores - 2001

Arquitectura de Computadores - 2001 IV. Segmentación o Pipelining Alternativas de Implementación de Procesador 1. Procesador Uniciclo CPI = 1 Pero Período de Reloj Grande 2. Procesador Multiciclo CPI > 1 Pero Período de Reloj más Pequeño

Más detalles

Pipeline (Segmentación)

Pipeline (Segmentación) Pipeline (Segmentación) Segmentación (Pipeline) Es una técnica de implementación por medio de la cual se puede traslapar la ejecución de instrucciones. En la actualidad la segmentación es una de las tecnologías

Más detalles

ESTRUCTURA Y TECNOLOGÍA A DE COMPUTADORES

ESTRUCTURA Y TECNOLOGÍA A DE COMPUTADORES Universidad Rey Juan Carlos ESTRUCTURA Y TECNOLOGÍA A DE COMPUTADORES Estructura de un computador: conceptos básicos Luis Rincón Córcoles Licesio J. Rodríguez-Aragón Programa 1. Introducción 2. Elementos

Más detalles

FUNDAMENTOS DE COMPUTADORES 18 de junio de Examen parcial del 2º cuatrimestre.

FUNDAMENTOS DE COMPUTADORES 18 de junio de Examen parcial del 2º cuatrimestre. FUNDAMENTOS DE COMPUTADORES 18 de junio de 2014. Examen parcial del 2º cuatrimestre. Nombre DNI Apellidos Grupo Ejercicio 1 (2.5 puntos) Para el computador MIPS estudiado en clase, responder a las siguientes

Más detalles

Arquitectura de Computadores II Clase #7

Arquitectura de Computadores II Clase #7 Arquitectura de Computadores II Clase #7 Facultad de Ingeniería Universidad de la República Instituto de Computación Curso 2009 Veremos Memoria virtual Resumen de ideas para mejorar performance 1 Recordemos:

Más detalles

ESCUELA TÉCNICA SUPERIOR DE INGENIERÍA

ESCUELA TÉCNICA SUPERIOR DE INGENIERÍA Tema 4: Familia x86 Carlos Garre 1 Familia x86 Contenidos Concepto de familia: la familia x86. Generaciones de la familia x86. Primera generación: 8086. Segunda generación: 80286. Tercera generación: 80386.

Más detalles

Estructura de Computadores

Estructura de Computadores Estructura de Computadores Tema 6. Sistemas de entrada/salida Departamento de Informática Grupo de Arquitectura de Computadores, Comunicaciones y Sistemas UNIVERSIDAD CARLOS III DE MADRID Contenido Concepto

Más detalles

Tema 11. Soporte del Sistema Operativo 11.1. REQUERIMIENTOS DE LOS SISTEMAS OPERATIVOS. 11.1.1. MULTIPROGRAMACIÓN.

Tema 11. Soporte del Sistema Operativo 11.1. REQUERIMIENTOS DE LOS SISTEMAS OPERATIVOS. 11.1.1. MULTIPROGRAMACIÓN. Tema 11 Soporte del Sistema Operativo 11.1. REQUERIMIENTOS DE LOS SISTEMAS OPERATIVOS. El sistema operativo es básicamente un programa que controla los recursos del computador, proporciona servicios a

Más detalles

Tema: Historia de los Microprocesadores

Tema: Historia de los Microprocesadores Universidad Nacional de Ingeniería Arquitectura de Maquinas I Unidad I: Introducción a los Microprocesadores y Microcontroladores. Tema: Historia de los Microprocesadores 1 Contenidos La década de los

Más detalles

PROCESADORES. Existen 3 tipos de procesadores: DE GALLETA, DE PINES Y DE CONTACTO. DE GALLETA: se utilizaban en las board en los años 80 y 90.

PROCESADORES. Existen 3 tipos de procesadores: DE GALLETA, DE PINES Y DE CONTACTO. DE GALLETA: se utilizaban en las board en los años 80 y 90. PROCESADORES TIPOS DE PROCESADORES. Existen 3 tipos de procesadores: DE GALLETA, DE PINES Y DE CONTACTO DE GALLETA: se utilizaban en las board en los años 80 y 90. DE PINES: reemplazaron los procesadores

Más detalles

Tema V Generación de Código

Tema V Generación de Código Tema V Generación de Código Una vez que se ha realizado la partición HW/SW y conocemos las operaciones que se van a implementar por hardware y software, debemos abordar el proceso de estas implementaciones.

Más detalles

3 - Arquitectura interna de un up

3 - Arquitectura interna de un up cei@upm.es 3 - Arquitectura interna un up Componentes básicos Lenguaje ensamblador y código máquina Ciclo básico ejecución una instrucción Algunos ejemplos Universidad Politécnica Madrid Componentes básicos

Más detalles

ITT-327-T Microprocesadores

ITT-327-T Microprocesadores ITT-327-T Microprocesadores Introducción al Microprocesador y al Microcomputador. al Microcomputador. Profesor Julio Ferreira. Sistema Microcomputador. Un Sistema Microcomputador tiene dos componentes

Más detalles

EMISION MULTIPLE DE INSTRUCCIONES ARQUITECTURA AVANZADA. Uciel Cohen

EMISION MULTIPLE DE INSTRUCCIONES ARQUITECTURA AVANZADA. Uciel Cohen EMISION MULTIPLE DE INSTRUCCIONES Uciel Cohen Tabla de contenido PROCESADORES VECTORIALES... 2 PROCESAMIENTO VECTORIAL... 2 TIEMPOS DE EJECUCION VECTORIAL... 3 TIEMPO DE ARRANQUE VECTORIAL Y TASA DE INICIALIZACIÓN...

Más detalles

ISA (Instruction Set Architecture) Arquitectura del conjunto de instrucciones

ISA (Instruction Set Architecture) Arquitectura del conjunto de instrucciones ISA (Instruction Set Architecture) Arquitectura del conjunto de instrucciones Instruction Set Architecture (ISA) Arquitectura del conjunto de instrucciones software Conjunto de instrucciones hardware Universidad

Más detalles

Métricas de Rendimiento

Métricas de Rendimiento Métricas de Rendimiento DISEÑO DE SISTEMAS DIGITALES EL-3310 I SEMESTRE 2008 6. RENDIMIENTO DE SISTEMAS COMPUTACIONALES (1 SEMANA) 6.1 Definición de rendimiento en términos computacionales 6.2 Medición

Más detalles

Tema 2: Arquitectura del repertorio de instrucciones. Visión del computador que tiene el programador en bajo nivel.

Tema 2: Arquitectura del repertorio de instrucciones. Visión del computador que tiene el programador en bajo nivel. Tema 2: Arquitectura del repertorio de instrucciones Visión del computador que tiene el programador en bajo nivel. Lo que el programador en lenguaje ensamblador debe conocer para escribir programas: (1)

Más detalles

1. Introducción a la Arquitectura de Computadoras

1. Introducción a la Arquitectura de Computadoras 1. Introducción a la Arquitectura de Computadoras M. Farias-Elinos Contenido Definiciones Estructura de una computadora Evolución de las computadoras Generaciones de computadoras Evolución de la família

Más detalles

HYPERTHREADING TECHNOLOGY IN THE NETBURST MICROARCHITECTURE. Arquitectura de computadores Leyre Aldama Pérez

HYPERTHREADING TECHNOLOGY IN THE NETBURST MICROARCHITECTURE. Arquitectura de computadores Leyre Aldama Pérez HYPERTHREADING TECHNOLOGY IN THE NETBURST MICROARCHITECTURE ÍNDICE 1. Introducción 2. Descripción de necesidades para la implementación de la tecnología: 2.1- Cómo trabaja la tecnología 2.2- Estructuras

Más detalles

Pipelining o Segmentación de Instrucciones

Pipelining o Segmentación de Instrucciones Pipelining o Segmentación de Instrucciones La segmentación de instrucciones es similar al uso de una cadena de montaje en una fábrica de manufacturación. En las cadenas de montaje, el producto pasa a través

Más detalles

Ejercicios de Arquitectura de Computadoras

Ejercicios de Arquitectura de Computadoras Ejercicios Arquitectura Computadoras José Garzía 9 En este tipo ejercicios bemos tener siempre presentes estas tres ecuaciones: MP ( en Memoria Principal ) Cantidad en la Memoria Principal por Cantidad

Más detalles

Carlos Bernal Serra Rafa Sospedra Cardona

Carlos Bernal Serra Rafa Sospedra Cardona Carlos Bernal Serra (carberse@teleco.upv.es) Rafa Sospedra Cardona (rasoscar@teleco.upv.es) Objetivos Estudiar una arquitectura segmentada, como es el caso de P6. Conocer todas las etapas de su segmentación.

Más detalles

Area Académica: Sistemas Computacionales. Tema: Elementos de diseño de memoria caché

Area Académica: Sistemas Computacionales. Tema: Elementos de diseño de memoria caché Area Académica: Sistemas Computacionales Tema: Elementos de diseño de memoria caché Profesor: Raúl Hernández Palacios Periodo: 2011 Keywords: Memory, cache memory. Tema: Elementos de diseño de memoria

Más detalles

Tema 2. Arquitectura de CPU avanzadas 15/03/2011

Tema 2. Arquitectura de CPU avanzadas 15/03/2011 Tema 2. Arquitectura de CPU avanzadas. Juegos CISC y RISC. Proceso paralelo. Procesadores escalares y vectoriales. Segmentación. Caches multinivel. Índice Introducción... 1 Procesadores CISC y RISC...

Más detalles

Organización lógica Identificación de bloque

Organización lógica Identificación de bloque Cómo se encuentra un bloque si está en el nivel superior? La dirección se descompone en varios campos: Etiqueta (tag): se utiliza para comparar la dirección requerida por la CPU con aquellos bloques que

Más detalles

Sistemas operativos: una visión aplicada. Capítulo 11 Estudio de casos: Linux

Sistemas operativos: una visión aplicada. Capítulo 11 Estudio de casos: Linux Sistemas operativos: una visión aplicada Capítulo 11 Estudio de casos: Linux Contenido Historia de Linux Características y estructura de Linux Gestión de procesos Gestión de memoria Entrada/salida Sistema

Más detalles

Estudio de la Wii U: CPU y GPU. Michael Harry O'Gay García Microprocesadores para comunicaciones ULPGC

Estudio de la Wii U: CPU y GPU. Michael Harry O'Gay García Microprocesadores para comunicaciones ULPGC Estudio de la Wii U: CPU y GPU Michael Harry O'Gay García Microprocesadores para comunicaciones ULPGC Índice Índice...2 Introducción...2 Diseño del Hardware...3 El CPU: Espresso...4 El GPU: Latte...4 Comparación

Más detalles

Ejercicios Jerarquía de Memoria

Ejercicios Jerarquía de Memoria Ejercicios Jerarquía de Memoria Grupo ARCOS Estructura de Computadores Grado en Ingeniería Informática Universidad Carlos III de Madrid Contenidos 1. Memoria caché CPU cache Memoria principal 2. Memoria

Más detalles

Instituto Tecnológico de Morelia

Instituto Tecnológico de Morelia Instituto Tecnológico de Morelia Arquitectura de Computadoras Unidad 1a Programa 1 Modelo de arquitecturas de cómputo. 1.1 Modelos de arquitecturas de cómputo. 1.1.1 Clásicas. 1.1.2 Segmentadas. 1.1.3

Más detalles

Tema: Microprocesadores

Tema: Microprocesadores Universidad Nacional de Ingeniería Arquitectura de Maquinas I Unidad I: Introducción a los Microprocesadores y Microcontroladores. Tema: Microprocesadores Arq. de Computadora I Ing. Carlos Ortega H. 1

Más detalles

Arquitecturas RISC. Arquitectura de Computadoras y Técnicas Digitales - Mag. Marcelo Tosini Facultad de Ciencias Exactas - UNCPBA

Arquitecturas RISC. Arquitectura de Computadoras y Técnicas Digitales - Mag. Marcelo Tosini Facultad de Ciencias Exactas - UNCPBA Arquitecturas RISC Características de las arquitecturas RISC Juego de instrucciones reducido (sólo las esenciales) Acceso a memoria limitado a instrucciones de carga/almacenamiento Muchos registros de

Más detalles

SISTEMAS OPERATIVOS Arquitectura de computadores

SISTEMAS OPERATIVOS Arquitectura de computadores SISTEMAS OPERATIVOS Arquitectura de computadores Erwin Meza Vega emezav@unicauca.edu.co Esta presentación tiene por objetivo mostrar los conceptos generales de la arquitectura de los computadores, necesarios

Más detalles

Electrónica Digital II

Electrónica Digital II Electrónica Digital II TIPOS DE MEMORIAS MEMORIA DDR MEMORIA DDR2 MEMORIA DDR3 COMPARACIÓN TIEMPOS DE ACCESO TIPOS DE LATENCIAS RAS CAS ACTIVIDAD PRECARGA TIPOS DE CONFIGURACIONES SINGLE CHANNEL DUAL CHANNEL

Más detalles

TEMA 4: PARALELISMO A NIVEL DE DATOS (DLP).

TEMA 4: PARALELISMO A NIVEL DE DATOS (DLP). TEMA 4: PARALELISMO A NIVEL DE DATOS (DLP). ÍNDICE: 4.1. Introducción: Aplicaciones científicas y multimedia. 4.2. Arquitecturas vectoriales segmentadas clásicas. 4.3. Extensiones multimedia y núcleos

Más detalles

Memoria. Organización de memorias estáticas.

Memoria. Organización de memorias estáticas. Memoria 1 Memoria Organización de memorias estáticas. 2 Memoria En memoria físicas con bus de datos sea bidireccional. 3 Memoria Decodificación en dos niveles. 4 Necesidad de cantidades ilimitadas de memoria

Más detalles

Arquitecturas de computadoras

Arquitecturas de computadoras Arquitecturas de computadoras Colaboratorio Nacional de Computación Avanzada (CNCA) 2014 Contenidos 1 Computadoras 2 Estación de Trabajo 3 Servidor 4 Cluster 5 Malla 6 Nube 7 Conclusiones Computadoras

Más detalles

INDICE 2. Organización de computadoras 3. El Nivel de Lógica Digital

INDICE 2. Organización de computadoras 3. El Nivel de Lógica Digital INDICE Prefacio XV 1. Introducción 1 1.1. Lenguajes, niveles y maquinas virtuales 4 1.2. Maquinas multinivel actuales 4 1.3. Evolución histórica de las maquinas multinivel 8 1.4. Hardware, software y maquinas

Más detalles

EVOLUCION PROCESADORES AMD (ADVANCED MICRO DEVICES)

EVOLUCION PROCESADORES AMD (ADVANCED MICRO DEVICES) EVOLUCION PROCESADORES AMD (ADVANCED MICRO DEVICES) AMD AM286 Es la copia del intel 80286, creado con permiso de intel. Por petición de IBM como segunda fuente, tienen arquitectura interna de 16 bits,

Más detalles

Arquitecturas RISC v.2014

Arquitecturas RISC v.2014 Arquitecturas RISC v.2014 William Stallings, Organización y Arquitectura de Computadores, Capítulo 12: Computadores de repertorio reducido de instrucciones. John Hennessy David Patterson, Arquitectura

Más detalles

SISTEMAS OPERATIVOS Ciclo 2014 Plan 2012

SISTEMAS OPERATIVOS Ciclo 2014 Plan 2012 Lic. en Sistemas de Información SISTEMAS OPERATIVOS Ciclo 2014 Plan 2012 UNIDAD 6 (Parte B) GESTION DE MEMORIA ING. AGUILERA SERGIO OMAR MEMORIA VIRTUAL Todas las referencias a la memoria se traducirán

Más detalles

0.Principios del Microprocesador

0.Principios del Microprocesador There are no translations available. La revolución tecnológica en integración de componentes ha llegado a extremos insospechados, un ejemplo los procesadores Dual Core.. PROCESADORES DE DOBLE NÚCLEO ÍNDICE

Más detalles

Tema 11. Riesgos de control y predicción de saltos

Tema 11. Riesgos de control y predicción de saltos Tema 11. Riesgos de control y predicción de saltos Organización de Computadores LUIS ENRIQUE MORENO LORENTE RAÚL PÉRULA MARTÍNEZ ALBERTO BRUNETE GONZALEZ DOMINGO MIGUEL GUINEA GARCIA ALEGRE CESAR AUGUSTO

Más detalles

Procesador Intel Core 2 Extreme de 4 núcleos Traducción de Textos Curso 2007/2008

Procesador Intel Core 2 Extreme de 4 núcleos Traducción de Textos Curso 2007/2008 Procesador Intel Core 2 Traducción de Textos Curso 2007/2008 Versión Cambio 0.9RC Revisión del texto 0.8 Traducido el octavo párrafo 0.7 Traducido el séptimo párrafo Autor: Rubén Paje del Pino i010328

Más detalles

Procesador Pentium II 450 MHz Procesador Pentium II 400 MHz Procesador Pentium II 350 MHz Procesador Pentium II 333 MHz Procesador Pentium II 300 MHz

Procesador Pentium II 450 MHz Procesador Pentium II 400 MHz Procesador Pentium II 350 MHz Procesador Pentium II 333 MHz Procesador Pentium II 300 MHz PENTIUM El procesador Pentium es un miembro de la familia Intel de procesadores de propósito general de 32 bits. Al igual que los miembros de esta familia, el 386 y el 486, su rango de direcciones es de

Más detalles

TEMA 1: Concepto de ordenador

TEMA 1: Concepto de ordenador TEMA 1: Concepto de ordenador 1.1 Introducción Los ordenadores necesitan para su funcionamiento programas. Sin un programa un ordenador es completamente inútil. Para escribir estos programas necesitamos

Más detalles

Tema 3 SUBRUTINAS. Estructura de Computadores OCW_2015 Nekane Azkona Estefanía

Tema 3 SUBRUTINAS. Estructura de Computadores OCW_2015 Nekane Azkona Estefanía Tema 3 SUBRUTINAS ÍNDICE Definición e instrucciones básicas Soporte para el tratamiento de subrutinas (ejecución de la subrutina y gestión del bloque de activación) Interrupciones vs llamadas a procedimiento

Más detalles

1.1 Introducción y definición de un microcontrolador 1.2 Estructura básica de un microcontrolador 1.3 Características de la Arquitectura

1.1 Introducción y definición de un microcontrolador 1.2 Estructura básica de un microcontrolador 1.3 Características de la Arquitectura Índice 1.1 Introducción y definición de un microcontrolador 1.2 Estructura básica de un microcontrolador 1.3 Características de la Arquitectura 1.3.1 Arquitectura RISC 1.3.2 Arquitectura Harvard 1.3.3

Más detalles