Memoria. Rendimiento del caché

Documentos relacionados
Universidad de Sonora Arquitectura de Computadoras 2

Evaluación de rendimiento

Miss rate vs. Tamaño de bloque En general el MR baja cuando se aumenta el tamaño del bloque.

Trabajo Práctico Número 6

Introducción. Universidad de Sonora Arquitectura de Computadoras 2

Trabajo Práctico Número 6 Arquitectura de Computadoras

Diseño de la jerarquía de memoria

Arquitectura de Computadoras para Ingeniería

Mapa de memoria. memoria CACHÉ

Arquitectura de Computadoras

Arquitectura de Computadores Problemas (hoja 4). Curso

Memoria caché básica

Introducción a memorias cache

Microprocesadores para comunicaciones. Escuela Técnica Superior de Ingenieros de Telecomunicación. Organización y estructura de las memorias caché

Arquitectura de Computadoras Trabajo Práctico N 7 Pipeline de Instrucciones Primer Cuatrimestre de 2010

Arquitectura de Computadoras Trabajo Práctico N 8 Pipeline de Instrucciones 1 Primer Cuatrimestre de 2016

Jerarquía de Memoria Memoria Cache

Organización lógica Identificación de bloque

MEMORIA CACHÉ PRINCIPIOS BASICOS

Arquitectura de Computadores II Clase #7

Arquitectura de Computadores II Clase #7

Tema 6: Memoria virtual. Óscar David Robles Sánchez Sofía Bayona Beriso David Miraut Andrés Luis Rincón Córcoles

Arquitectura de Computadores II Clase #6

Optimizaciones avanzadas de memoria caché

Arquitectura de Computadores II Clase #7

SISTEMAS OPERATIVOS Arquitectura de computadores

Aspectos avanzados de arquitectura de computadoras Pipeline. Facultad de Ingeniería - Universidad de la República Curso 2017

Arquitectura de Computadores II Clase #5

ARQUITECTURA DE VON NEUMANN Y HARVARD

Procesadores superescalares. Introducción

Fundamentos de Sistemas Operativos Licenciatura en Administración de Tecnologías de Información y Comunicaciones

Superescalares. Scheduling dinámico: algoritmo de Tomasulo

Ejercicios de jerarquía de memoria

Clase Práctica: Entrada Salida

Arquitectura de Computadoras para Ingeniería

Arquitectura de Computadores

ENTRADA-SALIDA. 2. Dispositivos de Carácter: Envía o recibe un flujo de caracteres No es direccionable, no tiene operación de búsqueda

Memoria Cache. Departamento de Arquitectura de Computadores

Práctica 1 - Rendimiento *

Estructura de los sistemas de cómputo

Tutorías con Grupos Reducidos (TGR) Parte 1: Evaluación de prestaciones

Memoria Virtual. Memoria Virtual

Arquitectura de Computadores II Clase #9

PROBLEMAS TEMA 1: Estructuras de interconexión de un computador

Unidad 1: Conceptos generales de Sistemas Operativos.

Subsistemas de memoria. Departamento de Arquitectura de Computadores

1. Partes del ordenador. Nuevas Tecnologías y Sociedad de la Información

Sistema Operativo. Repaso de Estructura de Computadores. Componentes Hardware. Elementos Básicos

ARQUITECTURA DE COMPUTADORES. 2º INGENIERIA INFORMATICA. Soluciones del BOLETIN 2: Tecnología de los sistemas de memoria. Curso 06/07.

16bits: Tamaño total: 2 16 Tamaño página: 2 13 nº de páginas: 2 16 / 2 13 = 2 3 = 8 páginas Tamaño de tabla: 2 3 *2B = 16B por tabla

La solución es colocar un memoria más pequeña y rápida entre la CPU y la memoria principal.

Memoria. Organización de memorias estáticas.

Problemas de estructura y tecnología de computadores Hoja 6: Temas 12, 13 y 14

EJERCICIOS DEL TEMA 4

Memorias RAM. Basilio B. Fraguela Rodríguez. Copyright Basilio B. Fraguela 2006

Estructura Interna de La PC. 1. Microprocesadores 2. I/O ( Entrada / Salida) 3. Memoria

Introducción a la Computación. Capitulo 4 Memoria Cache

AUTOMATIZACION. Reconocer la arquitectura y características de un PLC Diferenciar los tipos de entradas y salidas MARCO TEORICO. Estructura Interna

El espectro de almacenamiento (Jerarquías de Memorias)

ARQUITECTURA DEL COMPUTADOR

MULTIPROCESADORES COMERCIALES. José M. Cámara v. 2.0

Jerarquía de memoria y memoria caché Ejercicios resueltos

CPU MEMORIAS CACHE. Memorias caché. Memoria caché = memoria de tamaño pequeño y acceso rápido situada entre la CPU y la memoria principal.

Tema 1. Introducción a la arquitectura de computadores: diseño, coste y rendimiento

Organización del Sistema de Memoria. 1. Tipos de memoria 2. Jerarquía de memoria 3. El principio de localidad 4. Organización de la memoria

Estructura del Computador

Tema 5: Memorias. Espacio reservado para notas del alumno

Taller de la memoria RAM

MEMORIAS. Arquitectura de Computadoras. (Conceptos Introductorios) M. C. Felipe Santiago Espinosa

Pipelining. Introducción

El procesador. Datapath y control

1) Se dispone de un computador de 32 bits con la siguiente estructura:

Microprocesador. Introducción. Instituto Sagrado Corazón de Jesús

Transcripción:

Memoria Rendimiento del caché

Medidas El tiempo de CPU se divide en: Ciclos de reloj usados en ejecutar el programa. Ciclos de reloj usados en detenciones (stalls) del sistema de memoria. La ecuación: Tiempo CPU = Ciclos de reloj x Período de reloj Se convierte en: Tiempo CPU = (Ciclos de reloj ejecución + Ciclos de reloj detención memoria) x Período de reloj Universidad de Sonora Arquitectura de Computadoras 2

Medidas Los ciclos usados en detenciones de la memoria vienen principalmente de fallas de caché. Se definen como los ciclos usados en detenciones por lecturas mas los ciclos usados en detenciones por escrituras. Ciclos de reloj detención memoria = Ciclos detención lectura + Ciclos detención escritura Universidad de Sonora Arquitectura de Computadoras 3

Medidas Los ciclos usados en detenciones de lectura se definen en términos de: Número de accesos de lectura por programa. El castigo por falla de lectura en ciclos de reloj. La tasa de fallas por lectura. lecturas Ciclos detención lectura = tasa de fallas por lectura castigo por falla de lectura programa Universidad de Sonora Arquitectura de Computadoras 4

Medidas Los ciclos usados en detención de escritura dependen de la estrategia (write-through o writeback). En write-through hay 2 fuentes de detenciones: Fallas de escritura, donde hay que cargar el bloque antes de continuar la escritura. Detenciones por el buffer de escritura, que ocurren cuando el buffer está lleno. escrituras Ciclos detención escritura = tasa de falla escritura castigo por falla escritura programa + detenciones por buffer escritura Universidad de Sonora Arquitectura de Computadoras 5

Medidas En sistemas bien diseñados las detenciones por el buffer de escritura se pueden ignorar. En write-back hay posibles detenciones adicionales causadas por escribir el bloque del caché en la memoria. Por ahora se ignoran. En la mayoría de organizaciones de caché los castigos por falla de lectura y escritura son iguales. accesos memoria Ciclos de reloj detención memoria = tasa de falla castigo por falla programa instrucciones fallas Ciclos de reloj detención memoria = castigo por falla programa instrucción Universidad de Sonora Arquitectura de Computadoras 6

Ejemplo Un sistema con un caché dividido (split). Tasa de fallas del caché de instrucciones: 2%. Tasa de fallas del caché de datos: 4%. Castigo por falla: 100 ciclos. CPI: 2 (sin detenciones de memoria). Qué tanto mas rápido correría el procesador con un caché perfecto (sin fallas)? Suponer las frecuencias de instrucciones de SPECint2000 (slide siguiente). Universidad de Sonora Arquitectura de Computadoras 7

Universidad de Sonora Arquitectura de Computadoras 8

Ejemplo Para el caché de instrucciones: Ciclos de detención = I x 0.02 x 100 = 2 x I Para el caché de datos (loads y stores son 35%): Ciclos de detención = I x 0.35 x 0.04 x 100 = 1.44 x I Número total de ciclos de detención de memoria es 2 x I + 1.44 x I = 3.44 x I. CPI con detenciones de memoria es 2 + 3.44 = 5.44. El porcentaje de tiempo de ejecución perdido por detenciones de memoria es 3.44/5.44 = 63%. Universidad de Sonora Arquitectura de Computadoras 9

Ejemplo El rendimiento con y sin detenciones se compara: Rendimiento1 Tiempo ejecución2 = Rendimiento2 Tiempo ejecución1 Tiempo de ejecución = I x CPI x Período de reloj. Tiempo CPU con detenciones Tiempo CPU con caché perfecto = I CPI I CPI detenciones perfecto Período reloj Período reloj = CPI CPI detencione s perfecto Universidad de Sonora Arquitectura de Computadoras 10

Ejemplo El rendimiento de la CPU con caché perfecto es mejor por 5.44/2 = 2.77 veces. Universidad de Sonora Arquitectura de Computadoras 11

AMAT Average Memory Access Time (tiempo promedio de acceso a memoria). Es el tiempo promedio de acceso a memoria considerando éxitos, fallas y la frecuencia de los distintos accesos. AMAT = Tiempo de éxito + tasa de fallas x castigo por falla El AMAT indica que el rendimiento es afectado por el tiempo de acceso a los datos, incluyendo éxitos y fallas. Universidad de Sonora Arquitectura de Computadoras 12

Ejemplo Encontrar el AMAT para una CPU con los siguientes datos: Velocidad de reloj = 2 GHz Castigo por falla = 20 ciclos Tasa de fallas del caché = 5% Tiempo de acceso al caché = 1 ciclos. AMAT = 1 + 0.05 x 20 = 2 ciclos Tamaño de ciclo = 1 / 2e9 = 0.5 ns AMAT = 1 ns Universidad de Sonora Arquitectura de Computadoras 13

Conclusión El rendimiento de un sistema de cachés se puede medir de dos formas: Tiempo de ejecución contando los ciclos que se pierden por accesos a la memoria. Tiempo promedio de acceso a la memoria (AMAT). Universidad de Sonora Arquitectura de Computadoras 14