Soluciones a ejercicios de Fundamentos

Documentos relacionados
Tendencias y Evaluación

Ejercicios de jerarquía de memoria

Memoria caché básica

Soluciones a ejercicios de paralelismo y concurrencia

Definición. Alternativamente. Speedup = Universidad de Sonora Arquitectura de Computadoras 2

Ejercicios de Paralelismo a Nivel de Instrucción

Rendimiento de computadores

Optimizaciones avanzadas de memoria caché

Tema 3. Leyes sobre el aumento de prestaciones

Tutorías con Grupos Reducidos (TGR) Parte 1: Evaluación de prestaciones

Memoria compartida distribuida

Ley de Amdahl Ley de Moore Prof. Gilberto Díaz

Arquitectura de Computadores II Clase #9

Unidad I: Performance. Arquitectura de Computadoras Esteban Peláez Andrés Airabella Facundo Aguilera

TEMA 1: EJECUCIÓN PARALELA: FUNDAMENTOS(I)

Memoria compartida simétrica

Rendimiento y sus factores

Algoritmo Cuántico de Búsqueda Paralelo

Soluciones a ejercicios de Paralelismo a Nivel de instrucción

TEMA 4 PROCESAMIENTO PARALELO

Soluciones a ejercicios de jerarquía de memoria

GRADO EN INGENIERÍA DE COMPUTADORES

TEMA 2: PROGRAMACIÓN PARALELA (I)

Unidad 4 - Procesamiento paralelo. Arquitectura de computadoras. D o c e n t e : E r n e s t o L e a l. E q u i p o : J e s s i c a F i e r r o

Práctica 1 - Rendimiento *

Tema 1. Introducción a la arquitectura de computadores: diseño, coste y rendimiento

Información general Quién utiliza la computación en paralela? Conceptos y Terminología Límites y Costos de Programación Paralela

Modelos de consistencia de memoria

Lusitania. Pensando en Paralelo. César Gómez Martín

Computación de Alta Performance Curso 2009 MEDIDAS DE PERFORMANCE MEDIDAS DE PERFORMANCE

Manual de Procedimientos. Dirección de Sistemas

6. PROCESADORES SUPERESCALARES Y VLIW

Tema 1. Introducción a la arquitectura de computadores: diseño, coste y rendimiento

PRESENTACIÓN. Grupo de Arquitectura de Computadores, Comunicaciones y Sistemas. Desarrollo de Aplicaciones Distribuidas

Introducción a la evaluación de rendimiento

Introducción a paralelismo a nivel de instrucción

Titulación: Grado en Ingeniería Informática Asignatura: Fundamentos de Computadores. Bloque 1: Introducción Tema 1: Introducción a los computadores

Sistemas Operativos. S.O. Estructura Básica. S.O. Como Administrador de Recursos. Multiprogramación. Multiprogramación y Procesos

Bibliografía básica de referencia: Fundamentos de Informática para Ingeniería Industrial, Fernando Díaz del Río et al.

Aspectos avanzados de arquitectura de computadoras Superescalares I. Facultad de Ingeniería - Universidad de la República Curso 2017

Ejercicios de teoría de colas

Capítulo 6: EVALUACIÓN Y COMPARACIÓN DE MÉTODOS

Computación 1. Roles en la interconexión

Memoria. Otros temas sobre cachés

Aprendizaje Basado en Problemas y Aprendizaje Cooperativo

Tarea 2. Descripción y Control de Procesos

Tema 7. Mejora del rendimiento: introducción a la segmentación y a las arquitecturas paralelas

Aspectos avanzados de arquitectura de computadoras Multithreading. Facultad de Ingeniería - Universidad de la República Curso 2017

Examen de la convocatoria de junio Problemas

Capítulo 5 El procesador

Programación Concurrente y Paralela. Unidad 1 Introducción

Aspectos avanzados de arquitectura de computadoras Pipeline. Facultad de Ingeniería - Universidad de la República Curso 2017

Tema: Microprocesadores

Rendimiento John Hennessy David Patterson,

Organización del Computador I Verano. Rendimiento (2 de 3) Basado en el capítulo 1 del libro de Patterson y Hennessy

Arquitectura de Computadoras Trabajo Práctico N 7 Pipeline de Instrucciones Primer Cuatrimestre de 2010

Trabajo Práctico Número 6

Introduccion a Sistemas Operativos. Ej: Linux

Ejercicio 1. Considere el siguiente fragmento en ensamblador:

Prerrequisito (s): DOMINIOS COGNITIVOS (Objetos de aprendizaje, temas y subtemas) UNIDAD I: INTRODUCCIÓN

Mgter. Leandro Daniel Torres. Mgter. Leandro D. Torres 1

Consistencia de memoria en C++

Evaluación del rendimiento de Algoritmos Paralelos y/o Concurrentes

Métricas de Rendimiento

Unidad Didáctica 4. Distribuciones de Probabilidad II. Departamento de Estadística e Investigación Operativa Aplicadas y Calidad

Paralelismo en el procesador

Introducción a los Sistemas Operativos

Definiciones. Para qué sirve la evaluación del desempeño? Tópicos Especiales en Evaluación de Desempeño. Mariela J. Curiel H. 1

NY Paris Velocidad Througput Avión Pasajeros horas mph p/mph

Notas de Teórico. Evaluación de Rendimiento

Tema 1. Aspectos fundamentales en el diseño de computadores: Rendimiento, consumo y coste. Organización de Computadores I Rendimiento y Coste

1. Motivación. 2. Procesadores superescalares. 3. Procesadores VLIW. 4. Procesadores supersegmentados.

Objetivo: Conocer el esquema básico de un Microprocesador. Arquitectura secuencial

Sistemas Operativos. Dr. Luis Gerardo de la Fraga. Departamento de Computación Cinvestav

Definiendo desempeño

Hilos Secciones Stallings:

Retos del cómputo moderno Distribuido, paralelo e integrado

INTRODUCCIÓN Y MEDIDAS DE RENDIMIENTO LEY DE AMDAHL

Quinta tarea: Existen varias versiones del 80486:

Bases de Datos Paralelas. Carlos A. Olarte BDII

1. Introducción 2. S.O. de Red. NFS 3. S.O. Distribuidos 4. Características de Diseño. Tema5: Sistemas Operativos Distribuidos

Introducción al Sistema Operativo Unix

Apoyo a la docencia. Web de Martín Garzón, Gracia Ester

Sincronización. Arquitectura de Computadores

PROBLEMAS TEMA 1: Estructuras de interconexión de un computador

PLIEGO DE PRESCRIPCIONES TÉCNICAS CONTRATO DE SUMINISTRO

Procesos y Threads Procesos y Threads. Concurrencia Concurrencia Ventajas Ventajas. Rendimiento Rendimiento (paralelismo) (paralelismo)

Arquitectura de Computadoras Trabajo Práctico N 8 Pipeline de Instrucciones 1 Primer Cuatrimestre de 2016

Herramientas Informáticas I Hardware: Conceptos Básicos

PREGUNTAS INFORMÁTICA MONITOR UPB EXAMEN 1

Arquitectura de Computadores Problemas (hoja 2). Curso

Paralelismo _Arquitectura de Computadoras IS603

UNIVERSIDAD NACIONAL FEDERICO VILLARREAL FACULTAD DE INGENIERÍA ELECTRÓNICA E INFORMÁTICA SÍLABO

GUÍAS. Módulo de Mantenimiento e instalación de hardware y software SABER PRO

ANX-PR/CL/ GUÍA DE APRENDIZAJE

Montaje y Reparación de Sistemas Microinformáticos

ALGORITMO DE COMPRESIÓN DE HUFFMAN PARA PLATAFORMAS DISTRIBUIDAS IMPLEMENTADO EN CLUSTER BASADO EN MPI

ACI-M - Arquitectura y Configuraciones Informáticas

UNIVERSIDAD DE GUADALAJARA

Transcripción:

Soluciones a ejercicios de Fundamentos J. Daniel García Sánchez (coordinador) David Expósito Singh Javier García Blas Óscar Pérez Alonso J. Manuel Pérez Lobato Arquitectura de Computadores Grupo ARCOS Departamento de Informática Universidad Carlos III de Madrid. Ejercicios de examen Ejercicio Junio 205 Se dispone de una aplicación que permite procesar una imagen de muy alta resolución de la cuál una cierta fracción es paralelizable y otra parte debe ejecutarse secuencialmente. Se asume que no hay límite superior al número de procesos en que se puede paralelizar. Se desea obtener un speedup global de 0 en la versión paralela. Exprese la fracción de código que debe ser paralelizable en función del grado de paralelismo (número de procesos en que se paraleliza). Solución S = ( F ) + F n ( S ( F ) + F ) = n S S F + S F n = n S n S F + S F = n n S n = n S F S F S F (n ) = n (S ) F = n (S ) S (n ) Para el caso de S = 0 F = n (0 ) 0 (n ) = 9 n 0 n 0 Arquitectura de Computadores

Para que tenga sentido F debe ser menor o igual que. F 9 n 0 n 0 9 n 0 n 0 n 0 Ejercicio 2 Enero 204. Se dispone de un computador con un solo núcleo que ejecuta una aplicación de evaluación de riesgos nancieros. Esta aplicación es intensiva en cálculo, a lo que dedica el 90 % del tiempo. El 0 % restante lo dedica a esperar en operaciones de entrada/salida a disco. Del tiempo que la aplicación pasa ejecutando instrucciones de cálculo un 75 % del tiempo lo pasa ejecutando operaciones en coma otante y un 25 % lo pasa ejecutando otras instrucciones. La ejecución de una instrucción de coma otante requiere como promedio 2 CPI. El resto de instrucciones requieren como promedio 4 CPI. Se está valorando la migración de esta aplicación a las siguientes alternativas, que no incorporan ninguna mejora para el tiempo de las operaciones de entrada/salida a disco: Alternativa A: Un procesador con un solo núcleo y con una frecuencia de reloj un 50 % más alta que la de la máquina original en el que las instrucciones de coma otante requieren un 0 % más de ciclos por instrucción y el resto de instrucciones requieren un 25 % más de ciclos por instrucción. Alternativa B: Un procesador con cuatro núcleos y con una frecuencia de reloj un 50 % más baja que la de la máquina original, en el que las instrucciones de coma otante requieren un 20 % menos de ciclos de reloj y el resto de instrucciones los mismos ciclos de reloj. Se pide responder de forma justicada a las siguientes cuestiones:. ¾Cuál será la aceleración/deceleración global de la aplicación en el caso A? 2. ¾Cuál será la aceleración/deceleración global de la aplicación en el caso B si se asume que la parte de cálculo es totalmente paralelizable mientras la entrada/salida no admite ningún tipo de paralelización? Solución 2 El tiempo dedicado a la ejecución de instrucciones en el computador original será: T orig = 0,75 2 IC P + 0,25 4 IC P = (9 + ) IC P () 2 Arquitectura de Computadores

Alternativa A El tiempo dedicado a la ejecución de instrucciones en el computador A será: T A = (0,75 (, 2)+0,25 (,25 4)) IC P,5 T A = 7,433 IC P El Speedup debido a instrucciones será: S I A = T orig T A = 0 7,433 =,345 Aplicando la Ley de Amdahl el speedup global sera: S A = 0, + 0,9,345 =,3 = (9,9 +,25) IC P,5 =,5 IC P (2),5 (3) (4) (5) Alternativa B En este caso, al asumirse paralelización completa de la parte de cálculo se puede considerar que el número de instrucciones a ejecutar en cada núcleo es la cuarta parte del original. T B = (0,75 0,8 2 + 0,25 4) IC 4 P 0,5 = (7,2 + ) 2 IC P = (6) 4 T B = 4, IC P (7) El Speedup debido a instrucciones sera: S I B = T orig T B = 0 4, = 2,439 (8) Aplicando la Ley de Amdahl el speedup global sera: S B = 0, + 0,9 2,439 = 2,32 (9) Ejercicio 3 Examen de octubre de 203. En su organización se dispone de una aplicación con las siguientes características: La aplicación pasa el 80 % del tiempo ejecutando instrucciones y el 20 % del tiempo restante esperando a la realización de operaciones de disco. El tiempo que la aplicación pasa ejecutando instrucciones se distribuye en un 20 % para instrucciones en coma otante (que requieren 8 CPI) y un 80 % para el resto de instrucciones (que requierens 6 CPI). Se está valorando la migración a una nueva máquina en la que las instrucciones requieren un 25 % más de CPI, pero cuya frecuencia de reloj es el doble. ¾Cuál será la aceleración global de la aplicación? Solución 3 3 Arquitectura de Computadores

T inst (orig) = 0,2 8 IC P + 0,8 6 IC P = (,6 + 4,8) IC P = 6,4 IC P T inst (mej) = 0,2 0 IC P 2 S inst = 6,4 4 =,6 S = 0,2 + 0,8,6 = + 0,8 7,5IC P 2 0,2 + 0,5 = =, 42 0,7 Ejercicio 4 Examen de octubre de 203. = ( + 3) IC P = 4 IC P Dado un procesador que consume una potencia dinámica P existen dos alternativas de reducción de potencia dinámica consumida:. Disminuir el voltaje a la mitad manteniendo el valor de la frecuencia, 2. Disminuir la frecuencia a la mitad manteniendo el valor del voltaje. Razone cuál de ellas consigue una mayor reducción de la potencia dinámica y cuantique el valor de la reducción. Solución 4 Si se disminuye el voltaje a la mitad se tiene: P nuevo P ant = (V 0,5)2 f V 2 f = 0,25 V 2 f V 2 f = 0,25 Si se disminuye la frecuencia a la mitad se tiene: P nuevo = V 2 f 0,5 P ant V 2 = 0,5 f Por consiguiente se consigue una mayor reducción de potencia dinámica en le caso de reducir el voltaje a la mitad. Ejercicio 5 Enero de 203. Dado un computador que funciona de forma continuada y sin errores hasta un tiempo t = 20 meses.. Dena qué es la abilidad de un equipo. ¾Cuál es la abilidad de ese computador para t = 0, t = 24 y t = 30? (con t medido en meses). 2. Dena qué es la disponibilidad de un equipo. Si durante los dos años de uso, el computador tiene dos averías cuyos tiempos de reparación son 3,85 y 4,5 días respectivamente, ¾cuál sería su disponibilidad? Solución 5 4 Arquitectura de Computadores

La abilidad (R) es la probabilidad de que el tiempo de vida del sistema (X) sea mayor que un tiempo t dado, por tanto P [X > t]. La abilidad es una función del tiempo y se verica que: R(t = 0) = R(t = ) = 0 R(0 < t < ) [0, ] En el ejemplo: R(t = 0) =, R(t = 24) = 0, R(t = 30) = 0 La disponibilidad (A) es la fracción del tiempo en que el sistema está funcionando correctamente, o libre de errores. Formalmente, la disponibilidad media será: A = MT T F MT T F + MT T R Donde MT T F es el tiempo medio entre fallos y MTTR es el tiempo medio hasta reparación. Por tanto, la disponibilidad del sistema del ejemplo: MT T R = 3,85 + 4,5 = 8 MT T F = 365 2 8 = 722 A = 722 = 0, 9890 98,9 % 730 5 Arquitectura de Computadores