RENDIMIENTO Y MEJORA DE LA CPU
|
|
|
- José Francisco Romero Soriano
- hace 7 años
- Vistas:
Transcripción
1 RENDIMIENTO Y MEJORA DE LA CPU UPCO ICAI Departamento de Electrónica y Automática 1 Por qué hablar de rendimiento de un ordenador? RAE 92: Proporción entre el producto o el resultado obtenido y los medios utilizados. Elegir el ordenador con mejor rendimiento (EL MEJOR) Diseñar, montar o elegir un ordenador que sea apto para la aplicación en la que va ser utilizado: Rápido Capacidad de almacenamiento adecuada Capacidad de comunicaciones adecuada Sistema gráfico adecuado (Servidor WWW vs. Cliente WWW) Múltiples usuarios Mantenimiento Escalabilidad De los que cumplen: el más barato Desembolso inicial, coste de las ampliaciones, consumo UPCO ICAI Departamento de Electrónica y Automática 2
2 Cómo medir el rendimiento? Fórmula para una máquina Rendimient o = Cuántas veces es mejor la máquina A que la B? Rendimient o_ordenado r_a n = Rendimient o_ordenado r_b Prestaciones Coste Cómo medir las prestaciones? Dependerá de la aplicación donde se quiera utilizar el ordenador Coste? Difícil de evaluar: sometido a las leyes del mercado En la mayoría de los casos al comparar rendimientos se supone que los costes son iguales (Tabla de comparación de Intel) Rendimiento_Ordenador_A Prestaciones_Ordenador_A n = = Rendimiento_Ordenador_B Prestaciones_Ordenador_B UPCO ICAI Departamento de Electrónica y Automática 3 Dónde está el coste? UPCO ICAI Departamento de Electrónica y Automática 4
3 Qué mide? Mi AMD será más rápido? Mi aplicación correrá más rápida en un AMD que en un Pentium? UPCO ICAI Departamento de Electrónica y Automática 5 Medir las prestaciones Fundamental: Tiempo de ejecución de los programas Cómo medir? A mano: cronómetro en mano NO FALLA: el más rápido en ejecutar un programa siempre es el mejor a igualdad de coste. Cómo saber esto a priori? Mediante una fórmula Tiempo = Programa * Factor Cómo se comparan o miden programas? Cómo se calcula ese factor? Problema de parada de la máquina de Turing: No existe un algoritmo general que permita calcular el número de operaciones de cualquier tipo de algoritmo (programa) Cómo mejorar a partir de las medidas la arquitectura? Más prestaciones: almacenamiento, conexión... Aunque parezca imposible se pueden introducir números UPCO ICAI Departamento de Electrónica y Automática 6
4 Qué números? Métricas básicas Periodo o frecuencia de reloj de la CPU (MHz, GHz) Tiempo de ejecución de un programa (latencia - Latency) Tiempo de respuesta El ordenador más rápido es el que tarda menos en ejecutar un programa Mejorar el rendimiento = Mejorar el tiempo de ejecución = Decrementar el tiempo de ejecución Cómo saber esto a priori? Qué mejorar de la máquina? Futuras aplicaciones? Productividad (Throughput) Cuánto trabajo (operaciones) puede realizar por unidad de tiempo CPI Ciclos por instrucción MIPS Millones de instrucciones por segundo UPCO ICAI Departamento de Electrónica y Automática 7 Tiempo de ejecución de un programa (latencia) El tiempo de ejecución es la medida básica del rendimiento del ordenador Es el tiempo total para completar una tarea Desde que se arranca hasta que se termina Dos componentes: Tiempo de CPU: tiempo de la CPU empleado en ejecutar nuestro programa incluido la parte correspondiente de SO. Resto: tiempo de espera de la E/S o de ejecución de otros programas Tiempo de CPU Tiempo de Usuario: Tiempo de la CPU gastado en modo usuario Tiempo de Sistema Operativo: Tiempo de la CPU gastado por el sistema operativo Cómo se reparte entre usuarios? Diferentes OS? Ejemplo en UNIX (comando time): 90.7u 12.9s 2:39 65% Usuario: 90.7s; SO: 12.9s Tiempo de ejecución: 2min, 39s ; 65 % es tiempo de CPU UPCO ICAI Departamento de Electrónica y Automática 8
5 Rendimiento y tiempo de ejecución Si se mide el rendimiento como tiempo de ejecución 1 Rendimient o = Tiempo_Eje cución_pro grama Rendimiento de todo el ordenador Si sólo se tiene en cuenta el tiempo de CPU es una medida del conjunto CPU más Sistema Operativo Cuántas veces es mejor la CPU_A que la CPU_B? Rendimient o_cpu_a Tiempo_CPU _B _ Programa n = = Rendimient o_cpu _ B Tiempo_CPU _A _ Programa Ordenador completo Rendimient o_ordenado r_a Tiempo_Eje cución_pro grama_b n = = Rendimient o_ordenado r _ B Tiempo_Eje cución_pro grama_a Depende del programa utilizado: caso medio, casos extremos Benchmark (Eje: SPEC s): Simular diferentes tipos de aplicación. UPCO ICAI Departamento de Electrónica y Automática 9 Throughput Mide la cantidad de trabajo realizado por unidad de tiempo Número de programas ejecutados por hora Número de instrucciones ejecutadas por segundo Número de consultas WWW despachadas por segundo Medir la productividad: Director CPD ( A cuántos doy servicio?) Frente a tiempo de ejecución (latencia) Tiempo que tarda en ejecutarse un programa Tiempo que tarda en ejecutarse una instrucción Tiempo en despachar una consulta en un servidor WWW Medida muy cercana al usuario final ( Cuánto tarda?) Ejemplo Un ordenador tarda 8 s. en ejecutar dos programas de igual carga: Tiempo de ejecución: 4 s (uno tras otro / multitarea: 8s aprox.) Throughput: 2 programas/8 segundos=0.25 Con dos CPU s: tiempo de ejecución: 4 s; throughput: 4/8: 0.5 UPCO ICAI Departamento de Electrónica y Automática 10
6 Reloj Frecuencia de reloj Todo procesador tiene un reloj interno que funciona a frecuencia constante ( Ordenadores portátiles?). Todo en el procesador ocurre a ritmo de ese reloj Gasto energético es proporcional a la frecuencia del reloj Muy importante para el rendimiento en sistemas móviles Mayor frecuencia no significa mayor rendimiento (Intel y AMD). Ejemplo: 500 MHz: ciclos por segundo (1GHz = 10 9 ciclos/s.) Duración del ciclo de reloj (periodo): inverso de la frecuencia Los retardos máximos en los elementos del procesador fijan la frecuencia máxima del reloj Dato más del diseñador ( Me he comprado un ordenador de 1 ns?) Ejemplo: 500 MHz -> 2 ns (1 nanosegundo=10-9 s; f: 1GHz) 1 ms (milisegundos) = 10-3 s (f: 1KHz); 1 µs (microsegundo): 10-6 s (f: 1MHz); 1 ps (picosegundo) = s (f: 1THz). UPCO ICAI Departamento de Electrónica y Automática 11 Relación entre tiempo de CPU y reloj Recuerde que tiempo de CPU es el tiempo de CPU necesario para ejecutar un trozo de código Tiempo_CPU = Número_Cic los_programa*periodo _Reloj Ejemplo: Número_Ciclos_Programa Tiempo_CPU = Frecuencia_Reloj CPU 500MHz, Programa que ocupa ciclos Tiempo CPU: 1*10 5 / 500*10 6 = 2 * 10-4 = 20 ms (Utilizar siempre prefijo adecuado) A igualdad de arquitectura: mayor frecuencia = menor tiempo de ejecución = mayor rendimiento Cuántos ciclos de reloj necesita un programa para ejecutarse? Volvemos al Problema de parada de la máquina de Turing Cómo pasar de número de instrucciones a número de ciclos? UPCO ICAI Departamento de Electrónica y Automática 12
7 Otra métrica: Ciclos por instrucción (CPI) Número medio de ciclos de reloj (ciclos máquina) por instrucción CPI = Número_Ciclos_Programa Número_Instrucciones_Programa A igualdad de arquitectura y reloj si disminuye el CPI aumenta el rendimiento Rendimiento_CPU_A CPI_CPU_B n = = Rendimiento_CPU _ B CPI_CPU_A Teóricamente es una medida estricta del rendimiento de la CPU No aparece ni Sistema Operativo ni los tiempos de espera de la Entrada/Salida Cómo se mide? UPCO ICAI Departamento de Electrónica y Automática 13 Ejemplo de rendimiento con CPI Se tiene dos implantaciones (CPU_A y CPU_B) con el mismo juego de instrucciones. La CPU_A tiene un ciclo de reloj de 1 ns y CPI de 2.0 y la CPU_B tiene un tiempo de ciclo de 2 ns y un CPI de 1.2. Cuál es la máquina más rápida y cuánto? Rendimiento_CPU_A Tiempo_ CPU _ B I * 2*1.2 n = = = = 1.2 Rendimiento_CPU _ B Tiempo_CPU_A I * 2*1 I es el número de instrucciones del programa A es 1.2 veces más rápido que B Si el periodo de B pasa a 1.3 ns ( Qué frecuencia?) cambia Rendimiento_CPU_A Tiempo_ CPU _ B I *1.3*1.2 n = = = = Rendimiento_CPU _ B Tiempo_CPU_A I * 2 *1 B es 1.28 veces más rápido que A Sólo es válido para el programa utilizado para calcular el CPI UPCO ICAI Departamento de Electrónica y Automática 14
8 Cómo se mide el CPI de una CPU? Depende del programa utilizado Los programas utilizan subconjuntos diferentes del juego de instrucciones del procesador Cálculo científico (operaciones en coma flotante) Manejo de base de datos (mover datos entre posiciones de memoria) Ejemplo: Benchmark de 80 instrucciones 25 instrucciones son del tipo LOAD/STORE (MOVE): 8 ciclos 50 instrucciones son del tipo ADD: 4 ciclos 5 instrucciones son del tipo raiz cuadrada: 100 ciclos CPI = (25*8 + 50*4 + 5*100)/80 = 13.8 ciclos/instrucción Si fuera un programa con una sola instrucción de cada tipo CPI = ( )/3 = 37.3 ciclos/instrucción UPCO ICAI Departamento de Electrónica y Automática 15 Ecuación básica del rendimiento Función del número de instrucciones, CPI y periodo Tiempo_Eje cución = Número_Ins trucciones_programa* CPI * Periodo t = I CPI T Número de instrucciones CPI Periodo Programa X Compilador X (X) Juego de instrucciones X X Organización de la CPU X X Tecnología X En algunos casos CPI se concreta para diferentes tipos de instrucciones Tipo i de instrucción necesita CPI i ciclos I i : número de instrucciones del tipo i T: Periodo t = ( I * CPI ) T i i * UPCO ICAI Departamento de Electrónica y Automática 16
9 Ejemplo de rendimiento Un diseñador de compiladores está intentando decidir entre dos secuencias de código para un mismo programa. Los diseñadores de la CPU donde correrá ese programa le han proporcionado los siguientes datos Instrucciones CPI Tipo A 1 Tipo B 2 Tipo C 3 Secuencia de Total de instrucción por clase código Tipo A Tipo B Tipo C Tiempo ejecución secuencia 1 T1= (2*1+1*2+2*3)*T = 10*T = 10 ciclos (5 instrucciones); CPI1=2 Tiempo ejecución secuencia 2 T2= (4*1+1*2+1*3)*T = 9*T = 9 ciclos (6 instrucciones); CPI2=1.5 La secuencia 2 es más rápida que la secuencia 1 aunque tenga más instrucciones Todos los factores son importantes en el rendimiento UPCO ICAI Departamento de Electrónica y Automática 17 MIPS Millones de instrucciones que ejecuta el procesador por segundo Número_Instrucciones_Programa MIPS = 6 Tiempo_CPU*10 Sólo sirve para comparar CPU s que implantan el mismo juego de instrucciones Medida del rendimiento engañosa: CPU A (1MHz) tiene una instrucción especial para realizar la raiz cuadrada que tarda 100 ciclos en ejecutarla CPU B (1MHz) no tiene la instrucción especial de raiz cuadrada y hay que hacerla por software mediante instrucciones ADD, MUL, etc. donde todas tardan 1 ciclo de reloj MIPS(CPU A)=0.01 MIPS(CPU B)=1 Quién hace más rápido la raiz cuadrada? UPCO ICAI Departamento de Electrónica y Automática 18
10 Más sobre MIPS Utilizado para comparar máquinas diferentes de forma engañosa Número de instrucciones por segundo Contenido semántico de las instrucciones Programa con que se ha hecho la medida Compilador utilizado MIPS de pico Velocidad de ejecución de las instrucciones en el mejor de los casos Se toma un programa que tiene una sola instrucción que es la más rápida de ejecutar del juego de instrucciones. MIPS y CPI son equivalentes MIPS es interesante para el usuario, CPI para el diseñador Número_Ins trucciones _Programa MIPS = 6 Número_Ins trucciones _Programa* CPI*Period o*10 UPCO ICAI Departamento de Electrónica y Automática 19 MFLOPS Contabilizar operaciones de coma flotante en alto nivel frente a instrucciones necesarias para ejecutarlas No depende de la arquitectura de la máquina (MIPS, CPI) No depende del compilador Número_Operaciones_Coma_Flotante MFLOPS = 6 Tiempo_CPU*10 Problemas Sólo es aplicable a programas que hagan uso masivo de la coma flotante (entornos de cálculo científico) Depende del programa: una división tarda más que una multiplicación Solución MFLOPS normalizados (Función semejante a CPI i ) Operaciones Coste normalizado ADD, SUB, COMPARE, MULT 1 DIVIDE, SQRT 4 EXP, SIN 8 UPCO ICAI Departamento de Electrónica y Automática 20
11 Resumen de lo visto: Medidas del rendimiento Aplicación Lenguaje de Programación Compilador Respuestas diarias Transacciones por segundo Tiempo de respuesta Medir para saber si la CPU es Tiempo de respuesta adecuada para la aplicación ISA Datapath Control Transistores Cables Pines MIPS MFLOPS CPI Reloj Medir para saber si la CPU mejora (Independiente de la aplicación) UPCO ICAI Departamento de Electrónica y Automática 21 Qué programa elegir para medir? Mejor medida: CARGA REAL Comparar con el programa que estás siempre utilizando Problema: No se sabe a priori que programas se van a ejecutar Alternativa: Programas de prueba (BENCHMARK) Predecir el rendimiento de la máquina cuando ejecute los programas reales. Simular la posible carga real. Cómo construir un benchmark? Medida reproducible No vulnerable Preparar la CPU o el compilador para ejecutar más rápidamente del código del benchmark Conjunto de varios programas para que sea representativo Programas actuales Programas futuros: Difícil Ponderar los tiempos de ejecución de cada programa UPCO ICAI Departamento de Electrónica y Automática 22
12 Ponderación en Intel Java Ofimática Ofimática Juegos 3D Audio, vídeo, imagen UPCO ICAI Departamento de Electrónica y Automática 23 Diferentes tipos de benchmarks Basados en aplicaciones reales Científicas (secuenciación genoma), ingeniería (CAD, elementos finitos), bases de datos, edición, compiladores Filosofía de los SPEC Núcleos: trozos críticos de programas representativos Facilidad Microbenchmark (Medir aspectos concretos del sistema) Operación en coma fija Operación en coma flotante Entrada/salida Memoria Sistema Operativo Otros: juegos, algoritmos muy concretos (Ordenación) El mejor: tu aplicación UPCO ICAI Departamento de Electrónica y Automática 24
13 Comparación entre benchmarks Pros Contras Representativo Portable Ampliamente usados Mide mejoras sobre la realidad CARGA REAL BENCHMARK BASADOS EN APLICACIONES REALES Muy específico No portable Difícil de correr o medir Difícil para identificar causas de bajo rendim. Menos representativo USUARIO Fáciles de correr, incluso en etapas tempranas del diseño DISEÑADOR NÚCLEOS MICROBENCHMARK Vulnerables Difícil de extrapolar a una aplicación real UPCO ICAI Departamento de Electrónica y Automática 25 SPEC Sistem Performance Evaluation Cooperative (SPEC) Fundada en 1988 por un número pequeño de fabricantes y vendedores de estaciones de trabajo, concienciados de la necesidad desesperada de disponer de un conjunto de test para medir el rendimiento (prestaciones) de una forma realista y estandarizada Ha crecido hasta convertirse en el estándar de facto. Filosofía de SPEC Asegurar que el mercado tenga un conjunto de métricas realistas y fáciles de usar para comparar diferentes sistemas entre sí. La base de la metodología SPEC es utilizar benchmark basados en un conjunto de códigos extraídos de aplicaciones reales Diferentes tipos de benchmark CPU: SPECint2000, SPECfp2000, SPECint95, SPECfp95 WWW: SPEC JBB2000, SPEC JVM98, SPEC WEB99 OS: SPEC SFS97 (medidas de throughput) VISITA a UPCO ICAI Departamento de Electrónica y Automática 26
14 Programas: SPEC CINT2000 Benchmarks UPCO ICAI Departamento de Electrónica y Automática 27 Programas: SPEC CFP2000 Benchmark UPCO ICAI Departamento de Electrónica y Automática 28
15 Ejemplo de SPEC ( cómo es la situación actual?) Modelo INT2000 Intel D850GB motherboard (2.0 GHz, Pentium IV) 640 hp workstation j6700 (PA MHz) 569 AlphaServer GS320 68/(Alpha 21264C 1001 MHz) 561 Gigabyte GA-7DX Motherboard (AMD Athlon 1.4GHz) 495 Sun Blade 1000 Model 1900 (UltraSPARC-III 900 MHz) 439 IBM RS/6000 Model M80 (RS64 IV 750 MHz) 409 SGI X (R14k 500MHz) 397 CFP2000 Intel D850GB motherboard (2.0 GHz, Pentium IV) 704 hp server rx4610 (Intel Itanium 800 MHz) 701 AlphaServer ES40 6/833 (Alpha 21264B 833 MHz) 621 Sun Blade 1000 Model 1900 (UltraSPARC-III 900 MHz) 427 Gigabyte GA-7DX Motherboard (AMD Athlon 1.4GHz) 426 SGI X (R14k 500MHz) 362 IBM RS/6000 Model M80 (750 MHz) 359 UPCO ICAI Departamento de Electrónica y Automática 29 Configuraciones de máquinas Hewlett Packard Corporation Advanced Micro Devices hp server rx4610 Gigabyte GA-7DX Motherboard CPU: Intel Itanium CPU: 1.4GHz AMD Athlon CPU MHz: 800 processor A1400AMS3C CPU(s) enabled:1 CPU MHz: 1400 CPU(s) orderable: 2-4 CPU(s) enabled: 1 Primary Cache:16KBI + CPU(s) orderable: 1 16KBD on chip Primary Cache: 64KBI + 64KBD Secondary Cache:96KB(I+D) on chip on chip Secondary Cache: 256KB(I+D) L3 Cache: 4MB(I+D) off chip on chip Other Cache: N/A L3 Cache: N/A Memory: 8 GB (64 * 128MB Other Cache: N/A DIMMs) Memory: 2x128MB PC2100 Disk Subsystem: 1x36 GB DDR SDRAM CL2 SCSI Disk Subsystem: IBM DPTA UPCO ICAI Departamento de Electrónica y Automática 30
16 MIPS comparado con un benchmark UPCO ICAI Departamento de Electrónica y Automática 31 Otros benchmarks (Ver web AMD e Intel) Video Encoding Microsoft Windows Media Encoder Ligos Technology GoMotion Adobe PhotoDeluxe 3.0 Compute Intensive Ziff Davis Inc. 3D WinBench 2000, v1.0 Processor Test SiSoft Sandra Multimedia SIMD FP SiSoft Sandra Multimedia SIMD Integer etesting Labs Inc. WinBench 99, v1.2 CPUmark 99 etesting Labs Inc. WinBench 99, v1.2 FPU WinMark 99 Dónde está SPEC? Productivity BAPCO SYSmark Overall BAPCO SYSmark 2000 Office Productivity BAPCO SYSmark 2000 Microsoft Excel 2000 BAPCO SYSmark 2000 Microsoft PowerPoint 2000 etesting Labs Inc. Business Winstone 2001, v1.0 UPCO ICAI Departamento de Electrónica y Automática 32
17 Ley de Amdahl Si se mejora la ejecución de una parte del programa (speedup de esta parte), no se mejora la ejecución de todo el programa en la misma cantidad (speedup del conjunto). 10 s 90 s 100 s 1 s 91 s Fórmula Tiempo Speedup sin Conjunto = = Tiempomejorado Fracciónmejorada SpeedupFracción Caso anterior: Speedup Conjunto = (1 Fracciónmejorada ) UPCO ICAI Departamento de Electrónica y Automática 33 Ejemplo de la ley de Amdhal El tiempo de ejecución de un programa es 100 segundos en un sistema monoprocesador. 50% del programa es pararalelizable en un sistema multiprocesador. Se utiliza un sistema con 5 procesadores. Calcular el speedup. Speedup Conjunto = 1 1 = = (1 0.5) Corolario de la ley de Amdhal: Hacer más rápido el caso más frecuente El alumno suele cometer errores cuando se aplica la ley de Amdahl para varias mejoras simultáneas. UPCO ICAI Departamento de Electrónica y Automática 34
18 Caso multiprocesador Grado de paralelización del programa UPCO ICAI Departamento de Electrónica y Automática 35 Precio (coste) de un ordenador El coste y precio de un ordenador es equivalente a la de cualquier otro sistema. Coste de fabricación Precio Componentes (muy sensible) Costes directos: mano de obra, gestión de compras, garantía, equipos defectuosos. Coste indirecto o margen bruto R&D, mantenimiento, marketing, ventas, costes financieros, beneficio mínimo, impuestos. Margen de descuento: descuento del precio final (compra por volumen, venta a distribuidores, etc) Precio de lista Margen de descuento 25% al 40% mínimo Margen bruto 34% al 39% Costes directos 6% al 8% Componentes 15% al 33% Para comprar un ordenador o sistema informático: 1. Que cumpla con los requisitos 2. Más barato (ojo con olvidarse de garantía, mantenimiento, etc) UPCO ICAI Departamento de Electrónica y Automática 36
19 Ejemplo de coste por elementos para un PC La CPU sólo representa una pequeña fracción del coste UPCO ICAI Departamento de Electrónica y Automática 37 Comparación de coste entre máquinas 100% 80% 60% 40% 20% Average Discount Gross Margin Direct Costs Component Costs 0% Mini W/S PC Average Discount Gross Margin Direct Costs Component Costs 0 Mini W/S PC UPCO ICAI Departamento de Electrónica y Automática 38
20 Lo que me gustaría saber: rendimiento/coste Secreto Trabajo de consultoría muy bien pagado UPCO ICAI Departamento de Electrónica y Automática 39 La curva de la verdad Coste Límite en la inversión Equipos a descartar Mínimo en las prestaciones 1/Prestaciones Cómo se suma velocidad más capacidad más throughtput...? Definir la función de coste y optimizarla UPCO ICAI Departamento de Electrónica y Automática 40
21 Relación coste/rendimiento en Pentium III Coste Pentium III 750 descartado y 700 casi Relación lineal: no hay cambios en la organización Rendimiento /Rendimiento Frecuencia UPCO ICAI Departamento de Electrónica y Automática 41 Ritmo de crecimiento del rendimiento / prestaciones Evolución del rendimiento de los procesadores 1000 Rendimiento Supercomputers Mainframes Minicomputers Microprocessors Año UPCO ICAI Departamento de Electrónica y Automática 42
22 Evolución memoria (un solo chip DRAM) size año tamaño(mb) Reloj ns ns ns ns ns ns ns Year UPCO ICAI Departamento de Electrónica y Automática 43 Resumen de crecimiento según tecnología Relaciones de Moore (Intel) Capacidad Velocidad (latencia) Lógica x2 en 3 años x2 en 3 años SPEC x2 en 1.5 años DRAM x4 en 3 años x2 en 10 años Disco x4 en 3 años x2 en 10 años Si un estudiante tarda 6 años en realizar su carrera: Velocidad CPU Tamaños disco y memoria X 16 A través de los SPEC se llega a la misma conclusión? La distancia entre velocidad de CPU y memoria sigue creciendo. UPCO ICAI Departamento de Electrónica y Automática 44
23 Brecha entre procesador y DRAM (gap latency) Rendimiento Ley de Moore DRAM Año D.A. Patterson New directions in Computer Architecture Berkeley, June 1998 CPU µproc 60%/año Procesador-Memoria rendimiento brecha: (crece 50% / año) DRAM 7%/año UPCO ICAI Departamento de Electrónica y Automática 45 Rendimiento y potencia consumida La potencia consumida se está incrementando La corriente de la fuente de alimentación está aumentando más rápidamente Disminuye la tensión Power Dissipation Supply Current Power (W) Voltage (V) Current (A) Voltage (V) Joel Emer, Compaq, HPCA00 UPCO ICAI Departamento de Electrónica y Automática 46
24 Resumen de rendimiento (I) Fórmula fundamental del tiempo de ejecución (CPI) Tiempo_Eje cución = Número_Ins trucciones_programa* CPI * Periodo Todos los factores influyen Ley de Amdahl: Tiempo sin 1 SpeedupConjunto = = Tiempomejorado Fracciónmejorada + (1 Fracciónmejorada ) SpeedupFracción La mejora tiene un límite: importancia del elemento Mejores benchmarks: tiempo de ejecución y throughput CPU, disco duro, sistema operativo o máquina completa? Relaciones o leyes de Moore La velocidad de la CPU crece más rápidamente que la memoria La política de precios de ordenadores, compras de ordenadores es equivalente a la de cual otro sistema UPCO ICAI Departamento de Electrónica y Automática 47
Rendimiento de computadores
+ Prof. José María Foces Morán Dept. IESA Universidad de León Rendimiento de computadores Tiempo de ejecución Tiempo de CPU Rendimiento comparativo Ley de Amdahl Ley de Gustaffson + Computador síncrono
Tema 1. Aspectos fundamentales en el diseño de computadores: Rendimiento, consumo y coste. Organización de Computadores I Rendimiento y Coste
Tema 1 Aspectos fundamentales en el diseño de computadores: Rendimiento, consumo y coste 1 Contenido Qué se entiende por arquitectura de computadores? Evolución del rendimiento de los computadores Tipos
Tutorías con Grupos Reducidos (TGR) Parte 1: Evaluación de prestaciones
Tutorías con Grupos Reducidos (TGR) Parte 1: Evaluación de prestaciones ESTRUCTURA DE COMPUTADORES Grupo de Arquitectura de Computadores (GAC) Dyer Rolán García (GAC) Evaluación de Prestaciones Curso 2011/2012
Arquitectura de Computadores II Clase #9
Arquitectura de Computadores II Clase #9 Facultad de Ingeniería Universidad de la República Instituto de Computación Curso 2010 Veremos Rendimiento Rendimiento (Performance) Ver a través de la niebla del
Medición del Rendimiento de Computadores
Arquitectura 09/10 Medición l Rendimiento Motivación: Qué medidas tiempo se utilizan para evaluar el rendimiento? Cómo finimos el tiempo cpu y el rendimiento l procesador? Qué parámetros condicionan el
Tema 2: Conceptos básicos. Escuela Politécnica Superior Ingeniería Informática Universidad Autónoma de Madrid
Tema 2: Conceptos básicos Ingeniería Informática Universidad Autónoma de Madrid 1 O B J E T I V O S Introducción a la Informática Adquirir una visión global sobre la Informática y sus aplicaciones. Conocer
INTRODUCCIÓN Y MEDIDAS DE RENDIMIENTO BENCHMARK
Todos los derechos de propiedad intelectual de esta obra pertenecen en exclusiva a la Universidad Europea de Madrid, S.L.U. Queda terminantemente prohibida la reproducción, puesta a disposición del público
Medición del rendimiento
Medición del rendimiento Medición del rendimiento El rendimiento de la CPU es el tiempo de ejecución. Ecuación del rendimiento de la CPU Tiempo CPU = Ciclos de reloj para el programa x Periodo del reloj
Práctica 1 - Rendimiento *
Práctica 1 - Rendimiento * Organización del Computador 1 Verano 2014 Subconjunto mínimo de ejercicios recomendado: 1 a 11 Ejercicio 1 Considere tres procesadores distintos P 1, P 2 y P 3 que ejecutan el
INTRODUCCIÓN Y MEDIDAS DE RENDIMIENTO MEDIDAS DE RENDIMIENTO
Todos los derechos de propiedad intelectual de esta obra pertenecen en exclusiva a la Universidad Europea de Madrid, S.L.U. Queda terminantemente prohibida la reproducción, puesta a disposición del público
Tema 1. Introducción a la arquitectura de computadores: diseño, coste y rendimiento
Tema 1. Introducción a la arquitectura de computadores: diseño, coste y rendimiento Arquitectura de Computadores Curso 2009-2010 Transparencia: 2 / 32 Índice Relación de asignaturas del plan de estudios
Rendimientos y costes
Rendimientos y costes Curso 2011-2012 Qué es el Rendimiento? El Rendimiento es un parámetro que indica el nivel de computación de la máquina y la velocidad a la que produce los resultados. El Rendimiento
TEMA 1: EJECUCIÓN PARALELA: FUNDAMENTOS(I)
Grupo de Arquitectura de Computadores, Comunicaciones y Sistemas ARQUITECTURA DE COMPUTADORES II AUTORES: David Expósito Singh Florin Isaila Daniel Higuero Alonso-Mardones Javier García Blas Borja Bergua
Rendimiento John Hennessy David Patterson,
Rendimiento John Hennessy David Patterson, Arquitectura de Computadores Un enfoque cuantitativo 1a Edición, Capítulos 1 y 2 (3a y 4a Edición, Capítulo 1) Rendimiento Introducción Cómo comparar la performance
Organización del Computador I. Introducción e Historia
Organización del Computador I Introducción e Historia Introducción Qué es una computadora? Stallings: Máquina digital electrónica programable para el tratamiento automático de la información, capaz de
EVOLUCION PROCESADORES AMD (ADVANCED MICRO DEVICES)
EVOLUCION PROCESADORES AMD (ADVANCED MICRO DEVICES) AMD AM286 Es la copia del intel 80286, creado con permiso de intel. Por petición de IBM como segunda fuente, tienen arquitectura interna de 16 bits,
Arquitectura de computadoras y rendimiento de sistemas
Arquitectura de computadoras y rendimiento de sistemas Arquitectura de Computadoras I Prof. Marcelo Tosini Prof. Elías Todorovich 207 Arqui-UNICEN Introducción Qué se entiende por arquitectura de un computador?
Arquitectura del Computador. Programación 1 er semestre 2013
Arquitectura del Computador Programación 1 er semestre 2013 Introducción Qué es una computadora? Stallings: Máquina digital electrónica programable para el tratamiento automático de la información, capaz
Estructura de un Ordenador
Estructura de un Ordenador 1. Unidad Central de Proceso (CPU) 2. Memoria Principal 3. El Bus: La comunicación entre las distintas unidades 4. La unión de todos los elementos: la placa Base Estructura de
Tipos De Procesadores
Tipos De Procesadores Procesadores de INTEL 1971 Intel 4004 CPU de 4 bits. Fue el primer microprocesador de venta comercial. Frecuencia de reloj 740 KHz. 1972 Intel 8008 Pensado para el Datapoint 2200
Definición. Alternativamente. Speedup = Universidad de Sonora Arquitectura de Computadoras 2
Ley de Amdahl Definición Evalúa como cambia el rendimiento al r una parte de la computadora. Define el speedup (aceleración) que se puede alcanzar al usar cierta. Alternativamente Rendimiento al usar la
Instrucciones de máquina y tipos de software
(obsoletos) Instrucciones de máquina y tipos de software Software del sistema: Implementa sobre la máquina convencional («desnuda») una «máquina virtual»: la máquina operativa Software de aplicaciones:
2. UNION TEMPORAL SED INTERNACIONAL - HARDWARE ASESORIAS Y SOFTWARE. HP DX 5150 MINITORRE 1. DELL COLOMBIA INC.
3. EVALUACIÓN ESPECIFICACIONES TÉCNICAS 3.1. PC TIPO BASICO Marca, modelo, referencia Pentium IV 640 de 3.2 Ghz HT o superior TIPO BÁSICO Especificar, torre o minitorre o desktop con posibilidad de funcionar
Medidas de rendimiento
Todos los derechos de propiedad intelectual de esta obra pertenecen en exclusiva a la Universidad Europea de Madrid, S.L.U. Queda terminantemente prohibida la reproducción, puesta a disposición del público
Arquitectura de Computadores II Clase #11
Arquitectura de Computadores II Clase #11 Facultad de Ingeniería Universidad de la República Instituto de Computación Curso 2009 Veremos Rendimiento 1 Performance Medir, Reportar, y Sumarizar Tomar opciones
Conceptos y Estructuras de Sistemas Operativos
Conceptos y Estructuras de Sistemas Operativos Contenido del Curso Evaluación I ex. Parcial 100% prueba escrita II ex. Parcial 100% proyecto Examen final= Nota del proyecto (50%) + prueba escrita (50%)
Pruebas aplicaciones base (application based) las ejecuta y las cronometra.
Que es un benchmark? (Comparador de rendimiento) Un benchmark es un conjunto de procedimientos (programas de computación) para evaluar el rendimiento de un ordenador. Hay cuatro categorías generales de
Estructura de Computadores I
Estructura de Computadores I Profesores Patricia González Gómez (Coordinadora, Teoría) Despacho D 1.13 Extensión 1363 [email protected] Margarita Amor López (Problemas, Prácticas) Despacho D 1.15 Extensión
1. Partes del ordenador. Nuevas Tecnologías y Sociedad de la Información
1 1. Conceptos básicos 2 Qué hacen los ordenadores? Un ordenador trabaja únicamente con información. Cuatro funciones básicas: Recibe información (entrada). Procesa la información recibida. Almacena la
Tema 1. Introducción a la arquitectura de computadores: diseño, coste y rendimiento
Soluciones a los problemas impares Tema 1. Introducción a la arquitectura de computadores: diseño, coste y rendimiento Arquitectura de Computadores I Curso 2009-2010 Tema 1: Hoja: 2 / 18 Tema 1: Hoja:
FUNDAMENTOS DE COMPUTACION INVESTIGACION PROCESADORES DIANA CARRIÓN DEL VALLE DOCENTE: JOHANNA NAVARRO ESPINOSA TRIMESTRE II
FUNDAMENTOS DE COMPUTACION INVESTIGACION PROCESADORES DIANA CARRIÓN DEL VALLE DOCENTE: JOHANNA NAVARRO ESPINOSA TRIMESTRE II 2013 Características principales de la arquitectura del procesador AMD Phenom
Trabajo Práctico Número 1
Trabajo Práctico Número 1 Página 1 de 6 Arquitectura de Computadoras 18/03/2014 Instrucciones Los problemas de ejercitación propuestos en el presente trabajo práctico pueden ser resueltos en forma individual
ANALISIS COMPARATIVO DEL RENDIMIENTO. PUA: Vergara Bruno Benjamín 2011
ANALISIS COMPARATIVO DEL RENDIMIENTO PUA: Vergara Bruno Benjamín 2011 CONTENIDO Introducción Necesidad y Objetivos de la evaluación Técnicas de evaluación de un sistema informático Medidas del rendimiento
Métricas de Rendimiento
Métricas de Rendimiento DISEÑO DE SISTEMAS DIGITALES EL-3310 I SEMESTRE 2008 6. RENDIMIENTO DE SISTEMAS COMPUTACIONALES (1 SEMANA) 6.1 Definición de rendimiento en términos computacionales 6.2 Medición
Sistemas Operativos. Introducción. Tema 6
Sistemas Operativos Introducción Qué es un sistema operativo? Ubicación de un sistema operativo en un computador Descripción de un sistema operativo: Funcional Estructural Realización Funciones de los
Microprocesadores para comunicaciones. Escuela Técnica Superior de Ingenieros de Telecomunicación. Organización y estructura de las memorias caché
Microprocesadores para comunicaciones Escuela Técnica Superior de Ingenieros de Telecomunicación Organización y estructura de las memorias caché Índice Introducción Niveles de jerarquía de memoria Principio
PROCESADORES. Existen 3 tipos de procesadores: DE GALLETA, DE PINES Y DE CONTACTO. DE GALLETA: se utilizaban en las board en los años 80 y 90.
PROCESADORES TIPOS DE PROCESADORES. Existen 3 tipos de procesadores: DE GALLETA, DE PINES Y DE CONTACTO DE GALLETA: se utilizaban en las board en los años 80 y 90. DE PINES: reemplazaron los procesadores
Taller de la memoria RAM
Taller de la memoria RAM CONTESTE Que es la memoria RAM y su principal función 1. Para que sirven la memoria RAM, en que momento desaparece o se borra la información que hay guardada en ella. 2. De qué
Estructura de Computadores Tema 1. Introducción a los computadores
Estructura de Computadores Tema 1. Introducción a los computadores Departamento de Informática Grupo de Arquitectura de Computadores, Comunicaciones y Sistemas UNIVERSIDAD CARLOS III DE MADRID Contenido
Estructura Interna de La PC. 1. Microprocesadores 2. I/O ( Entrada / Salida) 3. Memoria
Estructura Interna de La PC 1. Microprocesadores 2. I/O ( Entrada / Salida) 3. Memoria Estructura Interna de La PC Estructura Interna de La PC Estructura Interna de La PC Estructura Interna de La PC Estructura
EVOLUCIÓN DE LOS PROCESADORES
EVOLUCIÓN DE LOS PROCESADORES Lecturas recomendadas: * Tanembaum, A. Organización de computadoras. Cap. 1 * Stallings, W. Organización y arquitectura de computadores. Cap. 2 Arquitectura de una computadora
Quinta tarea: Existen varias versiones del 80486:
Quinta tarea: Los primeros procesadores utilizados en los PC fueron los procesadores 8088 y 8086. Sus principales diferencias con el 80286 es que el segundo permite multitarea, tenía una velocidad de reloj
Transcodificación de video de hasta. 2,3 veces
MEGATAREAS AL EXTREMO Edite videos 4K, renderice efectos 3D y componga bandas sonoras simultáneamente sin comprometer el desempeño del sistema Edición de video 4k hasta 2,4 veces más rápido¹ con Adobe*
Arquitectura de Computadores II Clase #9
Arquitectura de Computadores II Clase #9 Facultad de Ingeniería Universidad de la República Instituto de Computación Curso 2010 Veremos Rendimiento Rendimiento (Performance) Ver a través de la niebla del
Arquitectura de Computadoras Trabajo Práctico N 8 Pipeline de Instrucciones 1 Primer Cuatrimestre de 2016
Departamento de Cs. e Ingeniería de la Computación Universidad Nacional del Sur Ejercicios Arquitectura de Computadoras Trabajo Práctico N 8 Pipeline de Instrucciones 1 Primer Cuatrimestre de 2016 1. La
MODULO DE MEMORIA RAM. Ing. Raúl Rojas Reátegui
MODULO DE MEMORIA RAM Ing. Raúl Rojas Reátegui OBJETIVOS Al termino de la sesión el estudiante será capaz de: Describir las principales chips de memoria RAM. Describir las principales de los módulos de
1. La importancia de la Informática
Introducción Contenidos 1. La importancia de la informática 2. Conceptos básicos y definiciones 3. Unidades de medida de la información 4. Componentes físicos y lógicos del ordenador 5. Evolución de los
1. Necesidades del comprador: COMPUTADOR PERSONAL Y DE OFICINA PROCESADORES, MEMORIAS RAM, ROM, DISCO DURO, CACHÉ, TARJETAS, IMPRESORAS
1. Necesidades del comprador: COMPUTADOR PERSONAL Y DE OFICINA PROCESADORES, MEMORIAS RAM, ROM, DISCO DURO, CACHÉ, TARJETAS, IMPRESORAS 2. CLON O COMPUTADOR DE MARCA? REQUERIMIENTOS: Procesador Memorias
UNIDAD CENTRAL DE PROCESO
UNIDAD CENTRAL DE PROCESO NO SON CPU, SON CASES COMPONENTES DE UN SISTEMA DE CÓMPUTOS DISPOSITIVOS DE ALMACENAMIENTO Disco Rígido, Disquete, CD, DVD DISPOSITIVOS DE ENTRADA Teclado Mouse Micrófono Cámara
Arquitectura de Computadoras Trabajo Práctico N 7 Pipeline de Instrucciones Primer Cuatrimestre de 2010
Departamento de Cs. e Ingeniería de la Computación Universidad Nacional del Sur Ejercicios Arquitectura de Computadoras Trabajo Práctico N 7 Pipeline de Instrucciones Primer Cuatrimestre de 2010 1. La
Estructura y Tecnología de Computadores. Tema 3. Introducción a la estructura de computadores
1 Estructura y Tecnología de Computadores Módulo B. Introducción a la estructura de computadores Tema 3. Introducción a la estructura de computadores José Manuel Mendías Cuadros Dpto.. Arquitectura de
TEMA 1: Concepto de ordenador
TEMA 1: Concepto de ordenador 1.1 Introducción Los ordenadores necesitan para su funcionamiento programas. Sin un programa un ordenador es completamente inútil. Para escribir estos programas necesitamos
Modelos de computadores paralelos
Modelos de computadores paralelos Domingo Giménez Departamento de Informática y Sistemas Universidad de Murcia, Spain dis.um.es/~domingo Universidad de Murcia 1 Contenido Programación paralela Modelos
ANEXO II RECOMENDACIONES APLICABLES A LA CONTRATACIÓN DE EQUIPOS INFORMÁTICOS ÍNDICE
MINISTERIO DE ADMINISTRACIONES PÚBLICAS SECRETARIA GENERAL PARA LA ADMINISTRACIÓN PÚBLICA DIRECCIÓN GENERAL DE MODERNIZACIÓN ADMINISTRATIVA ANEXO II RECOMENDACIONES APLICABLES A LA CONTRATACIÓN DE EQUIPOS
MICROPROCESADORES Y CHIPSETS DE INTEL Mayo de 1999
MICROPROCESADORES Y CHIPSETS DE INTEL Mayo de 1999 En este curso se pretende ofrecer una información de primera mano lo más actualizada posible acerca de los nuevos microprocesadores de Intel recientemente
0.Principios del Microprocesador
There are no translations available. La revolución tecnológica en integración de componentes ha llegado a extremos insospechados, un ejemplo los procesadores Dual Core.. PROCESADORES DE DOBLE NÚCLEO ÍNDICE
POWER PC. Indice ARQUITECTURA DE COMPUTADORES. Antonio del Amo Ruiz. 1. Introducción. 2. Tecnología RISC. 3. Arquitectura de la CPU Power PC
ARQUITECTURA DE COMPUTADORES POWER PC Antonio del Amo Ruiz 1. Introducción 2. Tecnología RISC Indice 3. Arquitectura de la CPU Power PC 4. Modelos del Power PC 5. Comparación entre Power PC, Pentium y
Medición de Performance. Organización del Computador 1 Verano 2016
Medición de Performance Organización del Computador 1 Verano 2016 Qué es el rendimiento? Cuál de estos aviones tiene mejor rendimiento? El que tiene mayor autonomía, o el más rápido? El más rápido o el
Diseño de la jerarquía de memoria
Diseño de la jerarquía de memoria William Stallings, Organización y Arquitectura de Computadores Andrew S. Tanenbaum, Organización de Computadoras Linda Null y Julia Lobur, Computer Organization and Architecture
PORTAFOLIO DE PRODUCTOS
PORTAFOLIO DE PRODUCTOS Servidores Dell Productos Prodiojjsld destinados para Pequeñas y medianas Empresas que hacen uso Intensivo de la información, local Y centrados en la web. Enfrentarse a los desafíos
Definición de prestaciones
Definición de prestaciones En términos de velocidad. Diferentes puntos de vista: Tiempo de ejecución. Productividad (throughput) Medidas utilizadas En función de la duración del ciclo de reloj y del número
Computadores para bases de datos.
Computadores para bases de datos. Área: INFORMÁTICA Y COMUNICACIONES Modalidad: Teleformación Duración: 60 h Precio: 30.00 Curso Bonificable Solicita información Añade al archivador Recomienda a un amigo
Trabajo Práctico Número 6
Página 1 de 6 Trabajo Práctico Número 6 Arquitectura de Computadoras 24/05/2014 Instrucciones Los problemas de ejercitación propuestos en el presente trabajo práctico pueden ser resueltos en forma individual
Debian GNU/Linux. Debian, integra exclusivamente Software Libre.
Agenda Debian GNU/Linux Características de Debian GNU/Linux Versiones Debian GNU/Linux Manejo de paquetería Debian GNU/Linux Dispositivos de almacenamiento - Particionamiento Proceso de instalación Debian
Tema 5 Jerarquía de Memoria
Tema 5 Jerarquía de Memoria Grupo ARCOS Estructura de Computadores Grado en Ingeniería Informática Universidad Carlos III de Madrid Contenidos 1. Tipos de memoria 2. Jerarquía de memoria 3. Memoria principal
Lección 2. El Rendimiento en las Computadoras
Lección 2 El Rendimiento en las Computadoras INDICE: LECCIÓN II 2.1- Introducción......2 2.2- Rendimiento en los computadores...2 2.3.- Comparación del rendimiento... 2.4- Unidades de medida del rendimiento
CUESTIONARIO TEMA 2 UNIDADES FUNCIONALES.
ACTIVIDADES TEMA 2 2.- BUSCA EN INTERNET LOS FABRICANTES MAS COMUNES DE PROCESADORES Y AVERIGUA LOS MODELOS QUE MAS SE VENDEN ACTUALMENTE. 3.- DE LOS DIFERENTES PERIFERICOS DE SALIDA BUSCA INFORMACIÓN
TEMA 10 INTRODUCCIÓN A LOS SISTEMAS OPERATIVOS DISTRIBUIDOS. Introducción Hardware Software Aspectos de diseño
TEMA 10 INTRODUCCIÓN A LOS SISTEMAS OPERATIVOS DISTRIBUIDOS Introducción Hardware Software Aspectos de diseño 1 Introducción Aparecen en los 80 Desarrollo de Microprocesadores LAN Sistemas Distribuidos:
Tema: Componentes físicos de un ordenador. Dónde se lleva a cabo el procesamiento de los datos en un ordenador? Qué unidades conforman el procesador?
Tema: Componentes físicos de un ordenador (II) Recordando Dónde se lleva a cabo el procesamiento de los datos en un ordenador? En la Unidad Central de Procesamiento (CPU) Qué unidades conforman el procesador?
Organización del Computador 1. Introducción
Organización del Computador 1 Introducción Verano - 2016 Quiénes somos? Clases Teóricas Dr. Juan Pablo Galeotti Ingeniería del Software www.dc.uba.ar/~jgaleotti Dr. Diego Fernández Slezak Inteligencia
TEMA 9. SISTEMAS OPERATIVOS DISTRIBUIDOS
TEMA 9. SISTEMAS OPERATIVOS DISTRIBUIDOS Introducción Hardware Software Aspectos de diseño 1 Introducción Aparecen en los 80 Desarrollo de Microprocesadores LAN Sistemas Distribuidos: Gran nº de procesadores
Introducción TEMA 1 TECNOLOGÍA DE LOS CI. ME Tema 1 Aspectos generales sobre diseño microelectrónico 1
Introducción TEMA 1 TECNOLOGÍA DE LOS CI ME Tema 1 Aspectos generales sobre diseño microelectrónico 1 ÍNDICE TEMA 1 ASPECTOS GENERALES SOBRE DISEÑO MICROELECTRONICO Evolución del diseño electrónico Proceso
ITT-327-T Microprocesadores
ITT-327-T Microprocesadores Introducción al Microprocesador y al Microcomputador. al Microcomputador. Profesor Julio Ferreira. Sistema Microcomputador. Un Sistema Microcomputador tiene dos componentes
Introducción a las Computadoras
Introducción a las Computadoras Coordinación de Computación I, Intensiva ITAM Conceptos Fundamentales Qué es una computadora? Conceptos Fundamentales La computadora como parte de un sistema de cómputo:
Iniciación a la informática
Iniciación a la informática Nociones básicas sobre el uso de ordenadores El ordenador. Qué es el ordenador? Maquina capaz de procesar información, capaz de realizar multitud de operaciones distintas La
Contenidos del Curso. Arquitectura de Computadores. Organización de un Sistema computacional
Arquitectura de Computadores Cecilia Hernández Contenidos del Curso Introducción Arquitectura de conjunto de instrucciones y programación assembly Arquitectura y organización de procesadores Sistemas de
DEFINICIONES BÁSICAS. Información obtenida de: PRIETO ESPINOSA, Alberto Introducción a la Informática: Madrid: McGrawHill, D.
DEFINICIONES BÁSICAS. UNIDADES FUNCIONALES. Información obtenida de: PRIETO ESPINOSA, Alberto Introducción a la Informática: Madrid: McGrawHill, D.L 2001 INFORMACIÓN CODIFICADA Bit: Binary digit Byte:
HP Operations Orchestration
HP Operations Orchestration Para Sistemas operativos Windows y Linux Versión de software: 10.01 Requisitos del sistema Fecha de publicación del documento: Agosto de 2013 Fecha de lanzamiento del software:
Práctica de laboratorio: Armado de un sistema informático especializado
Práctica de laboratorio: Armado de un sistema informático especializado Utilice Internet, un periódico o una tienda local para obtener información sobre el armado de un sistema informático especializado
