Fundamentos del hardware Microprocesadores Actuales. José Domingo Muñoz Rafael Luengo Lorenzo Pérez Bueno Noviembre 2013
Técnicas de mejora de rendimiento Paralelismo (I) Hoy día los procesadores llevan varios núcleos de proceso (Core) en el mismo encapsulado (en un sólo zócalo) mejorando la multitarea. Multi-Tarea (Multi-Task). Habilidad del micro para simular que realizan varias tareas a la vez. Multi-Hilo (Multi-Threading). El trabajo de un programa (proceso), se divide en varios sub-trabajos para poder ejecutarse en núcleos o procesadores diferentes. Hyper-Hilo (Hyper-Threading). Como Multi-Hilo. Solo que un mismo núcleo puede procesar varios sub-programas
Técnicas de mejora de rendimiento Paralelismo (II) Hyper-Threading (Es una patente de INTEL) Simula dos núcleos lógicos por cada uno físico. No se consigue el 100% de rendimiento (solo tenemos un micro) pero se consiguen mejoras de 20% a 30%. Activando Hyper-Threading (normalmente por BIOS). Nuestro equipo y su Sistema Operativo, verán dos procesadores (lógicos) cuando realmente tenemos uno (físico). AMD lo soluciona montando realmente dos núcleos físicos. Al ocupar mayor espacio, se ve obligada a quitar una de las FPU de uno núcleos dejando la FPU del otro compartida.
Técnicas de mejora de rendimiento Procesadores de varios núcleos. INTEL PENRYN 2 Dual Core unidos AMD K10 (BARCELONA) para crear un Quad. Más cache de 2º nivel Mayor compatibilidad con SSE4. Frecuencias más elevadas. Ofrece mayor rendimiento... 4 núcleos diferenciados (Quad nativos). Cache L3 compartida que produce algo de latencia, aumentando los tiempos de respuesta.
Técnicas de mejora de rendimiento Turbo Boost (Intel) / Turbo Core (AMD). Permite aumentar la frecuencia de funcionamiento del micro automáticamente, en determinadas circunstancias. Consecuencia: se desprende más calor. Factores de Activación Cuando hay pocos núcleos activos La mayor parte del tiempo solo están funcionando 1 o 2 núcleos. Consumo estimado de Corriente/ Temperatura /Energía. Analizando varios parámetros deducir si seguirán bajo un limite máximo. http://computadoras.about.com/od/preguntas-frecuentes-elegir-pc/a/que-es-amd-turbo-core.htm
Hoy día en el mercado de micros, AMD no puede competir en potencia con los micros de Intel. Se está centrando en la procesamiento gráfico donde es puntera y ofrecernos una buena solución de microprocesadores a un precio más económico. AMD FX8150 (32nm) 8 Núcleos 3,6-4,7 Ghz Cache: L1 128+256 KB - L2 1 MB - L3 8 MB Bus Sistema 5,2 Ghz 157,90 Intel i7 3970X (32nm) 6 Núcleos 3,5 4 Ghz Cache: L1 32 KB+32 KB - L2 256 KB - L3 15 MB Bus Sistema 3,2 Ghz (6,4 GT/s) 889
Lanzó 3 Lineas de producción de micros para competir con la arquitectura Sandy Bridge de Intel: Bobcat. Para equipos pequeños: smatphone, netbooks.. (eficientes energéticamente). Llano. Para portátiles de uso normal. Bulldozer. Ordenadores de alta gama y servidores. Al no tener el rendimiento esperado, mejoran su arquitectura: - Piledriver. Mejora su frecuencia de funcionamiento, su Tarjeta Gráfica integrada en placa, su juego de instrucciones (AVX,SSE + FMA3) y cantidad memoria cache (8MB). - Trinity. PC y portátiles Bulldozer + Tecn. Fusión
APU (Unidad Acelerada de Proceso). El desarrollo de las tecnologías de fabricación, aumento de núcleos de CPU, hacen que funcionalidades del Puente Norte se incorporen al micro: Controladores de memoria, Entrada/Salida, instrucciones... Ventajas Reducir el tamaño. Mejorar la velocidad de comunicación. Reducir el consumo energético. APU AMD Fusión. Fusiona el microprocesador con la tarjeta Gráfica y el Puente Norte dentro de una misma pastilla. Su consumo se reduce de 46w a 18w.
AMD SERVER Opteron Serie 6000 Incluye 8, 12 y 16 núcleos. CMI mejorado. Soporta: Quad Channel DDR3-1866 (hasta 29,9 GB/s Ancho de Banda) Chipset AMD Serie 5600 Capacidad I/O de virtualización, Hypertransport 3.0 (hasta 16 GB/s Ancho de Banda) y PCI Express 2.0.
4 núcleos 6 núcleos
Ofrece una gran variedad de microprocesadores organizados por familias. Desde los más simples en prestaciones como los Celeron, seguidos de los pentium hasta llegar a los Intel Core: i3, i5 y i7. Micros de varios núcleos Origen: Tecnología encuentra límites para superar los 4GHz (Pentium D) con un solo microprocesador. Desarrollo de las técnicas de reducción e integración de componentes. Se inicia el desarrollo capacidad de procesamiento en paralelo de varias tareas a través de arquitecturas multi-núcleo dentro de un mismo chip.
FUTURO: Tecnología de innovación ( tick tock ) Funciona en dos fases. 1º Fase tick. Se mejora la tecnología de fabricación, añadiendo más elementos dentro del mismo espacio. 2º Fase tock Se mejora el rendimiento, remodelando y depurando la arquitectura.
Intel Core (evolución de los Intel Core 2 Duo): i3, i5, i7 (K, S, T) 1º Gen. (65 45) nm Lynnfield Es cr it or io S er vi do r i3 i5 4 núcleos 45nm TDP: 95W 82W Turbo - Bus I/O DMI L2 4x256 KB/ L3 8MB GPU 733 Mhz 2º Gen. (ix-2xxx) 3º Gen. (ix-3xxx) 4º Gen. (ix-4xxx) Clarkdale Sandy Bridge Ivy Bridge Hanswell 2 núcleos 32nm TDP: 73W Bus I/O DMI L2 2x256 KB/ L3 4MB GPU 733 Mhz 2 núcleos 32nm TDP: 65W - 35W Bus I/O DMI 2.0 L2 2x256 KB/ L3 3MB GPU HD 2000 Mhz 2 núcleos 22nm TDP: 55W - 35W Bus I/O DMI 2.0 L2 2x256 KB/ L3 3MB GPU HD 2500 Mhz 2 núcleos 22nm TDP: 54W 35W - 35W Bus I/O DMI 2.0 L2 2x256 KB/ L3 4MB GPU HD 4600 Mhz 2 núcleos 32nm TDP: 73W 82W Turbo - Bus I/O DMI L2 2x256 KB/ L3 4MB GPU 733 Mhz (*) 4 núcleos 32nm TDP: 95W - 65W - 45W (*) 4 núcleos 22nm TDP: 77W - 65W - 45W (*) 4 núcleos 22nm TDP: 84W - 65W - 45W Turbo - Bus I/O DMI 2.0 Turbo - Bus I/O DMI 2.0 L2 4x256 KB/ L3 6MB GPU HD 2000 Mhz L2 4x256 KB/ L3 6MB GPU HD 2500 Mhz Turbo - Bus I/O DMI 2.0 L2 4x256 KB/ L3 6MB GPU HD 4600 Mhz Gladden I3 2 núcleos 22nm TDP: 25W Bus I/O DMI 2.0 L2 2x256 KB/ L3 3MB ECC memory 2 núcleos 22nm TDP: 25W Bus I/O DMI 2.0 L2 2x256 KB/ L3 4MB ECC memory (*) Hay versiones de 2 núcleos. I3 Todos soportan : MMX, SSE/2/3, SSSE3, SSE4.1/2, (AVX: Sandy, Ivy), (AVX2, FMA3: Hanswell) Intel 64, Intel VT-x, Hyper-Threading, Smart Cache. 'K = Están pensados para hacer overclocking. S = Procesadores Life Style. (para usuarios poco exigentes). T = Para modelos de bajo consumo.
Intel Core (evolución de los Intel Core 2 Duo): i3, 15, i7 (K, S, T, X) i7 1º Gen. (65 45) nm Nehalem Es cr it or io Westmere 4 núcleos 45nm TDP: 130W Bus I/O: QPI 1x 4,8 GT/s 6 núcleos 32nm TDP: 130W- 130W Bus I/O: QPI 1x 6,48 GT/s L2 4x256 KB/ L3 8MB L2 6x256 KB/ L3 12MB E 2º Gen. (ix-2xx) 3º Gen. (ix-3xx) 4º Gen. (ix-4xx) Sandy Bridge Ivy Bridge Hanswell 4 núcleos 32nm TDP: 95W - 65W Bus I/O DMI 2.0 L2 2x256 KB/ L3 8MB GPU HD 2000 Mhz 4 núcleos 22nm TDP: 77W - 65W - 45W Bus I/O DMI 2.0 L2 4x256 KB/ L3 8MB GPU HD 4000 Mhz (*) 6 núcleos 32nm TDP: 130W - 150W (*) 6 núcleos 22nm TDP: 130W - 130W (*) 4 núcleos 22nm TDP: 84W - 65W - 45W Turbo - Bus I/O DMI 2.0 Turbo - Bus I/O DMI 2.0 Turbo - Bus I/O DMI 2.0 L2 6x256 KB/ L3 12MB - 15MB L2 6x256 KB/ L3 12MB - 15MB 4 núcleos 22nm TDP: 84W 65W - 45W Bus I/O DMI 2.0 L2 4x256 KB/ L3 8MB GPU HD 4600 Mhz L2 4x256 KB/ L3 6MB GPU HD 4600 Mhz 'K = Están pensados para hacer overclocking. S = Procesadores Life Style. (para usuarios poco exigentes). T = Para modelos de bajo consumo. 'X' = Para Notebook. (*) Hay versiones de 4 núcleos. Todos soportan : MMX, SSE/2/3, SSSE3, SSE4.1/2, (AVX: Sandy, Ivy), (AVX2, FMA3: Hanswell) Intel 64, Intel VT-x, Hyper-threading, Turbo Boost, Smart Cache.
Analisis i7 (Intel) Desaparición FSB. Sustituido por un bus punto a punto QPI (Quick Path Interconnect): Ancho de banda 25.6 GB/s (bidireccional) y 3,2 Ghz. Controlador de Memoria Integrado (en el procesador). Como AMD, Intel lo elimina del chipset y lo instalarla en el propio procesador, aumentando el rendimiento de sus procesadores. Implementan memorias de triple canal y cuatro canales que aumentan el ancho de banda disponible en el sistema. Pero curiosamente, parece ser más eficiente el doble (aunque ésto podría ser debido más a que las Bios de las nuevas placas base están todavía muy verdes). Quad/Octo Core nativo Los Core2 Quad que se comunican entre si a través de un canal externo (FSB). El Core i7, puede comunicar sus cuatro núcleos entre sí sin tener que depender de un canal externo.
Analisis i7 (Intel) Disminución de las caché L1 permanece intacta: 32KB + 32KB L2 desciende a 256 kb (pero más rápida) L3 de 8/12/15 MB (más rápida) Nuevos Zócalos. La inclusión nuevos elementos en el micro hace necesarios bastantes más contactos, de los 775, 1366, 1150, 2011 pines y para el núcleo. Nuevos Set de Instrucciones SSE4.1/2, (AVX: Sandy, Ivy), (AVX2, FMA3: Hanswell) incorporan nuevas instrucciones para el tratamiento multimedia, Representación 3d y procesos de encriptación/ desencriptación.
Analisis i7 (Intel) Nuevo Chipset X58 El controlador de memoria deja de estar en el chipset, y cambia de nombre: MCH (Memory Controller Hub) I/O Hub (Input/Output Hub). El X58 se encargará principalmente del control de los PCIe de la placa base. Se mantiene el Southbridge: ICH10
Haswell (Intel Core de 4º Generación ix-4xxx) Toda una gama de micros desde Smartphone hasta servidores: - DT (Pcs) - E (Gama alta 140W) - ULT (Ultrabooks.- Equipos con la mayor parte de componentes integrados en micro y bajo consumo 15W). - EP (Servidores) - ULX (Equipos de bajo consumo 10W) Características Tecnología de 22 nm. Menor consumo en Standby Tarjeta Gráfica Integrada 2x Nuevos juegos de instrucciones AVX2 y FMA3 (gráficos y video) + TSX para procesamiento en paralelo. Soporte para memoria DDR4. Aumento de memoria caché.
http://ark.intel.com/eses
http://products.amd.com/es -la/