Índice de contenidos [25 diapositivas] 1. La saga DDR [6] 2. Memorias DDR4 [4] 3. Consejos de compra [6] 4. Directrices de montaje [4] 5. Etiquetado [5] La memoria del PC Manuel Ujaldón Martínez Dpto. Arquitectura de Computadores Universidad de Málaga Comparativa frente a otras tecnologías de almacenamiento de datos 1. La saga DDR Precio medio aproximado Uso en el PC Latencia DRAM (celdas de memoria dinámica) Módulos de memoria principal 5-10 microsegs. Flash (no volátil) BIOS y pendrives (almacenamiento a pequeña escala) 25-50 microsegs. 15 MB/sg. 1 / Gigabyte Almacenamiento masivo sin componentes móviles 25-50 microsegs. 500 MB/sg. 0.5 / Gigabyte SSD (disco de estado sólido) HD (disco duro) 3 Ancho de banda Tipo de memoria 25000 MB/sg. 10 / Gigabyte Almacenamiento en 5-10 milisegs. cilindros accesibles (5.5 msg. @ 5400 RPM) 250 MB/sg. mediante cabezales (3 msg. @ 10000 RPM) 0.05 / Gbyte 4
Típico sistema DRAM conformado con 4 módulos de memoria DDR3 Zócalos: Zócalo para los procesadores (CPU + GPU) 3,2,1,0 4 zócalos para módulos DDR3 4 zócalos para módulos DDR3 Cómo funciona el sistema de memoria DDR# 4,5,6,7 Un ejemplo: La placa base Asus Rampage IV Extreme. CPU 8 zócalos de memoria DDR3. Configuración quad-channel. Dos bancos independientes. Los módulos deben llenar todos los zócalos del mismo color. Cores 50 GB/s. 4 canales de 64 bits @ 2 GHz Memoria caché (SRAM) GPU many-core (256 bits = 32 bytes) 64 GB/s. 512 bits @ 3 GHz Banco 0 (obligatorio): Zócalo 0 + zócalo 2 + zócalo 4 + zócalo 6 = 256 bits de anchura. Banco 1 (opcional): Zócalo 1 + zócalo 3 + zócalo 5 + zócalo 7 = 256 bits de anchura. Utilizar el banco 1 nos permite: - Adquirir un sistema de memoria que no sea potencia de 2 (ej: 8 GB + 4 GB = 12 GB). - Hacer de cortafuegos en caso de avería. - Ampliar memoria el día de mañana si lo dejamos inicialmente vacío. Memoria del sistema (DDR3) 192 GB/s. Memoria de vídeo (GDDR5) PCI-e 3.0: 8 GB/s. Pero con la memoria 3D diremos adiós a toda esta modularidad en favor de la velocidad, como ya sucede con el sistema de memoria de la GPU. Nos centramos pues en el banco 0. 5 Funcionamiento de la saga de memoria DDR para servir una línea de caché de 128 bytes Evolución y catálogo comercial Año Tipo de Latencia CAS Frecuencia memoria (en CL) 1998 SDRAM-100 100 MHz 2 Latencia CAS (en ns.) Ancho de banda del módulo (MB/s.) 2 ciclos de 10 ns. = 20 ns. 800 2002 DDR-200 2x 100 MHz 2 2 ciclos de 10 ns. = 20 ns. 1600 2005 DDR2-400 2x 200 MHz 4 4 ciclos de 5 ns. = 20 ns. 3200 2008 DDR3-800 2x 400 MHz 8 8 ciclos de 2.5 ns. = 20 ns. 6400 0ns. Bus de dirs. Fila Col. Bus de control ACTIVE READ Bus de datos 40 ns. 60 ns. 80 ns. 100 ns. RCD=2 RCD=2 8528 9 x (1/666MHz) = 13.50 ns. 10664 11 x (1/800MHz) = 13.75 ns. 12800 140 ns. 160 ns. 180 ns. 200 ns. (longitud de la ráfaga: 16 palabras de 8 bytes para completar la línea de caché de 128 bytes) CL=2 CL=2 RCD=2 CL=2 200 MHz SDRAM-100, CL=2 (1998) t = 200 ns. peso de la latencia: 20% DDR-200, CL=2 t = 120 ns. peso de la latencia: 33% DDR-200, CL=2, arq. de doble canal de memoria (dual-channel) t = 80 ns. peso de la La memoria más popular en 2015 es latencia: 50% la DDR3-1600 con RCD=11 y CL=11. Estas dos latencias suman 27.5 ns. del total de 30 ns., superando ya el 91.6%. A. banda (MB/s.) 7 x (1/533MHz)=13.13 ns. 120 ns. Tclk = 10 ns. En 10 años no se ha podido bajar la latencia de la saga DDR. Y últimamente incluso vamos a peor: Latencia CAS (en ns.) 20 ns. 100 MHz 7 RCD=4 CL=4 RCD=4 CL=4 RCD=8 CL=8 DDR2-400, CL=4, dual-channel t = 60 ns. peso de la latencia: 66% Y llevamos más de 15 años esperando una oportunidad como TSVs en 3D para poder mejorarla. DDR2-400, CL=4, quad-channel t = 50 ns. Peso de la latencia: 80% DDR3-800, CL=8, quad-channel t = 45 ns. Peso de la latencia: 89% 8
La capacidad (GB.) y sobre todo el interfaz (DDR#) perjudican a la latencia Baja la latencia dentro de DDR3 aunque aumente la capacidad. Cuando mejora DDR#, NO baja la latencia. [1998] SDRAM 100 MHz. CL=2. 128 MB. (un solo canal de memoria principal) 2. Memorias DDR4 20% del total [2002] DDR 200 MHz. CL=2. 512 MB. (un canal) 33% del total [2002] DDR 200 MHz. CL=2. 512 MB. (2 canales) 50% del total [2005] DDR2 400 MHz. CL=4. 1 GB. (2 canales) 66% del total 40 + 20 = 60 ns. [2005] DDR2 400 MHz. CL=4. 1 GB. (4 canales) 80% del total 40 + 10 = 50 ns. [2008] DDR3 800 MHz. CL=8. 2 GB. (4 canales) 89% del total 40 + 5 = 45 ns. [2011] DDR3 1333 MHz. CL=9. 4 GB. (4 canales) 90% del total 27 + 3 = 30 ns. [2014] DDR3 1600 MHz. CL=11. 8 GB. (4 canales) 91.66% del total 27.5 + 2.5 = 30 ns. Si la latencia baja históricamente 2x/década. Por qué no lo hace aquí? Porque "cuanto más grande, más lento". Pero... qué hace al chip de memoria más grande? Hay una respuesta lógica (# GB.) y otra tapada (DDR#). 10 9 Comparativa en ancho de banda con sus antecesoras en la saga DDR Incremento lineal de la frecuencia en la familia DDR DDR3 2014 2015 2016? 11 12
Más velocidad a menos voltaje s técnicos y comparativa frente a DDR3 Capacidad del chip Capacidad del módulo Frecuencia Voltaje nominal Número de bancos Tamaño de la fila (página) Encapsulado de los chips Contactos del módulo DIMM Contactos del módulo SO-DIMM DDR3 DDR4 De 512 Mbits a 8 Gbits De 4 a 16 Gbits 1, 2, 4, 8, 16, 32 y 64 Gbytes 8, 16, 32, 64 y 256 Gbytes Desde 2x400 MHz hasta 2x1066 MHz Desde 2x800 MHz hasta 2x1600 MHz 1.5 voltios 1.2 voltios 8 16 (4 grupos de 4) 1 Kbyte (para x4), 1 Kbyte (para x8), 2 Kbyte (para x16) 512 bytes (para x4), 1 Kbyte (para x8), 2 Kbytes (para x16) BGA de entre 78 y 96 pines según anchura (entre x4 y x16) 240 (al igual que DDR2) 288 204 260 13 14 Ejemplo de catálogo comercial de Kingston: Comparativa vs. DDR3 y diferencia de precio 3. Consejos de compra Precio en Septiembre de 2015: 15 Precio en Sept. de 2016: 16
La compra maestra en 2016 (sobre algunos ejemplos de Kingston) Ventajas adicionales de partir los módulos de memoria No compensa No compensa 834 290 290 105 105 No compensa Para una misma capacidad, compensa aumentar velocidad Para una misma velocidad, compensa duplicar capacidad mientras los tamaños sean populares 8 GB: 60 Sí compensa 4 GB: 35 17 Mayor fiabilidad. La tasa de errores crece de forma alarmante con el tamaño, con lo que 4 módulos de 2 Gbytes se estropean con menor probabilidad que uno sólo de 8 Gbytes. Menor riesgo de perderlo todo. La compra por partes ejerce de cortafuegos. Si se quema un chip, quedan inservibles todos los chips del módulo, pero se salvan el resto de módulos, por lo que con 4 módulos de 2 Gbytes logramos salvar 6 Gbytes. Mayor versatilidad: Podemos usar 4 Gbytes en un equipo y otros 4 Gbytes en otro. O poner a la venta 2, 4 ó 6 Gbytes en ebay. 18 Peculiaridades en el precio de la memoria principal La elección de 2017 Oferta/demanda: Las ventas tiran para abajo de los precios mucho más que el coste de la tecnología que usan. Por eso, memorias más viejas suelen ser más caras, y las que son muy nuevas, también. Corolario: Suscribir módulos en un punto dulce de popularidad y/o ventas. Mala escalabilidad: Para alta capacidad, el doble de Gbytes cuestan más del doble en euros, y además el sistema es menos fiable y versátil. 19 20
Frecuencias y latencias van contrapuestas 4. Directrices de montaje 22 21 Información de montaje y ensamblaje: Croquis del chip DDR4 Croquis del módulo DDR4 (unidades en milímetros) Envés: Revés: 23 24
Croquis del módulo DDR4 para portátiles (SO-DIMM) Cómo diferenciar un módulo DDR4 de otro DDR3 La muesca central del módulo DDR4 que se alinea con el zócalo de la placa base se desplaza un poco respecto a la DDR3. Los módulos DDR4 son más gruesos para poder acomodar más capas de pistas en la placa de circuito impreso. 25 26 Ejemplo 1: Identificando prestaciones a través del etiquetado. DDR3 y 2 en Kingston. 5. Etiquetado 27 28
Ejemplo 1: Kingston. Conociendo más a través de Google Ejemplo 2: DDR4 en Samsung (chips a la izquierda, módulos a la derecha) 29 Etiquetado de un módulo DDR4 (según el estándar JEDEC) 30 Ejemplo 3: DDR4 en Samsung (para chips de memoria de vídeo) 31 32