La caché L3 está de moda. Este componente ha permitido a AMD crear los procesadores con mejor rendimiento en juegos que existen ahora mismo, y ha demostrado que es tan importante en este tipo de aplicaciones que puede hacer que un procesador con menos núcleos y menos frecuencia venza a otro con más núcleos, mayor frecuencia y un precio mucho más elevado.
Aunque hoy hablamos de la caché L3 con total normalidad, lo cierto es que este tipo de memoria no siempre estuvo disponible en el mundillo tecnológico. El primer procesador que integró este tipo de memoria fue el Pentium 4 Extreme Edition, lanzado en 2003, un modelo que contaba con una caché L3 de 2 MB.
Intel fue la gran pionera en el uso de este tipo de caché, y también fue la que apostó por ella con más fuerza en su primera etapa. Los procesadores Core i7 de Intel (Nehalem) fueron los primeros chips de la compañía en contar con una caché L3 compartida por todos los núcleos, que comunicaban con ella a través de un sistema Ringbus, un diseño que Intel ha seguido utilizando durante muchos años.
Con los Intel Core i7 de primera generación la cantidad de caché L3 pasó de esos 2 MB a 8 MB, y el Intel Core i9 980X Extreme Edition fue el primero en alcanzar los 12 MB de L3.
Qué es la caché L3: una explicación detallada
La caché L3 es un tipo de memoria rápida y de baja latencia que sirve de apoyo a procesadores y también a GPUs (unidades de procesamiento gráfico).
Su nacimiento se produjo por la necesidad de aumentar la caché disponible en procesadores de alto rendimiento, y fue la respuesta a los problemas que encontraban los ingenieros a la hora de aumentar la caché L2.
Para entender mejor el papel de la caché L3 debemos ponerla en contexto con el resto de tipos de memoria caché:
Caché L1: es exclusiva de cada núcleo, tiene una capacidad muy baja, una latencia mínima y una gran velocidad.
Caché L2: también es exclusiva de cada núcleo, pero tiene una capacidad mayor que la anterior. Su latencia también es mayor, y es más lenta que la caché L1.
Caché L3: esta memoria es compartida, lo que significa que los distintos núcleos de la CPU, o los shaders de la GPU, pueden acceder a ella. Se puede implementar en grandes cantidades, pero es más lenta y tiene mayor latencia que la caché L2.
A diferencia de la memoria RAM, que se conecta en ranuras dedicadas de la placa base y es un componente independiente, la caché L3 se puede integrar de tres formas diferentes:
En la misma pastilla de silicio que la CPU o la GPU, creando un diseño monolítico.
En un chiplet conectado con la CPU o la GPU, creando un diseño modular o multichiplet.
Apilada en vertical sobre la CPU, algo que AMD ha implementado con su tecnología X3D.
Qué ventajas ofrece la caché L3 frente a la caché L2
Tenemos dos grandes ventajas que son muy importantes, y que nos permiten entender por qué es tan importante. La primera ventaja es su capacidad, ya que se puede implementar en cantidades mucho más grandes que la caché L2.
Os pongo un ejemplo, un procesador como el Ryzen 7 9700X tiene 8 MB de caché L2 (1 MB por núcleo), pero dispone de 32 MB de caché L3, es decir, tiene cuatro veces más memoria de este tipo.
¿Por qué es tan importante la capacidad de la caché L3?
Porque la caché actúa como un tipo de memoria de apoyo, lo que significa que guarda datos e instrucciones que el procesador o la GPU pueden necesitar en momentos concretos. Tener una caché L3 más grande permite guardar más datos e instrucciones en ella.
La segunda ventaja es su velocidad. Aunque la caché L3 es más lenta que la L2, y tiene mayor latencia que esta, sigue siendo más rápida que la RAM y que la VRAM, está más cerca de la CPU y de la GPU, y además no se produce la intermediación de un bus de datos para poder acceder a ella.
¿Por qué es tan importante la velocidad de la caché L3?
Es importante porque permite que la CPU y la GPU encuentren los datos e instrucciones que necesitan en menos tiempo, y con menos esperas. Esto ayuda a agilizar los ciclos de trabajo de ambos componentes, y puede tener un impacto muy positivo en el rendimiento.
¿Cómo trabaja la caché L3?
Esta caché guarda datos e instrucciones que son accesibles por la CPU o la GPU durante sus ciclos de trabajo. Ambos componentes buscan primero lo que necesitan en la caché L2, si no lo encuentran miran en la caché L3, y si tampoco lo encuentran en ese bloque de memoria ya tienen que mirar en la RAM o en la VRAM.
La caché L3 es más rápida que la RAM y que la VRAM, y tiene una menor latencia, así que si los datos que necesitan el procesador o la GPU se encuentran en dicha caché se evita tener que recurrir a la RAM o a la VRAM, que son más lentas, tienen mayor latencia y además implican la intermediación de un bus de datos.
Tener una caché L3 de mayor capacidad mejora la tasa de aciertos de la CPU y de la GPU al buscar datos e instrucciones en ella, y reduce las búsquedas en la RAM y la VRAM, por eso la capacidad de esta memoria es tan importante.
Os lo explico con un ejemplo. Cuando ejecutamos un juego se guardan muchos elementos y datos en la memoria gráfica (texturas, geometría, iluminación y otros) y en la RAM (lógica del juego, física, código básico y otros).
La CPU puede acceder a esos datos, pero estos se encuentran en componentes muy alejados de ella, y además tiene que pasar por un bus de datos, lo que aumenta muchísimo la latencia en esas comunicaciones y tiene un impacto negativo en el rendimiento.
Al ejecutar ese juego también se pueden guardar en la caché L3 algunos datos e instrucciones que la CPU o la GPU necesitarán en momentos concretos. El acceso a estos se hará en menos tiempo y con una latencia más baja, como dije anteriormente, y esto mejorará notablemente el rendimiento.
Cómo afecta al rendimiento en procesadores
Los Ryzen 7 7800X3D y Ryzen 7 9800X3D son procesadores de ocho núcleos y dieciséis hilos que tienen una gran cantidad de caché L3. Gracias al uso de chiplets de caché apilada en 3D, AMD ha podido integrar un total de 96 MB de L3 en ambos modelos, una cifra que prácticamente triplica la cantidad de caché de tercer nivel que podemos encontrar en procesadores de gama alta.
Ese aumento de la caché L3 tiene un impacto muy grande en el rendimiento de estos procesadores en juegos, tanto que les permite superar a procesadores más caros, con mayores frecuencias de reloj y consumos más altos. El Ryzen 7 7800X3D trabaja a 4,2 GHz-5 GHz en modo normal y turbo, y el Ryzen 7 9800X3D funciona a 4,7 GHz-5,2 GHz en modo normal y turbo.
El Intel Core i9-14900K tiene 24 núcleos y 32 hilos, y puede llegar a los 6 GHz en modo turbo. A pesar de esa diferencia de velocidad, su rendimiento es peor en juegos, y consume mucha más energía que las dos alternativas de AMD. No es magia, es la diferencia que marca tener una mayor cantidad de caché L3 cuando ejecutamos juegos.
En las dos gráficas adjuntas podéis ver datos reales de rendimiento en juegos, que son las aplicaciones que más se benefician de una mayor cantidad de caché L3. Utilizando una tarjeta gráfica más potente, como la GeForce RTX 5090, la diferencia sería todavía mayor, sobre todo en resoluciones inferiores a 4K, ya que en esos niveles es donde se produce una mayor dependencia del procesador.
Cómo afecta al rendimiento en GPUs
La caché L3 puede ayudar a mejorar también el rendimiento cuando se utiliza en núcleos gráficos, aunque en este caso, por una cuestión de espacio a nivel de silicio, no siempre se ha implementado con un diseño monolítico (en la misma pastilla de silicio que la GPU).
AMD fue la primera en recurrir a ella con la arquitectura RDNA 2. Los modelos más potentes contaron con 128 MB de caché L3 externalizada en chiplets interconectados con la GPU. Solo los modelos con 32 MB de caché L3 integraron dicha memoria en la misma pastilla de silicio (Radeon RX 6650 XT e inferiores).
Lo mismo ocurrió con las Radeon RX 7000, que utilizan caché L3 externalizada en chiplets en los modelos más potentes, y adoptan el diseño monolítico en aquellos modelos con 32 MB de L3 (Radeon RX 7600 XT e inferiores).
Con las Radeon RX 9000 en AMD han adoptado un diseño de núcleo monolítico, lo que significa que todos los modelos integran la caché L3 en la misma pastilla de silicio (junto a la GPU). Esto tiene un impacto positivo en el rendimiento, y en la latencia de dicha caché.
Disponer de caché L3 en una GPU reduce los accesos y la dependencia de esta de la VRAM, ya que puede realizar más búsquedas de lo que necesita en esa caché, y puede conseguir los datos e instrucciones que requiere a una mayor velocidad y con menos latencia. Esta caché permite conseguir picos de ancho de banda que no serían posibles con la memoria gráfica, mejorando el rendimiento.
Una GPU con una gran cantidad de caché L3 y un bus de datos pequeño puede conseguir un rendimiento similar a otra configurada sin caché L3 y con un bus de datos más grande, gracias a esa menor dependencia del subsistema de memoria gráfica.
La entrada Caché L3: qué es, qué hace y por qué es tan importante se publicó primero en MuyComputer.