DeepSeek se ha convertido en un auténtico fenómeno dentro de la industria de la IA. Ya hemos hablado de este modelo en varios artículos, y hemos visto que al final sus costes reales de entrenamiento fueron mucho más altos de lo que se dijo en un principio. Esto es muy interesante, pero si hablamos de rendimiento, ¿cómo posiciona la GeForce RTX 5090 con DeepSeek?
Es una pregunta muy interesante porque, al fin y al cabo, estamos hablando de la tarjeta gráfica más potente que existe en el mercado de consumo general, y de una solución que gracias a sus nuevos núcleos tensor y a sus 32 GB de memoria gráfica está mucho mejor preparada para trabajar con modelos complejos de IA.
Los datos de rendimiento oficiales que ha compartido NVIDIA confirman que la GeForce RTX 5090 es capaz de superar en más del doble el rendimiento de la Radeon RX 7900 XTX en DeepSeek. Las pruebas de rendimiento se han realizado partiendo de un valor tan sencillo como importante, la cantidad de tokens por segundo.
Con DeepSeek R1 Distill Qwen de 7.000 millones de parámetros la GeForce RTX 4090 rinde un 43% mejor que la Radeon RX 7900 XTX, y la GeForce RTX 5090 supera a la solución de AMD en un 203%, es decir, dobla su rendimiento. Con DeepSeek Distill Llama de 8.000 millones de parámetros la GeForce RTX 5090 supera a la Radeon RX 7900 XTX en un 206%, y en DeepSeek R1 Distill Qwen de 32.000 millones de parámetros la solución de NVIDIA gana por un 224%.
La diferencia es sustancial, y es lógico, porque al fin y al cabo la GeForce RTX 5090 tiene núcleos tensor de nueva generación capaces de trabajar con operaciones INT4 y FP4, y de ofrecer una potencia de 3.352 TOPs, siglas de trillones (americanos) de operaciones por segundo.
Las pruebas se realizaron partiendo de lo que se conoce como escalamiento en tiempo, que permite al modelo asignar recursos de una manera más efectiva durante el proceso de inferencia para poder razonar mejor cada problema. Los drivers utilizados con las GeForce RTX 4090 y GeForce RTX 5090 fueron los 572.16. En el caso de AMD se utilizó el driver 25.1.1.
Debemos tener en cuenta también que la GeForce RTX 5090 utiliza la arquitectura Blackwell, que es la misma que ha hecho posible el último gran salto generacional en el mundo de la IA avanzada en centros de datos, y que las tecnologías inherentes a la familia RTX permiten acelerar por hardware todos los modelos de DeepSeek para conseguir el máximo rendimiento posible en ordenadores personales en tareas de inferencia.
Con la GeForce RTX 5090 tenemos todo el rendimiento necesario para trabajar con grandes modelos de lenguaje manteniendo un alto nivel de rendimiento, y de forma local, es decir, sin necesidad de contar con una conexión a Internet. Esto supone un importante valor añadido, sobre todo en términos de seguridad y de privacidad.
La entrada La GeForce RTX 5090 es el doble de rápida en DeepSeek se publicó primero en MuyComputer.