El mito de los teraFLOPs como unidad de medida de rendimiento de las tarjetas gráficas en juegos ha sido siempre una constante, y por desgracia todavía se mantiene en nuestros tiempos como un error muy frecuente que cometen incluso medios especializados.
En este artículo quiero hablaros de este tema en profundidad. Os voy a explicar qué son los teraFLOPs, por qué son importantes y por qué no se pueden utilizar como única referencia para medir el rendimiento de una tarjeta gráfica en juegos, ni para comparar de forma directa.
¿Qué son los teraFLOPs y qué miden en tarjetas gráficas?
Son una unidad de medida de rendimiento que podemos utilizar para determinar la potencia de una tarjeta gráfica, pero se refieren a un valor muy concreto, la cantidad de operaciones de coma flotante que puede realizar esta en un segundo. Eso es lo que significan en inglés las siglas «FLOPs», mientras que tera equivale a un billón.
Por tanto, cuando decimos que una tarjeta gráfica tiene una potencia de 15 TFLOPs estamos diciendo que puede calcular 15 billones de operaciones de coma flotante en un segundo. Hasta aquí todo claro, no es difícil de entender, pero hay otra cosa que debemos tener en cuenta, y es el grado de precisión con el que se realizan esas operaciones.
Hay muchas posibilidades, pero estas son las más utilizadas a día de hoy:
FP64: conocido como doble precisión, que utiliza binarios de 64 bits.
FP32: conocido también como precisión simple, utiliza binarios de 32 bits.
FP16: o precisión media, que utiliza binarios de 16 bits.
A mayor precisión los resultados obtenidos son de mayor calidad, pero también aumenta la exigencia. Por eso normalmente una tarjeta gráfica suele tener una potencia muy alta en FP32, pero mucho más baja en FP64.
Os pongo un ejemplo, la GeForce RTX 5090 tiene una potencia de 104,8 TFLOPs en FP32, pero su potencia es de solo 1,63 TFLOPs en FP64. ¿Esto es malo? Para nada, las operaciones de FP64 solo se utilizan en cargas de trabajo muy concretas, y no son necesarias ni en juegos ni en operaciones relacionadas con IA.
En juegos la mayoría de la carga de trabajo que se maneja en este sentido es bajo FP32 y FP16, por eso las tarjetas gráficas de consumo tienen el mismo nivel de potencia con ambos tipos de operaciones. Con todo, con el auge de la IA aplicada a gaming los niveles de precisión más bajos han ido ganando terreno, por eso las GeForce RTX 40 introdujeron soporte nativo de FP8, y las GeForce RTX 50 soportan FP4.
Según el tipo de carga de trabajo cada nivel de precisión en operaciones de coma flotante resulta más o menos recomendable. En simulaciones científicas, por ejemplo, suele ser necesario un mayor grado de precisión, mientras que en IA y aprendizaje profundo se necesita de un nivel de precisión mucho más bajo.
¿Por qué los teraFLOPs no son lo más importante?
Porque cuando hablamos de juegos al final hay muchas otras cosas que determinan el rendimiento que será capaz de ofrecer una tarjeta gráfica, como por ejemplo las optimizaciones a nivel de arquitectura, el nivel de soporte de los controladores, el hardware especializado en tareas de concretas de aceleración y el sistema de memoria.
Normalmente el rendimiento de una tarjeta gráfica se mide en TFLOPs en FP32, es decir, en precisión simple, pero esto es solo una parte de la historia, porque:
Los drivers pueden marcar una diferencia enorme, tanto que unos drivers mal hechos pueden hacer que un juego directamente ni siquiera funcione.
Una tarjeta gráfica muy potente necesita de un ancho de banda acorde para que las comunicaciones entre la GPU y la memoria gráfica sean rápidas. Por eso una gráfica con muchos teraFLOPs pero un bajo ancho de banda puede acabar rindiendo mucho menos de lo que debería.
También es importante que tenga suficiente memoria gráfica, ya que de lo contrario podría perder mucho rendimiento debido a los retrasos que se generan cuando se llena y se vacía la memoria gráfica.
El hardware especializado marca una diferencia enorme en ciertas cargas de trabajo. Un buen ejemplo lo tenemos en los núcleos para acelerar trazado de rayos, y otro ejemplo serían los núcleos tensor, especializados en IA.
Os pongo un ejemplo, la GeForce GTX 1080 Ti tiene una potencia de 11,34 TFLOPs, y la GeForce RTX 2070 tiene una potencia de 7,46 TFLOPs, ambos valores en FP32. En potencia bruta la primera es superior, pero esta es incapaz de trabajar con trazado de rayos porque carece de hardware dedicado, y tampoco tiene hardware especializado en IA, así que no soporta DLSS y otras tecnologías de IA aplicadas a gaming.
Quake II RTX, que fue uno de los primeros grandes exponentes del trazado de rayos, funciona a 60 FPS en 1080p con una GeForce RTX 2070, mientras que la GeForce GTX 1080 Ti apenas es capaz de conseguir 12 FPS, una diferencia enorme que deja claro lo que os he dicho desde el principio, que los teraFLOPs son solo una parte de la historia.
¿Entonces los teraFLOPS no sirven para nada?
Tampoco es eso, sí que tienen valor, pero la clave está en que debemos interpretarlos correctamente. Los teraFLOPs nos sirven, sobre todo para establecer relaciones de rendimiento aproximadas, y también para comparar diferentes tarjetas gráficas, siempre que estas no presenten grandes diferencias a nivel de arquitectura y de hardware especializado.
Sin embargo, no nos sirven para establecer equivalencias directas. Para esto debemos partir de datos reales de rendimiento en juegos, que es precisamente lo que hacemos en nuestra guía de equivalencias de tarjetas gráficas.
Debemos tener en cuenta también que los teraFLOPs no escalan de forma lineal en rendimiento cuando hablamos de juegos. Por ejemplo, una GeForce RTX 5090 tiene el doble de potencia en FP32 que una GeForce RTX 5080, pero esto no quiere decir que rinda el doble en juegos. La diferencia de rendimiento a favor de la primera es de aproximadamente un 50% en 4K.
Si además de para jugar vamos a utilizar la tarjeta gráfica para otras cosas es importante fijarnos en el soporte que esta tiene de otros niveles de precisión. Las GeForce RTX 30 soportan FP16 de forma nativa, las GeForce RTX 40 introdujeron soporte de FP8, y las GeForce RTX 50 soportan FP4.
Estos distintos niveles de compatibilidad marcan una gran diferencia en términos de rendimiento con IA, así que si tienes pensado trabajar con inteligencia artificial debes tenerlo muy en cuenta. En caso de que tu prioridad sea el rendimiento en FP64 siento decirte que para conseguir un valor elevado tendrás que irte a por las aceleradoras gráficas de NVIDIA, conocidas anteriormente como Tesla.
La entrada Tarjetas gráficas y el mito de los teraFLOPs como valor de rendimiento en juegos se publicó primero en MuyComputer.