El kit de desarrollo Agility de DirectX 12 Ultimate ha incorporado dos nuevas tecnologías que pueden marcar una gran diferencia de rendimiento a favor de las GPUs de NVIDIA, Shader Execution Reordering, también conocida como SER, y Opacity Micromaps, que ya están disponibles en la versión estable de dicho kit.
Estas dos nuevas tecnologías se incorporaron con la arquitectura Ada Lovelace, lo que significa que están presentes a partir de la serie GeForce RTX 40, y realizan funciones muy diferentes que os voy a explicar a continuación para que tengáis claro cómo pueden marcar la diferencia.
Opacity Micro-Maps realiza una determinación precisa del grado de opacidad de los objetos y de los elementos gráficos de una escena, como por ejemplo del humo, la niebla y el agua, y también de la densidad de los mismos. De esta manera se consigue una mayor eficiencia a la hora renderizar esos objetos y elementos, y se mejora el rendimiento hasta en un 230%.
La tecnología Opacity Micro-Maps cuenta aceleración específica en los núcleos RT que incorporan la GeForce RTX 40 y GeForce RTX 50, así que estas dos generaciones gráficas serían las grandes beneficiadas del uso de esta tecnología, que mejoraría el rendimiento en juegos con trazado de rayos.
Shader Execution Reordering trabaja a nivel de shaders realizando una reordenación de los hilos de trabajo en bloques o grupos específicos. Por ejemplo, si hay veinte fragmentos desordenados que corresponden con cinco bloques diferentes los agrupa en bloques ordenados para despacharlos de forma organizada en grupos de cuatro.
Esta tecnología puede mejorar, según NVIDIA, hasta un 25% el rendimiento en renderizado tradicional, y hasta un 200% el rendimiento en trazado de rayos. Las GeForce RXT 40 son compatibles con esta tecnología, y las GeForce RTX 50 recibieron una versión mejorada que es capaz de organizar hilos y de derivarlos al bloque de núcleos que deba despacharlos, diferenciando entre shaders y núcleos tensor.
Hasta un 64,7% más de rendimiento en juegos bajo DirectX con SER y OMM
Las primeras pruebas realizadas con DirectX y estas nuevas funciones son prometedoras. Utilizar Opacity Micro-Maps en una compleja demo técnica con trazado de trayectorias hace que el rendimiento pase de 55 FPS a 90 FPS, lo que significa que está muy cerca de llegar a doblar el rendimiento aplicado solo una de esas dos tecnologías.
Con trazado de rayos activado puede generar hasta 10 rayos por píxel, lo que equivale a 36,9 millones de rayos por fotograma si tenemos una resolución de 2.560 x 1.440 píxeles. Esto supone una carga de trabajo enorme para cualquier GPU, y una tarjeta gráfica tan potente como la GeForce RTX 4090 tarda 16,8 ms en generar un fotograma en esas condiciones sin ningún tipo de optimización.
Si aplicamos Opacity Micro-Maps y Shader Execution Reordering el tiempo de renderizado de cada fotograma se reduce a 10,2 ms, una ganancia del 64,7%. Este juego es tremendamente exigente debido, sobre todo, a su alta carga geométrica. En una única escena este juego puede llegar a mostrar casi 14 millones de triángulos con 5,2 millones de vértices y 2.200 instancias texturizadas.
La integración de ambas tecnologías en el kit de desarrollo de DirectX permitirá a los desarrolladores implementarlas fácilmente en sus juegos, y esto debería traducirse en mejoras notables de rendimiento tanto en juegos actuales que se actualicen para aprovecharlas como en juegos futuros que las integren.
La entrada DirectX recibe dos novedades que mejorarán el rendimiento de GPUs NVIDIA hasta en un 200% se publicó primero en MuyComputer.