DLSS 3 vs DLSS 2 vs Native – ¿GeForce RTX 4090’s Ace?


Cuando NVIDIA presentó las tarjetas gráficas de la serie GeForce RTX 4000 como el gran anuncio de la transmisión especial GTC 2022 GeForce Beyond, quedó claro de inmediato que DLSS 3 jugó un papel importante en lograr el salto de rendimiento generacional sin precedentes (2x-4x) reclamado por NVIDIA.

Casi todos los puntos de referencia compartidos por el fabricante incluyeron la nueva tecnología DLSS 3, y los pocos que no mostraron mejoras de rendimiento con respecto a la serie GeForce RTX 3000 que estaban más en línea con lo que esperábamos de una nueva generación de gráficos. tarjetas

Ahora que la GeForce RTX 4090, la GPU insignia (al menos hasta el inevitable modelo Ti) y también la primera de la nueva arquitectura Ada Lovelace en lanzarse, ha estado en manos de los revisores por un tiempo, hemos podido verificar cuánto potencia el rendimiento DLSS 3. Sin embargo, lo primero es lo primero, echemos un vistazo a lo que hay detrás del capó.

Las nuevas tarjetas gráficas GeForce RTX están equipadas con núcleos Tensor de cuarta generación, que incluyen un nuevo motor Tensor de punto flotante (FP8) de 8 bits, lo que aumenta el rendimiento hasta 5 veces hasta un Tensor-petaFLOPS estimado de 1,32 en la RTX 4090.

Sin embargo, con DLSS 3, NVIDIA está dando un paso más allá de DLSS Super Resolution. Ahora hay un nuevo codificador automático convolucional de generación de cuadros DLSS que genera un cuadro completo por sí solo en función de los campos de flujo óptico calculados con el acelerador de flujo óptico.

Los aceleradores de flujo óptico han estado disponibles en las GPU de NVIDIA desde la arquitectura de Turing. Sin embargo, como explicó anteriormente el vicepresidente de investigación de aprendizaje profundo aplicado, Bryan Catanzaro, las nuevas tarjetas gráficas están equipadas con una versión significativamente más rápida y avanzada de OFA, por lo que DLSS 3 es actualmente una exclusiva de las tarjetas gráficas GeForce RTX 4000.

El cuadro generado se encuentra entre los cuadros reconstruidos con DLSS Super Resolution. Como tal, NVIDIA afirma que en cada dos fotogramas, solo una octava parte de los píxeles mostrados se renderizaron normalmente, mientras que el resto se reconstruyó entre Súper Resolución y Generación de fotogramas, lo que ofrece mejoras masivas en la velocidad de fotogramas.

Para tener en cuenta el aumento de latencia causado por Frame Generation, NVIDIA ha incorporado su tecnología Reflex de reducción de latencia para garantizar que la capacidad de respuesta siga siendo óptima.

Nuestro Hassan ha podido probar la GeForce RTX 4090 con todos los juegos compatibles con DLSS 3 que NVIDIA compartió con los revisores. Eligió el ajuste preestablecido de calidad (a una resolución de 4K, obviamente) porque sintió que la nueva tarjeta gráfica ya ejecutaba la mayoría de los juegos lo suficientemente rápido como para que no tuviera sentido bajar la resolución de renderizado base bajando los ajustes preestablecidos de DLSS.

Ciberpunk 2077

Primero está Cyberpunk 2077 de CD Projekt RED, el último juego que usó el Red Engine interno del estudio antes del cambio a Unreal Engine 5. Tenga en cuenta que la compilación de Cyberpunk 2077 no incluía el próximo Ray Tracing Overdrive Mode, que también fue anunciado durante la transmisión de GeForce Beyond. El modo Overdrive agregará técnicas avanzadas y exigentes de trazado de rayos como iluminación directa RTX, reflejos de resolución completa e iluminación indirecta de rebote múltiple. NVIDIA estima que reducirá el rendimiento en alrededor de 51 FPS a 4K con DLSS 3, aunque también puede absorber el impacto mejor que DLSS 2.

Sin embargo, con el juego actual, DLSS 3 solo mejoró el FPS promedio en un 16,1 % y la velocidad de fotogramas de un percentil en un 15,3 % con respecto a DLSS 2.

Capturas de pantalla de DLSS 3 (haga clic para acercar):

Capturas de pantalla nativas (haga clic para acercar):

Un cuento de plagas: Réquiem

A continuación, uno de los primeros juegos que se lanzará públicamente con soporte para DLSS 3, A Plague Tale: Requiem de Asobo Studio (que se lanzará la próxima semana; esperamos nuestra revisión en breve). Desarrollado por Unreal Engine 4, A Plague Tale: Requiem presenta tecnología actualizada que puede admitir una cantidad mucho mayor de ratas en comparación con el juego original, así como una iluminación dinámica mejorada. La versión final también incluirá alguna forma de trazado de rayos, pero la versión probada no lo hizo.

En este caso, DLSS 3 proporciona un aumento del rendimiento del 29 % sobre DLSS 2 en FPS promedio y una mejora del 39,1 % en la velocidad de fotogramas de un percentil. Sin embargo, es probable que el impulso sea mayor una vez que se habilite el trazado de rayos.

Capturas de pantalla de DLSS 3 (haga clic para acercar):

Capturas de pantalla nativas (haga clic para acercar):

F1 2022

F1 22 de Codemasters, impulsado por EGO Engine 4.0, es, con mucho, el menos exigente de todos los juegos probados, y ofrece la velocidad de fotogramas más alta incluso con su opción de trazado de rayos habilitada.

Como tal, en la edición de este año del juego de Fórmula 1 con licencia oficial, DLSS 3 solo puede aumentar aún más el FPS promedio en un 20,5 % y el FPS mínimo en un 22,4 %.

Capturas de pantalla de DLSS 3 (haga clic para acercar):

Capturas de pantalla nativas (haga clic para acercar):

Simulador de vuelo de Microsoft

El verdadero poder de DLSS 3 se puede ver en Microsoft Flight Simulator. Mientras que DLSS 2 no pudo mejorar los juegos vinculados a la CPU de manera significativa, el componente clave de la nueva versión de DLSS 3, Frame Generation, es completamente independiente de cualquier cuello de botella de la CPU.

Como tal, hay un aumento masivo del 106 % en el FPS promedio y una mejora aún mayor del 115 % en el FPS mínimo con respecto a la implementación de DLSS 2.

Capturas de pantalla de DLSS 3 (haga clic para acercar):

Capturas de pantalla nativas (haga clic para acercar):

Demostración de Unity Enemies

La última prueba de DLSS 3 proporcionada por NVIDIA fue la magnífica demostración técnica de Unity Engine Enemies, presentada originalmente en GDC 2022. Sin embargo, en este caso, no pudimos hacer una comparación directa con DLSS 2 ya que no estaba disponible como una opción en la demostración. . En comparación con el renderizado nativo, DLSS 3 proporciona un aumento promedio de FPS del 235 % y un aumento del 319 % en la velocidad de fotogramas de un percentil.

Capturas de pantalla de DLSS 3 (haga clic para acercar):

Capturas de pantalla nativas (haga clic para acercar):

Resumen

Como señaló NVIDIA durante su presentación de la tecnología, DLSS 3 realmente puede potenciar el rendimiento en escenarios vinculados a la CPU como Microsoft Flight Simulator, así como en los juegos con trazado de rayos más avanzados. Como tal, su verdadero potencial se desbloqueará con los juegos de mañana.

Cuando se prueba en títulos que ya se ejecutan a velocidades de cuadro muy altas, su impulso en comparación con el DLSS 2 normal es más limitado (al menos cuando se usa el ajuste preestablecido Calidad; creo que el ajuste preestablecido Rendimiento y Ultra rendimiento puede ampliar la brecha). Esto se debe principalmente a que la RTX 4090 es una bestia en sí misma, ya que ofrece mejoras sustanciales en el rendimiento con respecto a las mejores tarjetas de la generación anterior, incluso cuando se usa DLSS 2 o renderizado nativo. Si alguna vez ha querido jugar juegos en 4K, 144+FPS con todas las configuraciones de gráficos al máximo, RTX 4090 y DLSS 3 pueden brindarlo fácilmente.

Como se señaló por primera vez en la práctica inicial de Digital Foundry con la tecnología, el componente Frame Generation a veces puede introducir artefactos. Sin embargo, son realmente difíciles de notar durante el juego normal. También es posible que el algoritmo de generación de fotogramas se mejore con el tiempo para disminuir estos fallos, al igual que hizo NVIDIA con DLSS Super Resolution.

Por último, pero no menos importante, debo admitir que me impresionaron mucho las mediciones de latencia. Durante las presentaciones de prensa, los ingenieros de NVIDIA habían insinuado que la latencia más baja se obtendría con una combinación de DLSS 2 y Reflex en lugar de DLSS 3 debido a su componente Frame Generation. Sin embargo, los datos muestran que DLSS 3 se destaca en todos los casos, a veces con una diferencia significativa sobre DLSS 2 + Reflex. Se requerirán más pruebas, pero parece que los propietarios de la serie RTX 4000 pueden no tener una razón para desactivar Frame Generation.

Productos mencionados en esta publicación.



Source link-29