Portal: Prelude RTX trae un mod Source clásico a la vanguardia de la tecnología gráfica


Portal: Prelude RTX es una exhibición impresionante de la tecnología RTX Remix de Nvidia, que toma lo que alguna vez fue un mod Source para Portal y le brinda características visuales y tecnología que rivalizan e incluso superan los lanzamientos triple AAA de gama alta. Es realmente espectacular y, con suerte, una de las muchas remasterizaciones trazadas que vendrán en el futuro a medida que se acerquen al lanzamiento de las herramientas de modificación RTX Remix.

Sin embargo, lo más interesante es que Prelude también es el primer juego compatible con RTX IO, un esquema de descompresión acelerado por GPU que se ejecuta bajo Vulkan. Esta es esencialmente una versión con la marca Nvidia de Direct Storage 1.2, que también se incluye en Ratchet and Clank: Rift Apart, que se lanza para PC a finales de este mes. Su propósito es acelerar la carga de juegos y la transmisión de activos en la plataforma de PC, y su inclusión aquí nos da una buena excusa para ver cómo funciona la tecnología.

Históricamente, la carga implicaba la transferencia de datos del juego, como texturas o modelos, desde un disco duro a la memoria del sistema y luego a la GPU bajo el control de la CPU. Este fue un enfoque en serie con bastante latencia, ya que el disco tenía que girar físicamente el eje, ubicar los datos y luego cargar los datos bloque por bloque de una manera que minimiza la cantidad de búsqueda necesaria.


Aquí está la presentación completa en video de Alex Battaglia sobre RTX IO en Portal: Prelude RTX.

Esta técnica funcionó bastante bien con activos de juegos relativamente pequeños cargados desde HDD, pero ahora que los juegos tienen un tamaño de cientos de gigabytes con activos extremadamente detallados, todos estos datos deben comprimirse para hacer un buen uso del espacio de almacenamiento y el ancho de banda disponibles. Eso significa que la CPU debe descomprimir los activos antes de que puedan usarse en la GPU, y el tiempo adicional y la carga de la CPU que esto impone significa que el enfoque tradicional comienza a fallar.

Afortunadamente, la llegada del almacenamiento flash rápido y de baja latencia en SSD significa que no necesitamos leer los datos de forma secuencial para minimizar los tiempos de búsqueda: podemos crear un nuevo estándar. Primero, queremos acceder a los datos en paralelo para reducir enormemente los tiempos de carga en comparación con el antiguo estándar de E/S de Windows. En segundo lugar, queremos asegurarnos de que los datos se muevan del almacenamiento a la GPU. antes esta descomprimido. Las GPU tienen muchos núcleos y realizan tareas masivamente paralelas, como la descompresión, mejor que las CPU, por lo que este enfoque ahorra mucho tiempo. Este es el nuevo sistema previsto para RTX IO y Direct Storage 1.2, y ofrece tiempos de carga más rápidos y, cuando se usa en el juego con fines de transmisión, una reducción en la carga de la CPU que puede mejorar potencialmente el rendimiento.

Para RTX IO, como está aquí en Portal Prelude RTX, los datos en el disco se comprimen usando el formato GDeflate y se mueven a la memoria del sistema temporalmente, luego a la VRAM y la GPU los descomprime allí. Este formato GDeflate es un estándar abierto de compresión de GPU de Nvidia, que se entregó a Microsoft y Kronos Group, y es el formato que espero ver utilizado en los juegos Direct Storage 1.2 usando DirectX en PC, con GPU de Nvidia, AMD e Intel compatibles.

Esta explicación funciona mejor en video, pero la idea principal en RTX IO es que estamos reduciendo la carga de la CPU al descomprimir datos en la GPU directamente y acelerar los tiempos de carga al leer datos en paralelo desde el SSD.

Por el contrario, Portal: Prelude RTX utiliza la API de gráficos Vulkan, que no tiene llamadas estándar agnósticas de proveedores acordadas para la descompresión de GPU; que yo sepa, actualmente solo existen las extensiones propuestas por Nvidia. Estas extensiones de Nvidia para la descompresión de GPU podrían ser las que el grupo Kronos adapte al por mayor para el equivalente de almacenamiento directo de Vulkan. Mientras tanto, la descompresión rápida de GPU en Portal Prelude: RTX solo funcionará en controladores que admitan estas extensiones específicas, es decir, en tarjetas gráficas Nvidia RTX.

Sin embargo, Portal Prelude RTX todavía funciona con un paradigma de carga más tradicional, lo que significa que RTX IO no aumenta la velocidad de fotogramas. Después de todo, RTX Remix no reemplaza el motor del juego ni altera la forma en que se dividen y cargan los niveles; En cambio, RTX Remix simplemente cambia la forma en que se realiza el renderizado y cómo se cargan los activos para alimentar ese renderizado. Esto es diferente a Ratchet and Clank: Rift Apart, que también debería usar la descompresión de GPU para acelerar el juego. Por lo tanto, Portal Prelude RTX se beneficia principalmente en términos de tiempos de carga dedicados y tiempos de carga de textura visible.

Para probar cuánto efecto tiene la tecnología aquí, probé una versión del juego que se ejecutaba con RTX IO apagado y con un SSD SATA con un límite de 500 MB/s. El juego se carga razonablemente rápido, pero las texturas tardan un tiempo en alcanzar su máxima calidad: sin la compresión GDeflate de RTXIO, el juego en el disco está completamente sin comprimir y es aproximadamente un 60 por ciento más grande. Por lo tanto, el ancho de banda se grava de manera correspondiente para mover las texturas a VRAM, y la última textura tarda un poco más de un segundo en cargarse. Con RTX IO activado, esa misma textura en un SSD SATA se carga en menos de la mitad del tiempo.

Configuración Cargar al juego Carga de textura
12900K + 500 MB/s SATA SSD + RTX IO apagado 1,13 s 2,36 s
12900K + 500 MB/s SSD SATA + E/S RTX activado 0,67 s 1,16 s
12900K + SSD NVMe de 3,5 GB/s + E/S RTX desactivado 0,57 s 1,45 s
12900K + SSD NVMe de 3,5 GB/s + E/S RTX activado 0,53 s 1,07 s

Esta no es exactamente la diferencia más grande del mundo real, ya que medio segundo se ha ido en un instante, pero la reducción a la mitad del tiempo sigue siendo impresionante. Después de haber realizado una serie de pruebas en diferentes configuraciones, tengo dos conclusiones interesantes. En primer lugar, una unidad SATA de 500 MB/s con RTX IO habilitado supera a una unidad NVMe de 3,5 GB/s con RTX IO desactivado, bastante sobresaliente. En segundo lugar, las diferencias de hardware de CPU y GPU no afectaron drásticamente los tiempos de carga, con el sistema RTX 2060 Super + Core i9 12900K funcionando de manera muy similar a la misma CPU con el buque insignia RTX 4090; un sistema RTX 4070 y Ryzen 5 3600 también estuvo muy cerca en términos de tiempos de carga.

Por lo tanto, Portal: Prelude RTX es una primera salida prometedora de esta tecnología para PC, pero al mismo tiempo es mundana, ya que se aplica a un juego que utiliza un antiguo paradigma de carga en primer lugar. Con juegos que usan transmisión activa y sin pantallas de carga de ningún tipo, como Ratchet and Clank: Rift Apart y otros juegos futuros, aquí es donde esta tecnología mostrará su mejor valor. Por supuesto, estamos ansiosos por cubrir ese título muy pronto, ya que el juego llegará a la PC el 26 de julio, así que estad atentos.





Source link-11