SER mejora el rendimiento de hardware RT de UE5 Lumen en las GPU GeForce RTX 4000, dice NVIDIA


Una de las principales características nuevas introducidas con las tarjetas gráficas de la serie GeForce RTX 4000 es SER, abreviatura de Shader Execution Reordering. Con el trazado de rayos cada vez más omnipresente de manera lenta pero segura, SER tiene como objetivo mejorar la eficiencia de los sombreadores mitigando la ejecución y la divergencia de datos. Como sugiere su nombre, logra este resultado reordenando los hilos en tiempo real para mejorar la coherencia. También desacopla la intersección de rayos y las operaciones de sombreado.

NVIDIA confirmó a Wccftech en una breve sesión de preguntas y respuestas que SER (al igual que Opacity Micro-Maps y Displaced Micro-Mesh, las otras dos mejoras de rendimiento) requiere una integración explícita del desarrollador en un juego y viene con su propia extensión API de NVAPI. Afortunadamente, la rama NvRTX Unreal Engine 5 pronto se actualizará a la versión 5.0.3, que agrega soporte para SER en el motor de próxima generación más popular. Según NVIDIA, Shader Execution Reordering puede ofrecer hasta un 40 % de optimización de la velocidad de fotogramas en operaciones de trazado de rayos sin afectar la calidad.

Curiosamente, SER también mejora el rendimiento de UE5 Lumen cuando el trazado de rayos de hardware está habilitado. NVIDIA proporcionó tres casos de uso de ejemplo. El seguimiento de rutas es el primero y el más simple, donde las ganancias de rendimiento pueden oscilar entre el 20 y el 50 por ciento.

El rastreo de rutas presenta un flujo de trabajo muy divergente, lo que lo convierte en un gran candidato para aplicar SER. La aplicación de SER permite que el rastreador de ruta reduzca la divergencia en su evaluación de material en lugar de solo en la cantidad de rebotes.

Esta escena se renderiza un 40% más rápido gracias a SER, según NVIDIA.

SER puede ser útil más allá de simplemente reorganizar los sombreadores para reducir la divergencia. Por ejemplo, NVIDIA dijo que la compactación del trabajo puede generar beneficios significativos cuando se utiliza la iluminación global con trazado de rayos de hardware de Lumen.

Para escenas grandes, como UE5 City Sample, los trazos se dividen en el campo cercano y lejano, que se ejecutan como pasadas de trazo separadas con compactación en el medio. Los pases múltiples y la compactación se pueden reemplazar por una sola llamada NVReorderThread. Esto evita las burbujas inactivas en la GPU necesarias para compactar los resultados del rastreo de campo cercano y luego lanzar rayos de campo lejano.

Eliminar los gastos generales adicionales de almacenamiento, compactación y relanzamiento del trabajo a menudo vale un 20% de ahorro. Los cambios de shader pueden ser más intensos debido a las suposiciones en el código original (funciones que usan macros para permutar comportamientos en lugar de argumentos). Sin embargo, los cambios lógicos consistieron en agregar dos llamadas de reordenación con una sola expresión booleana para determinar si un seguimiento había acertado o no.

Por último, NVIDIA detalló un tercer caso de uso (aunque más complejo) con reflejos de trazado de rayos de hardware de Lumen. Hay dos tuberías de trazado de rayos diferentes que normalmente funcionan aquí, una para el trazado de campo cercano y lejano y otra para la iluminación de impacto.

Con SER activado, las pasadas se pueden combinar porque ya no son necesarias las fases separadas de compactación y clasificación. El pase se convierte aproximadamente en un campo cercano de rastreo, si no es un campo lejano de rastreo de aciertos, si cualquiera de los aciertos utiliza el objeto de impacto para evaluar el material y realizar la iluminación. Esto es posible debido al desacoplamiento de trazado y sombreado.

La implementación descrita anteriormente dio como resultado un aumento de la velocidad del 20-30 % en los reflejos de Lumen en la GPU, medidos al perfilar una carga de trabajo típica en UE5 City Sample.

Si es un desarrollador interesado en agregar compatibilidad con SER a su motor, puede consultar el documento técnico completo. Actualmente no está claro qué juegos admitirán Shader Execution Reordering (o Opacity Micro-Maps y Displaced Micro-Mesh, para el caso) en el futuro cercano, pero investigaremos con NVIDIA y los estudios de juegos.



Source link-29