Intel lanzó un video explicativo de su próxima tecnología de mejora XeSS AI y mostró cómo funciona la tecnología en sus GPU Arc Alchemist casi listas para su lanzamiento público. Usó el Arc A770 más rápido para las demostraciones, aunque es difícil decir cómo se comparará el rendimiento con las mejores tarjetas gráficas según los detalles de rendimiento limitado que se muestran.
Si está familiarizado con el DLSS de Nvidia, que ha existido durante cuatro años en varias encarnaciones, el video debería despertar una aguda sensación de Deja Vu. Tom Petersen, quien anteriormente trabajó para Nvidia y realizó algunas de las presentaciones antiguas de DLSS, explica los fundamentos de XeSS. Para resumir, XeSS se parece mucho a una versión reflejada de DLSS de Nvidia, excepto que está diseñado para funcionar con los núcleos XMX de aprendizaje profundo de Intel en lugar de los núcleos tensoriales de Nvidia. Sin embargo, la tecnología también puede funcionar con otras GPU utilizando el modo DP4a, lo que podría convertirla en una alternativa interesante al escalador FSR 2.0 de AMD.
En las demostraciones mostradas por Intel, XeSS parecía estar funcionando bien. Por supuesto, es difícil decir con certeza cuándo el video de origen es una versión comprimida de 1080p del contenido real, pero guardaremos las comparaciones detalladas de calidad de imagen para otro momento. Las ganancias de rendimiento parecen ser similares a las que hemos visto con DLSS, con un aumento de la velocidad de fotogramas de más del 100 % en algunas situaciones cuando se usa el modo XeSS Performance.
Cómo funciona
Si ya sabe cómo funciona DLSS, la solución de Intel es prácticamente la misma, pero con algunos ajustes menores. XeSS es un algoritmo de mejora de resolución acelerado por IA, diseñado para aumentar la velocidad de fotogramas en los videojuegos.
Comienza con el entrenamiento, el primer paso en la mayoría de los algoritmos de aprendizaje profundo. La red de IA toma fotogramas de muestra de menor resolución de un juego y los procesa, generando lo que deberían ser imágenes de salida mejoradas. Luego, la red compara los resultados con la imagen de destino deseada y propaga hacia atrás los ajustes de peso para tratar de corregir cualquier «error». Al principio, las imágenes resultantes no se verán muy bien, pero el algoritmo de IA aprende lentamente de sus errores. Después de miles (o más) de imágenes de entrenamiento, la red finalmente converge hacia los pesos ideales que generarán «mágicamente» los resultados deseados.
Una vez que el algoritmo se ha entrenado completamente, utilizando muestras de muchos juegos diferentes, en teoría puede tomar cualquier entrada de imagen de cualquier videojuego y mejorarla casi perfectamente. Al igual que con DLSS (y FSR 2.0), el algoritmo XeSS también asume la función de suavizado y reemplaza soluciones clásicas como AA temporal.
Nuevamente, nada hasta ahora es particularmente digno de mención. DLSS y FSR 2.0 e incluso los algoritmos AA temporales estándar tienen muchas de las mismas funciones básicas, menos las cosas de IA para FSR y TAA. Los juegos integrarán XeSS en su proceso de renderizado, generalmente después de que se hayan realizado el renderizado principal y los efectos iniciales, pero antes de que se dibujen los efectos de posprocesamiento y los elementos GUI/HUD. De esa manera, la interfaz de usuario se mantiene nítida mientras que la difícil tarea de la representación 3D se ejecuta a una resolución más baja.
XeSS opera en los núcleos Arc XMX de Intel, pero también puede ejecutarse en otras GPU en un modo ligeramente diferente. Las instrucciones DP4a son básicamente cuatro cálculos INT8 (entero de 8 bits) realizados con un solo registro de 32 bits, a lo que normalmente tendría acceso a través de un núcleo GPU shader. Mientras tanto, los núcleos XMX admiten de forma nativa INT8 y pueden operar en 128 valores a la vez.
Eso puede parecer muy desequilibrado, pero como ejemplo, un Arc A380 tiene 1024 núcleos de sombreado que podrían realizar cuatro operaciones INT8 al mismo tiempo. Alternativamente, el A380 tiene 128 unidades MXM que pueden realizar 128 operaciones INT8 cada una. Eso hace que el rendimiento MXM sea cuatro veces más rápido que el rendimiento DP4a, pero aparentemente el modo DP4a aún debería ser suficiente para cierto nivel de bondad XeSS.
Tenga en cuenta que DP4a parece usar un diferente red entrenada, una que es quizás menos intensiva computacionalmente. Queda por ver cómo se traducirá eso en rendimiento y calidad de imagen en el mundo real, y parece que los desarrolladores de juegos deberán incluir explícitamente soporte para los modos XMX y DP4a si quieren admitir GPU que no sean Arc.
Expectativas de rendimiento de Intel XeSS
Intel mostró un par de pruebas de juegos que ejecutan XeSS, incluida una versión de desarrollo de Shadow of the Tomb Raider y un nuevo punto de referencia 3DMark creado específicamente para XeSS. También mostró clips breves de Arcadegeddon, Redout II, Ghostwire Tokyo, The DioField Chronicle, Chivalry II, Naraka Bladepoint y Super People corriendo con y sin XeSS al final del video.
En Shadow of the Tomb Raider, ejecutándose en una tarjeta gráfica Arc A770 a 2560×1440 con configuraciones casi al máximo, incluidas las sombras con trazado de rayos, XeSS proporcionó desde aproximadamente un 25% de aumento de rendimiento en la configuración de calidad ultra hasta más del 100%. a las velocidades de cuadro al usar la configuración Rendimiento. Los ajustes de Calidad y Equilibrado buscan un punto medio y mejoran el rendimiento en un 50 % y un 75 %, respectivamente.
Esas ganancias variarán naturalmente según el motor del juego, la configuración y el rendimiento base. Cuanto más exigente sea el juego y menor sea la velocidad de fotogramas, más beneficioso será probablemente XeSS. Con el modo de rendimiento, Intel mostró ganancias típicas de entre el 40 % y el 110 % a 1440p, mientras que el modo equilibrado brindó mejoras que oscilaron entre el 25 % y el 75 %.
3DMark también agregará una prueba de funciones Intel XeSS para su edición avanzada, que incluye un modo de referencia, así como un inspector de marcos que permite a los usuarios ver imágenes de la referencia, acercándose para verificar las diferencias de calidad visual. Parece mucho más fácil de usar que la utilidad ICAT de Nvidia, aunque, por supuesto, también se limita a proporcionar marcos de un solo punto de referencia sintético.
Debido a que 3DMark utiliza su exigente escena de trazado de rayos Port Royal para la prueba de funciones XeSS, las ganancias de rendimiento pueden ser particularmente impresionantes. A 1440p con XeSS en modo de rendimiento, el punto de referencia vio una mejora del 145 % en FPS, un aumento del 109 % con el modo equilibrado, un 81 % con el modo de calidad y un 49 % con el modo de calidad ultra.
Frame Inspector también mostró algunos buenos resultados, con XeSS reconstruyendo la imagen muy bien, hasta el punto en que Tom Petersen de Intel argumenta que la imagen XeSS en realidad se ve mejor que la nativa con TAA. Por supuesto, debe tomar eso con pinzas, y es probable que las imágenes de una sola secuencia enlatada no representen completamente las experiencias de juego del mundo real.
XeSS SDK y más de 20 juegos en desarrollo
Intel proporcionará un SDK fácil de usar para implementar XeSS en un motor de juegos. La interfaz y los requisitos serán muy similares a las implementaciones de TAA, así como a DLSS y FSR 2.0, por lo que debería ser una adición relativamente fácil para cualquier motor gráfico moderno.
Al igual que TAA, FSR 2.0 y DLSS, XeSS necesita vectores de movimiento junto con el cuadro actual y mantiene su propia colección de cuadros anteriores. Todos estos se alimentan a la red de IA para generar en última instancia un buen resultado. XeSS también utiliza la inestabilidad de la cámara para ayudar a eliminar el aliasing en la escena.
En la actualidad, Intel tiene más de 20 juegos con XeSS planeados para su lanzamiento en los próximos meses. Algunos de ellos pueden pasar desapercibidos o retrasarse, pero al menos es un comienzo decente para el recién llegado. Al mismo tiempo, AMD acaba de anunciar otros ocho juegos que agregaron recientemente o pronto agregarán FSR 2.0, y Nvidia tiene más de 100 juegos que se envían con DLSS 2.0 o posterior. ¿Cuántos desarrolladores de juegos estarán dispuestos a agregar las tres alternativas, lo que brindaría a los jugadores la posibilidad de elegir el mejor algoritmo? Sospechamos que muchos juegos solo admitirán una o dos de las posibles opciones de mejora.
XeSS se lanzará oficialmente cuando Intel lance sus GPU Arc Alchemist en todo el mundo en algún momento en un futuro presumiblemente cercano. El Arc A380 se lanzó efectivamente en este punto, e Intel ahora se burló del A750 y el A770. Con suerte, podremos experimentar XeSS, en los modos MXM y DP4a, en un futuro no muy lejano. En la actualidad, la aceptación sigue estando muy por detrás de la competencia de AMD y Nvidia.