{"id":123870,"date":"2022-08-27T02:31:15","date_gmt":"2022-08-27T02:31:15","guid":{"rendered":"https:\/\/magazineoffice.com\/intel-detalla-el-funcionamiento-interno-de-xess\/"},"modified":"2022-08-27T02:31:16","modified_gmt":"2022-08-27T02:31:16","slug":"intel-detalla-el-funcionamiento-interno-de-xess","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/intel-detalla-el-funcionamiento-interno-de-xess\/","title":{"rendered":"Intel detalla el funcionamiento interno de XeSS"},"content":{"rendered":"


\n<\/p>\n

\n

Intel lanz\u00f3 un video explicativo de su pr\u00f3xima tecnolog\u00eda de mejora XeSS AI y mostr\u00f3 c\u00f3mo funciona la tecnolog\u00eda en sus GPU Arc Alchemist casi listas para su lanzamiento p\u00fablico. Us\u00f3 el Arc A770 m\u00e1s r\u00e1pido para las demostraciones, aunque es dif\u00edcil decir c\u00f3mo se comparar\u00e1 el rendimiento con las mejores tarjetas gr\u00e1ficas seg\u00fan los detalles de rendimiento limitado que se muestran.<\/p>\n

Si est\u00e1 familiarizado con el DLSS de Nvidia, que ha existido durante cuatro a\u00f1os en varias encarnaciones, el video deber\u00eda despertar una aguda sensaci\u00f3n de Deja Vu. Tom Petersen, quien anteriormente trabaj\u00f3 para Nvidia y realiz\u00f3 algunas de las presentaciones antiguas de DLSS, explica los fundamentos de XeSS. Para resumir, XeSS se parece mucho a una versi\u00f3n reflejada de DLSS de Nvidia, excepto que est\u00e1 dise\u00f1ado para funcionar con los n\u00facleos XMX de aprendizaje profundo de Intel en lugar de los n\u00facleos tensoriales de Nvidia. Sin embargo, la tecnolog\u00eda tambi\u00e9n puede funcionar con otras GPU utilizando el modo DP4a, lo que podr\u00eda convertirla en una alternativa interesante al escalador FSR 2.0 de AMD.<\/p>\n

En las demostraciones mostradas por Intel, XeSS parec\u00eda estar funcionando bien. Por supuesto, es dif\u00edcil decir con certeza cu\u00e1ndo el video de origen es una versi\u00f3n comprimida de 1080p del contenido real, pero guardaremos las comparaciones detalladas de calidad de imagen para otro momento. Las ganancias de rendimiento parecen ser similares a las que hemos visto con DLSS, con un aumento de la velocidad de fotogramas de m\u00e1s del 100 % en algunas situaciones cuando se usa el modo XeSS Performance. <\/p>\n

C\u00f3mo funciona<\/h2>\n

Si ya sabe c\u00f3mo funciona DLSS, la soluci\u00f3n de Intel es pr\u00e1cticamente la misma, pero con algunos ajustes menores. XeSS es un algoritmo de mejora de resoluci\u00f3n acelerado por IA, dise\u00f1ado para aumentar la velocidad de fotogramas en los videojuegos.<\/p>\n

Comienza con el entrenamiento, el primer paso en la mayor\u00eda de los algoritmos de aprendizaje profundo. La red de IA toma fotogramas de muestra de menor resoluci\u00f3n de un juego y los procesa, generando lo que deber\u00edan ser im\u00e1genes de salida mejoradas. Luego, la red compara los resultados con la imagen de destino deseada y propaga hacia atr\u00e1s los ajustes de peso para tratar de corregir cualquier \u00aberror\u00bb. Al principio, las im\u00e1genes resultantes no se ver\u00e1n muy bien, pero el algoritmo de IA aprende lentamente de sus errores. Despu\u00e9s de miles (o m\u00e1s) de im\u00e1genes de entrenamiento, la red finalmente converge hacia los pesos ideales que generar\u00e1n \u00abm\u00e1gicamente\u00bb los resultados deseados.<\/p>\n

Una vez que el algoritmo se ha entrenado completamente, utilizando muestras de muchos juegos diferentes, en teor\u00eda puede tomar cualquier entrada de imagen de cualquier videojuego y mejorarla casi perfectamente. Al igual que con DLSS (y FSR 2.0), el algoritmo XeSS tambi\u00e9n asume la funci\u00f3n de suavizado y reemplaza soluciones cl\u00e1sicas como AA temporal.<\/p>\n

\n
\n
\n

<\/picture><\/p>\n<\/div>\n<\/div>

(Cr\u00e9dito de la imagen: Intel)<\/span><\/figcaption><\/figure>\n

Nuevamente, nada hasta ahora es particularmente digno de menci\u00f3n. DLSS y FSR 2.0 e incluso los algoritmos AA temporales est\u00e1ndar tienen muchas de las mismas funciones b\u00e1sicas, menos las cosas de IA para FSR y TAA. Los juegos integrar\u00e1n XeSS en su proceso de renderizado, generalmente despu\u00e9s de que se hayan realizado el renderizado principal y los efectos iniciales, pero antes de que se dibujen los efectos de posprocesamiento y los elementos GUI\/HUD. De esa manera, la interfaz de usuario se mantiene n\u00edtida mientras que la dif\u00edcil tarea de la representaci\u00f3n 3D se ejecuta a una resoluci\u00f3n m\u00e1s baja.<\/p>\n

XeSS opera en los n\u00facleos Arc XMX de Intel, pero tambi\u00e9n puede ejecutarse en otras GPU en un modo ligeramente diferente. Las instrucciones DP4a son b\u00e1sicamente cuatro c\u00e1lculos INT8 (entero de 8 bits) realizados con un solo registro de 32 bits, a lo que normalmente tendr\u00eda acceso a trav\u00e9s de un n\u00facleo GPU shader. Mientras tanto, los n\u00facleos XMX admiten de forma nativa INT8 y pueden operar en 128 valores a la vez.<\/p>\n

Eso puede parecer muy desequilibrado, pero como ejemplo, un Arc A380 tiene 1024 n\u00facleos de sombreado que podr\u00edan realizar cuatro operaciones INT8 al mismo tiempo. Alternativamente, el A380 tiene 128 unidades MXM que pueden realizar 128 operaciones INT8 cada una. Eso hace que el rendimiento MXM sea cuatro veces m\u00e1s r\u00e1pido que el rendimiento DP4a, pero aparentemente el modo DP4a a\u00fan deber\u00eda ser suficiente para cierto nivel de bondad XeSS.<\/p>\n

Tenga en cuenta que DP4a parece usar un diferente<\/em> red entrenada, una que es quiz\u00e1s menos intensiva computacionalmente. Queda por ver c\u00f3mo se traducir\u00e1 eso en rendimiento y calidad de imagen en el mundo real, y parece que los desarrolladores de juegos deber\u00e1n incluir expl\u00edcitamente soporte para los modos XMX y DP4a si quieren admitir GPU que no sean Arc.<\/p>\n

Expectativas de rendimiento de Intel XeSS<\/h2>\n