Nvidia tiene forma cuando se trata de bloquear GPU más antiguas de nuevas tecnologías y funciones. Entonces, cuando lanzó la tecnología de ampliación DLSS, limitándola a la última arquitectura de GPU en ese momento, siempre estuvo la pregunta de si eso era estrictamente necesario. Si, tal vez, DLSS pudiera ejecutarse en GPU más antiguas, ¿fue simplemente que Nvidia prefirió ayudar a las ventas generacionales restringiendo la tecnología a hardware más nuevo?
Esa sospecha solo se ve aumentada por el hecho de que tanto el FSR de AMD como el XeSS de Intel pueden ejecutarse en una gama mucho más amplia de GPU, incluidas las de la competencia (para mayor claridad, el XeSS de Intel vino en dos versiones, una ampliamente compatible y la otra que requería Intel). GPU Arc). Entonces, todo esto se reduce a la cuestión de si el escalado DLSS realmente se apoya en gran medida en esos núcleos Tensor que aceleran la IA, como afirma Nvidia.
Bueno, ahora aparentemente tenemos una especie de respuesta. Y resulta que DLSS realmente necesita esos núcleos Tensor.
Un intrépido cartel de Reddit, bajo el nombre de Bluedot55, aprovechó las herramientas métricas de GPU Nsight Systems de Nvidia para profundizar en las cargas de trabajo que se ejecutan en varias partes de una GPU Nvidia RTX 4090.
Bluedot55 ejecutó escaladores DLSS y de terceros en una Nvidia RTX 4090 y midió la utilización del núcleo Tensor. En cuanto al uso promedio del núcleo Tensor, las cifras bajo DLSS fueron extremadamente bajas, menos del 1%.
Las investigaciones iniciales sugirieron que incluso la utilización máxima se registró en el rango del 4-9%, lo que implica que si bien se estaban utilizando los núcleos Tensor, probablemente no eran realmente esenciales. Sin embargo, el aumento de la tasa de encuestas reveló que la utilización máxima es, de hecho, superior al 90%, pero sólo durante breves períodos medidos en microsegundos.
Cuando lo piensas, tiene sentido. El proceso de ampliación debe ser ultrarrápido para no ralentizar la velocidad de fotogramas general. Tiene que tomar un fotograma renderizado, procesarlo, hacer todos los cálculos necesarios para la ampliación y generar el fotograma mejorado completo antes de que la canalización 3D haya tenido tiempo de generar un nuevo fotograma.
Entonces, lo que se esperaría encontrar es exactamente lo que observó Bluedot55. Una explosión de actividad increíblemente breve pero intensa dentro de los núcleos Tensor cuando se habilita la ampliación DLSS.
Por supuesto, las GPU de Nvidia han ofrecido núcleos Tensor durante tres generaciones y hay que volver a la serie GTX 10 para encontrar una GPU Nvidia que no admita DLSS en absoluto. Sin embargo, a medida que Nvidia agrega nuevas características al superconjunto general DLSS, como Frame Generation, el hardware más nuevo se queda atrás.
Lo que muestra esta investigación es que, si bien es tentador dudar de los motivos de Nvidia cada vez que parece bloquear a las GPU más antiguas de una nueva función, la realidad puede ser simplemente que las nuevas GPU pueden hacer cosas que las antiguas no pueden. Eso es progreso para ti.