Las computadoras portátiles de la serie RTX 40 de Nvidia no son un buen augurio para las GPU de escritorio RTX 4060, 4050


La arquitectura Ada Lovelace de Nvidia marca el comienzo de un nuevo nivel de rendimiento en la parte superior de la pila, con el RTX 4090 superando al RTX 3090 Ti de la generación anterior en un 52 % en promedio en nuestros puntos de referencia de rasterización y en un 70 % en los puntos de referencia de trazado de rayos, ambos en 4K , naturalmente. La 4090 ahora se encuentra cómodamente en la cima de nuestra jerarquía de puntos de referencia de GPU y se clasifica como una de las mejores tarjetas gráficas, al menos si tiene mucho dinero.

Desafortunadamente, el paso del 4090 al RTX 4080 es bastante precipitado, ya que reduce el rendimiento en un 23 % para la rasterización y en un 30 % para el trazado de rayos. Bajar otro nivel a la nueva RTX 4070 Ti reduce un 22 % adicional el rendimiento en relación con la 4080. Si lleva un registro, y definitivamente nos gusta llevar la cuenta, eso significa que la tarjeta Ada de tercera serie luce la GPU AD104. es más lento que la generación anterior 3090 Ti, sin importar las afirmaciones de Nvidia de lo contrario que se basan en puntos de referencia que utilizan Frame Generation de DLSS 3.

Quizás lo más alarmante con el RTX 4070 Ti es que solo tiene una interfaz de memoria de 192 bits. Todavía tiene 12 GB de memoria GDDR6X, y el gran caché L2 en general significa que el bus más angosto no es un problema, pero las cosas no se ven tan bien como vemos en las futuras partes de la serie RTX 40 de nivel inferior como el 4060. y 4050.

Nvidia anunció recientemente la línea completa de GPU para portátiles de la serie RTX 40, que van desde el móvil RTX 4090 que utiliza la GPU AD103 (básicamente un móvil 4080) hasta el RTX 4050 que suena anémico. Aquí está la lista completa de especificaciones para las partes móviles .

Desliza para desplazarte horizontalmente
Especificaciones de GPU para portátiles Nvidia Ada
Tarjeta grafica RTX 4090 para portátiles RTX 4080 para portátiles RTX 4070 para portátiles RTX 4060 para portátiles RTX 4050 para portátiles
Arquitectura AD103 AD104 AD106? AD106? AD107?
Proceso tecnológico TSMC 4N TSMC 4N TSMC 4N TSMC 4N TSMC 4N
Transistores (miles de millones) 45,9 35.8 ? ? ?
Tamaño del troquel (mm^2) 378.6 294.5 ? ? ?
SMS 76 58 36 24 20
Sombreadores de GPU 9728 7424 4608 3072 2560
Núcleos tensoriales 304 232 144 96 80
Trazado de rayos «núcleos» 76 58 36 24 20
Reloj de impulso (MHz) 1455-2040 1350-2280 1230-2175 1470-2370 1605-2370
Velocidad VRAM (Gbps) 18? 18? 18? 18? 18?
VRAM (GB) dieciséis 12 8 8 6
Ancho de bus VRAM 256 192 128 128 96
Caché L2 64 48 32 32 24
ROP 112 80 48 32 32
TMU 304 232 144 96 80
TFLOPS FP32 (impulso) 28,3-39,7 20,0-33,9 11.3-20.0 9.0-14.6 8.2-12.1
TFLOPS FP16 (FP8) 226-318 (453-635) 160-271 (321-542) 91-160 (181-321) 72-116 (145-233) 66-97 (131-194)
Ancho de banda (GBps) 576 432 288 288 216
TDP (vatios) 80-150 60-150 35-115 35-115 35-115

Es una apuesta razonablemente segura que la computadora de escritorio RTX 4070 usará el mismo AD104 que la RTX 4070 Ti, solo que con menos SM y shaders. Desktop RTX 4060 Ti, suponiendo que lo consigamos pronto, puede o no usar AD104; presumiblemente, la única otra opción sería la GPU AD106 utilizada en el móvil 4070/4060. Y eso es un problema.

La generación anterior de RTX 3060 Ti venía con 8 GB de GDDR6 en una interfaz de 256 bits. No estábamos particularmente complacidos con la falta de VRAM, especialmente cuando AMD comenzó a comercializar la RX 6700 XT (y luego la 6750 XT) con 12 GB de VRAM. Básicamente, Nvidia hizo una corrección de rumbo con el RTX 3060 y le dio 12 GB de VRAM, lo que lo convierte en un buen paso adelante del RTX 2060 anterior, e incluso el 2060 finalmente vio modelos de 12 GB, aunque los precios los hicieron en su mayoría poco atractivos.

Ahora estamos hablando de que lo más probable es que RTX 4060 regrese a 8 GB, y eso apestaría. Ahora hay muchos juegos que pueden exceder los 8 GB de uso de VRAM, y ese número solo crecerá en los próximos dos años. Pero Nvidia no tiene muchas otras opciones, ya que las capacidades de memoria GDDR6 y GDDR6X superan los 2 GB por canal de 32 bits.

Existe la posibilidad de hacer el modo «clamshell» con dos chips de memoria por canal, uno a cada lado de la PCB, pero eso es bastante complicado y no es algo que esperaríamos ver en una GPU convencional. Eso podría hacer que la interfaz de 128 bits tenga hasta 16 GB de VRAM, lo que nuevamente sería extraño ya que las partes de nivel superior como el 4070 Ti solo tienen 12 GB. Aún así, ¡eso me suena mejor que un modelo RTX 4060 de 8 GB!

¿Y qué hay de la RTX 4050? Tal vez Nvidia se quede con la interfaz de 128 bits en la GPU AD106 y simplemente omita el uso de AD107 en una parte de escritorio; eso es básicamente lo que sucedió con GA107 que se usó casi exclusivamente para la computadora portátil RTX 3050. Pero si intenta usar AD107 en un escritorio, solo tendría hasta 6 GB de VRAM, nuevamente con VRAM de concha como una posible salida.

La misma GPU AD104 se encuentra dentro de la tarjeta de escritorio RTX 4070 Ti de Nvidia, así como en la próxima solución para computadora portátil RTX 4080. (Crédito de la imagen: Hardware de Tom)

No son solo las capacidades de la memoria las que plantean cierta preocupación. Dijimos en la revisión de la RTX 4070 Ti que el rendimiento no era malo, pero tampoco sorprendente. Básicamente es una versión más económica de un RTX 3090, con la mitad de VRAM y un menor consumo de energía. El 4070 Ti se las arregla con 60 multiprocesadores de transmisión (SM) y 7680 núcleos CUDA (sombreadores de GPU), un poco más que el RTX 3070 Ti saliente. Pero AD106 podría alcanzar un máximo de solo 40 SM, tal vez incluso 36 SM, lo que lo colocaría en un territorio similar al RTX 3060 Ti en el recuento de núcleos, dejando solo los relojes de GPU como un impulso de rendimiento.

Ponga esas dos cosas juntas: VRAM insuficiente y aumentos relativamente menores en el recuento de sombreadores de GPU, y es probable que estemos viendo mejoras modestas en el rendimiento en comparación con las GPU de la generación Ampere anterior.

Luego, Nvidia presentará las mejoras de rendimiento de DLSS 3, que solo se aplican a un subconjunto de juegos y tampoco ofrecen aumentos reales de rendimiento, y las cosas comienzan a sonar aún peor. Parte del beneficio de tener una GPU que puede ejecutar juegos a 120 fps hoy en día es que, a medida que los juegos se vuelven más exigentes, aún podrá hacerlo a 60 fps en la mayoría de los juegos dentro de algunos años. Pero, ¿qué sucede cuando esos no son verdadero velocidades de fotogramas?

Nvidia controlador DLSS3 juegos

(Crédito de la imagen: Nvidia)

Supongamos que un juego se ejecuta a 120 fps por cortesía de la tecnología Frame Generation de DLSS 3, con un rendimiento base de 70 fps. Todo está bien por ahora, pero en el futuro, el rendimiento base caerá por debajo de los 40 fps a medida que los juegos se vuelvan más exigentes y, finalmente, caerá por debajo de los 30 fps. Lo que hemos experimentado es que la generación de fotogramas con una velocidad de fotogramas base de menos de 30 fps todavía se siente como por debajo de los 30 fps, incluso si el monitor recibe el doble de actualizaciones de fotogramas por segundo.

Esa misma lógica también se aplica a velocidades de cuadro más altas, por lo que DLSS 3 a 120 fps con una base de 70 fps seguirá pareciendo 70 fps, incluso si se ve un poco más suave a la vista. La mayoría de las personas no podrán notar la diferencia entre las tasas de entrada a 70 muestras por segundo y las entradas a 120 muestras por segundo. Pero cuando comienzas a caer por debajo de 40, incluso los jugadores no profesionales comenzarán a sentir la diferencia.

O para decirlo sin rodeos: DLSS 3 y Frame Generation no son la panacea. Pueden ayudar a suavizar las imágenes y tal vez mejorar un poco la sensación de los juegos, pero el beneficio no será tan notable como los cuadros totalmente renderizados reales con la nueva entrada del usuario, especialmente cuando el rendimiento cae por debajo de 60 fps.

Eso no quiere decir que sea una mala tecnología, en realidad es bastante inteligente, y no nos importa que exista. Pero Nvidia debe dejar de comparar las puntuaciones de DLSS 3 con los resultados que no son de DLSS 3 y actuar como si fueran lo mismo. Tome la tasa de fotogramas base antes de la Generación de fotogramas y agregue tal vez un 10-20 por ciento y así es como se siente un juego, no el 60-100 por ciento más de fps que mostrarán los puntos de referencia.

Volviendo al tema que nos ocupa, las futuras GPU de la serie RTX 40 convencionales y económicas sin duda superarán a los modelos existentes en rendimiento puro, y también ofrecerán compatibilidad con DLSS 3. Sin embargo, con suerte, Nvidia volverá a precios más cercanos a la generación anterior, porque si el RTX 4060 cuesta $ 499 y el RTX 4050 cuesta $ 399, terminarán siendo actualizaciones menores en comparación con las tarjetas existentes en esos puntos de precio.



Source link-41