Nvidia revela los secretos de GPU de Ada Lovelace: Recuentos extremos de transistores en relojes altos


Cuando Nvidia presentó su familia de unidades de procesamiento de gráficos Ada Lovelace a principios de esta semana, se centró principalmente en su GPU AD102 de gama alta y su tarjeta gráfica insignia GeForce RTX 4090. No dio a conocer demasiados detalles sobre sus chips gráficos AD103 y AD104. Afortunadamente, Nvidia subió hoy su documento técnico de Ada Lovelace que contiene una gran cantidad de datos sobre las nuevas GPU y llena muchos vacíos. Hemos actualizado el concentrador de GPU de la serie RTX 40 con los nuevos detalles, pero aquí está la descripción general de la información nueva e interesante.

Grandes GPU para grandes juegos

Ya sabemos que el AD102 tope de gama de Nvidia es una GPU de 608 mm^2 que contiene 76.300 millones de transistores, 18.432 núcleos CUDA y 96 MB de caché L2. Ahora también sabemos que AD103 es un procesador de gráficos de 378,6 mm^2 con 45,9 mil millones de transistores, 10 240 núcleos CUDA y 64 MB de caché L2. En cuanto al AD104, tiene un tamaño de matriz de 294,5 mm^2, 35,800 millones de transistores, 7680 núcleos CUDA y 48 MB de L2.

Especificaciones de Nvidia Ada frente a Ampere
GPU/tarjeta gráfica AD102 completo RTX 4090 RTX 4080 16GB RTX 4080 12GB RTX 3090 Ti
Arquitectura AD102 AD102 AD103 AD104 GA102
Proceso tecnológico TSMC 4N TSMC 4N TSMC 4N TSMC 4N Samsung 8LPP
Transistores (miles de millones) 76.3 76.3 45,9 35.8 28.3
Tamaño del troquel (mm^2) 608 608 378.6 294.5 628.4
Multiprocesadores de transmisión 144 128 76 60 84
Núcleos de GPU (sombreadores) 18432 16384 9728 7680 10752
Núcleos tensoriales 576 512 320 240 336
Núcleos de trazado de rayos 144 144 80 60 84
TMU 512 512 304? 240 336
ROP 192 192 112 80 112
Caché L2 (MB) 96 96 64 48 6
Reloj de impulso (MHz) ? 2520 2505 2600 1860
TFLOPS FP32 (impulso) ? 82.6 48.7 40.1 40,0
TFLOPS FP16 (FP8) ? 661 (1321) 390 (780) 319 (639) 320 (N/D)
Trazado de rayos TFLOPS ? 191 113 82 78.1
Interfaz de memoria (bit) 384 384 256 192 384
Velocidad de memoria (GT/s) ? 21 22.4 21 21
Ancho de banda (GBps) ? 1008 736 504 1008
TDP (vatios) ? 450 320 285 450
Fecha de lanzamiento ? 12 de octubre de 2022 noviembre de 2022? noviembre de 2022? marzo 2022
Precio de lanzamiento ? $1,599 $1,199 $899 $1,999

Una de las cosas interesantes que cuenta Nvidia en su documento técnico es que las GPU Ada Lovelace usan transistores de alta velocidad en rutas críticas para aumentar las velocidades máximas de reloj. Como resultado, su GPU AD102 totalmente habilitada con 18 432 núcleos CUDA es «capaz de funcionar a velocidades superiores a 2,5 GHz, manteniendo el mismo TGP de 450 W». Teniendo esto en cuenta, no nos sorprende que la compañía esté hablando de relojes de 3.0 GHz para la GeForce RTX 4090 (con 16,384 núcleos CUDA) alcanzados en sus laboratorios. A 3,0 GHz, la GeForce RTX 4090 encabezará absolutamente nuestra lista de las mejores tarjetas gráficas.

(Crédito de la imagen: Nvidia)

Además de los relojes altos, la GPU Ada Lovelace de Nvidia también cuenta con cachés L2 masivos que mejoran el rendimiento en cargas de trabajo intensivas (por ejemplo, trazado de rayos, seguimiento de rutas, simulaciones, etc.) y reducen los requisitos de ancho de banda de memoria. Esencialmente, las GPU Ada de Nvidia toman una página del libro de RDNA 2 Infinity Cache aquí, aunque creemos que los objetivos generales para la nueva arquitectura se establecieron mucho antes de que los productos de la serie Radeon RX 6000 de AMD debutaran en 2020.



Source link-41