{"id":188954,"date":"2022-09-23T23:09:27","date_gmt":"2022-09-23T23:09:27","guid":{"rendered":"https:\/\/magazineoffice.com\/nvidia-revela-los-secretos-de-gpu-de-ada-lovelace-recuentos-extremos-de-transistores-en-relojes-altos\/"},"modified":"2022-09-23T23:09:29","modified_gmt":"2022-09-23T23:09:29","slug":"nvidia-revela-los-secretos-de-gpu-de-ada-lovelace-recuentos-extremos-de-transistores-en-relojes-altos","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/nvidia-revela-los-secretos-de-gpu-de-ada-lovelace-recuentos-extremos-de-transistores-en-relojes-altos\/","title":{"rendered":"Nvidia revela los secretos de GPU de Ada Lovelace: Recuentos extremos de transistores en relojes altos"},"content":{"rendered":"


\n<\/p>\n

\n

Cuando Nvidia present\u00f3 su familia de unidades de procesamiento de gr\u00e1ficos Ada Lovelace a principios de esta semana, se centr\u00f3 principalmente en su GPU AD102 de gama alta y su tarjeta gr\u00e1fica insignia GeForce RTX 4090. No dio a conocer demasiados detalles sobre sus chips gr\u00e1ficos AD103 y AD104. Afortunadamente, Nvidia subi\u00f3 hoy su documento t\u00e9cnico de Ada Lovelace que contiene una gran cantidad de datos sobre las nuevas GPU y llena muchos vac\u00edos. Hemos actualizado el concentrador de GPU de la serie RTX 40 con los nuevos detalles, pero aqu\u00ed est\u00e1 la descripci\u00f3n general de la informaci\u00f3n nueva e interesante.<\/p>\n

Grandes GPU para grandes juegos <\/h2>\n

Ya sabemos que el AD102 tope de gama de Nvidia es una GPU de 608 mm^2 que contiene 76.300 millones de transistores, 18.432 n\u00facleos CUDA y 96 MB de cach\u00e9 L2. Ahora tambi\u00e9n sabemos que AD103 es un procesador de gr\u00e1ficos de 378,6 mm^2 con 45,9 mil millones de transistores, 10\u00a0240 n\u00facleos CUDA y 64 MB de cach\u00e9 L2. En cuanto al AD104, tiene un tama\u00f1o de matriz de 294,5 mm^2, 35,800 millones de transistores, 7680 n\u00facleos CUDA y 48 MB de L2.<\/p>\n

\n
\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n
Especificaciones de Nvidia Ada frente a Ampere<\/caption>\n
GPU\/tarjeta gr\u00e1fica<\/th>\nAD102 completo<\/th>\nRTX 4090<\/th>\nRTX 4080 16GB<\/th>\nRTX 4080 12GB<\/th>\nRTX 3090 Ti<\/th>\n<\/tr>\n<\/thead>\n
Arquitectura<\/td>\nAD102<\/td>\nAD102<\/td>\nAD103<\/td>\nAD104<\/td>\nGA102<\/td>\n<\/tr>\n
Proceso tecnol\u00f3gico<\/td>\nTSMC 4N<\/td>\nTSMC 4N<\/td>\nTSMC 4N<\/td>\nTSMC 4N<\/td>\nSamsung 8LPP<\/td>\n<\/tr>\n
Transistores (miles de millones)<\/td>\n76.3<\/td>\n76.3<\/td>\n45,9<\/td>\n35.8<\/td>\n28.3<\/td>\n<\/tr>\n
Tama\u00f1o del troquel (mm^2)<\/td>\n608<\/td>\n608<\/td>\n378.6<\/td>\n294.5<\/td>\n628.4<\/td>\n<\/tr>\n
Multiprocesadores de transmisi\u00f3n<\/td>\n144<\/td>\n128<\/td>\n76<\/td>\n60<\/td>\n84<\/td>\n<\/tr>\n
N\u00facleos de GPU (sombreadores)<\/td>\n18432<\/td>\n16384<\/td>\n9728<\/td>\n7680<\/td>\n10752<\/td>\n<\/tr>\n
N\u00facleos tensoriales<\/td>\n576<\/td>\n512<\/td>\n320<\/td>\n240<\/td>\n336<\/td>\n<\/tr>\n
N\u00facleos de trazado de rayos<\/td>\n144<\/td>\n144<\/td>\n80<\/td>\n60<\/td>\n84<\/td>\n<\/tr>\n
TMU<\/td>\n512<\/td>\n512<\/td>\n304?<\/td>\n240<\/td>\n336<\/td>\n<\/tr>\n
ROP<\/td>\n192<\/td>\n192<\/td>\n112<\/td>\n80<\/td>\n112<\/td>\n<\/tr>\n
Cach\u00e9 L2 (MB)<\/td>\n96<\/td>\n96<\/td>\n64<\/td>\n48<\/td>\n6<\/td>\n<\/tr>\n
Reloj de impulso (MHz)<\/td>\n?<\/td>\n2520<\/td>\n2505<\/td>\n2600<\/td>\n1860<\/td>\n<\/tr>\n
TFLOPS FP32 (impulso)<\/td>\n?<\/td>\n82.6<\/td>\n48.7<\/td>\n40.1<\/td>\n40,0<\/td>\n<\/tr>\n
TFLOPS FP16 (FP8)<\/td>\n?<\/td>\n661 (1321)<\/td>\n390 (780)<\/td>\n319 (639)<\/td>\n320 (N\/D)<\/td>\n<\/tr>\n
Trazado de rayos TFLOPS<\/td>\n?<\/td>\n191<\/td>\n113<\/td>\n82<\/td>\n78.1<\/td>\n<\/tr>\n
Interfaz de memoria (bit)<\/td>\n384<\/td>\n384<\/td>\n256<\/td>\n192<\/td>\n384<\/td>\n<\/tr>\n
Velocidad de memoria (GT\/s)<\/td>\n?<\/td>\n21<\/td>\n22.4<\/td>\n21<\/td>\n21<\/td>\n<\/tr>\n
Ancho de banda (GBps)<\/td>\n?<\/td>\n1008<\/td>\n736<\/td>\n504<\/td>\n1008<\/td>\n<\/tr>\n
TDP (vatios)<\/td>\n?<\/td>\n450<\/td>\n320<\/td>\n285<\/td>\n450<\/td>\n<\/tr>\n
Fecha de lanzamiento<\/td>\n?<\/td>\n12 de octubre de 2022<\/td>\nnoviembre de 2022?<\/td>\nnoviembre de 2022?<\/td>\nmarzo 2022<\/td>\n<\/tr>\n
Precio de lanzamiento<\/td>\n?<\/td>\n$1,599<\/td>\n$1,199<\/td>\n$899<\/td>\n$1,999<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n

Una de las cosas interesantes que cuenta Nvidia en su documento t\u00e9cnico es que las GPU Ada Lovelace usan transistores de alta velocidad en rutas cr\u00edticas para aumentar las velocidades m\u00e1ximas de reloj. Como resultado, su GPU AD102 totalmente habilitada con 18 432 n\u00facleos CUDA es \u00abcapaz de funcionar a velocidades superiores a 2,5 GHz, manteniendo el mismo TGP de 450 W\u00bb. Teniendo esto en cuenta, no nos sorprende que la compa\u00f1\u00eda est\u00e9 hablando de relojes de 3.0 GHz para la GeForce RTX 4090 (con 16,384 n\u00facleos CUDA) alcanzados en sus laboratorios. A 3,0 GHz, la GeForce RTX 4090 encabezar\u00e1 absolutamente nuestra lista de las mejores tarjetas gr\u00e1ficas. <\/p>\n

\n
\n
\n

<\/picture><\/p>\n<\/div>\n<\/div>

(Cr\u00e9dito de la imagen: Nvidia)<\/span><\/figcaption><\/figure>\n

Adem\u00e1s de los relojes altos, la GPU Ada Lovelace de Nvidia tambi\u00e9n cuenta con cach\u00e9s L2 masivos que mejoran el rendimiento en cargas de trabajo intensivas (por ejemplo, trazado de rayos, seguimiento de rutas, simulaciones, etc.) y reducen los requisitos de ancho de banda de memoria. Esencialmente, las GPU Ada de Nvidia toman una p\u00e1gina del libro de RDNA 2 Infinity Cache aqu\u00ed, aunque creemos que los objetivos generales para la nueva arquitectura se establecieron mucho antes de que los productos de la serie Radeon RX 6000 de AMD debutaran en 2020. <\/p>\n