{"id":188095,"date":"2022-09-23T15:50:42","date_gmt":"2022-09-23T15:50:42","guid":{"rendered":"https:\/\/magazineoffice.com\/nvidia-detalla-el-diagrama-de-bloques-de-la-gpu-ada-lovelace-multiprocesador-de-transmision-dlss-3-y-geforce-rtx-40-founders-edition-cooler\/"},"modified":"2022-09-23T15:50:43","modified_gmt":"2022-09-23T15:50:43","slug":"nvidia-detalla-el-diagrama-de-bloques-de-la-gpu-ada-lovelace-multiprocesador-de-transmision-dlss-3-y-geforce-rtx-40-founders-edition-cooler","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/nvidia-detalla-el-diagrama-de-bloques-de-la-gpu-ada-lovelace-multiprocesador-de-transmision-dlss-3-y-geforce-rtx-40-founders-edition-cooler\/","title":{"rendered":"NVIDIA detalla el diagrama de bloques de la GPU Ada Lovelace, multiprocesador de transmisi\u00f3n, DLSS 3 y GeForce RTX 40 Founders Edition Cooler"},"content":{"rendered":"
\n<\/p>\n
Durante su charla t\u00e9cnica de prensa, NVIDIA habl\u00f3 sobre varias tecnolog\u00edas que rodean a las pr\u00f3ximas tarjetas gr\u00e1ficas GeForce RTX 40 basadas en las GPU Ada Lovelace. Algunas de las tecnolog\u00edas que se destacaron incluyeron la propia GPU Ada Lovelace, la \u00faltima tecnolog\u00eda DLSS 3 y los refrigeradores incluidos en los nuevos modelos Founders Edition.<\/p>\n
NVIDIA lanzar\u00e1 su primera tarjeta gr\u00e1fica de la serie GeForce RTX 40, la RTX 4090, el 12 de octubre, seguida de la serie RTX 4080 en noviembre. Hay mucho de qu\u00e9 hablar, as\u00ed que comencemos.<\/p>\n
En el coraz\u00f3n de la tarjeta gr\u00e1fica NVIDIA GeForce RTX 4090 se encuentra la GPU Ada Lovelace AD102. La GPU mide 608,4 mm2 y utilizar\u00e1 el nodo de proceso 4N de TSMC, que es una versi\u00f3n optimizada del nodo de 5nm (N5) de TSMC dise\u00f1ado para el equipo verde. La GPU cuenta con 76,3 mil millones de transistores.<\/p>\n La GPU NVIDIA Ada Lovelace AD102 presenta hasta 12 GPC (clusters de procesamiento de gr\u00e1ficos). Estos son 5 SM m\u00e1s en comparaci\u00f3n con las GPU Ampere GA102. Cada GPU constar\u00e1 de 6 TPC y 2 SM, que es la misma configuraci\u00f3n que el chip existente. Cada SM (multiprocesador de transmisi\u00f3n) albergar\u00e1 cuatro subn\u00facleos, que tambi\u00e9n es lo mismo que la GPU GA102. Lo que ha cambiado es la configuraci\u00f3n central de FP32 y INT32. Cada subn\u00facleo incluir\u00e1 64 unidades FP32, pero las unidades FP32+INT32 combinadas llegar\u00e1n a 128. Esto se debe a que la mitad de las unidades FP32 no comparten el mismo subn\u00facleo que las unidades IN32. Los 64 n\u00facleos FP32 est\u00e1n separados de los 128 n\u00facleos INT32.<\/p>\n Entonces, en total, cada subn\u00facleo constar\u00e1 de 16 unidades FP32 m\u00e1s 16 unidades INT32 para un total de 32 unidades. Cada SM tendr\u00e1 un total de 64 unidades FP32 m\u00e1s 64 unidades INT32 para un total de 128 unidades. Y dado que hay un total de 144 unidades SM (12 por GPC), estamos viendo un total de 18 432 n\u00facleos. Cada SM tambi\u00e9n incluir\u00e1 dos programas de ajuste (32 subprocesos\/CLK) para 64 ajustes por SM y su propio i-cach\u00e9 L0. Este es un aumento del 33 % en Wraps\/Threads frente a la GPU GA102. El tama\u00f1o del archivo de registro es de 16 384 en un carril de 32 bits. Cada SM tambi\u00e9n lleva sus propios 128 KB de cach\u00e9 de datos L1 y memoria compartida, por lo que son 18 MB de cach\u00e9 L1.<\/p>\n Pasando al cach\u00e9, este es otro segmento en el que NVIDIA ha dado un gran impulso a las GPU Ampere existentes. El cach\u00e9 L2 se incrementar\u00e1 a 96 MB como se menciona en las filtraciones. Este es un aumento de 16 veces con respecto a la GPU Ampere que aloja solo 6 MB de cach\u00e9 L2. El cach\u00e9 se compartir\u00e1 en la GPU. La GPU tambi\u00e9n contar\u00e1 con hasta 192 ROP para el dado completo.<\/p>\n Tambi\u00e9n habr\u00e1 los \u00faltimos n\u00facleos Tensor de cuarta generaci\u00f3n y RT (trazado de rayos) de tercera generaci\u00f3n infundidos en las GPU Ada Lovelace que ayudar\u00e1n a impulsar el rendimiento de DLSS y Raytracing al siguiente nivel. En general, la GPU Ada Lovelace AD102 ofrecer\u00e1:<\/p>\n El dado completo no se ha presentado en ninguna GPU hasta el momento, ni siquiera en la L40 que tiene 2 SM deshabilitados. Es probable que, a medida que aumente el rendimiento, finalmente veamos un producto para juegos y estaciones de trabajo que use el AD102 completo. Hasta entonces, la RTX 4090 es la mejor tarjeta gr\u00e1fica para juegos, mientras que la RTX 6000 Ada es la mejor soluci\u00f3n para estaciones de trabajo.<\/p>\n Diagrama de bloques de la GPU para juegos NVIDIA AD102 ‘Ada Lovelace’:<\/strong><\/p>\n Diagrama de bloques de la GPU para juegos NVIDIA AD102 ‘Ada Lovelace’ ‘SM’:<\/strong><\/p>\n En cuanto a sus nuevas tarjetas Founders Edition, GeForce RTX 4090 de 24 GB y RTX 4080 de 16 GB, NVIDIA ha producido una placa de circuito impreso compacta, similar a las que vimos en la generaci\u00f3n anterior y el dise\u00f1o de una placa de circuito impreso como esta ayuda a mejorar el flujo de aire y el rendimiento de refrigeraci\u00f3n. .<\/p>\n NVIDIA dice que han optimizado a\u00fan m\u00e1s el sistema Dual Axial Flow Through, aumentando el tama\u00f1o de los ventiladores y el volumen de las aletas en un 10 %, ofreciendo un 20 % m\u00e1s de flujo de aire y actualizando a una fuente de alimentaci\u00f3n de 23 fases (20+3 fases para RTX 4090) . Las temperaturas de la memoria se reducen y las nuevas GPU Ada, sustancialmente m\u00e1s potentes, se mantienen frescas en gabinetes ventilados, lo que les brinda a los jugadores un excelente margen para el overclocking. NVIDIA pas\u00f3 por un riguroso procedimiento de prueba y se dice que evalu\u00f3 hasta 50 dise\u00f1os de ventiladores antes de finalizar el que estamos obteniendo en las nuevas tarjetas. El enfriador se usa para disipar el calor del conjunto del disipador de calor que comprende una c\u00e1mara de vapor, un gran salto con respecto al dise\u00f1o anterior tambi\u00e9n.<\/p>\n La NVIDIA GeForce RTX 4080 tambi\u00e9n usa el mismo enfriador que la RTX 4090 Founders Edition y, dado que tiene un TDP m\u00e1s bajo, deber\u00eda ofrecer un rendimiento t\u00e9rmico a\u00fan mejor.<\/p>\n Cada tarjeta gr\u00e1fica GeForce RTX 40 Series Founders Edition reduce el desorden de cables al aprovechar la nueva entrada de alimentaci\u00f3n GPU est\u00e1ndar de las fuentes de alimentaci\u00f3n ATX 3.0 de pr\u00f3xima generaci\u00f3n, el conector PCIe Gen-5 de 16 pines. Esto le permite alimentar las tarjetas gr\u00e1ficas GeForce RTX Serie 40 con un solo cable, mejorando la est\u00e9tica de su construcci\u00f3n. Si est\u00e1 utilizando una fuente de alimentaci\u00f3n de generaci\u00f3n anterior, se incluye un cable adaptador en la caja, lo que le permite enchufar tres conectores de alimentaci\u00f3n de 8 pines, con un cuarto conector opcional para un mayor margen de overclocking. Las fuentes de alimentaci\u00f3n ATX 3.0 estar\u00e1n disponibles en octubre de ASUS, Cooler Master, FSP, Gigabyte, iBuyPower, MSI y ThermalTake, con m\u00e1s modelos por venir.<\/p>\n Una ventaja que viene con el nuevo conector de 16 pines es que, si bien las tarjetas Founders Edition est\u00e1n dise\u00f1adas a 450 W y 320 W, respectivamente, pueden utilizar el espacio libre adicional proporcionado a trav\u00e9s del nuevo conector para un overclocking extremo con el RTX 4090 buscando esos 600 W completos. Marcos. La nueva entrega de energ\u00eda tambi\u00e9n le da a la serie RTX 40 un aumento de 10 veces en el tiempo de respuesta a la administraci\u00f3n de transitorios de energ\u00eda en comparaci\u00f3n con la generaci\u00f3n anterior.<\/p>\n Las nuevas tarjetas tambi\u00e9n cuentan con DP 1.4a (4K 12 bits HDR @ 240Hz) y HDMI 2.1 (4K 120Hz HDR \/ 8K 60Hz HDR). Todas las tarjetas cumplen con la interfaz PCIe Gen 4 en las placas base existentes y tambi\u00e9n cuentan con el cumplimiento total de las tecnolog\u00edas Resizable-BAR.<\/p>\n Placa de circuito impreso NVIDIA GeForce RTX 4090 Founders Edition:<\/strong><\/p>\n NVIDIA tambi\u00e9n ha aprovechado los \u00faltimos chips de memoria GDDR6X de Micron para sus tarjetas gr\u00e1ficas GeForce RTX 40 que funcionan con 10C m\u00e1s fr\u00edas, son m\u00e1s eficientes en el consumo de energ\u00eda y, dado que todas son matrices DRAM de 16 Gb, se pueden fusionar en un lado de la placa de circuito impreso para que se enfr\u00eden mejor que las duales. memoria lateral.<\/p>\n Ahora, profundicemos en los avances tecnol\u00f3gicos que permiten estos incre\u00edbles logros. Para empezar, los ingenieros de NVIDIA comenzaron con DLSS Super Resolution y agregaron algo llamado Generaci\u00f3n \u00f3ptica de m\u00faltiples cuadros basada en el Acelerador de flujo \u00f3ptico de Ada. Este acelerador analiza dos cuadros secuenciales de un juego en particular, capturando detalles de p\u00edxeles como part\u00edculas, reflejos, luces y sombras.<\/p>\n Adem\u00e1s de eso, NVIDIA DLSS 3 tambi\u00e9n tiene en cuenta la informaci\u00f3n del motor de juego convencional, como los vectores de movimiento. La red de codificador autom\u00e1tico convolucional de IA de generaci\u00f3n de cuadros DLSS decidir\u00e1 c\u00f3mo usar cada una de las cuatro entradas (cuadros actuales y anteriores, campo de flujo \u00f3ptico y vectores de movimiento) para recrear cuadros intermedios de la mejor manera posible.<\/p>\n Se dice que NVIDIA DLSS 3 reconstruye 3\/4 del primer fotograma con DLSS Super Resolution y el segundo fotograma completo con la ayuda de la generaci\u00f3n de fotogramas DLSS antes mencionada. En general, NVIDIA DLSS 3 reconstruye 7\/8 de los dos cuadros totales que se muestran, lo que explica la mejora masiva del rendimiento.<\/p>\n Adem\u00e1s, la nueva versi\u00f3n de la t\u00e9cnica de reconstrucci\u00f3n de im\u00e1genes Deep Learning Super Sampling tambi\u00e9n incluye la tecnolog\u00eda NVIDIA Reflex para reducir la latencia.<\/p>\n Entonces, hablando de la compatibilidad con GPU DLSS, la tecnolog\u00eda contar\u00e1 con la generaci\u00f3n de cuadros DLSS completa en todas las GPU de la serie RTX 40. Para las series RTX 20 y RTX 30 m\u00e1s antiguas, la tecnolog\u00eda estar\u00e1 disponible como la suite DLSS Super Resolution (tambi\u00e9n en RTX 40). Por \u00faltimo, NVIDIA Reflex ser\u00e1 compatible con la serie GeForce 900 y superior.<\/p>\n Se ha demostrado que Cyberpunk 2077 ejecuta NVIDIA DLSS 3, el nuevo Ray Tracing Overdrive y NVIDIA Reflex con un rendimiento mejorado hasta 4 veces y una latencia reducida hasta 2 veces. Eso no es todo, ya que NVIDIA incluso promete beneficios para los juegos vinculados a la CPU, que generalmente no se ejecutaron mucho m\u00e1s r\u00e1pido con DLSS 2.0. Por ejemplo, Microsoft Flight Simulator, notoriamente pesado en la CPU, obtiene un rendimiento mejorado hasta 2 veces con el nuevo DLSS. En general, NVIDIA dijo que los siguientes m\u00e1s de 35 juegos y aplicaciones ya prometieron compatibilidad con NVIDIA DLSS 3.<\/p>\n Las tarjetas gr\u00e1ficas NVIDIA GeForce RTX 4080 de 16 GB y RTX 4080 de 12 GB se lanzar\u00e1n en noviembre y tendr\u00e1n un precio de $1199 USD y $899 USD, respectivamente.<\/p>\n <\/p>\n<\/figure>\n
<\/figure>\n
\n
<\/figure>\n
<\/figure>\n
NVIDIA Founders Edition dise\u00f1ada para utilizar hasta 600 W de potencia para un mayor overclocking<\/h4>\n
<\/figure>\n
<\/figure>\n
<\/figure>\n
Los troqueles Micron GDDR6X de pr\u00f3xima generaci\u00f3n funcionan con un enfriador de 10C gracias a un nuevo nodo de proceso<\/h4>\n
NVIDIA DLSS 3: compatibilidad, conjunto de funciones, rendimiento de juegos y m\u00e1s<\/h3>\n
<\/figure>\n
<\/figure>\n
\n\n
\n \n \n
\n \n
<\/em><\/span><\/li>\n
<\/em><\/span><\/li>\n
<\/em><\/span><\/li>\nEspecificaciones preliminares de la serie NVIDIA GeForce RTX 40:<\/h2>\n
\n\n
\n \nNombre de la tarjeta gr\u00e1fica<\/th>\n NVIDIA GeForce RTX 4090<\/th>\n NVIDIA GeForce RTX 4080 16G<\/th>\n NVIDIA GeForce RTX 4080 12G<\/th>\n NVIDIA GeForce RTX 3090 Ti<\/th>\n<\/tr>\n<\/thead>\n \n Nombre de la GPU<\/td>\n \u00bfAda Lovelace AD102-300?<\/td>\n \u00bfAda Lovelace AD103-300?<\/td>\n \u00bfAda Lovelace AD104-400?<\/td>\n Amperio GA102-225<\/td>\n<\/tr>\n \n Nodo de proceso<\/td>\n TSMC 4N<\/td>\n TSMC 4N<\/td>\n TSMC 4N<\/td>\n Samsung 8nm<\/td>\n<\/tr>\n \n Tama\u00f1o del troquel<\/td>\n 608 mm2<\/td>\n ~450mm2<\/td>\n ~450mm2<\/td>\n 628,4 mm2<\/td>\n<\/tr>\n \n transistores<\/td>\n 76 mil millones<\/td>\n Por determinar<\/td>\n Por determinar<\/td>\n 28 mil millones<\/td>\n<\/tr>\n \n N\u00facleos CUDA<\/td>\n 16384<\/td>\n 9728<\/td>\n 7680<\/td>\n 10240<\/td>\n<\/tr>\n \n TMU \/ ROP<\/td>\n Por determinar<\/td>\n Por determinar<\/td>\n Por determinar<\/td>\n 320 \/ 112<\/td>\n<\/tr>\n \n N\u00facleos tensor \/ RT<\/td>\n 576 \/ 144<\/td>\n Por determinar \/ Por determinar<\/td>\n Por determinar \/ Por determinar<\/td>\n 320 \/ 80<\/td>\n<\/tr>\n \n Reloj b\u00e1sico<\/td>\n 2230 MHz<\/td>\n 2210 MHz<\/td>\n 2310 MHz<\/td>\n 1365 MHz<\/td>\n<\/tr>\n \n Reloj de impulso<\/td>\n 2520 MHz<\/td>\n 2510 MHz<\/td>\n 2610 MHz<\/td>\n 1665 MHz<\/td>\n<\/tr>\n \n C\u00f3mputo FP32<\/td>\n 83 TFLOP<\/td>\n 49 TFLOP<\/td>\n 40 TFLOP<\/td>\n 40 TFLOP<\/td>\n<\/tr>\n \n RT TFLOP<\/td>\n 191 TFLOP<\/td>\n 113 TFLOP<\/td>\n 82 TFLOP<\/td>\n 78 TFLOP<\/td>\n<\/tr>\n \n Tensor-TOP<\/td>\n 1321 tapas<\/td>\n 780 tops<\/td>\n 641 tops<\/td>\n 320 tapas<\/td>\n<\/tr>\n \n Capacidad de memoria<\/td>\n 24 GB GDDR6X<\/td>\n 16 GB GDDR6X<\/td>\n 12GB GDDR6X<\/td>\n 12GB GDDR6X<\/td>\n<\/tr>\n \n Bus de memoria<\/td>\n 384 bits<\/td>\n 256 bits<\/td>\n 192 bits<\/td>\n 384 bits<\/td>\n<\/tr>\n \n Velocidad de memoria<\/td>\n 21,0 Gbps<\/td>\n 23,0 Gb\/s<\/td>\n 21,0 Gbps<\/td>\n 19 Gb\/s<\/td>\n<\/tr>\n \n Banda ancha<\/td>\n 1008 GB\/s<\/td>\n 736 GB\/s<\/td>\n 504 GB\/s<\/td>\n 912 Gb\/s<\/td>\n<\/tr>\n \n TBP<\/td>\n 450W<\/td>\n 320W<\/td>\n 285W<\/td>\n 350W<\/td>\n<\/tr>\n \n Precio (MSRP \/ FE)<\/td>\n $ 1599 EE. UU.<\/td>\n $ 1199 EE. UU.<\/td>\n $ 899 EE. UU.<\/td>\n $1199<\/td>\n<\/tr>\n \n Lanzamiento (Disponibilidad)<\/td>\n octubre 2022<\/td>\n noviembre 2022<\/td>\n noviembre 2022<\/td>\n 3 de junio de 2021<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n