2024 - NVIDIA detalla el diagrama de bloques de la GPU Ada Lovelace, multiprocesador de transmisión, DLSS 3 y GeForce RTX 40 Founders Edition Cooler

Durante su charla técnica de prensa, NVIDIA habló sobre varias tecnologías que rodean a las próximas tarjetas gráficas GeForce RTX 40 basadas en las GPU Ada Lovelace. Algunas de las tecnologías que se destacaron incluyeron la propia GPU Ada Lovelace, la última tecnología DLSS 3 y los refrigeradores incluidos en los nuevos modelos Founders Edition.

NVIDIA Más detalles GPU Ada Lovelace, DLSS 3, tarjetas gráficas GeForce RTX 40 y más

NVIDIA lanzará su primera tarjeta gráfica de la serie GeForce RTX 40, la RTX 4090, el 12 de octubre, seguida de la serie RTX 4080 en noviembre. Hay mucho de qué hablar, así que comencemos.

GPU AD102 ‘Ada Lovelace’ de NVIDIA: la potencia de próxima generación

En el corazón de la tarjeta gráfica NVIDIA GeForce RTX 4090 se encuentra la GPU Ada Lovelace AD102. La GPU mide 608,4 mm2 y utilizará el nodo de proceso 4N de TSMC, que es una versión optimizada del nodo de 5nm (N5) de TSMC diseñado para el equipo verde. La GPU cuenta con 76,3 mil millones de transistores.

La GPU NVIDIA Ada Lovelace AD102 presenta hasta 12 GPC (clusters de procesamiento de gráficos). Estos son 5 SM más en comparación con las GPU Ampere GA102. Cada GPU constará de 6 TPC y 2 SM, que es la misma configuración que el chip existente. Cada SM (multiprocesador de transmisión) albergará cuatro subnúcleos, que también es lo mismo que la GPU GA102. Lo que ha cambiado es la configuración central de FP32 y INT32. Cada subnúcleo incluirá 64 unidades FP32, pero las unidades FP32+INT32 combinadas llegarán a 128. Esto se debe a que la mitad de las unidades FP32 no comparten el mismo subnúcleo que las unidades IN32. Los 64 núcleos FP32 están separados de los 128 núcleos INT32.

Entonces, en total, cada subnúcleo constará de 16 unidades FP32 más 16 unidades INT32 para un total de 32 unidades. Cada SM tendrá un total de 64 unidades FP32 más 64 unidades INT32 para un total de 128 unidades. Y dado que hay un total de 144 unidades SM (12 por GPC), estamos viendo un total de 18 432 núcleos. Cada SM también incluirá dos programas de ajuste (32 subprocesos/CLK) para 64 ajustes por SM y su propio i-caché L0. Este es un aumento del 33 % en Wraps/Threads frente a la GPU GA102. El tamaño del archivo de registro es de 16 384 en un carril de 32 bits. Cada SM también lleva sus propios 128 KB de caché de datos L1 y memoria compartida, por lo que son 18 MB de caché L1.

Pasando al caché, este es otro segmento en el que NVIDIA ha dado un gran impulso a las GPU Ampere existentes. El caché L2 se incrementará a 96 MB como se menciona en las filtraciones. Este es un aumento de 16 veces con respecto a la GPU Ampere que aloja solo 6 MB de caché L2. El caché se compartirá en la GPU. La GPU también contará con hasta 192 ROP para el dado completo.

También habrá los últimos núcleos Tensor de cuarta generación y RT (trazado de rayos) de tercera generación infundidos en las GPU Ada Lovelace que ayudarán a impulsar el rendimiento de DLSS y Raytracing al siguiente nivel. En general, la GPU Ada Lovelace AD102 ofrecerá:

71 % más de GPC (frente a amperios)
71 % más de núcleos (frente a amperios)
50 % más de caché L1 (frente a amperios)
16 veces más caché L2 (frente a amperios)
71 % más de ROP (frente a amperios)
Tensor de cuarta generación y núcleos RT de tercera generación

El dado completo no se ha presentado en ninguna GPU hasta el momento, ni siquiera en la L40 que tiene 2 SM deshabilitados. Es probable que, a medida que aumente el rendimiento, finalmente veamos un producto para juegos y estaciones de trabajo que use el AD102 completo. Hasta entonces, la RTX 4090 es la mejor tarjeta gráfica para juegos, mientras que la RTX 6000 Ada es la mejor solución para estaciones de trabajo.

Diagrama de bloques de la GPU para juegos NVIDIA AD102 ‘Ada Lovelace’:

Diagrama de bloques de la GPU para juegos NVIDIA AD102 ‘Ada Lovelace’ ‘SM’:

NVIDIA Founders Edition diseñada para utilizar hasta 600 W de potencia para un mayor overclocking

En cuanto a sus nuevas tarjetas Founders Edition, GeForce RTX 4090 de 24 GB y RTX 4080 de 16 GB, NVIDIA ha producido una placa de circuito impreso compacta, similar a las que vimos en la generación anterior y el diseño de una placa de circuito impreso como esta ayuda a mejorar el flujo de aire y el rendimiento de refrigeración. .

NVIDIA dice que han optimizado aún más el sistema Dual Axial Flow Through, aumentando el tamaño de los ventiladores y el volumen de las aletas en un 10 %, ofreciendo un 20 % más de flujo de aire y actualizando a una fuente de alimentación de 23 fases (20+3 fases para RTX 4090) . Las temperaturas de la memoria se reducen y las nuevas GPU Ada, sustancialmente más potentes, se mantienen frescas en gabinetes ventilados, lo que les brinda a los jugadores un excelente margen para el overclocking. NVIDIA pasó por un riguroso procedimiento de prueba y se dice que evaluó hasta 50 diseños de ventiladores antes de finalizar el que estamos obteniendo en las nuevas tarjetas. El enfriador se usa para disipar el calor del conjunto del disipador de calor que comprende una cámara de vapor, un gran salto con respecto al diseño anterior también.

La NVIDIA GeForce RTX 4080 también usa el mismo enfriador que la RTX 4090 Founders Edition y, dado que tiene un TDP más bajo, debería ofrecer un rendimiento térmico aún mejor.

Cada tarjeta gráfica GeForce RTX 40 Series Founders Edition reduce el desorden de cables al aprovechar la nueva entrada de alimentación GPU estándar de las fuentes de alimentación ATX 3.0 de próxima generación, el conector PCIe Gen-5 de 16 pines. Esto le permite alimentar las tarjetas gráficas GeForce RTX Serie 40 con un solo cable, mejorando la estética de su construcción. Si está utilizando una fuente de alimentación de generación anterior, se incluye un cable adaptador en la caja, lo que le permite enchufar tres conectores de alimentación de 8 pines, con un cuarto conector opcional para un mayor margen de overclocking. Las fuentes de alimentación ATX 3.0 estarán disponibles en octubre de ASUS, Cooler Master, FSP, Gigabyte, iBuyPower, MSI y ThermalTake, con más modelos por venir.

Una ventaja que viene con el nuevo conector de 16 pines es que, si bien las tarjetas Founders Edition están diseñadas a 450 W y 320 W, respectivamente, pueden utilizar el espacio libre adicional proporcionado a través del nuevo conector para un overclocking extremo con el RTX 4090 buscando esos 600 W completos. Marcos. La nueva entrega de energía también le da a la serie RTX 40 un aumento de 10 veces en el tiempo de respuesta a la administración de transitorios de energía en comparación con la generación anterior.

Las nuevas tarjetas también cuentan con DP 1.4a (4K 12 bits HDR @ 240Hz) y HDMI 2.1 (4K 120Hz HDR / 8K 60Hz HDR). Todas las tarjetas cumplen con la interfaz PCIe Gen 4 en las placas base existentes y también cuentan con el cumplimiento total de las tecnologías Resizable-BAR.

Placa de circuito impreso NVIDIA GeForce RTX 4090 Founders Edition:

Los troqueles Micron GDDR6X de próxima generación funcionan con un enfriador de 10C gracias a un nuevo nodo de proceso

NVIDIA también ha aprovechado los últimos chips de memoria GDDR6X de Micron para sus tarjetas gráficas GeForce RTX 40 que funcionan con 10C más frías, son más eficientes en el consumo de energía y, dado que todas son matrices DRAM de 16 Gb, se pueden fusionar en un lado de la placa de circuito impreso para que se enfríen mejor que las duales. memoria lateral.

NVIDIA DLSS 3: compatibilidad, conjunto de funciones, rendimiento de juegos y más

Ahora, profundicemos en los avances tecnológicos que permiten estos increíbles logros. Para empezar, los ingenieros de NVIDIA comenzaron con DLSS Super Resolution y agregaron algo llamado Generación óptica de múltiples cuadros basada en el Acelerador de flujo óptico de Ada. Este acelerador analiza dos cuadros secuenciales de un juego en particular, capturando detalles de píxeles como partículas, reflejos, luces y sombras.

Además de eso, NVIDIA DLSS 3 también tiene en cuenta la información del motor de juego convencional, como los vectores de movimiento. La red de codificador automático convolucional de IA de generación de cuadros DLSS decidirá cómo usar cada una de las cuatro entradas (cuadros actuales y anteriores, campo de flujo óptico y vectores de movimiento) para recrear cuadros intermedios de la mejor manera posible.

Se dice que NVIDIA DLSS 3 reconstruye 3/4 del primer fotograma con DLSS Super Resolution y el segundo fotograma completo con la ayuda de la generación de fotogramas DLSS antes mencionada. En general, NVIDIA DLSS 3 reconstruye 7/8 de los dos cuadros totales que se muestran, lo que explica la mejora masiva del rendimiento.

Además, la nueva versión de la técnica de reconstrucción de imágenes Deep Learning Super Sampling también incluye la tecnología NVIDIA Reflex para reducir la latencia.

Entonces, hablando de la compatibilidad con GPU DLSS, la tecnología contará con la generación de cuadros DLSS completa en todas las GPU de la serie RTX 40. Para las series RTX 20 y RTX 30 más antiguas, la tecnología estará disponible como la suite DLSS Super Resolution (también en RTX 40). Por último, NVIDIA Reflex será compatible con la serie GeForce 900 y superior.

Se ha demostrado que Cyberpunk 2077 ejecuta NVIDIA DLSS 3, el nuevo Ray Tracing Overdrive y NVIDIA Reflex con un rendimiento mejorado hasta 4 veces y una latencia reducida hasta 2 veces. Eso no es todo, ya que NVIDIA incluso promete beneficios para los juegos vinculados a la CPU, que generalmente no se ejecutaron mucho más rápido con DLSS 2.0. Por ejemplo, Microsoft Flight Simulator, notoriamente pesado en la CPU, obtiene un rendimiento mejorado hasta 2 veces con el nuevo DLSS. En general, NVIDIA dijo que los siguientes más de 35 juegos y aplicaciones ya prometieron compatibilidad con NVIDIA DLSS 3.

Un cuento de plagas: Réquiem
Corazón atómico
Mito negro: Wukong
Memoria brillante: Infinito
Chernobylita
Hoja del conquistador
Ciberpunk 2077
Rally Dakar
Líbranos Marte
¡Destruye a todos los humanos! 2 – Reprobado
Luz moribunda 2 Mantente humano
F1 22
PUÑO: Antorcha forjada en la sombra
Motor de congelación
HITMAN 3
Legado de Hogwarts
ÍCARO
Evolución del mundo jurásico 2
Justicia
Loopmancer
Merodeadores

Simulador de vuelo de Microsoft
Caza de fantasmas de medianoche
Mount & Blade II: Señor de la bandera
Naraka: Punta de espada
Omniverso de NVIDIA
Nvidia Racer RTX
PERECER
Portal con RTX
estafa
STALKER 2: Corazón de Chernobyl
Fustigar
espada y hada 7
SINCRONIZADO
El Señor de los Anillos: Gollum
The Witcher 3: Caza salvaje
TRONO Y LIBERTAD
Torre de la fantasía
Unidad
Unreal Engine 4 y 5
Warhammer 40,000: Marea Oscura

Las tarjetas gráficas NVIDIA GeForce RTX 4080 de 16 GB y RTX 4080 de 12 GB se lanzarán en noviembre y tendrán un precio de $1199 USD y $899 USD, respectivamente.

Especificaciones preliminares de la serie NVIDIA GeForce RTX 40:

Nombre de la tarjeta gráfica	NVIDIA GeForce RTX 4090	NVIDIA GeForce RTX 4080 16G	NVIDIA GeForce RTX 4080 12G	NVIDIA GeForce RTX 3090 Ti
Nombre de la GPU	¿Ada Lovelace AD102-300?	¿Ada Lovelace AD103-300?	¿Ada Lovelace AD104-400?	Amperio GA102-225
Nodo de proceso	TSMC 4N	TSMC 4N	TSMC 4N	Samsung 8nm
Tamaño del troquel	608 mm2	~450mm2	~450mm2	628,4 mm2
transistores	76 mil millones	Por determinar	Por determinar	28 mil millones
Núcleos CUDA	16384	9728	7680	10240
TMU / ROP	Por determinar	Por determinar	Por determinar	320 / 112
Núcleos tensor / RT	576 / 144	Por determinar / Por determinar	Por determinar / Por determinar	320 / 80
Reloj básico	2230 MHz	2210 MHz	2310 MHz	1365 MHz
Reloj de impulso	2520 MHz	2510 MHz	2610 MHz	1665 MHz
Cómputo FP32	83 TFLOP	49 TFLOP	40 TFLOP	40 TFLOP
RT TFLOP	191 TFLOP	113 TFLOP	82 TFLOP	78 TFLOP
Tensor-TOP	1321 tapas	780 tops	641 tops	320 tapas
Capacidad de memoria	24 GB GDDR6X	16 GB GDDR6X	12GB GDDR6X	12GB GDDR6X
Bus de memoria	384 bits	256 bits	192 bits	384 bits
Velocidad de memoria	21,0 Gbps	23,0 Gb/s	21,0 Gbps	19 Gb/s
Banda ancha	1008 GB/s	736 GB/s	504 GB/s	912 Gb/s
TBP	450W	320W	285W	350W
Precio (MSRP / FE)	$ 1599 EE. UU.	$ 1199 EE. UU.	$ 899 EE. UU.	$1199
Lanzamiento (Disponibilidad)	octubre 2022	noviembre 2022	noviembre 2022	3 de junio de 2021

¿Qué tarjeta gráfica de la serie NVIDIA GeForce RTX 40 esperas con más ansias?

Productos mencionados en esta publicación.

Source link-29

Europa Fin de semana por la mañana: de 6 a. m. a 9 a. m. – 18/05/2024

Se informa que Call of Duty: Black Ops 6 irá directamente a Game Pass – IGN Daily Fix

Seine-Saint-Denis: un personaje del narcotráfico asesinado a tiros

Helldivers 2, Baldur’s Gate 3 y Balatro lideran los premios Develop Star

NVIDIA detalla el diagrama de bloques de la GPU Ada Lovelace, multiprocesador de transmisión, DLSS 3 y GeForce RTX 40 Founders Edition Cooler