NVIDIA detalla el diagrama de bloques de la GPU Ada Lovelace, multiprocesador de transmisión, DLSS 3 y GeForce RTX 40 Founders Edition Cooler


Durante su charla técnica de prensa, NVIDIA habló sobre varias tecnologías que rodean a las próximas tarjetas gráficas GeForce RTX 40 basadas en las GPU Ada Lovelace. Algunas de las tecnologías que se destacaron incluyeron la propia GPU Ada Lovelace, la última tecnología DLSS 3 y los refrigeradores incluidos en los nuevos modelos Founders Edition.

NVIDIA Más detalles GPU Ada Lovelace, DLSS 3, tarjetas gráficas GeForce RTX 40 y más

NVIDIA lanzará su primera tarjeta gráfica de la serie GeForce RTX 40, la RTX 4090, el 12 de octubre, seguida de la serie RTX 4080 en noviembre. Hay mucho de qué hablar, así que comencemos.

GPU AD102 ‘Ada Lovelace’ de NVIDIA: la potencia de próxima generación

En el corazón de la tarjeta gráfica NVIDIA GeForce RTX 4090 se encuentra la GPU Ada Lovelace AD102. La GPU mide 608,4 mm2 y utilizará el nodo de proceso 4N de TSMC, que es una versión optimizada del nodo de 5nm (N5) de TSMC diseñado para el equipo verde. La GPU cuenta con 76,3 mil millones de transistores.

La GPU NVIDIA Ada Lovelace AD102 presenta hasta 12 GPC (clusters de procesamiento de gráficos). Estos son 5 SM más en comparación con las GPU Ampere GA102. Cada GPU constará de 6 TPC y 2 SM, que es la misma configuración que el chip existente. Cada SM (multiprocesador de transmisión) albergará cuatro subnúcleos, que también es lo mismo que la GPU GA102. Lo que ha cambiado es la configuración central de FP32 y INT32. Cada subnúcleo incluirá 64 unidades FP32, pero las unidades FP32+INT32 combinadas llegarán a 128. Esto se debe a que la mitad de las unidades FP32 no comparten el mismo subnúcleo que las unidades IN32. Los 64 núcleos FP32 están separados de los 128 núcleos INT32.

Entonces, en total, cada subnúcleo constará de 16 unidades FP32 más 16 unidades INT32 para un total de 32 unidades. Cada SM tendrá un total de 64 unidades FP32 más 64 unidades INT32 para un total de 128 unidades. Y dado que hay un total de 144 unidades SM (12 por GPC), estamos viendo un total de 18 432 núcleos. Cada SM también incluirá dos programas de ajuste (32 subprocesos/CLK) para 64 ajustes por SM y su propio i-caché L0. Este es un aumento del 33 % en Wraps/Threads frente a la GPU GA102. El tamaño del archivo de registro es de 16 384 en un carril de 32 bits. Cada SM también lleva sus propios 128 KB de caché de datos L1 y memoria compartida, por lo que son 18 MB de caché L1.

Pasando al caché, este es otro segmento en el que NVIDIA ha dado un gran impulso a las GPU Ampere existentes. El caché L2 se incrementará a 96 MB como se menciona en las filtraciones. Este es un aumento de 16 veces con respecto a la GPU Ampere que aloja solo 6 MB de caché L2. El caché se compartirá en la GPU. La GPU también contará con hasta 192 ROP para el dado completo.

También habrá los últimos núcleos Tensor de cuarta generación y RT (trazado de rayos) de tercera generación infundidos en las GPU Ada Lovelace que ayudarán a impulsar el rendimiento de DLSS y Raytracing al siguiente nivel. En general, la GPU Ada Lovelace AD102 ofrecerá:

  • 71 % más de GPC (frente a amperios)
  • 71 % más de núcleos (frente a amperios)
  • 50 % más de caché L1 (frente a amperios)
  • 16 veces más caché L2 (frente a amperios)
  • 71 % más de ROP (frente a amperios)
  • Tensor de cuarta generación y núcleos RT de tercera generación

El dado completo no se ha presentado en ninguna GPU hasta el momento, ni siquiera en la L40 que tiene 2 SM deshabilitados. Es probable que, a medida que aumente el rendimiento, finalmente veamos un producto para juegos y estaciones de trabajo que use el AD102 completo. Hasta entonces, la RTX 4090 es la mejor tarjeta gráfica para juegos, mientras que la RTX 6000 Ada es la mejor solución para estaciones de trabajo.

Diagrama de bloques de la GPU para juegos NVIDIA AD102 ‘Ada Lovelace’:

Diagrama de bloques de la GPU para juegos NVIDIA AD102 ‘Ada Lovelace’ ‘SM’:

NVIDIA Founders Edition diseñada para utilizar hasta 600 W de potencia para un mayor overclocking

En cuanto a sus nuevas tarjetas Founders Edition, GeForce RTX 4090 de 24 GB y RTX 4080 de 16 GB, NVIDIA ha producido una placa de circuito impreso compacta, similar a las que vimos en la generación anterior y el diseño de una placa de circuito impreso como esta ayuda a mejorar el flujo de aire y el rendimiento de refrigeración. .

NVIDIA dice que han optimizado aún más el sistema Dual Axial Flow Through, aumentando el tamaño de los ventiladores y el volumen de las aletas en un 10 %, ofreciendo un 20 % más de flujo de aire y actualizando a una fuente de alimentación de 23 fases (20+3 fases para RTX 4090) . Las temperaturas de la memoria se reducen y las nuevas GPU Ada, sustancialmente más potentes, se mantienen frescas en gabinetes ventilados, lo que les brinda a los jugadores un excelente margen para el overclocking. NVIDIA pasó por un riguroso procedimiento de prueba y se dice que evaluó hasta 50 diseños de ventiladores antes de finalizar el que estamos obteniendo en las nuevas tarjetas. El enfriador se usa para disipar el calor del conjunto del disipador de calor que comprende una cámara de vapor, un gran salto con respecto al diseño anterior también.

La NVIDIA GeForce RTX 4080 también usa el mismo enfriador que la RTX 4090 Founders Edition y, dado que tiene un TDP más bajo, debería ofrecer un rendimiento térmico aún mejor.

Cada tarjeta gráfica GeForce RTX 40 Series Founders Edition reduce el desorden de cables al aprovechar la nueva entrada de alimentación GPU estándar de las fuentes de alimentación ATX 3.0 de próxima generación, el conector PCIe Gen-5 de 16 pines. Esto le permite alimentar las tarjetas gráficas GeForce RTX Serie 40 con un solo cable, mejorando la estética de su construcción. Si está utilizando una fuente de alimentación de generación anterior, se incluye un cable adaptador en la caja, lo que le permite enchufar tres conectores de alimentación de 8 pines, con un cuarto conector opcional para un mayor margen de overclocking. Las fuentes de alimentación ATX 3.0 estarán disponibles en octubre de ASUS, Cooler Master, FSP, Gigabyte, iBuyPower, MSI y ThermalTake, con más modelos por venir.

Una ventaja que viene con el nuevo conector de 16 pines es que, si bien las tarjetas Founders Edition están diseñadas a 450 W y 320 W, respectivamente, pueden utilizar el espacio libre adicional proporcionado a través del nuevo conector para un overclocking extremo con el RTX 4090 buscando esos 600 W completos. Marcos. La nueva entrega de energía también le da a la serie RTX 40 un aumento de 10 veces en el tiempo de respuesta a la administración de transitorios de energía en comparación con la generación anterior.

Las nuevas tarjetas también cuentan con DP 1.4a (4K 12 bits HDR @ 240Hz) y HDMI 2.1 (4K 120Hz HDR / 8K 60Hz HDR). Todas las tarjetas cumplen con la interfaz PCIe Gen 4 en las placas base existentes y también cuentan con el cumplimiento total de las tecnologías Resizable-BAR.

Placa de circuito impreso NVIDIA GeForce RTX 4090 Founders Edition:

Los troqueles Micron GDDR6X de próxima generación funcionan con un enfriador de 10C gracias a un nuevo nodo de proceso

NVIDIA también ha aprovechado los últimos chips de memoria GDDR6X de Micron para sus tarjetas gráficas GeForce RTX 40 que funcionan con 10C más frías, son más eficientes en el consumo de energía y, dado que todas son matrices DRAM de 16 Gb, se pueden fusionar en un lado de la placa de circuito impreso para que se enfríen mejor que las duales. memoria lateral.

NVIDIA DLSS 3: compatibilidad, conjunto de funciones, rendimiento de juegos y más

Ahora, profundicemos en los avances tecnológicos que permiten estos increíbles logros. Para empezar, los ingenieros de NVIDIA comenzaron con DLSS Super Resolution y agregaron algo llamado Generación óptica de múltiples cuadros basada en el Acelerador de flujo óptico de Ada. Este acelerador analiza dos cuadros secuenciales de un juego en particular, capturando detalles de píxeles como partículas, reflejos, luces y sombras.

Además de eso, NVIDIA DLSS 3 también tiene en cuenta la información del motor de juego convencional, como los vectores de movimiento. La red de codificador automático convolucional de IA de generación de cuadros DLSS decidirá cómo usar cada una de las cuatro entradas (cuadros actuales y anteriores, campo de flujo óptico y vectores de movimiento) para recrear cuadros intermedios de la mejor manera posible.

Se dice que NVIDIA DLSS 3 reconstruye 3/4 del primer fotograma con DLSS Super Resolution y el segundo fotograma completo con la ayuda de la generación de fotogramas DLSS antes mencionada. En general, NVIDIA DLSS 3 reconstruye 7/8 de los dos cuadros totales que se muestran, lo que explica la mejora masiva del rendimiento.

Además, la nueva versión de la técnica de reconstrucción de imágenes Deep Learning Super Sampling también incluye la tecnología NVIDIA Reflex para reducir la latencia.

Entonces, hablando de la compatibilidad con GPU DLSS, la tecnología contará con la generación de cuadros DLSS completa en todas las GPU de la serie RTX 40. Para las series RTX 20 y RTX 30 más antiguas, la tecnología estará disponible como la suite DLSS Super Resolution (también en RTX 40). Por último, NVIDIA Reflex será compatible con la serie GeForce 900 y superior.

Se ha demostrado que Cyberpunk 2077 ejecuta NVIDIA DLSS 3, el nuevo Ray Tracing Overdrive y NVIDIA Reflex con un rendimiento mejorado hasta 4 veces y una latencia reducida hasta 2 veces. Eso no es todo, ya que NVIDIA incluso promete beneficios para los juegos vinculados a la CPU, que generalmente no se ejecutaron mucho más rápido con DLSS 2.0. Por ejemplo, Microsoft Flight Simulator, notoriamente pesado en la CPU, obtiene un rendimiento mejorado hasta 2 veces con el nuevo DLSS. En general, NVIDIA dijo que los siguientes más de 35 juegos y aplicaciones ya prometieron compatibilidad con NVIDIA DLSS 3.

  • Un cuento de plagas: Réquiem
  • Corazón atómico
  • Mito negro: Wukong
  • Memoria brillante: Infinito
  • Chernobylita
  • Hoja del conquistador
  • Ciberpunk 2077
  • Rally Dakar
  • Líbranos Marte
  • ¡Destruye a todos los humanos! 2 – Reprobado
  • Luz moribunda 2 Mantente humano
  • F1 22
  • PUÑO: Antorcha forjada en la sombra
  • Motor de congelación
  • HITMAN 3
  • Legado de Hogwarts
  • ÍCARO
  • Evolución del mundo jurásico 2
  • Justicia
  • Loopmancer
  • Merodeadores
  • Simulador de vuelo de Microsoft
  • Caza de fantasmas de medianoche
  • Mount & Blade II: Señor de la bandera
  • Naraka: Punta de espada
  • Omniverso de NVIDIA
  • Nvidia Racer RTX
  • PERECER
  • Portal con RTX
  • estafa
  • STALKER 2: Corazón de Chernobyl
  • Fustigar
  • espada y hada 7
  • SINCRONIZADO
  • El Señor de los Anillos: Gollum
  • The Witcher 3: Caza salvaje
  • TRONO Y LIBERTAD
  • Torre de la fantasía
  • Unidad
  • Unreal Engine 4 y 5
  • Warhammer 40,000: Marea Oscura

Las tarjetas gráficas NVIDIA GeForce RTX 4080 de 16 GB y RTX 4080 de 12 GB se lanzarán en noviembre y tendrán un precio de $1199 USD y $899 USD, respectivamente.

Especificaciones preliminares de la serie NVIDIA GeForce RTX 40:

Nombre de la tarjeta gráfica NVIDIA GeForce RTX 4090 NVIDIA GeForce RTX 4080 16G NVIDIA GeForce RTX 4080 12G NVIDIA GeForce RTX 3090 Ti
Nombre de la GPU ¿Ada Lovelace AD102-300? ¿Ada Lovelace AD103-300? ¿Ada Lovelace AD104-400? Amperio GA102-225
Nodo de proceso TSMC 4N TSMC 4N TSMC 4N Samsung 8nm
Tamaño del troquel 608 mm2 ~450mm2 ~450mm2 628,4 mm2
transistores 76 mil millones Por determinar Por determinar 28 mil millones
Núcleos CUDA 16384 9728 7680 10240
TMU / ROP Por determinar Por determinar Por determinar 320 / 112
Núcleos tensor / RT 576 / 144 Por determinar / Por determinar Por determinar / Por determinar 320 / 80
Reloj básico 2230 MHz 2210 MHz 2310 MHz 1365 MHz
Reloj de impulso 2520 MHz 2510 MHz 2610 MHz 1665 MHz
Cómputo FP32 83 TFLOP 49 TFLOP 40 TFLOP 40 TFLOP
RT TFLOP 191 TFLOP 113 TFLOP 82 TFLOP 78 TFLOP
Tensor-TOP 1321 tapas 780 tops 641 tops 320 tapas
Capacidad de memoria 24 GB GDDR6X 16 GB GDDR6X 12GB GDDR6X 12GB GDDR6X
Bus de memoria 384 bits 256 bits 192 bits 384 bits
Velocidad de memoria 21,0 Gbps 23,0 Gb/s 21,0 Gbps 19 Gb/s
Banda ancha 1008 GB/s 736 GB/s 504 GB/s 912 Gb/s
TBP 450W 320W 285W 350W
Precio (MSRP / FE) $ 1599 EE. UU. $ 1199 EE. UU. $ 899 EE. UU. $1199
Lanzamiento (Disponibilidad) octubre 2022 noviembre 2022 noviembre 2022 3 de junio de 2021

¿Qué tarjeta gráfica de la serie NVIDIA GeForce RTX 40 esperas con más ansias?

Productos mencionados en esta publicación.





Source link-29