NVIDIA GeForce RTX 4090 es la primera tarjeta gráfica para juegos que ofrece 100 TFLOP de rendimiento informático


La GeForce RTX 4090 de NVIDIA es la primera tarjeta gráfica para juegos en lograr más de 100 TFLOP de rendimiento informático. También puede leer nuestra revisión completa de la tarjeta aquí.

¡Rompiendo la barrera de los 100 TFLOPs! NVIDIA GeForce RTX 4090 se convierte en la tarjeta gráfica para juegos más rápida para computación y la tarjeta gráfica para juegos más rápida, ¡y punto!

Romper la barrera de los 100 TFLOP no es tarea fácil. Antes de hoy, la tarjeta gráfica para juegos más rápida de NVIDIA, la GeForce RTX 3090 Ti, solo entregaba 40 TFLOP de potencia de cómputo. Con el lanzamiento de la GeForce RTX 4090 nos acercamos a la barrera de los 100 TFLOPs pero no oficialmente. NVIDIA afirma que GeForce RTX 4090 Founders Edition ofrece 83 TFLOP en la configuración predeterminada. Esto significa que la tarjeta está 17 TFLOP por debajo de esa marca de 100 TFLOP.

Así que decidimos que era hora de probar hasta dónde podemos llevar la NVIDIA GeForce RTX 4090 Founders Edition con algo de overclocking. Para llegar a 100 TFLOP, primero empujamos el control deslizante de límite de potencia y límite de temperatura hasta el máximo y aumentamos los relojes de núcleo y memoria en +275 y +1100 MHz, respectivamente. Esto no fue suficiente ya que la tarjeta estaba limitada por su diseño de potencia. Fue entonces cuando pusimos nuestras manos en el último Afterburner de MSI que nos permitió aumentar los voltajes centrales. Al 100 %, vimos cierta regresión en el rendimiento, por lo que tuvimos que mantenernos con +55 %, lo que nos mostró algunos buenos resultados.

Con el overclock aplicado en nuestra tarjeta gráfica NVIDIA GeForce RTX 4090, vimos un reloj de núcleo de GPU máximo de 3150 MHz en la GPU AD102 Ada, un consumo máximo de energía de 547 W y nuestras temperaturas alcanzaron un máximo de 69 °C. Todo esto se hizo con aire y sin refrigeración líquida exótica, se utilizaron enfriadores o LN2.

Y he aquí, vimos el número mágico de no 100 sino casi 101 TFLOP justo frente a nuestros ojos. Para poner las cosas en perspectiva, este es un aumento de cómputo del 22% sobre el RTX 4090 estándar y un aumento del rendimiento de cómputo de 2.5x sobre el RTX 3090 Ti. La GPU AD102 también superó a las GPU Hopper H100 centradas en el centro de datos al ofrecer un rendimiento FP32 un 50 % mejor. Ada Lovelace es realmente un cambio de juego y definitivamente podemos verla convertirse en una popular tarjeta gráfica de computación e inteligencia artificial cuando las variantes Quadro de dicho chip se lancen como RTX 6000 ADA y L60.

Especificaciones ‘oficiales’ de NVIDIA GeForce RTX 4090: precio de $ 1599 en EE. UU.

NVIDIA GeForce RTX 4090 utilizará 128 SM de los 144 SM para un total de 16 384 núcleos CUDA. La GPU vendrá con 72 MB de caché L2 y un total de 176 ROP, lo que es simplemente una locura.

En cuanto a las especificaciones de memoria, la GeForce RTX 4090 contará con capacidades GDDR6X de 24 GB que se registrarán a velocidades de 21 Gbps en una interfaz de bus de 384 bits. Esto proporcionará hasta 1 TB/s de ancho de banda. Este es el mismo ancho de banda que la tarjeta gráfica RTX 3090 Ti existente y, en lo que respecta al consumo de energía, el TBP tiene una potencia nominal de 450 W. La tarjeta estará alimentada por un solo conector de 16 pines que ofrece hasta 600 W de potencia. Los modelos personalizados ofrecerán objetivos de TBP más altos.

La GPU NVIDIA GeForce RTX 4090 llega oficialmente a las tiendas mañana cuando los diseños de NVIDIA y de los socios de tarjetas personalizadas estén disponibles para el público. Puedes consultar nuestra reseña aquí.

Especificaciones oficiales de la serie NVIDIA GeForce RTX 40:

Nombre de la tarjeta gráfica NVIDIA GeForce RTX 4090 NVIDIA GeForce RTX 4080 16G NVIDIA GeForce RTX 4080 12G NVIDIA GeForce RTX 3090 Ti
Nombre de la GPU Ada Lovelace AD102-300 Ada Lovelace AD103-300 Ada Lovelace AD104-400 Amperio GA102-225
Nodo de proceso TSMC 4N TSMC 4N TSMC 4N Samsung 8nm
Tamaño del troquel 608 mm2 378,6 mm2 294,5 mm2 628,4 mm2
transistores 76 mil millones 45,9 mil millones 35.8 mil millones 28 mil millones
Núcleos CUDA 16384 9728 7680 10240
TMU / ROP 512 / 176 320 / 112 240 / 80 320 / 112
Núcleos tensor / RT 512 / 128 304 / 76 240 / 60 320 / 80
Reloj básico 2230 MHz 2210 MHz 2310 MHz 1365 MHz
Reloj de impulso 2520 MHz 2510 MHz 2610 MHz 1665 MHz
Cómputo FP32 83 TFLOP 49 TFLOP 40 TFLOP 40 TFLOP
RT TFLOP 191 TFLOP 113 TFLOP 82 TFLOP 78 TFLOP
Tensor-TOP 1321 tapas 780 tops 641 tops 320 tapas
Capacidad de memoria 24 GB GDDR6X 16 GB GDDR6X 12GB GDDR6X 12GB GDDR6X
Bus de memoria 384 bits 256 bits 192 bits 384 bits
Velocidad de memoria 21,0 Gbps 23,0 Gb/s 21,0 Gbps 19 Gb/s
Banda ancha 1008 GB/s 736 GB/s 504 GB/s 912 Gb/s
TBP 450W 320W 285W 350W
Precio (MSRP / FE) $ 1599 EE. UU. $ 1199 EE. UU. $ 899 EE. UU. $1199
Lanzamiento (Disponibilidad) octubre 2022 noviembre 2022 noviembre 2022 3 de junio de 2021

Productos mencionados en esta publicación.



Source link-29