La GeForce RTX 4090 de Nvidia puede parecer increíblemente sólida y, sin duda, se clasificará como la opción más rápida en nuestra lista de las mejores tarjetas gráficas cuando se estrene (al menos hasta que lleguen las GPU RDNA 3 de AMD), pero el troquel AD102 reducido en el RTX 4090 es No está cerca de mostrar todo el potencial de AD102 con todos sus núcleos y caché habilitados. Esto, combinado con mejoras adicionales, podría sugerir un futuro RTX 4090 Ti que será mucho más rápido y quizás incluso más costoso.
Las especificaciones de las GPU Nvidia RTX 40-series y Ada Lovelace, pero solo muestran las tarjetas anunciadas y rumoreadas. El chip AD102 completo de Nvidia viene equipado con 144 SM, 18 432 núcleos CUDA, 96 MB de caché L2 y 192 ROP. Esto se traduce en un 12 % más de núcleos CUDA y un 33 % más de capacidad de caché L2 en comparación con el RTX 4090 que tenemos hoy. El troquel AD102 completamente habilitado también incluye un 9 % más de ROPS y un 12 % más de unidades de mapeo de texturas, gracias a los SM adicionales.
Pero eso no es todo lo que se podría hacer para el futuro 4090 Ti. Micron tiene nuevos módulos de memoria GDDR6X de 24 Gbps en proceso, otro 14 % más que los módulos de 21 Gbps del RTX 4090 y aún más rápido que los módulos de 22,4 Gbps del RTX 4080 de 16 GB que, según Nvidia, son los más rápidos del mundo en este momento. Eso empujaría al hipotético (pero muy probable) RTX 4090 Ti hasta 1152 MB/s de ancho de banda.
Pero una memoria más rápida vendría con un mayor consumo de energía, y sospechamos que Nvidia también está frenando seriamente la velocidad de reloj completa y el potencial de energía de AD102. ¿Todos esos rumores sobre las tarjetas gráficas de la serie 40 RTX de 600 W? Sabemos que Nvidia ha acelerado con éxito el RTX 4090 a más de 3,0 GHz, y eso definitivamente aumentaría el consumo de energía.
Parece que la arquitectura Ada y el proceso 4N de TSMC tienen mucho espacio libre más allá de la frecuencia de impulso de 2520 MHz del RTX 4090. Una vez que el proceso madure un poco más, y si Nvidia está dispuesta a aumentar los límites de potencia, no nos sorprendería ver un reloj RTX 4090 Ti más cercano a los 2800 MHz.
El rendimiento teórico de AD102 con todas estas campanas y silbatos habilitados podría alcanzar la friolera de 103 teraflops en cargas de trabajo FP32, y 826 teraflops en cargas de trabajo FP16 con los núcleos Tensor, y 1652 teraflops con los núcleos Tensor en modo FP8. Eso sería un gran salto de rendimiento del 25% en comparación con el RTX 4090.
Estas ganancias solo se obtendrían en escenarios limitados de GPU, por supuesto, por lo que probablemente no sean juegos de 1080p o 1440p. Es probable que también se beneficien las aplicaciones informáticas pesadas. La combinación de más capacidad de caché L2, ancho de banda GDDR6X adicional y más núcleos y relojes podría generar mejoras tangibles.
RTX 4090 Ti (AD102 completo) | RTX 4090 | RTX 3090 Ti | |
Proceso | TSMC 4N | TSMC 4N | Samsung 8N |
transistores | 76.3B | 76.3B | 28.3 |
SMS | 144 | 128 | 84 |
Núcleos de GPU | 18432 | 16384 | 10752 |
Núcleos tensoriales | 576 | 512 | 336 |
Núcleos de trazado de rayos | 144 | 128 | 84 |
Reloj de impulso | 2800MHz??? | 2520MHz | 1860MHz |
Velocidad VRAM | 24 Gb/s? | 21 Gb/s | 21 Gbps |
VRAM | 24 GB | 24 GB | 24 GB |
Ancho de bus | 384 | 384 | 384 |
ancho de banda de memoria | 1152 GB/s | 1008 GB/s | 1008 GB/s |
Capacidad de caché L2 | 96MB | 72MB | Ninguna |
ROP | 192 | 176 | 112 |
TMU | 576 | 512 | 336 |
TFLOPS FP32 | 103.2 | 82.6 | 40 |
TFLOPS FP16 | 826 | 661 | N / A |
TDP | 600W?? | 450W | 450W |
¿Cuándo veremos una RTX 3090 Ti?
Parece que a Nvidia le queda mucho margen de rendimiento con su troquel GA102, con el potencial de crear un RTX 4090 Ti que teóricamente podría fumar el RTX 4090. Sin duda, costaría mucho más dinero y consumiría mucha más energía que un RTX 4090 , Pero puede hacerse.
Todo esto dependerá de qué tan fuerte Nvidia quiera empujar su matriz GA102, y eso seguramente dependerá de qué tan cerca pueda llegar AMD de igualar el rendimiento de Nvidia con los próximos chips RDNA 3. Los rendimientos de las GPU AD102 totalmente funcionales también jugarían un papel, aunque es dudoso que se trate de piezas de gran volumen.
Nvidia podría agregar algunas o todas estas mejoras a un RTX 4090 Ti en cualquier momento que sienta la necesidad. No obtuvimos el RTX 3090 Ti hasta 18 meses después del debut del RTX 3090, pero hubo muchos factores compuestos en juego. Lo más probable es que veamos una actualización de 2023 de la serie RTX 40 en algún momento alrededor de nueve meses a 12 meses después de la salva inicial.
También existe la rara posibilidad de que Nvidia pueda omitir el RTX 4090 Ti por completo a favor de una nueva variante de Titan, pero dudamos que ese sea el caso. Las tarjetas Titan tienden a reducir demasiado las lucrativas ganancias de las tarjetas profesionales de la serie RTX A.