La GPU NVIDIA GeForce RTX 5090 contará con un enorme troquel monolítico GB202 «Blackwell»


La GPU insignia GeForce RTX 5090 de NVIDIA contará con una matriz GB202 «Blackwell» masiva y monolítica, informa Kopite7kimi.

El buque insignia GeForce RTX 5090 de NVIDIA contará con una matriz monolítica GB202 «Blackwell», pero podría haber un giro

Según lo que sabemos hasta ahora, la GPU NVIDIA GB202 «Blackwell» alimentará la tarjeta gráfica insignia GeForce RTX 5090. Las especificaciones preliminares han revelado hasta 192 SM que representarán hasta 24,567 núcleos CUDA si el chip conserva los 128 núcleos por diseño SM de los chips AD102 «Ada». Ahora, según un nuevo tweet del experto, Kopite7kimi, se revela que la GPU utilizará un diseño monolítico.

Si bien NVIDIA ha cambiado a un diseño de chiplet para sus chips HPC/AI, como el B100 y el B200, parecerá que la compañía todavía quiere conservar los paquetes monolíticos para sus matrices de GPU orientadas al consumidor. Se dice que la GPU GB202 «Blackwell» tendrá un diseño físicamente monolítico y, según informes anteriores, sabemos que se espera que presente el doble de SM y núcleos que GB203, que es un troquel más reducido para los gustos. de la GeForce RTX 5080. Eso formará una gran disparidad en el rendimiento entre las dos tarjetas, pero la RTX 5090 se perfila como una completa bestia.

Hablaremos más sobre la NVIDIA GeForce RTX 5090 en un momento, pero antes de eso, hablemos un poco más sobre la GPU GB202 «Blackwell». Parece que estamos ante un diseño monolítico, pero tampoco podemos descartar la posibilidad de un diseño estilo chiplet debajo del capó.

Básicamente, es posible que NVIDIA incluya dos matrices GB203 en un paquete monolítico sin que parezca un diseño de chiplet. Permitirá una mejor comunicación entre los chips en lugar de los cuellos de botella en la comunicación fuera del chip asociados con las implementaciones adecuadas de chiplets. Si bien NVIDIA tiene soluciones para superar los cuellos de botella, como NVLINK y otras interconexiones, pueden resultar un poco costosas ya que aumentan la complejidad de la GPU.

Sin embargo, NVIDIA ya tiene una solución que ya ha aparecido en el mercado en forma de GA100 y GH100, que son esencialmente dos mitades de un troquel más pequeño conectado con una interconexión y se comunican a través de un caché L2 dividido. Bryan Catanzaro de NVIDIA explicó que esta implementación mejora la escalabilidad y que su transición inicial a este diseño se realizó sin problemas. También se espera que el chip se base en el nodo de proceso TSMC N4P (5 nm), que mejora la densidad en un 30% (transistor), por lo que también debería aportar una mejora importante además de la actualización arquitectónica.

Ahora, NVIDIA probablemente hará lo mismo en el lado de los juegos, lo que significa que si todo vale la pena, entonces podremos ver una oferta de chiplet estilo B100/B200 en el futuro.

Ahora, volviendo a la NVIDIA GeForce RTX 5090, hay varios informes de que podríamos obtener una interfaz de 512 bits en el buque insignia de próxima generación y ya hay información sobre una nueva solución de refrigeración y PCB en proceso para este monstruo de una tarjeta.

Teniendo en cuenta que los rumores sugieren que AMD se retira del segmento de rendimiento de gráficos de gama ultra alta con su línea RDNA 4, parece que NVIDIA podría impulsar aún más su liderazgo en el segmento de juegos con las GPU Blackwell una vez que salgan a la carretera. Se espera que la NVIDIA GeForce RTX 5090 se lance unas semanas después de la RTX 5080, que se rumorea que es la primera GPU para juegos Blackwell en los estantes.

Especificaciones de la GPU NVIDIA Blackwell ‘GB202’ ‘preliminares’:

Nombre de la GPU GB202 AD102
GPC 12 (por GPU)? 12 (por GPU)
TPC 8 (por GPC)? 6 (por GPC)
SM 2 (por TPC)? 2 (por TPC)
Total de SM 192? 144
Subnúcleo Por determinar 4 (por SM)
FP32 128 (por SM)? 128 (por SM)
FP32+INT32 Por determinar 128 (por SM)
Núcleos CUDA 24.567? 18.432
Deformaciones Por determinar 64 (por SM)
Hilos Por determinar 2048 (por SM)
Caché L1 Por determinar 192 KB (por SM)
Caché L2 Por determinar 96 MB (por GPU)
ROP Por determinar 32 (por GPC)
Estándar de memoria GDDR7 GDDR6X
Bus de memoria máxima 512 bits 384 bits
Límite máximo de memoria ¿48 GB? 24GB

¿Qué GPU NVIDIA GeForce RTX 50 esperas más?

Comparte esta historia

Facebook

Gorjeo





Source link-29