{"id":1144641,"date":"2024-05-27T06:56:30","date_gmt":"2024-05-27T06:56:30","guid":{"rendered":"https:\/\/magazineoffice.com\/la-gpu-nvidia-geforce-rtx-5090-contara-con-un-enorme-troquel-monolitico-gb202-blackwell\/"},"modified":"2024-05-27T06:56:34","modified_gmt":"2024-05-27T06:56:34","slug":"la-gpu-nvidia-geforce-rtx-5090-contara-con-un-enorme-troquel-monolitico-gb202-blackwell","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/la-gpu-nvidia-geforce-rtx-5090-contara-con-un-enorme-troquel-monolitico-gb202-blackwell\/","title":{"rendered":"La GPU NVIDIA GeForce RTX 5090 contar\u00e1 con un enorme troquel monol\u00edtico GB202 \u00abBlackwell\u00bb"},"content":{"rendered":"
\n<\/p>\n
La GPU insignia GeForce RTX 5090 de NVIDIA contar\u00e1 con una matriz GB202 \u00abBlackwell\u00bb masiva y monol\u00edtica, informa Kopite7kimi.<\/p>\n
Seg\u00fan lo que sabemos hasta ahora, la GPU NVIDIA GB202 \u00abBlackwell\u00bb alimentar\u00e1 la tarjeta gr\u00e1fica insignia GeForce RTX 5090. Las especificaciones preliminares han revelado hasta 192 SM que representar\u00e1n hasta 24,567 n\u00facleos CUDA si el chip conserva los 128 n\u00facleos por dise\u00f1o SM de los chips AD102 \u00abAda\u00bb. Ahora, seg\u00fan un nuevo tweet del experto, Kopite7kimi, se revela que la GPU utilizar\u00e1 un dise\u00f1o monol\u00edtico.<\/p>\n
\nf\u00edsicamente monol\u00edtico<\/p>\n
-kopite7kimi (@kopite7kimi) 23 de mayo de 2024<\/a><\/p>\n<\/blockquote>\n
Si bien NVIDIA ha cambiado a un dise\u00f1o de chiplet para sus chips HPC\/AI, como el B100 y el B200, parecer\u00e1 que la compa\u00f1\u00eda todav\u00eda quiere conservar los paquetes monol\u00edticos para sus matrices de GPU orientadas al consumidor. Se dice que la GPU GB202 \u00abBlackwell\u00bb tendr\u00e1 un dise\u00f1o f\u00edsicamente monol\u00edtico y, seg\u00fan informes anteriores, sabemos que se espera que presente el doble de SM y n\u00facleos que GB203, que es un troquel m\u00e1s reducido para los gustos. de la GeForce RTX 5080. Eso formar\u00e1 una gran disparidad en el rendimiento entre las dos tarjetas, pero la RTX 5090 se perfila como una completa bestia.<\/p>\n
Hablaremos m\u00e1s sobre la NVIDIA GeForce RTX 5090 en un momento, pero antes de eso, hablemos un poco m\u00e1s sobre la GPU GB202 \u00abBlackwell\u00bb. Parece que estamos ante un dise\u00f1o monol\u00edtico, pero tampoco podemos descartar la posibilidad de un dise\u00f1o estilo chiplet debajo del cap\u00f3.<\/p>\n
<\/figure>\nB\u00e1sicamente, es posible que NVIDIA incluya dos matrices GB203 en un paquete monol\u00edtico sin que parezca un dise\u00f1o de chiplet. Permitir\u00e1 una mejor comunicaci\u00f3n entre los chips en lugar de los cuellos de botella en la comunicaci\u00f3n fuera del chip asociados con las implementaciones adecuadas de chiplets. Si bien NVIDIA tiene soluciones para superar los cuellos de botella, como NVLINK y otras interconexiones, pueden resultar un poco costosas ya que aumentan la complejidad de la GPU.<\/p>\n
\nHace cuatro a\u00f1os, dividimos GA100 en dos mitades que se comunican a trav\u00e9s de una interconexi\u00f3n. Fue un gran movimiento y, sin embargo, casi nadie lo not\u00f3, gracias al incre\u00edble trabajo de CUDA y el equipo de GPU.<\/p>\n
Hoy, ese trabajo se hace realidad con el lanzamiento de Blackwell. Dos mueren. Una GPU incre\u00edble. https:\/\/t.co\/XuaUQPskkM pic.twitter.com\/svRKhwPYEn<\/a><\/p>\n
\n\n
\n \nNombre de la GPU<\/th>\n GB202<\/th>\n AD102<\/th>\n<\/tr>\n<\/thead>\n \n GPC<\/td>\n 12 (por GPU)?<\/td>\n 12 (por GPU)<\/td>\n<\/tr>\n \n TPC<\/td>\n 8 (por GPC)?<\/td>\n 6 (por GPC)<\/td>\n<\/tr>\n \n SM<\/td>\n 2 (por TPC)?<\/td>\n 2 (por TPC)<\/td>\n<\/tr>\n \n Total de SM<\/td>\n 192?<\/td>\n 144<\/td>\n<\/tr>\n \n Subn\u00facleo<\/td>\n Por determinar<\/td>\n 4 (por SM)<\/td>\n<\/tr>\n \n FP32<\/td>\n 128 (por SM)?<\/td>\n 128 (por SM)<\/td>\n<\/tr>\n \n FP32+INT32<\/td>\n Por determinar<\/td>\n 128 (por SM)<\/td>\n<\/tr>\n \n N\u00facleos CUDA<\/td>\n 24.567?<\/td>\n 18.432<\/td>\n<\/tr>\n \n Deformaciones<\/td>\n Por determinar<\/td>\n 64 (por SM)<\/td>\n<\/tr>\n \n Hilos<\/td>\n Por determinar<\/td>\n 2048 (por SM)<\/td>\n<\/tr>\n \n Cach\u00e9 L1<\/td>\n Por determinar<\/td>\n 192 KB (por SM)<\/td>\n<\/tr>\n \n Cach\u00e9 L2<\/td>\n Por determinar<\/td>\n 96 MB (por GPU)<\/td>\n<\/tr>\n \n ROP<\/td>\n Por determinar<\/td>\n 32 (por GPC)<\/td>\n<\/tr>\n \n Est\u00e1ndar de memoria<\/td>\n GDDR7<\/td>\n GDDR6X<\/td>\n<\/tr>\n \n Bus de memoria m\u00e1xima<\/td>\n 512 bits<\/td>\n 384 bits<\/td>\n<\/tr>\n \n L\u00edmite m\u00e1ximo de memoria<\/td>\n \u00bf48 GB?<\/td>\n 24GB<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n <\/p>\n
\n<\/p>\n\u00bfQu\u00e9 GPU NVIDIA GeForce RTX 50 esperas m\u00e1s?<\/strong>