Conocido filtrador de hardware @kopite7kimi, quien ha demostrado conocer los detalles sobre los planes de Nvidia, ha compartido algunos de sus pensamientos sobre posibles configuraciones de las GPU Blackwell de próxima generación de Nvidia. Si sus suposiciones, presumiblemente basadas en el conocimiento de ciertos detalles, son correctas, entonces Blackwell de Nvidia puede obtener una gran mejora en términos de número de núcleos CUDA e interfaz de memoria. Sin embargo, dado que esta información no es oficial, se debe tomar con precaución.
«Como mencioné antes, GA100 tiene 8 [GPC] * 8 [TPC]y GH100 es 8 [GPC] * 9 [GTC],» @kopite7kimi escribió en una publicación X. «[Compute] GB100 tendrá una estructura básica como 8 [GPC] * 10 [TPC]. [Client PC] GB202 parece 12 [GPC] * 8 [TPCs]».
Las GPU de Nvidia están organizadas en grupos de grandes clústeres de procesamiento de gráficos (GPC) compuestos por clústeres de procesamiento de texturas (TPC) más pequeños que, a su vez, constan de un grupo de multiprocesadores de transmisión (SM) que albergan núcleos CUDA reales.
nulo | GPC | TPC por GPC | SM por TPC | Núcleos CUDA por SM | Recuento de núcleos CUDA | Fila 0 – Celda 6 |
GA100 | 8 | 8 | 2 | 64 | 8192 | Fila 1 – Celda 6 |
GA102 | 7 | 6 | 2 | 128 | 10752 | Fila 2 – Celda 6 |
GH100 | 8 | 9 | 2 | 128 | 18432 | Fila 3 – Celda 6 |
AD102 | 12 | 6 | 2 | 128 | 18432 | Fila 4 – Celda 6 |
GB100 | 8 | 10 | 2 | 128 | 20480 | Fila 5 – Celda 6 |
GB202 | 12 | 8 | 2 | 128 | 24576 | Fila 6 – Celda 6 |
Suponiendo que la reconocida filtración de hardware sea correcta y que Nvidia esté preparada para mantener la cantidad de multiprocesadores de transmisión por TPC y núcleos CUDA por SM, entonces la GPU de cómputo GB100 de la compañía para aplicaciones de inteligencia artificial (IA) y computación de alto rendimiento (HPC) obtendrá 20,480 núcleos CUDA (un aumento del 11% con respecto al GH100) en su configuración completa, mientras que la GPU GB202 orientada a PC cliente obtendrá 24,576 núcleos CUDA (un aumento del 33% con respecto al AD102) en su configuración completa.
Dadas las cargas de trabajo que encontrará GB100, es lógico que Nvidia utilice GPC «gordos» con tantos TPC por GPC como sea posible para minimizar el intercambio de datos entre TPC tanto como sea posible. Al mismo tiempo, podría ser razonable que Nvidia hiciera los GPC del GB202 algo más «gordos» de lo que son hoy para simplificar la organización interna de la GPU. Sin embargo, una organización completamente nueva de GPC probablemente requerirá optimizaciones de controladores.
Además de una nueva microarquitectura y un mayor número de núcleos CUDA, se espera que el GB100 de Nvidia tenga una interfaz de memoria HBM3/HBM3E de 8.192 bits, mientras que se proyecta que el GB202 tenga un bus de memoria GDDR7 de 512 bits, el reclamaciones de filtraciones.
Hace aproximadamente una semana, @kopite7kimi asumió que Blackwell de Nvidia podría ser la primera GPU en adoptar una arquitectura multichiplet, pero no dio más detalles. No está claro si habló sobre la cantidad de GPC y TPC en un chiplet o en varios de ellos. Teniendo en cuenta que la tecnología de proceso TSMC N3 (que presumiblemente se utilizará para fabricar las GPU Blackwell) tiene ventajas limitadas sobre la N4 en lo que respecta a la densidad de transistores y que la GH100 de Nvidia ya está cerca del tamaño máximo de matriz posible utilizando los equipos de litografía existentes, es posible que Nvidia sólo ha logrado exprimir 20.480 núcleos CUDA en 100 GB. En este caso, podría ser razonable que Nvidia utilice dos matrices GB100 para su GPU informática de próxima generación.
Suponiendo que las GPU Blackwell lleguen a finales de 2024 o principios de 2025, las especificaciones objetivo de los procesadores Blackwell de próxima generación de Nvidia se establecieron hace más de un año y, a estas alturas, las GPU Blackwell de gama más alta probablemente ya se hayan agotado. Probablemente se estén probando muestras de estos dispositivos en algún lugar de los laboratorios de la empresa. Como resultado, hay cientos de personas en Nvidia que conocen las especificaciones de las GPU Blackwell de la compañía y pueden compartir algunos detalles con personas ajenas al diseñador del chip.
Dicho esto, es posible que @kopite7kimi tenga información más o menos precisa sobre las GPU Blackwell de próxima generación de Nvidia. Sin embargo, también es posible que todos los detalles sobre las próximas GPU de Nvidia sean esencialmente conjeturas fundamentadas en lugar de información sólida y real.