Las GPU Blackwell B200 totalmente habilitadas de NVIDIA consumen hasta 1200 W, una arquitectura completamente diferente a la de Hopper


Las GPU Blackwell B200 de NVIDIA incorporan una arquitectura completamente nueva en comparación con Hopper pero también consumen casi el doble de energía.

Las GPU NVIDIA Blackwell tienen una potencia nominal de hasta 1200 W, varias configuraciones y todas con una arquitectura completamente nueva

Cuando el CEO de NVIDIA, Jensen Huang, anunció Blackwell durante la conferencia magistral de GTC 2024, la revelación carecía de mucha información técnica y arquitectónica. Pero durante los próximos días de GTC, NVIDIA compartió un poco más de detalles pero aún sin profundizar demasiado en los detalles técnicos que todos estamos esperando. Los nuevos detalles fueron revelados por Jonah Albe (NVIDIA SVP & GPU Architect) e Ian Buck (NVIDIA VP of Hyperscale & HPC).

GPU Blackwell: diseñada para la era de la IA con una arquitectura completamente nueva

Para empezar, todos sabíamos que Blackwell iba a ser una mejora arquitectónica importante con respecto a Hopper y parece que es más que eso, ya que Jonah afirma que Blackwell utiliza una microarquitectura completamente diferente a la de Hopper.

Fuente de la imagen: NVIDIA

Lo que sí sabemos sobre Blackwell es que incluye la tecnología Transformer Engine de segunda generación que agrega formatos de cálculo FP4 y FP6. Estos formatos y las nuevas optimizaciones de software son lo que hacen de Blackwell el chip de IA más rápido de su tipo en el planeta, pero eso ha pasado factura a su cálculo FP64 estándar, que solo ha aumentado un 32% en comparación con hopper. El razonamiento es simple y llano: Blackwell es ante todo un chip de IA y ese es su principal mercado objetivo. FP64 no es tan importante desde la perspectiva de la IA y cuanto más bajo llegue, más rápidas serán las capacidades de inferencia y entrenamiento.

Además, la razón para optar por el chiplet (MCM) es la necesidad de mejorar el rendimiento general en lugar de mejorar los rendimientos. Será interesante ver cómo funciona el primer enfoque MCM de NVIDIA en el campo, ya que estamos hablando de dos GPU que se ejecutan en el mismo paquete. Se menciona que CUDA hace un trabajo bastante bueno en el manejo de las dos GPU y la arquitectura diferente, sin necesidad de realizar cambios importantes por parte de los programadores.

La GPU GB200 tiene las especificaciones completas de Blackwell, 500 W más de potencia que Hopper

Durante el lanzamiento, hubo una confusión particularmente grande en torno a todas las variantes de plataforma y GPU de Blackwell. Jensen afirmó que Blackwell no es una GPU, es una plataforma completa y la plataforma tiene una gama de productos, pero aún se basan en GPU. Hasta el momento, NVIDIA ha anunciado tres variantes oficiales de GPU Blackwell.

Estos incluyen el modelo insignia y el B200 de especificaciones completas que utilizan las plataformas GB200 Superchip. Este chip tiene las capacidades informáticas más altas y tiene un TDP máximo de 1200W. Esto es 500 vatios más que el Hopper H100, que presentaba un TDP de 700 W. Todo el Superchip está equipado con dos de estas GPU B200 y una CPU Grace para hasta 2700 W de potencia (1200 W x 2 para B200 + 300 W CPU/IO).

Fuente de la imagen: NVIDIA

El siguiente es el Blackwell B200 utilizado por las plataformas DGX y HGX, que está optimizado alrededor de 1000W y ofrece casi el 90% del rendimiento de la variante de especificación completa. No se sabe si esta variante solo tiene un TDP más bajo o viene con especificaciones reducidas en comparación con la configuración completa. Por último, está el Blackwell B100, que es una variante más optimizada con un TDP de 700W. Esta variante ofrece alrededor del 80% de rendimiento del B200 (1000W) y el 70% de rendimiento del B200 (1200W).

Existe la posibilidad de una variante de GPU Blackwell de un solo chip, especialmente para plataformas PCIe en el futuro. La arquitectura de GPU Blackwell ya se está incorporando en plataformas RTX e IA de nivel de consumidor como Drive Thor y la futura línea GeForce. Las GPU Blackwell GB200 de NVIDIA comenzarán a enviarse a finales de este año a los primeros clientes importantes de IA, seguido de un aumento de volumen más adelante.

Comparte esta historia

Facebook

Gorjeo



Source link-29