La próxima supercomputadora DGX de NVIDIA tiene que ver con la IA generativa


El CEO Jensen Hiang hizo una serie de anuncios durante su discurso de apertura de Computex, incluidos detalles sobre la próxima supercomputadora DGX de la compañía. Teniendo en cuenta hacia dónde se dirige claramente la industria, no debería sorprender que la DGX GH200 se dedique principalmente a ayudar a las empresas a desarrollar modelos.

La supercomputadora utiliza un nuevo sistema de conmutación NVLink para permitir que 256 superchips GH200 Grace Hopper actúen como una sola GPU (cada uno de los chips tiene una CPU Grace basada en Arm y una GPU H100 Tensor Core). Esto, según NVIDIA, permite que la DGX GH200 ofrezca 1 exaflop de rendimiento y tenga 144 terabytes de memoria compartida. La compañía dice que es casi 500 veces más memoria de la que encontraría en un solo sistema DGX A100.

A modo de comparación, el de las supercomputadoras Top500 aparece como el único sistema de exaescala conocido, habiendo alcanzado un rendimiento de casi 1,2 exaflops en el punto de referencia de Linmark. Eso es más del doble del rendimiento máximo del sistema que ocupa el segundo lugar, el .

En efecto, NVIDIA afirma haber desarrollado una supercomputadora que puede estar junto al sistema conocido más poderoso del planeta (Meta está construyendo una que, según afirma, será la supercomputadora de inteligencia artificial más rápida del mundo una vez que esté completamente construida). NVIDIA dice que la arquitectura de la DGX GH200 ofrece 10 veces más ancho de banda que la generación anterior, «ofreciendo la potencia de una supercomputadora de IA masiva con la simplicidad de programar una sola GPU».

Algunos grandes nombres están interesados ​​en la DGX GH200. Google Cloud, Meta y Microsoft deberían estar entre las primeras empresas en obtener acceso a la supercomputadora para probar cómo puede manejar cargas de trabajo generativas de IA. NVIDIA dice que las supercomputadoras DGX GH200 deberían estar disponibles para fines de 2023.

La empresa también está construyendo su propia supercomputadora, Helios, que combina cuatro sistemas DGX GH200. NVIDIA espera que Helios esté en línea a finales de año.

Huang discutió otros desarrollos de IA generativa durante su discurso de apertura, incluido uno en el frente de los juegos. NVIDIA Avatar Cloud Engine (ACE) para juegos es un servicio que los desarrolladores podrán aprovechar para crear modelos de IA personalizados para voz, conversación y animación. NVIDIA dice que ACE for Games puede «dar a los personajes no jugables habilidades de conversación para que puedan responder preguntas con personalidades realistas que evolucionan».



Source link-47