Más de 63 000 chips Xeon GPU Max y 21 000 chips Xeon CPU Max


Intel & Argonne National Laboratory anuncia la instalación exitosa de blade en la supercomputadora Aurora, acercándola un paso más a la funcionalidad completa.

La supercomputadora Aurora basada en Intel cuenta con 2 ExaFLOPS de potencia de cómputo, superando potencialmente la frontera de AMD

La supercomputadora Aurora ha sido víctima de varios retrasos desde su creación, pero es posible que finalmente la veamos funcionando. Para aquellos que no lo saben, la supercomputadora Aurora presenta las series Xeon CPU Max y Xeon GPU Max de Intel, elevando su rendimiento a 2 ExaFLOPS. Una de las aplicaciones de la plataforma Aurora será proporcionar un modelo de IA generativo de última generación para la ciencia.

Ofrece 10 624 nodos con 21 248 CPU Xeon de la línea Sapphire-Rapid SP. Viene con un total de 63.744 GPU basadas en el diseño Ponte Vecchio, lo que le permite ofrecer una inyección máxima de 2,12 PB/s y un ancho de banda de bisección máximo de 0,69 PB/s.

Así es como la supercomputadora Aurora con tecnología Intel tiene una ventaja, como lo detalló anteriormente el vicepresidente de Intel Super Compute Group, Jeff McVeigh:

  • La Intel Data Center GPU Max Series supera a la tarjeta Nvidia H100 PCIe en un promedio del 30 % en diversas cargas de trabajo1, mientras que el proveedor de software independiente Ansys muestra un aumento del 50 % en la velocidad de la GPU Max Series sobre H100 en aplicaciones HPC aceleradas por IA.
  • La CPU de la serie Xeon Max, el único procesador x86 con memoria de gran ancho de banda, muestra una mejora del 65 % con respecto al procesador Genoa de AMD en la prueba comparativa de gradientes conjugados de alto rendimiento (HPCG)1, utilizando menos energía. El alto ancho de banda de la memoria se ha señalado como una de las funciones más deseadas por los clientes de HPC.
  • Los procesadores escalables Intel Xeon de 4.ª generación, los más utilizados en HPC, ofrecen un aumento de velocidad promedio del 50 % con respecto al Milan4 de AMD, y el clúster HPC Xeon de 4.ª generación más nuevo de la empresa de energía BP proporciona un aumento de 8 veces en el rendimiento con respecto a sus procesadores de la generación anterior con una eficiencia energética mejorada .
  • El acelerador de aprendizaje profundo Gaudi2 tiene un rendimiento competitivo en la inferencia y el entrenamiento de aprendizaje profundo, con un rendimiento hasta 2,4 veces más rápido que Nvidia A100.

Para la capacidad de memoria, la supercomputadora Aurora cuenta con 10,9 PB de DRAM de sistema DDR5, 1,36 PB de capacidad HBM a través de las CPU y 8,16 PB de capacidad HBM a través de las GPU. Además, utiliza una disposición de 1024 nodos de almacenamiento que proporcionan una capacidad total de 220 TB. Si tiene curiosidad acerca de cómo se utilizará este sistema gigantesco, la siguiente es una explicación rápida:

Desde abordar el cambio climático hasta encontrar curas para enfermedades mortales, los investigadores enfrentan desafíos monumentales que exigen tecnologías informáticas avanzadas a escala. Aurora está lista para abordar las necesidades de las comunidades de HPC e IA, brindando las herramientas necesarias para ampliar los límites de la exploración científica.

La última Intel Data Center GPU Max Series 1550, que funciona en Aurora, proporciona el mejor rendimiento de SimpleFOMP, superando a los aceleradores NVIDIA A100 y AMD Instinct MI250X. Sin embargo, la supercomputadora aún debe pasar las pruebas preliminares. Después de eso, se espera que aparezca en la lista Top500.org, superando potencialmente a la supercomputadora Frontier con tecnología AMD. La supercomputadora Aurora está en camino de ser completamente funcional para este año.

Comparte esta historia

Facebook

Gorjeo



Source link-29