Intel ofrece 10 000 blades de supercomputadora Aurora, puntos de referencia frente a Nvidia y AMD


(Crédito de la imagen: Intel)

Con dos exaflops de rendimiento, se espera que la supercomputadora Aurora impulsada por Intel supere a la supercomputadora Frontier impulsada por AMD, actualmente la más rápida del mundo, y tome la delantera en la lista Top 500 de las supercomputadoras más rápidas. Sin embargo, debido a los continuos retrasos de Intel en la entrega del hardware, Aurora aún no ha presentado un punto de referencia al comité Top 500, por lo que no figura en la lista anunciada hoy. Intel compartió hoy nuevos detalles sobre el sistema y anunció en la conferencia ISC que ha entregado ‘más’ de 10,000 blades operativos para la supercomputadora Aurora, pero con la advertencia de que estos no son los actual cuchillas necesarias para un despliegue completo. Cubriremos los detalles a continuación.

Sin embargo, Intel dice que el sistema estará en pleno funcionamiento a finales de este año y compartió puntos de referencia con Aurora compitiendo cara a cara con las supercomputadoras impulsadas por AMD y Nvidia, reclamando una ventaja de rendimiento 2X sobre las GPU MI250X de AMD y una ganancia del 20% sobre H100 de Nvidia. GPU.

Intel dice que ha entregado el silicio para «más» de 10,000 cuchillas, tanto los chips Sapphire Rapids Xeon de cuarta generación como las GPU Ponte Vecchio, a Argonne Leadership Computing Facility (ALCF).

Sin embargo, Aurora está diseñada para funcionar con los chips Sapphire Rapids «Xeon Max» equipados con HBM de Intel, que se han retrasado perpetuamente. Debido a esos retrasos, Intel inicialmente comenzó a enviar a ALCF los chips Sapphire Rapids que no son de HBM, y la instalación comenzó a poblar Aurora con los Sapphire Rapids estándar que no son de HBM como medida provisional.

Intel ahora proporciona los chips Xeon Max equipados con HBM más rápidos a ALCF, pero no todos los 10,000 blades que promociona como entregados tienen los chips Max debajo del capó. Preguntamos a Intel y los representantes de la empresa confirmaron que no todos los blades están equipados con el silicio Xeon Max final. La compañía nos dice que aproximadamente el 75% de las palas contienen la revisión final Xeon Max del silicio. Presumiblemente, ese es el cuello de botella que impide que el sistema envíe un punto de referencia para la lista Top500.

El sistema consta de 166 racks con 64 blades por rack, para un total de 10 624 blades, por lo que es probable que los «más» de 10 000 blades entregados sean suficientes para que el sistema esté operativo, pero no a pleno rendimiento.

Intel también compartió más especificaciones para la supercomputadora Aurora, incluidas las especificaciones detalladas que puede ver en la diapositiva anterior. Con 21 248 CPU y 63 744 GPU Ponte Vecchio, Aurora cumplirá o superará los dos exaflops de rendimiento cuando esté completamente en línea antes de fin de año. El sistema también cuenta con 10,9 petabytes (PB) de memoria DDR5, 1,36 PB de HBM conectados a las CPU, 8,16 PB de memoria GPU y 230 PB de capacidad de almacenamiento que entrega 31 TB/s de ancho de banda (otros detalles interesantes se incluyen en el diapositiva arriba).

Intel también reveló que Aurora comenzaría a ejecutar cargas de trabajo generativas de IA en una gran cantidad de cargas de trabajo. El modelo de lenguaje grande ‘Aurora GPT’ estará orientado a la ciencia y tendrá 1 billón de parámetros con las bases de Megatron y DeepSpeed. Intel proporcionó el siguiente resumen del proyecto:

«Estos modelos generativos de IA para la ciencia se entrenarán en texto general, código, textos científicos y datos científicos estructurados de biología, química, ciencia de los materiales, física, medicina y otras fuentes. Los modelos resultantes (con hasta 1 billón de parámetros) se utilizará en una variedad de aplicaciones científicas, desde el diseño de moléculas y materiales hasta la síntesis de conocimiento a través de millones de fuentes para sugerir experimentos nuevos e interesantes en biología de sistemas, química de polímeros y materiales energéticos, ciencia del clima y cosmología. utilizarse para acelerar la identificación de procesos biológicos relacionados con el cáncer y otras enfermedades y sugerir objetivos para el diseño de fármacos».



Source link-41