Con dos exaflops de rendimiento, se espera que la supercomputadora Aurora impulsada por Intel supere a la supercomputadora Frontier impulsada por AMD, actualmente la más rápida del mundo, y tome la delantera en la lista Top 500 de las supercomputadoras más rápidas. Sin embargo, debido a los continuos retrasos de Intel en la entrega del hardware, Aurora aún no ha presentado un punto de referencia al comité Top 500, por lo que no figura en la lista anunciada hoy. Intel compartió hoy nuevos detalles sobre el sistema y anunció en la conferencia ISC que ha entregado ‘más’ de 10,000 blades operativos para la supercomputadora Aurora, pero con la advertencia de que estos no son los actual cuchillas necesarias para un despliegue completo. Cubriremos los detalles a continuación.
Sin embargo, Intel dice que el sistema estará en pleno funcionamiento a finales de este año y compartió puntos de referencia con Aurora compitiendo cara a cara con las supercomputadoras impulsadas por AMD y Nvidia, reclamando una ventaja de rendimiento 2X sobre las GPU MI250X de AMD y una ganancia del 20% sobre H100 de Nvidia. GPU.
Intel dice que ha entregado el silicio para «más» de 10,000 cuchillas, tanto los chips Sapphire Rapids Xeon de cuarta generación como las GPU Ponte Vecchio, a Argonne Leadership Computing Facility (ALCF).
Sin embargo, Aurora está diseñada para funcionar con los chips Sapphire Rapids «Xeon Max» equipados con HBM de Intel, que se han retrasado perpetuamente. Debido a esos retrasos, Intel inicialmente comenzó a enviar a ALCF los chips Sapphire Rapids que no son de HBM, y la instalación comenzó a poblar Aurora con los Sapphire Rapids estándar que no son de HBM como medida provisional.
Intel ahora proporciona los chips Xeon Max equipados con HBM más rápidos a ALCF, pero no todos los 10,000 blades que promociona como entregados tienen los chips Max debajo del capó. Preguntamos a Intel y los representantes de la empresa confirmaron que no todos los blades están equipados con el silicio Xeon Max final. La compañía nos dice que aproximadamente el 75% de las palas contienen la revisión final Xeon Max del silicio. Presumiblemente, ese es el cuello de botella que impide que el sistema envíe un punto de referencia para la lista Top500.
El sistema consta de 166 racks con 64 blades por rack, para un total de 10 624 blades, por lo que es probable que los «más» de 10 000 blades entregados sean suficientes para que el sistema esté operativo, pero no a pleno rendimiento.
Intel también compartió más especificaciones para la supercomputadora Aurora, incluidas las especificaciones detalladas que puede ver en la diapositiva anterior. Con 21 248 CPU y 63 744 GPU Ponte Vecchio, Aurora cumplirá o superará los dos exaflops de rendimiento cuando esté completamente en línea antes de fin de año. El sistema también cuenta con 10,9 petabytes (PB) de memoria DDR5, 1,36 PB de HBM conectados a las CPU, 8,16 PB de memoria GPU y 230 PB de capacidad de almacenamiento que entrega 31 TB/s de ancho de banda (otros detalles interesantes se incluyen en el diapositiva arriba).
Intel también reveló que Aurora comenzaría a ejecutar cargas de trabajo generativas de IA en una gran cantidad de cargas de trabajo. El modelo de lenguaje grande ‘Aurora GPT’ estará orientado a la ciencia y tendrá 1 billón de parámetros con las bases de Megatron y DeepSpeed. Intel proporcionó el siguiente resumen del proyecto:
«Estos modelos generativos de IA para la ciencia se entrenarán en texto general, código, textos científicos y datos científicos estructurados de biología, química, ciencia de los materiales, física, medicina y otras fuentes. Los modelos resultantes (con hasta 1 billón de parámetros) se utilizará en una variedad de aplicaciones científicas, desde el diseño de moléculas y materiales hasta la síntesis de conocimiento a través de millones de fuentes para sugerir experimentos nuevos e interesantes en biología de sistemas, química de polímeros y materiales energéticos, ciencia del clima y cosmología. utilizarse para acelerar la identificación de procesos biológicos relacionados con el cáncer y otras enfermedades y sugerir objetivos para el diseño de fármacos».
Intel también se burló de algunos puntos de referencia del sistema Sunspot, una versión más pequeña de dos racks de Aurora con 128 nodos en total. Intel comparó el rendimiento de Sunspot con números extrapolados que representan una supercomputadora Polaris de «tamaño similar» con GPU Nvidia A100 y la supercomputadora Crusher que funciona con GPU MI250X de AMD. Desafortunadamente, Intel no proporcionó notas de prueba ni detalles de estas configuraciones, así que tome los resultados con más de lo habitual.
En una prueba de un solo nodo en una carga de trabajo de predicción de reactores, Intel afirma que su sistema es un 45 % más rápido que el competidor de Nvidia y un 12 % más rápido que el sistema de AMD. En cuanto a las métricas de escalabilidad, Intel afirma que al normalizar la cantidad total de GPU utilizadas en los sistemas de prueba a 96 GPU (los nodos AMD y Nvidia tienen cuatro GPU cada uno, mientras que el sistema Intel tiene seis por nodo), Sunspot ofrece más del doble de rendimiento de los sistemas AMD y Nvidia en la carga de trabajo de Monte Carlo. Para 90 nodos en la carga de trabajo de NWChemEx, Intel afirma que es un 72 % más rápido que un sistema Solaris con Nvidia de 90 nodos.
La supercomputadora Aurora se anunció por primera vez en 2015, con una fecha de finalización prevista para 2018. En ese entonces, el sistema estaba diseñado para usar los procesadores Knights Hill que luego se cancelaron. El sistema ha sido objeto de numerosos rediseños y reprogramaciones en los años posteriores, y la nueva Aurora se anunció en 2019 con un exaflop de rendimiento que se entregará en 2021. Otra reprogramación a fines de 2021 afirmó que el sistema entregaría dos exaflops al finalizar, lo cual es ahora programado para finales de este año.
El largo y sinuoso camino continúa, pero finalmente parece que el final está al menos a la vista. Intel nos dice que entregará todos los procesadores Xeon Max para terminar el sistema pronto, y que el sistema estará completo y presentará su primer punto de referencia Top 500 antes de fin de año.