Más de 70 000 núcleos AMD EPYC, 54 millones de núcleos AI


Cerberas y G42 han presentado la supercomputadora de IA 4 Exaflops Condor Galaxy 1 con miles de AMD EPYC PU y millones de núcleos de IA.

Cerebras, en asociación con G42, está listo para abrir nuevas puertas de enlace en computación en la nube e IA generativa

Cerebras Systems, una de las empresas líderes de la industria en IA, y G42, un holding tecnológico, han presentado un nuevo estándar en supercomputadoras interconectadas. Las empresas desarrollarán nueve supercomputadoras diferentes, destacándose la CG-1 (Condor Galaxy 1), que se espera que presente la primera potencia informática de 4 exaFLOP del mundo.

Especificaciones de la supercomputadora Condor Galaxy 1 AI:

  • 4 exaFLOPS de cómputo de IA en FP16 con escasez
  • 54 millones de núcleos de cómputo optimizados para IA
  • 82 terabytes de memoria
  • 64 sistemas Cerebras CS-2
  • La configuración básica admite 600 mil millones de parámetros, ampliables hasta 100 billones.
  • 386 terabits de ancho de banda de estructura de clúster interno
  • 72,704 núcleos de procesador AMD EPYC Gen 3
  • Soporte de hardware nativo para entrenamiento con longitud de secuencia de 50,000 tokens, no se necesitan bibliotecas de terceros.
  • Modelo de programación paralela de datos con escalado de rendimiento lineal

Es posible que haya oído hablar de las empresas mencionadas por primera vez, pero ambas han estado involucradas en el desarrollo tecnológico durante mucho tiempo. Cerebras Systems es conocido por sus esfuerzos en la industria de la IA generativa, principalmente a través de su CS-2 Wafer Scale Engine, que ha alcanzado un hito asombroso de 2,6 billones de transistores. Se dice que el chip es el más grande jamás construido y se cita como un «sistema CS-2 único, similar a una supercomputadora por sí solo».

Sin embargo, Cerebras, en sociedad con G42 ha ido un paso adelante a través de sus nuevas supercomputadoras. Las empresas han proporcionado detalles sobre CG-1, que se espera que establezca un nuevo punto de referencia en la industria. Según la publicación del blog, se dice que CG-1 está vinculado con 64 sistemas Cerebras CS-2, incorporándolos en una sola supercomputadora con una potencia combinada de 4 exaFLOP.

Bueno, si desea conocer el inmenso potencial del CG-1, la supercomputadora activa actual, la Frontier con tecnología AMD, supuestamente está equipada con 1.1 exaFLOP. El CG-1 tiene casi un aumento de cuatro veces, un número enorme en la industria de las supercomputadoras. Esto es lo que el CEO de Cerebras, Andrew Feldman, tiene que decir sobre el desarrollo:

Con 4 exaFLOP de cómputo de IA en FP 16, CG-1 reduce drásticamente los plazos de capacitación de IA y elimina el dolor del cómputo distribuido.

Muchas empresas de la nube han anunciado clústeres de GPU masivos cuya construcción cuesta miles de millones de dólares, pero que son extremadamente difíciles de usar. Distribuir un solo modelo en miles de GPU diminutas requiere meses de tiempo de docenas de personas con experiencia poco común. CG-1 elimina este desafío

Al profundizar en las especificaciones de la supercomputadora CG-1, presenta 4 exaFLOP de potencia de cómputo de 16 bits junto con 600 mil millones de modelos de parámetros. Según se informa, el sistema está equipado con 54 millones de núcleos de cómputo optimizados para IA, 388 terabits por segundo de ancho de banda de estructura y 72,704 núcleos de CPU AMD EPYC. El equipo a bordo no se parece en nada a lo que hemos visto y, a juzgar por las métricas reveladas, el CG-1 está listo para dominar la industria.

AMD se compromete a acelerar la IA con procesadores informáticos de alto rendimiento y productos informáticos adaptables, así como a través de colaboraciones con empresas innovadoras como Cerebras que comparten nuestra visión de la IA generalizada.

Impulsado por más de 70 000 núcleos de procesador AMD EPYC, el Condor Galaxy 1 de Cerebras hará accesibles vastos recursos computacionales para investigadores y empresas a medida que impulsan la IA

-Forrest Norrod, vicepresidente del grupo empresarial de soluciones de centro de datos de AMD

Las ambiciones de Cerebras y G42 no terminan aquí, ya que la empresa tiene la intención de interconectar tres supercomputadoras (CG-1, CG-2 y CG-3), con el objetivo de alcanzar 12 exaFLOP, un hito enorme. Además, la compañía planea poner en funcionamiento otras seis supercomputadoras para 2024, elevando el listón a 36 exaFLOP de potencia informática total. Las ambiciones reveladas son de hecho gigantescas en el mundo moderno, y esto podría potencialmente abrir una nueva era en la computación en la nube y la industria de la IA generativa.

galaxia del cóndor Fase 1 Entregada Fase 2 Q4 2023 Fase 3 H1 2024 Fase 4 H2 2024
exaFLOPS 2 4 12 36
Sistemas CS-2 32 64 192 576
Centros de supercomputación 1 1 3 9
Hito Mayor despliegue de CS-2 hasta la fecha Primera supercomputadora Cerebras AI de 64 nodos Primera red de supercomputadoras distribuidas La red de supercomputadoras distribuidas más grande

Fuente de noticias: Cerebras

Comparte esta historia

Facebook

Gorjeo



Source link-29