Intel anuncia la primera CPU x86 del mundo con memoria HBM: CPU de centro de datos Xeon Max ‘Sapphire Rapids’


Intel anunció hoy la primera CPU x86 del mundo con memoria HBM: la serie Intel Xeon CPU Max. Esta es una línea de productos a la que anteriormente nos referimos como Sapphire Rapids y estará compuesta por 56 núcleos de rendimiento (112 subprocesos) y un TDP de 350 W. Cuenta con un diseño basado en EMIB dividido en cuatro grupos. Pero lo más interesante es que también cuenta con 64 GB de memoria HBM2e dividida en 4 clústeres de 16 GB para un total neto de 1 TB/s de ancho de banda de memoria y más de 1 GB de HBM por núcleo.

Coincidentemente, esta es la misma CPU que alimentará la supercomputadora Aurora en el Laboratorio Nacional de Argonne. Estos también se enviarán al Laboratorio Nacional de Los Alamos y la Universidad de Kyoto. Intel también afirma que la integración de la memoria HBM no requerirá ningún cambio de código y debería ser completamente transparente para el usuario final.

“Para garantizar que no se deje atrás ninguna carga de trabajo de HPC, necesitamos una solución que maximice el ancho de banda, maximice la computación, maximice la productividad del desarrollador y, en última instancia, maximice el impacto. La familia de productos de la serie Intel Max ofrece memoria de alto ancho de banda al mercado más amplio, junto con oneAPI, lo que facilita compartir código entre CPU y GPU y resolver los desafíos más grandes del mundo con mayor rapidez”. -Jeff McVeigh, vicepresidente corporativo y gerente general, Super Compute Group en Intel

Los 56 núcleos, anteriormente con el nombre en código Sapphire Rapids, se construyen a partir de cuatro mosaicos y se conectan mediante el puente de interconexión multi-die (EMIB) de Intel. El paquete incluye 64 GB de HBM y la plataforma contará con PCIe 5.0 y CXL 1.1 I/O.

  • 68 % menos de uso de energía que un clúster AMD Milan-X para el mismo rendimiento de HCPG.
  • Las extensiones AMX aumentan el rendimiento de la IA y ofrecen un rendimiento máximo 8 veces superior al AVX-512 para operaciones de acumulación INT8 con INT32.
  • Brinda flexibilidad para ejecutarse en diferentes configuraciones de memoria HBM y DDR.
  • Puntos de referencia de carga de trabajo:
    • Modelado climático: 2,4 veces más rápido que AMD Milan-X en MPAS-A usando solo HBM.
    • Dinámica molecular: en DeePMD, mejora del rendimiento de 2,8 veces frente a productos de la competencia con memoria DDR5.

Así que hablemos un poco sobre el rendimiento también. Intel reclama una mejora masiva del rendimiento de 5 veces en algunas cargas de trabajo en comparación con los procesadores de la serie Intel Xeon 8380 más antiguos o AMD EPYC 7773X. Vale la pena señalar que AMD anunciará sus CPU basadas en Génova mañana para que el análisis de TCO pueda comenzar en serio entonces.

Las nuevas CPU de Intel también contienen 20 motores aceleradores para cargas de trabajo AVX-512, AMX, DSA e Intel DL Boost. De hecho, Intel cuenta con un aumento del rendimiento de 3,6 veces sobre el 7763 de AMD y 1,2 veces sobre el A100 de NVIDIA en el entrenamiento MLPerf DeepCAM.

La nueva línea de CPU Max aterrizará en 2023 para enfrentarse a Génova de AMD. Se rumoreaba que AMD también estaba considerando las versiones HBM de sus próximas CPU Genoa, pero si no lo han hecho, le daría a Intel una ventaja única en las cargas de trabajo limitadas del ancho de banda de la memoria.

Las CPU Intel Xeon Max debutarán en la supercomputadora Aurora (estas comenzaron a enviarse hace un tiempo), actualmente en construcción en el Laboratorio Nacional de Argonne. Se espera que Aurora se convierta en la primera supercomputadora en superar los 2 exaflops de rendimiento máximo de cómputo de doble precisión. Aurora también será la primera en mostrar el poder de emparejar GPU y CPU de la serie Max en un solo sistema, con más de 10,000 blades, cada uno con seis GPU de la serie Max y dos CPU Xeon Max.

La plataforma de diapositivas completa revelada por Intel se puede ver a continuación:



Source link-29