GPU Intel Max Series Data Center: 128 GB HBM2e, 52 TFLOP por OAM, 8 OAM máx., hasta 2 veces más rápido que NVIDIA A100 en cargas de trabajo específicas


Intel, hoy, anunció la GPU Intel Data Center, que es la misma plataforma que conocemos y amamos como Ponte Vecchio y la idea que inició las ambiciones de GPU de Intel. Intel ha compartido mucha información y puntos de referencia en esta plataforma y, considerando que ya comenzó a enviarse a Argonne, no es realmente sorprendente que estemos comenzando a ver comparaciones de rendimiento reales ahora.

Intel lanza formalmente Ponte Vecchio como Data Center GPU Max, servidores blade ya disponibles

La GPU Intel ‘Ponte Vecchio’ o ‘Intel Data Center GPU Max Series’, como ahora le gusta llamarla a la compañía, es un producto importante que tiene 128 Xe Cores, 128 RT cores (lo que la convierte en la única GPU HPC/AI que tiene un núcleo de trazado de rayos nativo), hasta 64 MB de caché L1 y hasta 408 MB de caché L2. También se han utilizado 128 GB de HBM2e y el IO conectará hasta 8 troqueles discretos. PCIe Gen 5 se está utilizando junto con Xe Link para ofrecer una gran cantidad de potencia de procesamiento. Se crea utilizando una combinación de Intel 7, TSMC N5 y TSMC N7 empaquetados a través de enfoques EMIB y Foveros.

intel-sc-22-press-deck-final-embargo-6am-pt-nov-9-1-page-054
intel-sc-22-press-deck-final-embargo-6am-pt-nov-9-1-page-053

Las GPU de la serie Max estarán disponibles en varios factores de forma para abordar las diferentes necesidades de los clientes:

  • GPU Max Serie 1100: Una tarjeta PCIe de doble ancho de 300 vatios con 56 núcleos Xe y 48 GB de HBM2e
    memoria. Se pueden conectar varias tarjetas a través de puentes Intel Xe Link.
  • GPU Max Serie 1350: Un módulo OAM de 450 vatios con 112 núcleos Xe y 96 GB de HBM.
  • GPU Max Serie 1550: Módulo OAM de 600 vatios de rendimiento máximo de Intel con 128 Xe
    núcleos y 128 GB de HBM.

Intel dice que la arquitectura permitirá que se conecten hasta 8 OAM para un rendimiento absoluto en modo bestia y, según los números que dieron para 4 OAM, podemos calcular lo siguiente:

  • 1 OAM: 128 GB HBM2e, 128 Xe Cores, 600 W TDP, 52 TFLOP, 3,2 TB/ancho de banda de memoria
  • 2 AM: HBM2e de 256 GB, 256 núcleos Xe, TDP de 1200 W, 104 TFLOPS, ancho de banda de memoria de 6,4 TB/s
  • 4 OAM: HBM2e de 512 GB, 512 núcleos Xe, TDP de 2400 W, 208 TFLOPS, ancho de banda de memoria de 12,8 TB/s

Ahora hablemos del rendimiento.

Las GPU de la serie Max ofrecen hasta 128 núcleos Xe-HPC, la nueva arquitectura fundamental dirigida a las cargas de trabajo informáticas más exigentes. Además, las características de la GPU de la serie Max:

Intel afirma que cada OAM es 2 veces más rápido que un NVIDIA 100 en OpenMC y miniBUDE.

Intel afirma que Intel Data Center GPU Max Series tiene una ventaja de rendimiento agregado de 1.5x en ExaSMR: cargas de trabajo de simulación de reactor nuclear virtual NekRS como AdvSub, FDM (FP32), AxHelm (FP32) y AxHelm (FP64).

Finalmente, también reclaman la corona de rendimiento (en comparación con NVIDIA A100) en cargas de trabajo financieras como Riskfuel que se utilizan para entrenar modelos de precios de opciones de crédito.

Intel también reiteró su intención de estrenar el bestial sucesor del Ponte Vecchio, que será el Puente de Rialto. Albergará hasta 160 núcleos Xe en un nuevo factor de forma OAM v2. El mayor cambio en la GPU está en el diseño del troquel. Mientras que Ponte Vecchio tiene 16 troqueles Xe-HPC, cada uno con 8 núcleos Xe para un total de 128 núcleos o 16 384 ALU, la GPU Rialto Bridge viene con 8 16 troqueles Xe-HPC. Eso debería ser 20 núcleos Xe por troquel para un total de 160 núcleos Xe en los 8 troqueles. Eso redondea a 20,480 ALU, lo que representa un aumento del 25 por ciento con respecto a su predecesor.

La presentación completa se puede ver a continuación:



Source link-29