Hasta 4 veces más rápido que NVIDIA H100 en HPC, dos veces más eficiente


Además del MI300X para IA, AMD también anuncia que su APU Instinct MI300A ha entrado en producción en volumen y se espera que ofrezca el rendimiento HPC más rápido del mundo cuando se lance el próximo año.

AMD lleva la HPC al siguiente nivel con las APU Instinct MI300A, 4 veces más rápidas y 2 veces más eficientes que NVIDIA H100

Hemos esperado durante años a que AMD finalmente cumpla la promesa de una APU de clase exaescala y ese día se acerca a medida que nos acercamos al lanzamiento del Instinct MI300A. Hoy, AMD confirmó que la APU MI300A entró en producción en volumen este trimestre y está en camino de convertirse en la solución HPC más rápida del mundo cuando esté disponible en 2024.

La APU AMD Instinct MI300A es una combinación de varias arquitecturas y tecnología de interconexión con la arquitectura Zen 4, CDNA 3 y 4th Gen Infinity a la vanguardia. Algunos de los aspectos más destacados de las APU MI300A incluyen:

  • Computación FP64 de hasta 61 TFLOPS
  • Computación FP32 de hasta 122 TFLOPS
  • Hasta 128 GB de memoria HBM3
  • Ancho de banda de memoria de hasta 5,3 TB/s
  • 146 mil millones de transistores

El empaque del MI300A es muy similar al del MI300X, excepto que utiliza capacidades de memoria optimizadas para TCO y núcleos Zen 4. Así que vayamos a los detalles de esta potencia a exaescala para los centros de datos de IA y HPC de próxima generación.

Acelerador AMD Instinct MI300A.

Uno de los troqueles activos tiene dos GCD CDNA 3 cortados y reemplazados por tres CCD Zen 4 que ofrecen su grupo separado de caché e IP centrales. Obtienes 8 núcleos y 16 subprocesos por CCD, lo que da un total de 24 núcleos y 48 subprocesos en el chip activo. También hay 24 MB de caché L2 (1 MB por núcleo) y un grupo de caché separado (32 MB por CCD). Cabe recordar que los GCD CDNA 3 también tienen la caché L2 separada.

Muere el acelerador AMD Instinct MI300A con CDNA 3 y Zen 4.

Para el lado de la GPU, AMD ha habilitado un total de 228 unidades de cómputo basadas en la arquitectura CDNA 3, lo que equivale a 14,592 núcleos. Eso son 38 unidades de cómputo por chiplet de GPU. Resumiendo algunas de las características destacadas de los aceleradores AMD Instinct MI300, tenemos:

  • Primer paquete integrado de CPU+GPU
  • Apuntando al mercado de supercomputadoras a exaescala
  • AMD MI300A (CPU + GPU integradas)
  • 146 mil millones de transistores
  • Hasta 24 Zen 4 núcleos
  • Arquitectura de GPU CDNA 3
  • 228 unidades de cómputo (14,592 núcleos)
  • Hasta 128 GB de memoria HBM3
  • Hasta 8 chiplets + 8 pilas de memoria (proceso de 5 nm + 6 nm)
amd-instinct-mi300a-apu-para-hpc_4
amd-instinct-mi300a-apu-para-hpc_5

En cuanto a las cifras de rendimiento, AMD una vez más comparó el MI300A con el H100, pero esta vez en cargas de trabajo específicas de HPC. En OpenFOAM, la APU Instinct MI300A ofrece hasta 4 veces más rendimiento que proviene principalmente del diseño de memoria unificado, el rendimiento de la GPU y la capacidad general de la memoria y el ancho de banda. El sistema también ofrece hasta el doble de rendimiento por vatio en comparación con los superchips Grace Hopper de NVIDIA.

AMD también confirmó que las APU Instinct MI300A ya están disponibles y también se utilizarán para alimentar la supercomputadora El-Capitan de próxima generación, que se espera que entregue hasta 2 exaflops de cómputo. Cabe mencionar que AMD es la única empresa que ha superado la barrera del 1 exaflop con el superordenador Frontier y además es el sistema más eficiente del planeta.

Comparte esta historia

Facebook

Gorjeo



Source link-29