La APU AMD Instinct MI300A con GPU CDNA 3, CPU Zen 4 y memoria unificada ofrece hasta 4 veces más velocidad que las GPU discretas en HPC


Las APU Instinct MI300A de AMD ofrecen una mejora sustancial del rendimiento en cargas de trabajo HPC en comparación con las GPU discretas tradicionales.

Dejando a un lado las GPU discretas, las APU Instinct MI300A de AMD potenciarán las cargas de trabajo HPC con un rendimiento de hasta 4 veces

El AMD Instinct MI300A es la realización de la plataforma «Exascale APU» que se presentó hace años. La idea era empaquetar una GPU de alto rendimiento junto con una CPU de alto rendimiento en el mismo paquete que aprovecha un grupo de memoria unificado. Para HPC, estos diseños de aceleradores/coprocesadores brindan mayores ventajas de rendimiento por vatio, pero requieren una gran cantidad de portabilidad, ajuste y mantenimiento de aplicaciones con millones de líneas de código, lo que puede ser un poco complicado. Sin embargo, parece que los investigadores han utilizado dos modelos de programación populares, OpenMP y OpenACC, para aprovechar al máximo la APU gigante de próxima generación de AMD.

Para este trabajo de investigación, titulado «Transferencia de aplicaciones HPC a AMD Instinct MI300A usando memoria unificada y OpenMP», se utiliza el marco OpenFOAM, que es una biblioteca C++ de código abierto:

  • Proporcionamos un modelo del modelo de programación de APU y demostramos la facilidad y flexibilidad de portar códigos en MI300A con OpenMP.
  • Elaboramos nuestro método para la aceleración incremental de la producción y ampliamente utilizado en el código de la industria: OpenFOAM.

Dado que el acelerador AMD Instinct MI300A utiliza una interfaz HBM unificada, elimina la necesidad de replicación de datos y no requiere una distinción de programación entre los espacios de memoria del host y del dispositivo. Además, el paquete de software ROCm de AMD proporciona optimizaciones adicionales que ayudan a combinar todos los segmentos de la APU en un paquete coherente y heterogéneo. Como un pequeño resumen de las APU Instinct MI300A de AMD:

  • Primer paquete integrado de CPU+GPU
  • Apuntando al mercado de supercomputadoras a exaescala
  • AMD MI300A (CPU + GPU integradas)
  • 153 mil millones de transistores
  • Hasta 24 Zen 4 núcleos
  • Arquitectura de GPU CDNA 3
  • Hasta 192 GB de memoria HBM3
  • Hasta 8 chiplets + 8 pilas de memoria (proceso de 5 nm + 6 nm)
Fuente de la imagen: Aarxiv

Como resultado, el rendimiento obtiene un gran beneficio. En la evaluación utilizando el punto de referencia de motocicletas HPC de OpenFOAM, la APU AMD Instinct MI300A se probó con las GPU AMD Instinct MI210, NVIDIA A100 de 80 GB y NVIDIA H100 (80 GB). Las GPU AMD se ejecutaban en la pila ROCm 6.0 y las GPU NVIDIA se ejecutaban en la pila CUDA 12.2.2. El punto de referencia se configuró para ejecutarse durante 20 pasos de tiempo y el tiempo promedio de ejecución por paso de tiempo (segundos) se tomó como figura de mérito (FOM). Las tres configuraciones, además del Instinct MI300A, usaban una CPU discreta, por lo que se configuró una CPU con socket con administración de memoria heterogénea para permitir que las GPU direccionen la memoria del sistema y ejecuten el punto de referencia.

Al llegar a las pruebas, los resultados se normalizaron para el sistema NVIDIA H100, que ofrecía el mejor rendimiento de GPU discreta entre los tres chips discretos, pero la APU Instinct MI300A terminó con una ganancia 4 veces mayor que la NVIDIA H100 y una ganancia 5 veces mayor que el acelerador Instinct MI210. .

  • En las GPU, más del 65% del tiempo se dedica a migraciones de páginas: actualizar tablas de GPU y copiar datos entre el host y el dispositivo.
  • En la APU, la memoria física unificada compartida entre los núcleos de la CPU y las unidades de cómputo de la GPU elimina por completo la sobrecarga de las migraciones de páginas, lo que resulta en un aumento significativo del rendimiento.
Fuente de la imagen: Aarxiv

También se descubrió que el AMD Instinct MI300A con un paquete de CPU Zen 4 singular era dos veces más rápido que una CPU Zen 4 de un solo socket que se ejecutaba con una solución de GPU discreta. La sobrecarga de la APU MI300A con múltiples procesos mejoró aún más el rendimiento al doble (prueba con 3-6 núcleos de CPU por APU), lo cual es mucho mejor que la falta de escalabilidad en una configuración dGPU+dCPU.

Como resultado, parece que las capacidades informáticas de la APU AMD Instinct MI300A no tendrán comparación en el segmento HPC. NVIDIA ha dado un paso atrás respecto del rendimiento tradicional de HPC en su línea Blackwell de próxima generación, ya que la IA parece ser la principal moda en estos días y, aunque AMD va a abordar eso con sus aceleradores MI300X y sus futuras actualizaciones, parece que el segmento HPC traerá a AMD a lo más destacado.

Fuente de noticias: nicolas malaya

Comparte esta historia

Facebook

Gorjeo





Source link-29