Las CPU Intel Sapphire Rapids Xeon muestran resultados sorprendentes frente a AMD EPYC Genoa en AVX-512


La familia Xeon de cuarta generación de Intel, Sapphire Rapids, ha mostrado algunos resultados sorprendentes frente a la línea EPYC Genoa de AMD en cargas de trabajo AVX-512.

Pruebas comparativas de rendimiento de AVX-512 completadas en CPU AMD Genoa, Intel Sapphire Rapids y Ice Lake

La semana pasada, Intel lanzó los procesadores escalables Xeon de cuarta generación, también conocidos como Sapphire Rapids, que prometen un mayor rendimiento para los procesadores basados ​​en servidor. Introdujeron una nueva ISA, Advanced Matrix Extensions y más para ayudar a expandir la mejora en inteligencia artificial y aprendizaje automático.

Sin embargo, con el conjunto de extensiones AVX-512, que también se utiliza en AI, HPC y ML, se necesitaba más información en el lanzamiento sobre las ganancias de mejora para los procesadores escalables. Michael Larabel, analista de Linux y editor del sitio web de hardware de Linux Phoronix, sometió el nuevo procesador a numerosos puntos de referencia. Lo compararon con su predecesor Ice Lake y los nuevos procesadores Genoa de AMD y los resultados hablan por sí solos.

Larabel inició varias pruebas a través de Phoronix Test Suite, Phoromatic y el sitio web OpenBenchmarking, en el que es el desarrollador principal de todos los proyectos. Las pruebas realizadas en las tres CPU se basaron en probar el rendimiento de AVX en cargas de trabajo como:

  • Magia Neural DeepSparse – Un tiempo de ejecución de CPU que utiliza la escasez que se encuentra en las redes neuronales conduce a un subproducto de la disminución de la computación.
  • LCcero – También conocido como Leela Chess Zero, este software de ajedrez implementa el protocolo UCI, lo que requiere una GUI de ajedrez similar a Arena Chess GUI, BanksiaGUI, Cutechess, Nibbler y Chessbase.
  • Embre – creado por Intel, Embree es un conjunto de núcleos de trazado de rayos para ayudar a los ingenieros de aplicaciones gráficas a mejorar el rendimiento de las aplicaciones de representación fotorrealista.
  • OpenVKL – También creado por Intel, Open VKL está diseñado con un software de código abierto que comprende los datos almacenados con Open VDB y puede acceder a ellos sin conversión.
  • Imagen abierta Eliminación de ruido – Intel Open Image Denoise se basa en Intel oneAPI Deep Neural Network Library, también conocida como oneDNN. En tiempo real, explota conjuntos de instrucciones modernos como Intel SSE4, AVX2 y AVX-512. Esto se hace para que la explotación logre un alto rendimiento de eliminación de ruido.
  • OSPRay (Estudio) – OSPRay Studio de Intel es un programa de visualización y trazado de rayos interactivo de código abierto.
  • unoDNN – La biblioteca de redes neuronales profundas Intel oneAPI (o oneDNN) ofrece un rendimiento optimizado de bloques de construcción de aprendizaje profundo.
  • cpuminer-optar – Cpuminer-opt es un software de minería de CPU bifurcado en dos versiones separadas: Cpuminer-opt y Cpuminer-gr, que se utiliza para la criptomoneda Raptoreum.
  • OpenVINO – Open Visual Inference and Neural Network Optimization es un kit de herramientas gratuito que ayuda a optimizar los modelos de aprendizaje profundo desde un solo marco y los implementa utilizando un motor de inferencia en el hardware de Intel, siendo Intel la empresa que creó el kit de herramientas.
  • miniBUDE – un cálculo central del motor de acoplamiento de la Universidad de Bristol que se encuentra en otros modelos de programación HPC.
  • SMHasher – SMHasher es «un conjunto de pruebas diseñado para probar las propiedades de distribución, colisión y rendimiento de las funciones hash no criptográficas».

Las extensiones AVX-512 activas en la mayoría de las pruebas mostraron buenas ganancias para todas las CPU; sin embargo, las CPU Sapphire Rapids Xeon vieron la mayor ganancia con AVX-512 de hasta un 44 %, mientras que EPYC Genoa vio una ganancia del 21 %.

Sorprendentemente, Intel no solo entregó una mayor ganancia de rendimiento, sino que también entregó la mejor eficiencia con AVX-512, lo cual es bueno considerando que AMD se esforzó mucho en comercializar AVX-512 para chips EPYC Genoa, mientras que Intel no habló mucho sobre AVX-512 en su Sapphire. Chips rápidos. Con AVX-512 habilitado, las CPU Intel Sapphire Rapids pudieron igualar o superar a las piezas de Genoa y solo con AVX-512 los chips EPYC pudieron ofrecer la mejora de impulso. Tenga en cuenta que la ganancia de rendimiento es una comparación de generación contra generación y no una comparación directa con AMD Genoa, ya que Milan no ofreció soporte para AVX-512.

Lo siguiente es lo que Phoronix dijo sobre sus hallazgos:

La media geométrica también muestra la importancia del AVX-512 para el éxito de EPYC Genoa de 4.ª generación al competir con Xeon Scalable de 4.ª generación en cargas de trabajo de HPC. Si Zen 4 no hubiera agregado AVX-512, los resultados deshabilitados de EPYC 9654 2P AVX-512 aparecieron justo detrás del Xeon Platinum 8490H 2P con AVX-512 habilitado. Un procesador de servidor Zen 4 sin AVX-512 habría sido una carrera de cuello a cuello entre Sapphire Rapids y Génova en más cargas de trabajo. Pero en cambio, el EPYC 9654 2P con AVX-512 resultó un 19 % más rápido que los procesadores Xeon Platinum 8490H en este conjunto de pruebas.

Estoy bastante sorprendido de que Intel no haya promocionado más notablemente sus mejoras AVX-512 con 4th Gen Xeon Scalable en el lanzamiento, pero en cualquier caso es bueno ver que AVX-512 brinda una mayor mejora sin tener un impacto significativo en el consumo de energía. eso se vio con generaciones anteriores de procesadores AVX-512. Esto puede beneficiar inmediatamente a una gran cantidad de software existente en comparación con tener que adaptarse para utilizar AMX y los nuevos aceleradores. Con suerte, este AVX-512 más eficiente con Sapphire Rapids emparejado con CPU AMD Zen 4 que ahora tienen AVX-512 llevará a más desarrolladores de software a considerar las optimizaciones AVX-512 para su software.

a través de Phoronix

Larabel anticipa que los desarrolladores continuarán utilizando el software compatible con AVX-512 que ya está en el mercado y disminuirán la tensión de adaptarse al nuevo conjunto de extensiones AMX, donde los aceleradores más recientes necesitarán más aprendizaje y comprensión por parte de los equipos de desarrollo.

Comparte esta historia

Facebook

Gorjeo



Source link-29