Intel ha detallado la GPU Ponte Vecchio Xe-HPC de la empresa en Hot Chips 34. En los puntos de referencia proporcionados, el fabricante de chips afirma que Ponte Vecchio ofrece hasta 2,5 veces más rendimiento que Nvidia A100. Pero, como de costumbre, tome los puntos de referencia proporcionados por los proveedores con pinzas.
Ponte Vecchio superó al A100 por márgenes significativos en varios puntos de referencia seleccionados por Intel. La potencia de Intel también ostentó una ventaja de 2x en miniBUDE y 1.5x en ExaSMR. Es una comparación interesante si se tiene en cuenta que el Ponte Vecchio aún no ha salido y que el A100 (Ampere) está en el mercado desde 2020. Y no olvidemos que, según los informes, el Instinct MI250X (Aldebaran) de AMD es tres veces más rápido que el A100. Por lo tanto, Intel debería preocuparse por los productos HPC de próxima generación de AMD y Nvidia.
Si los números de Intel son precisos, Ponte Vecchio podría ser un competidor potencial contra el H100 (Hopper) de próxima generación de Nvidia. Según las especificaciones que tenemos hasta ahora, el H100 debería ser al menos el doble de rápido que el A100, lo que es aún más amenazador en el Instinct MI300 de AMD, que fusiona los chipsets de CPU Zen 4 y GPU CDNA 3 en un solo producto. Apodado como el primer APU del centro de datos del mundo, AMD afirma que el Instinct MI300 representa una mejora de 8 veces en el rendimiento del entrenamiento de IA en comparación con el Instinct MI250X.
Ponte Vecchio vendrá en tres sabores: OAM, subsistema x4 con enlaces Xe y subsistema x4 con enlaces Xe en una plataforma Sapphire Rapids de doble socket. Desafortunadamente, Sapphire Rapids ha sufrido tantos retrasos que ya no tiene gracia. A menos que se produzcan más contratiempos, algunos productos de Sapphire Rapids finalmente podrían debutar en octubre. No obstante, es posible que los chips de gran volumen no lleguen hasta febrero de 2023.
En su factor de forma OAM, Ponte Vecchio cuenta con soporte para plataformas de cuatro GPU y ocho GPU. Una configuración Ponte Vecchio de dos pilas bombea 52 TFLOP de rendimiento FP32 y FP64. A modo de comparación, un solo módulo H100 SXM5 alcanza un máximo de 60 TFLOP de FP32 y 30 TFLOP de rendimiento de FP64.
Ponte Vecchio presenta un archivo de registro de 64 MB, con una salida de hasta 419 TBps de ancho de banda. Los cachés L1 y L2 son de 64 MB y 408 MB, respectivamente. La gran caché L2 en Ponte Vecchio beneficia cargas de trabajo específicas, como 2D-FFT Case y DNN Case. En la presentación, los resultados de Intel revelan una mejora sustancial del rendimiento de 80 MB a 408 MB en ambos escenarios.