Ampere presenta CPU de 192 núcleos, puntos de referencia controvertidos


Ampere presentó esta semana sus procesadores AmpereOne para centros de datos en la nube que resultan ser las primeras CPU de propósito general de la industria con hasta 132 que se pueden usar para la inferencia de IA.

Los nuevos chips consumen más energía que sus predecesores, Ampere Altra (que permanecerá en el establo de Ampere durante al menos un tiempo), pero la compañía afirma que, a pesar del mayor consumo de energía, sus procesadores con hasta 192 núcleos brindan mayor densidad computacional que las CPU. de AMD e Intel. Algunas de esas afirmaciones de rendimiento pueden ser controvertidas.

192 núcleos nativos de nube personalizados

Los procesadores AmpereOne de Ampere cuentan con 136 a 192 núcleos (a diferencia de los 32 a 128 núcleos de Ampere Altra) que funcionan hasta a 3,0 GHz y se basan en la implementación patentada de la empresa de la arquitectura del conjunto de instrucciones Armv8.6+ (con dos vectores de 128 bits). unidades compatibles con los formatos FP16, BF16, INT16 e INT8) que están equipados con 2 MB de caché L2 de asociatividad establecida de 8 vías por núcleo (antes 1 MB) y están interconectados mediante una red mecánica con 64 nodos domésticos y snoop basado en directorio filtrar. Además de los cachés L1 y L2, el SoC también tiene un caché de nivel de sistema de 64 MB. Las nuevas CPU tienen una clasificación de 200 W a 350 W según el SKU exacto, en comparación con 40 W a 180 W para Ampere Altra.

(Crédito de la imagen: Amperio)

La compañía afirma que sus nuevos núcleos están aún más optimizados para cargas de trabajo de inteligencia artificial y en la nube y cuentan con instrucciones de ‘potencia y eficiencia’ por ganancias de reloj (IPC), lo que probablemente significa un IPC más alto (en comparación con Neoverse N1 de Arm utilizado para Altra) sin un aumento tangible. en consumo de energía y área de troquel. Hablando del área de la matriz, Ampere no lo revela, pero dice que el AmpereOne está fabricado con una de las tecnologías de proceso de clase de 5nm de TSMC.

(Crédito de la imagen: Amperio)

Aunque Ampere no revela todos los detalles sobre su núcleo AmpereOne, dice que cuentan con un precapturador de datos L1 de alta precisión (reduce la latencia, asegura que la CPU pase menos tiempo esperando datos y reduce el consumo de energía del sistema al minimizar los accesos a la memoria), recuperación refinada de predicción errónea de rama (cuanto antes la CPU pueda detectar una predicción errónea de rama y recuperarse, reducirá la latencia y desperdiciará menos energía) y desambiguación de memoria sofisticada (aumenta el IPC, minimiza las paradas de la tubería, maximiza la ejecución fuera de orden, reduce latencia y mejora el manejo de múltiples solicitudes de lectura/escritura en entornos virtualizados).



Source link-41