Surgen los detalles de AMD Instinct MI300, debuta en la supercomputadora 2 Exaflop El Capitan


(Crédito de la imagen: Marco Chiappetta)

El Instinct MI300 de AMD se perfila como un chip increíble con núcleos de CPU y GPU y una gran cantidad de memoria de alta velocidad reunida en el mismo procesador, pero los detalles siguen siendo leves. Ahora hemos recopilado algunos detalles nuevos de una presentación de International Super Computing (ISC) 2023 que describe la próxima supercomputadora El Capitan de dos exaflop que será impulsada por Instinct MI300. También encontramos otros detalles en un discurso de apertura del CTO de AMD, Mark Papermaster, en ITF World 2023, una conferencia organizada por el gigante de la investigación imec (puede leer nuestra entrevista con Papermaster aquí).

La supercomputadora El Capitán está lista para ser la más rápida del mundo cuando se encienda a fines de 2023, tomando la posición de liderazgo de la Frontier impulsada por AMD. El poderoso Instinct MI300 de AMD impulsará la máquina, y los nuevos detalles incluyen un mapa de topología de una instalación de MI300, imágenes del laboratorio Austin MI300 de AMD y una imagen de los nuevos blades que se emplearán en la supercomputadora El Capitan. También cubriremos algunos de los otros desarrollos nuevos en torno al despliegue de El Capitán.

Como recordatorio, el Instinct MI300 es una APU de centro de datos que combina un total de 13 chipsets, muchos de ellos apilados en 3D, para crear un paquete de un solo chip con veinticuatro núcleos de CPU Zen 4 fusionados con un motor de gráficos CDNA 3 y ocho pilas de memoria HBM3 por un total de 128 GB. En general, el chip pesa 146 mil millones de transistores, lo que lo convierte en el chip más grande que AMD ha presionado para producir. Los nueve troqueles de cómputo, una combinación de CPU y GPU de 5nm, están apilados en 3D sobre cuatro troqueles base de 6nm que son intercaladores activos que manejan la memoria y el tráfico de E/S, entre otras funciones.

El discurso de apertura de ITF World de Papermaster se centró en el objetivo «30×25» de AMD de aumentar la eficiencia energética en 30 veces para 2025, y cómo la informática ahora está siendo controlada por la eficiencia energética a medida que la Ley de Moore se ralentiza. La clave de esa iniciativa es el Instinct MI300, y gran parte de sus ganancias provienen de la topología de sistema simplificada que ve arriba.

Como puede ver en la primera diapositiva, un nodo con tecnología Instinct MI250 tiene CPU y GPU separadas, con una sola CPU EPYC en el medio para coordinar las cargas de trabajo.

En contraste, el Instinct MI300 contiene un procesador EPYC Genoa de cuarta generación de 24 núcleos incorporado dentro del paquete, lo que elimina una CPU independiente de la ecuación. Sin embargo, se mantiene la misma topología general, sin la CPU independiente, lo que permite una topología de todos a todos totalmente conectada con cuatro elementos. Este tipo de conexión permite que todos los procesadores se comuniquen entre sí directamente sin que otra CPU o GPU actúe como intermediario para transmitir datos a los demás elementos, lo que reduce la latencia y la variabilidad. Ese es un punto de dolor potencial con la topología MI250. El mapa de topología del MI300 también indica que cada chip tiene tres conexiones, tal como vimos con el MI250. Las diapositivas de Papermaster también se refieren a los intercaladores activos que forman los troqueles base como el «troquel base de tela infinity de cuarta generación».

Como puede ver en el resto de estas diapositivas, el MI300 ha colocado a AMD en un camino claro para superar sus objetivos de eficiencia de 30X25 y, al mismo tiempo, superar la tendencia de potencia de la industria. También lanzamos algunas fotos del silicio Instinct MI300 que vimos de primera mano, pero a continuación vemos cómo se ve el MI300 dentro de una hoja real que se instalará en El Capitán.

AMD Instinct MI300 en El Capitán



Source link-41