AMD parece estar preparando una actualización de 4 nm de sus aceleradores de IA MI300, conocidos como MI350, que está prevista para finales de este año.
El acelerador AMD MI350 AI contará con una arquitectura actualizada de 4 nm y se lanzará más adelante este año
La línea actual MI300 de AMD consta de los aceleradores MI300X optimizados para IA y MI300A optimizados para computación, pero parece que la compañía está planeando expandir su cartera. Recientemente vimos la aparición del MI388X, que podría ser una variante compatible con las exportaciones para China, pero AMD declaró que se le impidió realizar envíos. El MI388X probablemente sería otra oferta de CDNA 3 que utilizaría una tecnología de proceso de 5 nm y 6 nm, pero parece que AMD tiene planeada una actualización adecuada para su familia Instinct para finales de este año.
Según un informe de TrendForce, parece que AMD podría estar lanzando una nueva pieza conocida como Instinct MI350 que utilizará una arquitectura CDNA 3 actualizada utilizando el nodo de proceso de 4 nm de TSMC. Si bien los detalles sobre el Instinct MI350 son escasos, recientemente la propia AMD se burló de que ofrecerán capacidades HBM3E más altas en futuras actualizaciones de la serie Instinct MI300. Por lo tanto, mayores capacidades de HBM junto con una arquitectura optimizada en el nodo de 4 nm pueden generar ganancias decentes.
Además, TrendForce señala que la extensión de los controles de exportación ahora incluye no solo los chips AI previamente restringidos de NVIDIA y AMD, como las series NVIDIA A100/H100, AMD MI250/300, NVIDIA A800, H800, L40, L40S y RTX4090, pero también sus sucesores de próxima generación, como las series H200, B100, B200, GB200 y MI350 de AMD. En respuesta, los fabricantes de HPC han desarrollado rápidamente productos que cumplen con los nuevos estándares TPP y PD, como el H20/L20/L2 ajustado de NVIDIA, que siguen siendo elegibles para la exportación.
fuerza de tendencia
Videocardz también pudo detectar una lista de AMD Singapur que confirma la línea de aceleradores Instinct MI350. El producto ya ha sido enviado para preparación y optimización del silicio.
Cabe recordar que AMD competirá contra NVIDIA e Intel en el espacio de la IA. Las GPU Blackwell B100 están en producción y B100/B200 se lanzarán a los clientes pronto. Mientras tanto, Intel también anunció sus aceleradores Gaudi 3 que ofrecen computación de IA hasta un 50% más rápida en comparación con las GPU NVIDIA H100. Entonces el espacio se está calentando. En los puntos de referencia recientes de MLPerf, NVIDIA e Intel fueron los únicos que presentaron sus puntos de referencia de rendimiento de IA, mientras que AMD perdió el centro de atención al no enviar ningún número.
TrendForce también ha compartido la lista completa de productos afectados por la última versión de los controles de exportación de Estados Unidos contra China. Estos incluyen varias GPU actuales y futuras, incluidas las series Instinct MI388X y MI350 de AMD.
Productos controlados de exportación de EE. UU. (Restringidos para China / A partir del 29 de marzo):
Proveedor | Producto | Proceso tecnológico | Fecha de lanzamiento |
---|---|---|---|
Nvidia | GB200 | 4 nm (TSMC) | 2S 2024 |
Nvidia | B200 | 4 nm (TSMC) | 2S 2024 |
Nvidia | B100 | 4 nm (TSMC) | 2S 2024 |
Nvidia | H200 | 4 nm (TSMC) | 11/2023 |
Nvidia | H100 | 4 nm (TSMC) | 03/2022 |
Nvidia | H800 | 4 nm (TSMC) | 03/2022 |
Nvidia | L40/L40S | 5 nm (TSMC) | 10/2022 |
Nvidia | RTX 4090 | 5 nm (TSMC) | 10/2022 |
Nvidia | A100 | 7 nm (TSMC) | 05/2020 |
Nvidia | A800 | 7 nm (TSMC) | 05/2020 |
AMD | MI250 | 6 nm (TSMC) | 11/2021 |
AMD | MI250X | 6 nm (TSMC) | 11/2021 |
AMD | MI300/MI309 | 5 nm (TSMC) | 11/2021 |
AMD | MI300X/MI388X | 5 nm/6 nm (TSMC) | 12/2023 |
AMD | MI350 | 4 nm (TSMC) | 2S 2024 |
AMD también ha confirmado su acelerador de IA MI400 de próxima generación, que debería lanzarse en 2025 y presentar una arquitectura más capaz y adaptada a la era de la IA. AMD también está trabajando en su paquete de software ROCm y ha hecho que ciertos bloques sean de código abierto para ajustar su rendimiento para cargas de trabajo de IA.
Aceleradores AMD Radeon Instinct
Nombre del acelerador | AMD Instinto MI400 | AMD Instinto MI350X | AMD Instinto MI300X | AMD Instinto MI300A | AMD Instinto MI250X | AMD Instinto MI250 | AMD Instinto MI210 | AMD Instinto MI100 | AMD Radeon Instinto MI60 | AMD Radeon Instinto MI50 | AMD Radeon Instinto MI25 | AMD Radeon Instinto MI8 | AMD Radeon Instinto MI6 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Arquitectura de CPU | Zen 5 (APU exaescala) | N / A | N / A | Zen 4 (APU exaescala) | N / A | N / A | N / A | N / A | N / A | N / A | N / A | N / A | N / A |
Arquitectura de GPU | ADNC 4 | ¿CDN 3+? | Aqua Vanjaram (CDNA 3) | Aqua Vanjaram (CDNA 3) | Aldebarán (CDNA 2) | Aldebarán (CDNA 2) | Aldebarán (CDNA 2) | Arcturus (CDNA 1) | Vega 20 | Vega 20 | Vega 10 | Fiyi XT | Polaris 10 |
Nodo de proceso GPU | 4nm | 4nm | 5nm+6nm | 5nm+6nm | 6nm | 6nm | 6nm | FinFET de 7 nm | FinFET de 7 nm | FinFET de 7 nm | FinFET de 14 nm | 28nm | FinFET de 14 nm |
Chiplets de GPU | Por determinar | Por determinar | 8 (MCM) | 8 (MCM) | 2 (MCM) 1 (por troquel) |
2 (MCM) 1 (por troquel) |
2 (MCM) 1 (por troquel) |
1 (monolítico) | 1 (monolítico) | 1 (monolítico) | 1 (monolítico) | 1 (monolítico) | 1 (monolítico) |
Núcleos de GPU | Por determinar | Por determinar | 19.456 | 14.592 | 14.080 | 13.312 | 6656 | 7680 | 4096 | 3840 | 4096 | 4096 | 2304 |
Velocidad de reloj de la GPU | Por determinar | Por determinar | 2100MHz | 2100MHz | 1700MHz | 1700MHz | 1700MHz | 1500MHz | 1800MHz | 1725MHz | 1500MHz | 1000MHz | 1237MHz |
Computación INT8 | Por determinar | Por determinar | 2614 TOPS | 1961 TOPS | 383 TOP | 362 TOPS | 181 TOPS | 92.3 TOPS | N / A | N / A | N / A | N / A | N / A |
Computación FP16 | Por determinar | Por determinar | 1.3 PFLOP | 980,6 TFLOP | 383 TFLOP | 362 TFLOP | 181 TFLOP | 185 TFLOP | 29,5 TFLOP | 26,5 TFLOP | 24,6 TFLOP | 8.2 TFLOP | 5.7 TFLOP |
Computación FP32 | Por determinar | Por determinar | 163,4 TFLOP | 122,6 TFLOP | 95,7 TFLOP | 90,5 TFLOP | 45,3 TFLOP | 23.1 TFLOP | 14,7 TFLOP | 13.3 TFLOP | 12.3 TFLOP | 8.2 TFLOP | 5.7 TFLOP |
Computación FP64 | Por determinar | Por determinar | 81,7 TFLOP | 61,3 TFLOP | 47,9 TFLOP | 45,3 TFLOP | 22,6 TFLOP | 11,5 TFLOP | 7.4 TFLOP | 6.6 TFLOP | 768 GFLOP | 512 GFLOP | 384 GFLOP |
VRAM | Por determinar | HBM3e | 192GB HBM3 | 128GB HBM3 | 128GB HBM2e | 128GB HBM2e | 64GB HBM2e | 32GB HBM2 | 32GB HBM2 | 16GB HBM2 | 16GB HBM2 | 4GB HBM1 | 16GB GDDR5 |
Caché infinito | Por determinar | Por determinar | 256 megas | 256 megas | N / A | N / A | N / A | N / A | N / A | N / A | N / A | N / A | N / A |
Reloj de la memoria | Por determinar | Por determinar | 5,2 Gbit/s | 5,2 Gbit/s | 3,2 Gbps | 3,2 Gbps | 3,2 Gbps | 1200MHz | 1000MHz | 1000MHz | 945MHz | 500MHz | 1750MHz |
Autobús de memoria | Por determinar | Por determinar | 8192 bits | 8192 bits | 8192 bits | 8192 bits | 4096 bits | autobús de 4096 bits | autobús de 4096 bits | autobús de 4096 bits | autobús de 2048 bits | autobús de 4096 bits | autobús de 256 bits |
ancho de banda de memoria | Por determinar | Por determinar | 5,3 TB/s | 5,3 TB/s | 3,2 TB/s | 3,2 TB/s | 1,6 TB/s | 1,23 TB/s | 1TB/s | 1TB/s | 484GB/s | 512GB/s | 224GB/s |
Factor de forma | Por determinar | Por determinar | OAM | Zócalo APU SH5 | OAM | OAM | Tarjeta de doble ranura | Ranura doble, longitud completa | Ranura doble, longitud completa | Ranura doble, longitud completa | Ranura doble, longitud completa | Ranura doble, longitud media | Ranura única, longitud completa |
Enfriamiento | Por determinar | Por determinar | Enfriamiento pasivo | Enfriamiento pasivo | Enfriamiento pasivo | Enfriamiento pasivo | Enfriamiento pasivo | Enfriamiento pasivo | Enfriamiento pasivo | Enfriamiento pasivo | Enfriamiento pasivo | Enfriamiento pasivo | Enfriamiento pasivo |
TDP (máx.) | Por determinar | Por determinar | 750W | 760W | 560W | 500W | 300W | 300W | 300W | 300W | 300W | 175W | 150W |