AMD actualizará la serie Instinct MI300 con el acelerador de IA MI350 utilizando un nodo de 4 nm este año


AMD parece estar preparando una actualización de 4 nm de sus aceleradores de IA MI300, conocidos como MI350, que está prevista para finales de este año.

El acelerador AMD MI350 AI contará con una arquitectura actualizada de 4 nm y se lanzará más adelante este año

La línea actual MI300 de AMD consta de los aceleradores MI300X optimizados para IA y MI300A optimizados para computación, pero parece que la compañía está planeando expandir su cartera. Recientemente vimos la aparición del MI388X, que podría ser una variante compatible con las exportaciones para China, pero AMD declaró que se le impidió realizar envíos. El MI388X probablemente sería otra oferta de CDNA 3 que utilizaría una tecnología de proceso de 5 nm y 6 nm, pero parece que AMD tiene planeada una actualización adecuada para su familia Instinct para finales de este año.

Según un informe de TrendForce, parece que AMD podría estar lanzando una nueva pieza conocida como Instinct MI350 que utilizará una arquitectura CDNA 3 actualizada utilizando el nodo de proceso de 4 nm de TSMC. Si bien los detalles sobre el Instinct MI350 son escasos, recientemente la propia AMD se burló de que ofrecerán capacidades HBM3E más altas en futuras actualizaciones de la serie Instinct MI300. Por lo tanto, mayores capacidades de HBM junto con una arquitectura optimizada en el nodo de 4 nm pueden generar ganancias decentes.

Además, TrendForce señala que la extensión de los controles de exportación ahora incluye no solo los chips AI previamente restringidos de NVIDIA y AMD, como las series NVIDIA A100/H100, AMD MI250/300, NVIDIA A800, H800, L40, L40S y RTX4090, pero también sus sucesores de próxima generación, como las series H200, B100, B200, GB200 y MI350 de AMD. En respuesta, los fabricantes de HPC han desarrollado rápidamente productos que cumplen con los nuevos estándares TPP y PD, como el H20/L20/L2 ajustado de NVIDIA, que siguen siendo elegibles para la exportación.

fuerza de tendencia

Videocardz también pudo detectar una lista de AMD Singapur que confirma la línea de aceleradores Instinct MI350. El producto ya ha sido enviado para preparación y optimización del silicio.

Fuente de la imagen: AMD Singapur

Cabe recordar que AMD competirá contra NVIDIA e Intel en el espacio de la IA. Las GPU Blackwell B100 están en producción y B100/B200 se lanzarán a los clientes pronto. Mientras tanto, Intel también anunció sus aceleradores Gaudi 3 que ofrecen computación de IA hasta un 50% más rápida en comparación con las GPU NVIDIA H100. Entonces el espacio se está calentando. En los puntos de referencia recientes de MLPerf, NVIDIA e Intel fueron los únicos que presentaron sus puntos de referencia de rendimiento de IA, mientras que AMD perdió el centro de atención al no enviar ningún número.

TrendForce también ha compartido la lista completa de productos afectados por la última versión de los controles de exportación de Estados Unidos contra China. Estos incluyen varias GPU actuales y futuras, incluidas las series Instinct MI388X y MI350 de AMD.

Productos controlados de exportación de EE. UU. (Restringidos para China / A partir del 29 de marzo):

Proveedor Producto Proceso tecnológico Fecha de lanzamiento
Nvidia GB200 4 nm (TSMC) 2S 2024
Nvidia B200 4 nm (TSMC) 2S 2024
Nvidia B100 4 nm (TSMC) 2S 2024
Nvidia H200 4 nm (TSMC) 11/2023
Nvidia H100 4 nm (TSMC) 03/2022
Nvidia H800 4 nm (TSMC) 03/2022
Nvidia L40/L40S 5 nm (TSMC) 10/2022
Nvidia RTX 4090 5 nm (TSMC) 10/2022
Nvidia A100 7 nm (TSMC) 05/2020
Nvidia A800 7 nm (TSMC) 05/2020
AMD MI250 6 nm (TSMC) 11/2021
AMD MI250X 6 nm (TSMC) 11/2021
AMD MI300/MI309 5 nm (TSMC) 11/2021
AMD MI300X/MI388X 5 nm/6 nm (TSMC) 12/2023
AMD MI350 4 nm (TSMC) 2S 2024

AMD también ha confirmado su acelerador de IA MI400 de próxima generación, que debería lanzarse en 2025 y presentar una arquitectura más capaz y adaptada a la era de la IA. AMD también está trabajando en su paquete de software ROCm y ha hecho que ciertos bloques sean de código abierto para ajustar su rendimiento para cargas de trabajo de IA.

Aceleradores AMD Radeon Instinct

Nombre del acelerador AMD Instinto MI400 AMD Instinto MI350X AMD Instinto MI300X AMD Instinto MI300A AMD Instinto MI250X AMD Instinto MI250 AMD Instinto MI210 AMD Instinto MI100 AMD Radeon Instinto MI60 AMD Radeon Instinto MI50 AMD Radeon Instinto MI25 AMD Radeon Instinto MI8 AMD Radeon Instinto MI6
Arquitectura de CPU Zen 5 (APU exaescala) N / A N / A Zen 4 (APU exaescala) N / A N / A N / A N / A N / A N / A N / A N / A N / A
Arquitectura de GPU ADNC 4 ¿CDN 3+? Aqua Vanjaram (CDNA 3) Aqua Vanjaram (CDNA 3) Aldebarán (CDNA 2) Aldebarán (CDNA 2) Aldebarán (CDNA 2) Arcturus (CDNA 1) Vega 20 Vega 20 Vega 10 Fiyi XT Polaris 10
Nodo de proceso GPU 4nm 4nm 5nm+6nm 5nm+6nm 6nm 6nm 6nm FinFET de 7 nm FinFET de 7 nm FinFET de 7 nm FinFET de 14 nm 28nm FinFET de 14 nm
Chiplets de GPU Por determinar Por determinar 8 (MCM) 8 (MCM) 2 (MCM)
1 (por troquel)
2 (MCM)
1 (por troquel)
2 (MCM)
1 (por troquel)
1 (monolítico) 1 (monolítico) 1 (monolítico) 1 (monolítico) 1 (monolítico) 1 (monolítico)
Núcleos de GPU Por determinar Por determinar 19.456 14.592 14.080 13.312 6656 7680 4096 3840 4096 4096 2304
Velocidad de reloj de la GPU Por determinar Por determinar 2100MHz 2100MHz 1700MHz 1700MHz 1700MHz 1500MHz 1800MHz 1725MHz 1500MHz 1000MHz 1237MHz
Computación INT8 Por determinar Por determinar 2614 TOPS 1961 TOPS 383 TOP 362 TOPS 181 TOPS 92.3 TOPS N / A N / A N / A N / A N / A
Computación FP16 Por determinar Por determinar 1.3 PFLOP 980,6 TFLOP 383 TFLOP 362 TFLOP 181 TFLOP 185 TFLOP 29,5 TFLOP 26,5 TFLOP 24,6 TFLOP 8.2 TFLOP 5.7 TFLOP
Computación FP32 Por determinar Por determinar 163,4 TFLOP 122,6 TFLOP 95,7 TFLOP 90,5 TFLOP 45,3 TFLOP 23.1 TFLOP 14,7 TFLOP 13.3 TFLOP 12.3 TFLOP 8.2 TFLOP 5.7 TFLOP
Computación FP64 Por determinar Por determinar 81,7 TFLOP 61,3 TFLOP 47,9 TFLOP 45,3 TFLOP 22,6 TFLOP 11,5 TFLOP 7.4 TFLOP 6.6 TFLOP 768 GFLOP 512 GFLOP 384 GFLOP
VRAM Por determinar HBM3e 192GB HBM3 128GB HBM3 128GB HBM2e 128GB HBM2e 64GB HBM2e 32GB HBM2 32GB HBM2 16GB HBM2 16GB HBM2 4GB HBM1 16GB GDDR5
Caché infinito Por determinar Por determinar 256 megas 256 megas N / A N / A N / A N / A N / A N / A N / A N / A N / A
Reloj de la memoria Por determinar Por determinar 5,2 Gbit/s 5,2 Gbit/s 3,2 Gbps 3,2 Gbps 3,2 Gbps 1200MHz 1000MHz 1000MHz 945MHz 500MHz 1750MHz
Autobús de memoria Por determinar Por determinar 8192 bits 8192 bits 8192 bits 8192 bits 4096 bits autobús de 4096 bits autobús de 4096 bits autobús de 4096 bits autobús de 2048 bits autobús de 4096 bits autobús de 256 bits
ancho de banda de memoria Por determinar Por determinar 5,3 TB/s 5,3 TB/s 3,2 TB/s 3,2 TB/s 1,6 TB/s 1,23 TB/s 1TB/s 1TB/s 484GB/s 512GB/s 224GB/s
Factor de forma Por determinar Por determinar OAM Zócalo APU SH5 OAM OAM Tarjeta de doble ranura Ranura doble, longitud completa Ranura doble, longitud completa Ranura doble, longitud completa Ranura doble, longitud completa Ranura doble, longitud media Ranura única, longitud completa
Enfriamiento Por determinar Por determinar Enfriamiento pasivo Enfriamiento pasivo Enfriamiento pasivo Enfriamiento pasivo Enfriamiento pasivo Enfriamiento pasivo Enfriamiento pasivo Enfriamiento pasivo Enfriamiento pasivo Enfriamiento pasivo Enfriamiento pasivo
TDP (máx.) Por determinar Por determinar 750W 760W 560W 500W 300W 300W 300W 300W 300W 175W 150W

Comparte esta historia

Facebook

Gorjeo



Source link-29