{"id":1087295,"date":"2024-04-12T02:19:13","date_gmt":"2024-04-12T02:19:13","guid":{"rendered":"https:\/\/magazineoffice.com\/amd-actualizara-la-serie-instinct-mi300-con-el-acelerador-de-ia-mi350-utilizando-un-nodo-de-4-nm-este-ano\/"},"modified":"2024-04-12T02:19:16","modified_gmt":"2024-04-12T02:19:16","slug":"amd-actualizara-la-serie-instinct-mi300-con-el-acelerador-de-ia-mi350-utilizando-un-nodo-de-4-nm-este-ano","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/amd-actualizara-la-serie-instinct-mi300-con-el-acelerador-de-ia-mi350-utilizando-un-nodo-de-4-nm-este-ano\/","title":{"rendered":"AMD actualizar\u00e1 la serie Instinct MI300 con el acelerador de IA MI350 utilizando un nodo de 4 nm este a\u00f1o"},"content":{"rendered":"
\n<\/p>\n
AMD parece estar preparando una actualizaci\u00f3n de 4 nm de sus aceleradores de IA MI300, conocidos como MI350, que est\u00e1 prevista para finales de este a\u00f1o.<\/p>\n
La l\u00ednea actual MI300 de AMD consta de los aceleradores MI300X optimizados para IA y MI300A optimizados para computaci\u00f3n, pero parece que la compa\u00f1\u00eda est\u00e1 planeando expandir su cartera. Recientemente vimos la aparici\u00f3n del MI388X, que podr\u00eda ser una variante compatible con las exportaciones para China, pero AMD declar\u00f3 que se le impidi\u00f3 realizar env\u00edos. El MI388X probablemente ser\u00eda otra oferta de CDNA 3 que utilizar\u00eda una tecnolog\u00eda de proceso de 5 nm y 6 nm, pero parece que AMD tiene planeada una actualizaci\u00f3n adecuada para su familia Instinct para finales de este a\u00f1o.<\/p>\n
Seg\u00fan un informe de TrendForce, parece que AMD podr\u00eda estar lanzando una nueva pieza conocida como Instinct MI350 que utilizar\u00e1 una arquitectura CDNA 3 actualizada utilizando el nodo de proceso de 4 nm de TSMC. Si bien los detalles sobre el Instinct MI350 son escasos, recientemente la propia AMD se burl\u00f3 de que ofrecer\u00e1n capacidades HBM3E m\u00e1s altas en futuras actualizaciones de la serie Instinct MI300. Por lo tanto, mayores capacidades de HBM junto con una arquitectura optimizada en el nodo de 4 nm pueden generar ganancias decentes.<\/p>\n
\nAdem\u00e1s, TrendForce se\u00f1ala que la extensi\u00f3n de los controles de exportaci\u00f3n ahora incluye no solo los chips AI previamente restringidos de NVIDIA y AMD, como las series NVIDIA A100\/H100, AMD MI250\/300, NVIDIA A800, H800, L40, L40S y RTX4090, pero tambi\u00e9n sus sucesores de pr\u00f3xima generaci\u00f3n, como las series H200, B100, B200, GB200 y MI350 de AMD. En respuesta, los fabricantes de HPC han desarrollado r\u00e1pidamente productos que cumplen con los nuevos est\u00e1ndares TPP y PD, como el H20\/L20\/L2 ajustado de NVIDIA, que siguen siendo elegibles para la exportaci\u00f3n.<\/p>\n
fuerza de tendencia<\/p>\n<\/blockquote>\n
Videocardz tambi\u00e9n pudo detectar una lista de AMD Singapur que confirma la l\u00ednea de aceleradores Instinct MI350. El producto ya ha sido enviado para preparaci\u00f3n y optimizaci\u00f3n del silicio.<\/p>\n
\n<\/div>Fuente de la imagen: AMD Singapur<\/figcaption><\/figure>\n Cabe recordar que AMD competir\u00e1 contra NVIDIA e Intel en el espacio de la IA. Las GPU Blackwell B100 est\u00e1n en producci\u00f3n y B100\/B200 se lanzar\u00e1n a los clientes pronto. Mientras tanto, Intel tambi\u00e9n anunci\u00f3 sus aceleradores Gaudi 3 que ofrecen computaci\u00f3n de IA hasta un 50% m\u00e1s r\u00e1pida en comparaci\u00f3n con las GPU NVIDIA H100. Entonces el espacio se est\u00e1 calentando. En los puntos de referencia recientes de MLPerf, NVIDIA e Intel fueron los \u00fanicos que presentaron sus puntos de referencia de rendimiento de IA, mientras que AMD perdi\u00f3 el centro de atenci\u00f3n al no enviar ning\u00fan n\u00famero.<\/p>\n
TrendForce tambi\u00e9n ha compartido la lista completa de productos afectados por la \u00faltima versi\u00f3n de los controles de exportaci\u00f3n de Estados Unidos contra China. Estos incluyen varias GPU actuales y futuras, incluidas las series Instinct MI388X y MI350 de AMD.<\/p>\n
Productos controlados de exportaci\u00f3n de EE. UU. (Restringidos para China \/ A partir del 29 de marzo):<\/h2>\n
\n\n
\n \nProveedor<\/th>\n Producto<\/th>\n Proceso tecnol\u00f3gico<\/th>\n Fecha de lanzamiento<\/th>\n<\/tr>\n<\/thead>\n \n Nvidia<\/td>\n GB200<\/td>\n 4 nm (TSMC)<\/td>\n 2S 2024<\/td>\n<\/tr>\n \n Nvidia<\/td>\n B200<\/td>\n 4 nm (TSMC)<\/td>\n 2S 2024<\/td>\n<\/tr>\n \n Nvidia<\/td>\n B100<\/td>\n 4 nm (TSMC)<\/td>\n 2S 2024<\/td>\n<\/tr>\n \n Nvidia<\/td>\n H200<\/td>\n 4 nm (TSMC)<\/td>\n 11\/2023<\/td>\n<\/tr>\n \n Nvidia<\/td>\n H100<\/td>\n 4 nm (TSMC)<\/td>\n 03\/2022<\/td>\n<\/tr>\n \n Nvidia<\/td>\n H800<\/td>\n 4 nm (TSMC)<\/td>\n 03\/2022<\/td>\n<\/tr>\n \n Nvidia<\/td>\n L40\/L40S<\/td>\n 5 nm (TSMC)<\/td>\n 10\/2022<\/td>\n<\/tr>\n \n Nvidia<\/td>\n RTX 4090<\/td>\n 5 nm (TSMC)<\/td>\n 10\/2022<\/td>\n<\/tr>\n \n Nvidia<\/td>\n A100<\/td>\n 7 nm (TSMC)<\/td>\n 05\/2020<\/td>\n<\/tr>\n \n Nvidia<\/td>\n A800<\/td>\n 7 nm (TSMC)<\/td>\n 05\/2020<\/td>\n<\/tr>\n \n AMD<\/td>\n MI250<\/td>\n 6 nm (TSMC)<\/td>\n 11\/2021<\/td>\n<\/tr>\n \n AMD<\/td>\n MI250X<\/td>\n 6 nm (TSMC)<\/td>\n 11\/2021<\/td>\n<\/tr>\n \n AMD<\/td>\n MI300\/MI309<\/td>\n 5 nm (TSMC)<\/td>\n 11\/2021<\/td>\n<\/tr>\n \n AMD<\/td>\n MI300X\/MI388X<\/td>\n 5 nm\/6 nm (TSMC)<\/td>\n 12\/2023<\/td>\n<\/tr>\n \n AMD<\/td>\n MI350<\/td>\n 4 nm (TSMC)<\/td>\n 2S 2024<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n <\/p>\n
<\/figure>\nAMD tambi\u00e9n ha confirmado su acelerador de IA MI400 de pr\u00f3xima generaci\u00f3n, que deber\u00eda lanzarse en 2025 y presentar una arquitectura m\u00e1s capaz y adaptada a la era de la IA. AMD tambi\u00e9n est\u00e1 trabajando en su paquete de software ROCm y ha hecho que ciertos bloques sean de c\u00f3digo abierto para ajustar su rendimiento para cargas de trabajo de IA.<\/p>\n
Aceleradores AMD Radeon Instinct<\/h2>\n
\n\n
\n \nNombre del acelerador<\/th>\n AMD Instinto MI400<\/th>\n AMD Instinto MI350X<\/th>\n AMD Instinto MI300X<\/th>\n AMD Instinto MI300A<\/th>\n AMD Instinto MI250X<\/th>\n AMD Instinto MI250<\/th>\n AMD Instinto MI210<\/th>\n AMD Instinto MI100<\/th>\n AMD Radeon Instinto MI60<\/th>\n AMD Radeon Instinto MI50<\/th>\n AMD Radeon Instinto MI25<\/th>\n AMD Radeon Instinto MI8<\/th>\n AMD Radeon Instinto MI6<\/th>\n<\/tr>\n<\/thead>\n \n Arquitectura de CPU<\/td>\n Zen 5 (APU exaescala)<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n Zen 4 (APU exaescala)<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n<\/tr>\n \n Arquitectura de GPU<\/td>\n ADNC 4<\/td>\n \u00bfCDN 3+?<\/td>\n Aqua Vanjaram (CDNA 3)<\/td>\n Aqua Vanjaram (CDNA 3)<\/td>\n Aldebar\u00e1n (CDNA 2)<\/td>\n Aldebar\u00e1n (CDNA 2)<\/td>\n Aldebar\u00e1n (CDNA 2)<\/td>\n Arcturus (CDNA 1)<\/td>\n Vega 20<\/td>\n Vega 20<\/td>\n Vega 10<\/td>\n Fiyi XT<\/td>\n Polaris 10<\/td>\n<\/tr>\n \n Nodo de proceso GPU<\/td>\n 4nm<\/td>\n 4nm<\/td>\n 5nm+6nm<\/td>\n 5nm+6nm<\/td>\n 6nm<\/td>\n 6nm<\/td>\n 6nm<\/td>\n FinFET de 7 nm<\/td>\n FinFET de 7 nm<\/td>\n FinFET de 7 nm<\/td>\n FinFET de 14 nm<\/td>\n 28nm<\/td>\n FinFET de 14 nm<\/td>\n<\/tr>\n \n Chiplets de GPU<\/td>\n Por determinar<\/td>\n Por determinar<\/td>\n 8 (MCM)<\/td>\n 8 (MCM)<\/td>\n 2 (MCM)
1 (por troquel)<\/td>\n2 (MCM)
1 (por troquel)<\/td>\n2 (MCM)
1 (por troquel)<\/td>\n1 (monol\u00edtico)<\/td>\n 1 (monol\u00edtico)<\/td>\n 1 (monol\u00edtico)<\/td>\n 1 (monol\u00edtico)<\/td>\n 1 (monol\u00edtico)<\/td>\n 1 (monol\u00edtico)<\/td>\n<\/tr>\n \n N\u00facleos de GPU<\/td>\n Por determinar<\/td>\n Por determinar<\/td>\n 19.456<\/td>\n 14.592<\/td>\n 14.080<\/td>\n 13.312<\/td>\n 6656<\/td>\n 7680<\/td>\n 4096<\/td>\n 3840<\/td>\n 4096<\/td>\n 4096<\/td>\n 2304<\/td>\n<\/tr>\n \n Velocidad de reloj de la GPU<\/td>\n Por determinar<\/td>\n Por determinar<\/td>\n 2100MHz<\/td>\n 2100MHz<\/td>\n 1700MHz<\/td>\n 1700MHz<\/td>\n 1700MHz<\/td>\n 1500MHz<\/td>\n 1800MHz<\/td>\n 1725MHz<\/td>\n 1500MHz<\/td>\n 1000MHz<\/td>\n 1237MHz<\/td>\n<\/tr>\n \n Computaci\u00f3n INT8<\/td>\n Por determinar<\/td>\n Por determinar<\/td>\n 2614 TOPS<\/td>\n 1961 TOPS<\/td>\n 383 TOP<\/td>\n 362 TOPS<\/td>\n 181 TOPS<\/td>\n 92.3 TOPS<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n<\/tr>\n \n Computaci\u00f3n FP16<\/td>\n Por determinar<\/td>\n Por determinar<\/td>\n 1.3 PFLOP<\/td>\n 980,6 TFLOP<\/td>\n 383 TFLOP<\/td>\n 362 TFLOP<\/td>\n 181 TFLOP<\/td>\n 185 TFLOP<\/td>\n 29,5 TFLOP<\/td>\n 26,5 TFLOP<\/td>\n 24,6 TFLOP<\/td>\n 8.2 TFLOP<\/td>\n 5.7 TFLOP<\/td>\n<\/tr>\n \n Computaci\u00f3n FP32<\/td>\n Por determinar<\/td>\n Por determinar<\/td>\n 163,4 TFLOP<\/td>\n 122,6 TFLOP<\/td>\n 95,7 TFLOP<\/td>\n 90,5 TFLOP<\/td>\n 45,3 TFLOP<\/td>\n 23.1 TFLOP<\/td>\n 14,7 TFLOP<\/td>\n 13.3 TFLOP<\/td>\n 12.3 TFLOP<\/td>\n 8.2 TFLOP<\/td>\n 5.7 TFLOP<\/td>\n<\/tr>\n \n Computaci\u00f3n FP64<\/td>\n Por determinar<\/td>\n Por determinar<\/td>\n 81,7 TFLOP<\/td>\n 61,3 TFLOP<\/td>\n 47,9 TFLOP<\/td>\n 45,3 TFLOP<\/td>\n 22,6 TFLOP<\/td>\n 11,5 TFLOP<\/td>\n 7.4 TFLOP<\/td>\n 6.6 TFLOP<\/td>\n 768 GFLOP<\/td>\n 512 GFLOP<\/td>\n 384 GFLOP<\/td>\n<\/tr>\n \n VRAM<\/td>\n Por determinar<\/td>\n HBM3e<\/td>\n 192GB HBM3<\/td>\n 128GB HBM3<\/td>\n 128GB HBM2e<\/td>\n 128GB HBM2e<\/td>\n 64GB HBM2e<\/td>\n 32GB HBM2<\/td>\n 32GB HBM2<\/td>\n 16GB HBM2<\/td>\n 16GB HBM2<\/td>\n 4GB HBM1<\/td>\n 16GB GDDR5<\/td>\n<\/tr>\n \n Cach\u00e9 infinito<\/td>\n Por determinar<\/td>\n Por determinar<\/td>\n 256 megas<\/td>\n 256 megas<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n<\/tr>\n \n Reloj de la memoria<\/td>\n Por determinar<\/td>\n Por determinar<\/td>\n 5,2 Gbit\/s<\/td>\n 5,2 Gbit\/s<\/td>\n 3,2 Gbps<\/td>\n 3,2 Gbps<\/td>\n 3,2 Gbps<\/td>\n 1200MHz<\/td>\n 1000MHz<\/td>\n 1000MHz<\/td>\n 945MHz<\/td>\n 500MHz<\/td>\n 1750MHz<\/td>\n<\/tr>\n \n Autob\u00fas de memoria<\/td>\n Por determinar<\/td>\n Por determinar<\/td>\n 8192 bits<\/td>\n 8192 bits<\/td>\n 8192 bits<\/td>\n 8192 bits<\/td>\n 4096 bits<\/td>\n autob\u00fas de 4096 bits<\/td>\n autob\u00fas de 4096 bits<\/td>\n autob\u00fas de 4096 bits<\/td>\n autob\u00fas de 2048 bits<\/td>\n autob\u00fas de 4096 bits<\/td>\n autob\u00fas de 256 bits<\/td>\n<\/tr>\n \n ancho de banda de memoria<\/td>\n Por determinar<\/td>\n Por determinar<\/td>\n 5,3 TB\/s<\/td>\n 5,3 TB\/s<\/td>\n 3,2 TB\/s<\/td>\n 3,2 TB\/s<\/td>\n 1,6 TB\/s<\/td>\n 1,23 TB\/s<\/td>\n 1TB\/s<\/td>\n 1TB\/s<\/td>\n 484GB\/s<\/td>\n 512GB\/s<\/td>\n 224GB\/s<\/td>\n<\/tr>\n \n Factor de forma<\/td>\n Por determinar<\/td>\n Por determinar<\/td>\n OAM<\/td>\n Z\u00f3calo APU SH5<\/td>\n OAM<\/td>\n OAM<\/td>\n Tarjeta de doble ranura<\/td>\n Ranura doble, longitud completa<\/td>\n Ranura doble, longitud completa<\/td>\n Ranura doble, longitud completa<\/td>\n Ranura doble, longitud completa<\/td>\n Ranura doble, longitud media<\/td>\n Ranura \u00fanica, longitud completa<\/td>\n<\/tr>\n \n Enfriamiento<\/td>\n Por determinar<\/td>\n Por determinar<\/td>\n Enfriamiento pasivo<\/td>\n Enfriamiento pasivo<\/td>\n Enfriamiento pasivo<\/td>\n Enfriamiento pasivo<\/td>\n Enfriamiento pasivo<\/td>\n Enfriamiento pasivo<\/td>\n Enfriamiento pasivo<\/td>\n Enfriamiento pasivo<\/td>\n Enfriamiento pasivo<\/td>\n Enfriamiento pasivo<\/td>\n Enfriamiento pasivo<\/td>\n<\/tr>\n \n TDP (m\u00e1x.)<\/td>\n Por determinar<\/td>\n Por determinar<\/td>\n 750W<\/td>\n 760W<\/td>\n 560W<\/td>\n 500W<\/td>\n 300W<\/td>\n 300W<\/td>\n 300W<\/td>\n 300W<\/td>\n 300W<\/td>\n 175W<\/td>\n 150W<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n <\/p>\n