{"id":883570,"date":"2023-11-14T01:25:55","date_gmt":"2023-11-14T01:25:55","guid":{"rendered":"https:\/\/magazineoffice.com\/cdna-3-y-zen-4-se-unen-en-una-maravilla-de-empaque-avanzado\/"},"modified":"2023-11-14T01:25:59","modified_gmt":"2023-11-14T01:25:59","slug":"cdna-3-y-zen-4-se-unen-en-una-maravilla-de-empaque-avanzado","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/cdna-3-y-zen-4-se-unen-en-una-maravilla-de-empaque-avanzado\/","title":{"rendered":"CDNA 3 y Zen 4 se unen en una maravilla de empaque avanzado"},"content":{"rendered":"
\n<\/p>\n
AMD Instinct MI300X y MI300A son algunos de los aceleradores m\u00e1s esperados en el segmento de IA y se lanzar\u00e1n el pr\u00f3ximo mes. Hay mucha anticipaci\u00f3n en torno a la primera obra maestra de IA en toda regla de AMD y hoy pensamos en brindarle un resumen de qu\u00e9 esperar de esta maravilla t\u00e9cnica.<\/p>\n
El 6 de diciembre, AMD organizar\u00e1 su discurso de apertura \u00abAdvancing AI\u00bb, donde una de las principales agendas es realizar una presentaci\u00f3n completa de la familia de aceleradores Instinct de pr\u00f3xima generaci\u00f3n con nombre en c\u00f3digo MI300. Esta nueva familia acelerada de GPU y CPU ser\u00e1 el producto l\u00edder del segmento de IA, que es el n\u00famero uno de AMD y la prioridad estrat\u00e9gica m\u00e1s importante en este momento, ya que finalmente lanza un producto que no solo es avanzado sino que tambi\u00e9n est\u00e1 dise\u00f1ado para cumplir con los requisitos cr\u00edticos. Requisito de IA dentro de la industria. La clase MI300 de aceleradores de IA ser\u00e1 otra potencia de chiplet, que utilizar\u00e1 tecnolog\u00edas de empaquetado avanzadas de TSMC, as\u00ed que veamos qu\u00e9 hay debajo del cap\u00f3 de estos monstruos de IA.<\/p>\n
El AMD Instinct MI300X es definitivamente el chip que m\u00e1s se destacar\u00e1, ya que est\u00e1 claramente dirigido a los aceleradores Hopper de NVIDIA y Gaud\u00ed de Intel dentro del segmento de IA. Este chip ha sido dise\u00f1ado \u00fanicamente en la arquitectura CDNA 3 y est\u00e1n sucediendo muchas cosas. El chip albergar\u00e1 una combinaci\u00f3n de IP de 5 nm y 6 nm, todos combinados para ofrecer hasta 153 mil millones de transistores (MI300X).<\/p>\n Comenzando con el dise\u00f1o, el intercalador principal se presenta con un troquel pasivo que alberga la capa de interconexi\u00f3n utilizando una soluci\u00f3n Infinity Fabric de pr\u00f3xima generaci\u00f3n. El intercalador incluye un total de 28 troqueles que incluyen ocho paquetes HBM3, 16 troqueles ficticios entre los paquetes HBM y cuatro troqueles activos, y cada uno de estos troqueles activos tiene dos troqueles de c\u00f3mputo.<\/p>\n Cada GCD basado en la arquitectura de GPU CDNA 3 presenta un total de 40 unidades de c\u00f3mputo, lo que equivale a 2560 n\u00facleos. Hay ocho matrices de c\u00f3mputo (GCD) en total, lo que nos da un total de 320 unidades de c\u00f3mputo y 20,480 unidades centrales. En cuanto al rendimiento, AMD reducir\u00e1 una peque\u00f1a parte de estos n\u00facleos y obtendremos m\u00e1s detalles sobre las configuraciones exactas dentro de un mes.<\/p>\n La memoria es otra \u00e1rea en la que ver\u00e1 una gran mejora: el MI300X cuenta con un 50 % m\u00e1s de capacidad HBM3 que su predecesor, el MI250X (128 GB). Para lograr un grupo de memoria de 192 GB, AMD est\u00e1 equipando el MI300X con 8 pilas HBM3 y cada pila es de 12 Hi e incorpora circuitos integrados de 16 Gb que nos brindan 2 GB de capacidad por IC o 24 GB por pila.<\/p>\n La memoria ofrecer\u00e1 hasta 5,2 TB\/s de ancho de banda y 896 GB\/s de Infinity Fabric Bandwidth. A modo de comparaci\u00f3n, el pr\u00f3ximo acelerador de IA H200 de NVIDIA ofrece capacidades de 141 GB, mientras que Gaudi 3 de Intel ofrecer\u00e1 capacidades de 144 GB. Los grandes grupos de memoria son muy importantes en los LLM, que en su mayor\u00eda est\u00e1n vinculados a la memoria, y AMD definitivamente puede mostrar su destreza en IA liderando el departamento de memoria. Para comparaciones:<\/p>\n En t\u00e9rminos de consumo de energ\u00eda, el AMD Instinct MI300X tiene una potencia de 750 W, lo que supone un aumento del 50 % con respecto a los 500 W del Instinct MI250X y 50 W m\u00e1s que el NVIDIA H200.<\/p>\n Hemos esperado durante a\u00f1os a que AMD finalmente cumpla la promesa de una APU de clase exaescala y ese d\u00eda se acerca a medida que nos acercamos al lanzamiento del Instinct MI300A. El empaque del MI300A es muy similar al del MI300X, excepto que utiliza capacidades de memoria optimizadas para TCO y n\u00facleos Zen 4.<\/p>\n Uno de los troqueles activos tiene dos GCD CDNA 3 cortados y reemplazados por tres CCD Zen 4 que ofrecen su propio grupo separado de cach\u00e9 e IP centrales. Obtienes 8 n\u00facleos y 16 subprocesos por CCD, lo que da un total de 24 n\u00facleos y 48 subprocesos en el chip activo. Tambi\u00e9n hay 24 MB de cach\u00e9 L2 (1 MB por n\u00facleo) y un grupo de cach\u00e9 separado (32 MB por CCD). Cabe recordar que los GCD CDNA 3 tambi\u00e9n tienen la cach\u00e9 L2 separada.<\/p>\n Resumiendo algunas de las caracter\u00edsticas destacadas de los aceleradores AMD Instinct MI300, tenemos:<\/p>\n Al reunir todo esto, AMD trabajar\u00e1 con sus socios y habilitadores del ecosistema para ofrecer aceleradores de IA MI300 en configuraciones de 8 v\u00edas con dise\u00f1os SXM que se conectan a la placa base con conectores intermedios. Ser\u00e1 interesante ver qu\u00e9 tipo de configuraciones se ofrecer\u00e1n y, si bien las placas SXM son un hecho, tambi\u00e9n podemos esperar algunas variantes en los factores de forma PCI-E.<\/p>\n Por ahora, AMD debe saber que sus competidores tambi\u00e9n est\u00e1n avanzando a toda m\u00e1quina en la moda de la IA: NVIDIA ya ha adelantado algunas cifras enormes para sus GPU Blackwell 2024 e Intel tambi\u00e9n est\u00e1 preparando sus GPU Guadi 3 y Falcon Shores para su lanzamiento en los pr\u00f3ximos a\u00f1os. Una cosa es segura en este momento: los clientes de IA devorar\u00e1n casi todo lo que puedan conseguir y todos se aprovechar\u00e1n de eso. Pero AMD tiene una soluci\u00f3n formidable que no solo apunta a ser una alternativa a NVIDIA sino un l\u00edder en el segmento de IA y esperamos que MI300 pueda ayudarlos a lograr ese \u00e9xito.<\/p>\n <\/p>\n\n
AMD Instinct MI300A: las APU exaescala densamente empaquetadas ahora son una realidad<\/h4>\n
\n
Aceleradores AMD Radeon Instinct<\/h2>\n
\n\n
\n \nNombre del acelerador<\/th>\n AMD Instinto MI400<\/th>\n AMD Instinto MI300<\/th>\n AMD Instinto MI250X<\/th>\n AMD Instinto MI250<\/th>\n AMD Instinto MI210<\/th>\n AMD Instinto MI100<\/th>\n AMD Radeon Instinto MI60<\/th>\n AMD Radeon Instinto MI50<\/th>\n AMD Radeon Instinto MI25<\/th>\n AMD Radeon Instinto MI8<\/th>\n AMD Radeon Instinto MI6<\/th>\n<\/tr>\n<\/thead>\n \n Arquitectura de CPU<\/td>\n Zen 5 (APU exaescala)<\/td>\n Zen 4 (APU exaescala)<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n N \/ A<\/td>\n<\/tr>\n \n Arquitectura de GPU<\/td>\n ADNC 4<\/td>\n Aqua Vanjaram (CDNA 3)<\/td>\n Aldebar\u00e1n (CDNA 2)<\/td>\n Aldebar\u00e1n (CDNA 2)<\/td>\n Aldebar\u00e1n (CDNA 2)<\/td>\n Arcturus (CDNA 1)<\/td>\n Vega 20<\/td>\n Vega 20<\/td>\n Vega 10<\/td>\n Fiyi XT<\/td>\n Polaris 10<\/td>\n<\/tr>\n \n Nodo de proceso GPU<\/td>\n 4nm<\/td>\n 5nm+6nm<\/td>\n 6nm<\/td>\n 6nm<\/td>\n 6nm<\/td>\n FinFET de 7 nm<\/td>\n FinFET de 7 nm<\/td>\n FinFET de 7 nm<\/td>\n FinFET de 14 nm<\/td>\n 28nm<\/td>\n FinFET de 14 nm<\/td>\n<\/tr>\n \n Chiplets de GPU<\/td>\n Por determinar<\/td>\n 8 (MCM)<\/td>\n 2 (MCM)
1 (por troquel)<\/td>\n2 (MCM)
1 (por troquel)<\/td>\n2 (MCM)
1 (por troquel)<\/td>\n1 (monol\u00edtico)<\/td>\n 1 (monol\u00edtico)<\/td>\n 1 (monol\u00edtico)<\/td>\n 1 (monol\u00edtico)<\/td>\n 1 (monol\u00edtico)<\/td>\n 1 (monol\u00edtico)<\/td>\n<\/tr>\n \n N\u00facleos de GPU<\/td>\n Por determinar<\/td>\n Hasta 19.456<\/td>\n 14.080<\/td>\n 13.312<\/td>\n 6656<\/td>\n 7680<\/td>\n 4096<\/td>\n 3840<\/td>\n 4096<\/td>\n 4096<\/td>\n 2304<\/td>\n<\/tr>\n \n Velocidad de reloj de la GPU<\/td>\n Por determinar<\/td>\n por confirmar<\/td>\n 1700MHz<\/td>\n 1700MHz<\/td>\n 1700MHz<\/td>\n 1500MHz<\/td>\n 1800MHz<\/td>\n 1725MHz<\/td>\n 1500MHz<\/td>\n 1000MHz<\/td>\n 1237MHz<\/td>\n<\/tr>\n \n Computaci\u00f3n FP16<\/td>\n Por determinar<\/td>\n por confirmar<\/td>\n 383 TOP<\/td>\n 362 TOP<\/td>\n 181 mejores<\/td>\n 185 TFLOP<\/td>\n 29,5 TFLOP<\/td>\n 26,5 TFLOP<\/td>\n 24,6 TFLOP<\/td>\n 8.2 TFLOP<\/td>\n 5.7 TFLOP<\/td>\n<\/tr>\n \n Computaci\u00f3n FP32<\/td>\n Por determinar<\/td>\n por confirmar<\/td>\n 95,7 TFLOP<\/td>\n 90,5 TFLOP<\/td>\n 45,3 TFLOP<\/td>\n 23.1 TFLOP<\/td>\n 14,7 TFLOP<\/td>\n 13.3 TFLOP<\/td>\n 12.3 TFLOP<\/td>\n 8.2 TFLOP<\/td>\n 5.7 TFLOP<\/td>\n<\/tr>\n \n Computaci\u00f3n FP64<\/td>\n Por determinar<\/td>\n por confirmar<\/td>\n 47,9 TFLOP<\/td>\n 45,3 TFLOP<\/td>\n 22,6 TFLOP<\/td>\n 11,5 TFLOP<\/td>\n 7.4 TFLOP<\/td>\n 6.6 TFLOP<\/td>\n 768 GFLOP<\/td>\n 512 GFLOP<\/td>\n 384 GFLOP<\/td>\n<\/tr>\n \n VRAM<\/td>\n Por determinar<\/td>\n 192GB HBM3<\/td>\n 128GB HBM2e<\/td>\n 128GB HBM2e<\/td>\n 64GB HBM2e<\/td>\n 32GB HBM2<\/td>\n 32GB HBM2<\/td>\n 16GB HBM2<\/td>\n 16GB HBM2<\/td>\n 4GB HBM1<\/td>\n 16GB GDDR5<\/td>\n<\/tr>\n \n Reloj de la memoria<\/td>\n Por determinar<\/td>\n 5,2 Gbit\/s<\/td>\n 3,2 Gbps<\/td>\n 3,2 Gbps<\/td>\n 3,2 Gbps<\/td>\n 1200MHz<\/td>\n 1000MHz<\/td>\n 1000MHz<\/td>\n 945MHz<\/td>\n 500MHz<\/td>\n 1750MHz<\/td>\n<\/tr>\n \n Autob\u00fas de memoria<\/td>\n Por determinar<\/td>\n 8192 bits<\/td>\n 8192 bits<\/td>\n 8192 bits<\/td>\n 4096 bits<\/td>\n autob\u00fas de 4096 bits<\/td>\n autob\u00fas de 4096 bits<\/td>\n autob\u00fas de 4096 bits<\/td>\n autob\u00fas de 2048 bits<\/td>\n autob\u00fas de 4096 bits<\/td>\n autob\u00fas de 256 bits<\/td>\n<\/tr>\n \n ancho de banda de memoria<\/td>\n Por determinar<\/td>\n 5,2 TB\/s<\/td>\n 3,2 TB\/s<\/td>\n 3,2 TB\/s<\/td>\n 1,6 TB\/s<\/td>\n 1,23 TB\/s<\/td>\n 1TB\/s<\/td>\n 1TB\/s<\/td>\n 484GB\/s<\/td>\n 512GB\/s<\/td>\n 224GB\/s<\/td>\n<\/tr>\n \n Factor de forma<\/td>\n Por determinar<\/td>\n OAM<\/td>\n OAM<\/td>\n OAM<\/td>\n Tarjeta de doble ranura<\/td>\n Ranura doble, longitud completa<\/td>\n Ranura doble, longitud completa<\/td>\n Ranura doble, longitud completa<\/td>\n Ranura doble, longitud completa<\/td>\n Ranura doble, longitud media<\/td>\n Ranura \u00fanica, longitud completa<\/td>\n<\/tr>\n \n Enfriamiento<\/td>\n Por determinar<\/td>\n Enfriamiento pasivo<\/td>\n Enfriamiento pasivo<\/td>\n Enfriamiento pasivo<\/td>\n Enfriamiento pasivo<\/td>\n Enfriamiento pasivo<\/td>\n Enfriamiento pasivo<\/td>\n Enfriamiento pasivo<\/td>\n Enfriamiento pasivo<\/td>\n Enfriamiento pasivo<\/td>\n Enfriamiento pasivo<\/td>\n<\/tr>\n \n TDP (m\u00e1x.)<\/td>\n Por determinar<\/td>\n 750W<\/td>\n 560W<\/td>\n 500W<\/td>\n 300W<\/td>\n 300W<\/td>\n 300W<\/td>\n 300W<\/td>\n 300W<\/td>\n 175W<\/td>\n 150W<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n