AMD tiene como objetivo adoptar un enfoque agresivo en la industria de la IA, ya que revela sus planes para los aceleradores de IA MI400 Instinct de próxima generación.
AMD tiene como objetivo mejorar su plataforma de software para brindar soporte mejorado para aplicaciones de inteligencia artificial generativa, confirma los aceleradores Instinct MI400 de próxima generación
AMD ha confirmado formalmente sus intenciones de desarrollar la serie Instinct «MI400». Esta confirmación no sorprende, ya que el vicepresidente de Lenovo ya confirmó la existencia de los aceleradores de próxima generación en la agenda de AMD.
Durante la reciente llamada de ganancias del segundo trimestre de la compañía, la directora ejecutiva Lisa Su insinuó los futuros aceleradores de inteligencia artificial Instinct MI400, sin revelar ningún detalle, creando así un suspenso. Pero al igual que la serie MI300, los aceleradores MI400 también vendrán en una variedad de configuraciones.
Cuando observa esas cargas de trabajo y las inversiones que estamos haciendo, no solo hoy, sino en el futuro con nuestra serie MI400 de próxima generación y así sucesivamente, definitivamente creemos que tenemos una hoja de ruta de hardware muy competitiva y capaz. Creo que la discusión sobre AMD, francamente, siempre ha sido sobre la hoja de ruta del software, y vemos un pequeño cambio aquí en el lado del software.
Dra. Lisa Su (CEO de AMD)
La declaración del CEO menciona el hecho de que la línea Instinct está bien equipada en el departamento de hardware y ofrece especificaciones de primera línea. Sin embargo, se considera que AMD carece de desarrollo de software, lo que incluye un amplio soporte para aplicaciones de IA generativa. NVIDIA ha estado a la vanguardia por ahora, con la introducción de funciones como «NVIDIA ACE» y «DLSDR». AMD planea mejorar las cosas en el lado del software, por lo tanto, podemos ver cambios importantes introducidos por AMD, que con suerte elevarán la plataforma Instinct.
Como se discutió anteriormente, además de la línea MI400 Instinct de próxima generación, AMD también reveló planes para el desarrollo de variantes MI300 «reducidas» para los mercados chinos en un esfuerzo por cumplir con las políticas comerciales de EE. UU. Si bien las especificaciones exactas aún no son seguras, creemos que Team Red adoptará un enfoque similar al de NVIDIA con sus GPU «H800 y A800».
NVIDIA se ha estado beneficiando principalmente de la «mina de oro» de la IA, alcanzando niveles tremendos de ventas y demanda. Los competidores como Intel y AMD han llegado tarde, pero podrían ofrecer una dura competencia dado el hecho de que aportan un mejor rendimiento y valor a bordo.
Aceleradores AMD Radeon Instinct
Nombre del acelerador | AMD instinto MI400 | AMD instinto MI300 | AMD instinto MI250X | Instinto de AMD MI250 | Instinto de AMD MI210 | AMD instinto MI100 | AMD Radeon instinto MI60 | AMD Radeon instinto MI50 | AMD Radeon instinto MI25 | AMD Radeon instinto MI8 | AMD Radeon instinto MI6 |
---|---|---|---|---|---|---|---|---|---|---|---|
Arquitectura de CPU | Zen 5 (APU a exaescala) | Zen 4 (APU a exaescala) | N / A | N / A | N / A | N / A | N / A | N / A | N / A | N / A | N / A |
Arquitectura GPU | CDNA 4 | Agua Vanjaram (CDNA 3) | Aldebarán (CDNA 2) | Aldebarán (CDNA 2) | Aldebarán (CDNA 2) | Arcturo (CDNA 1) | Vega 20 | Vega 20 | Vega 10 | Fiyi XT | estrella polar 10 |
Nodo de proceso GPU | 4 nm | 5nm+6nm | 6nm | 6nm | 6nm | FinFET de 7 nm | FinFET de 7 nm | FinFET de 7 nm | FinFET de 14 nm | 28nm | FinFET de 14 nm |
Chiplets GPU | Por determinar | 8 (MMC) | 2 (MMC) 1 (por dado) |
2 (MMC) 1 (por dado) |
2 (MMC) 1 (por dado) |
1 (monolítico) | 1 (monolítico) | 1 (monolítico) | 1 (monolítico) | 1 (monolítico) | 1 (monolítico) |
Núcleos de GPU | Por determinar | Hasta 19,456 | 14,080 | 13,312 | 6656 | 7680 | 4096 | 3840 | 4096 | 4096 | 2304 |
Velocidad de reloj de la GPU | Por determinar | por confirmar | 1700 MHz | 1700 MHz | 1700 MHz | 1500 MHz | 1800 MHz | 1725 MHz | 1500 MHz | 1000 MHz | 1237 MHz |
Cómputo FP16 | Por determinar | por confirmar | 383 tops | 362 tops | 181 tops | 185 TFLOP | 29,5 TFLOP | 26,5 TFLOP | 24,6 TFLOP | 8.2 TFLOP | 5.7 TFLOP |
Cómputo FP32 | Por determinar | por confirmar | 95,7 TFLOP | 90,5 TFLOP | 45,3 TFLOP | 23.1 TFLOP | 14,7 TFLOP | 13.3 TFLOP | 12.3 TFLOP | 8.2 TFLOP | 5.7 TFLOP |
Cómputo FP64 | Por determinar | por confirmar | 47,9 TFLOP | 45,3 TFLOP | 22,6 TFLOP | 11,5 TFLOP | 7.4 TFLOP | 6.6 TFLOP | 768 GFLOP | 512 GFLOP | 384 GFLOP |
VRAM | Por determinar | 192GB HBM3 | 128GB HBM2e | 128GB HBM2e | 64GB HBM2e | 32GB HBM2 | 32GB HBM2 | 16GB HBM2 | 16GB HBM2 | 4GB HBM1 | 16GB GDDR5 |
Reloj de la memoria | Por determinar | 5,2 Gb/s | 3,2 Gb/s | 3,2 Gb/s | 3,2 Gb/s | 1200 MHz | 1000 MHz | 1000 MHz | 945 MHz | 500 MHz | 1750 MHz |
Bus de memoria | Por determinar | 8192 bits | 8192 bits | 8192 bits | 4096 bits | autobús de 4096 bits | autobús de 4096 bits | autobús de 4096 bits | autobús de 2048 bits | autobús de 4096 bits | autobús de 256 bits |
ancho de banda de memoria | Por determinar | 5,2 TB/s | 3,2 TB/s | 3,2 TB/s | 1,6 TB/s | 1,23 TB/s | 1 TB/s | 1 TB/s | 484 GB/s | 512 GB/s | 224 GB/s |
Factor de forma | Por determinar | OAM | OAM | OAM | Tarjeta de doble ranura | Ranura doble, longitud completa | Ranura doble, longitud completa | Ranura doble, longitud completa | Ranura doble, longitud completa | Ranura doble, longitud media | Ranura única, longitud completa |
Enfriamiento | Por determinar | Enfriamiento Pasivo | Enfriamiento Pasivo | Enfriamiento Pasivo | Enfriamiento Pasivo | Enfriamiento Pasivo | Enfriamiento Pasivo | Enfriamiento Pasivo | Enfriamiento Pasivo | Enfriamiento Pasivo | Enfriamiento Pasivo |
TDP (máx.) | Por determinar | 750W | 560W | 500W | 300W | 300W | 300W | 300W | 300W | 175W | 150W |
Fuentes de noticias: Videocardz, SemiAnalysis