Equipado con memoria de 48 GB, 200 TOPS AI Computing, Gen5 Ready


Moore Threads, el fabricante chino de GPU, ha presentado su nueva GPU MTT S4000 que ofrece 200 TOP de computación de IA y 48 GB de memoria para LLM.

Moore Threads se sube al tren de la IA con una GPU 200 TOPS MTT S4000, equipada con memoria GDDR6 de 48 GB y preparación Gen5

En un evento, Moore Threads presentó su nueva GPU MTT S4000 que utiliza su arquitectura central MUSA de tercera generación. La tarjeta está diseñada específicamente para impulsar cargas de trabajo de IA y ofrece capacidades de memoria muy grandes para modelos de lenguajes grandes.

En cuanto a las especificaciones, el Moore Threads MTT S4000 cuenta con 48 GB de memoria GDDR6 con velocidad de 16 Gbps para proporcionar un ancho de banda de 768 GB/s. La GPU viene con la última tecnología de interfaz MTLink 1.0 que permite a los clientes ejecutar varias tarjetas simultáneamente. Piense en ello como una solución NVLINK para las GPU Moore Threads. La tarjeta también se basa en el protocolo PCIe Gen5 y, hasta ahora, la empresa es la única que ofrece hardware de nivel de consumidor compatible con Gen5.

Fuente de la imagen: Hilos de Moore

Según la propia compañía, algunas de las cifras de computación compartidas muestran 25 TFLOP de FP32, 50 TFLOP de TF32, 100 TFLOP de FP16/BF16 y 200 TOPS en rendimiento INT8. Eso es 5 veces más que la combinación NPU+CPU+GPU más rápida disponible en PC con IA, como la serie Ryzen 8040 de AMD y la serie Intel Core Ultra. Desafortunadamente, la empresa no ha compartido el recuento de núcleos y otros aspectos técnicos.

Una cosa interesante a tener en cuenta es que, a pesar de ser una tarjeta aceleradora de IA, la MTT S4000 tiene cuatro salidas de pantalla y puede admitir pantallas de hasta 8K. La tarjeta también admite 96 transmisiones simultáneas de 1080p y está equipada con las últimas herramientas de desarrollo USIFY que pueden aprovechar al máximo el software basado en CUDA de NVIDIA. Resumiendo las especificaciones:

  • Arquitectura GPU MUSA de tercera generación
  • Memoria GDDR6 de 48 GB
  • Ancho de banda de 768 GB/s (velocidades de PIN de 16 Gbps)
  • Compatible con PCIe Gen5
  • 25 TFLOP FP32
  • 50 TFLOP TF32
  • 100 TFLOP FP16/BF16
  • 200 TOPS INT8
  • Cuatro salidas de pantalla
  • 96 transmisiones de 1080p
  • Hecho para aplicaciones de IA

La tarjeta en sí viene en una solución estándar de dos ranuras con refrigeración pasiva y utiliza un conector de alimentación de 12 VHPWR para arrancar. A modo de comparación, el MTT S3000 de la generación anterior ofrece 32 GB de memoria y un cálculo FP32 máximo de 15,2 TFLOP. Esto supone un aumento del 50 % en la capacidad de memoria y del 64 % en las capacidades informáticas del FP32.

Fuente de la imagen: Hilos de Moore

La GPU Moore Threads MTT S4000 también se está integrando en las soluciones informáticas de KUAE que son similares a los sistemas DGX de NVIDIA. El sistema Kuae MCCX D800 utiliza 8 GPU MTT S4000 y también viene con una expansión perfecta desde una sola máquina a múltiples tarjetas y múltiples sistemas de IA. Tanto las GPU MTT S4000 como los sistemas Kuae son compatibles con los últimos LLM, como LLaMA, GLM, Aquila, Baichuan, GPT, Bloom, Yuyan, y pueden manejar 130 mil millones de parámetros con facilidad. Las primeras 1000 GPU MTT S4000 se alojarán en el primer clúster informático a gran escala de China para impulsar cargas de trabajo de IA.

Fuente de la imagen: Hilos de Moore

Al igual que las otras dos GPU Moore Threads, MTT S80 y MTT S70, se espera que la MTT S4000 esté disponible a precios muy competitivos. El rendimiento, por otro lado, es algo que sólo sabremos realmente una vez que los resultados reales estén disponibles, ya que las dos primeras tarjetas fueron muy decepcionantes a pesar de que la compañía se jactaba mucho de sus capacidades de rendimiento en juegos.

Comparte esta historia

Facebook

Gorjeo



Source link-29