Intel Habana Gaudi supera al H100 de Nvidia en modelos de IA en lenguaje visual: Hugging Face


Un nuevo punto de referencia de rendimiento de ajuste para BridgeTower, un modelo de IA Vision-Language (VL), ha demostrado que hay vida en el campo de la aceleración de IA además del verde de Nvidia. Si bien Nvidia domina el mercado de aceleración de la IA (a través de una previsión excepcional, una pila de software bien pensada y documentada y un rendimiento de procesamiento puro), otros jugadores están deseosos de hacerse con una parte del mercado de la IA. Y al menos para BridgeTower, Hugging Face ha demostrado que el propio silicio Gaudi 2 de Intel (diseñado y fabricado a través de la adquisición de Habana por 2 mil millones de dólares de Intel en 2019) supera al A100 de 80 GB de Nvidia en una asombrosa cifra de 2,5 veces, e incluso supera al prodigio de Nvidia. niño H100 en 1,4x.

Visión-Lenguaje

Vision-Language (VL) se refiere a modelos de IA que pueden procesar y asociar información a través de las modalidades de lenguaje y representación visual. Los modelos VL en específico se asocian comúnmente con modelos de generación de imágenes como CLIP de Open AI y Stable Diffusion XL, un mercado de rápido crecimiento liderado principalmente por Midjourney, Stable Diffusion y ahora Ideogram.

Según Habana, las importantes aceleraciones son el resultado de un sistema de carga de datos acelerado por hardware, uno de los cuellos de botella para el ajuste fino de los modelos de IA, y especialmente para los modelos VL. Cargar una carga de trabajo en la memoria es a menudo un cuello de botella en el rendimiento dondequiera que se encuentre la informática, por lo que Habana no buscaría optimizar este paso particular en el proceso de capacitación.



Source link-41