AWS utiliza Habana Gaudi de Intel para modelos de lenguaje grande


Si bien Habana Gaudi de Intel ofrece un rendimiento algo competitivo y viene con el paquete de software Habana SynapseAI, aún se queda corto en comparación con las GPU de cómputo habilitadas para CUDA de Nvidia. Esto, junto con la disponibilidad limitada, es la razón por la que Gaudi no ha sido tan popular para los modelos de lenguaje extenso (LLM) como ChatGPT.

Ahora que la fiebre de la IA está en marcha, Habana de Intel está experimentando implementaciones más amplias. Amazon Web Services decidió probar la primera generación de Gaudí de Intel con PyTorch y DeepSpeed ​​para capacitar a los LLM, y los resultados fueron lo suficientemente prometedores como para ofrecer instancias DL1 EC2 comercialmente.



Source link-41