Amazon dice que sus chips de próxima generación son cuatro veces más rápidos para el entrenamiento de IA


Amazon Web Services (AWS) acaba de iniciar su conferencia re:Invent con sede en Las Vegas, la mayor parte de la cual involucra la tecnología más popular del año, la IA. Estas noticias, en su conjunto, nos dan un adelanto de los objetivos a largo plazo de la empresa para las plataformas de inteligencia artificial.

En primer lugar, AWS presentó productos destinados al entrenamiento de modelos y a la ejecución de modelos entrenados. Trainium2, que obviamente está destinado al entrenamiento de modelos, ha sido diseñado para ofrecer un rendimiento hasta 4 veces mejor y una eficiencia energética 2 veces mayor en comparación con su antecesor. Amazon promete que estos chips permitirán a los programadores entrenar modelos rápidamente y a un costo menor, debido a una reducción en el uso de energía. Anthropic ya ha anunciado planes para construir modelos utilizando chips Trainium2.

Graviton4, por otro lado, es más para uso general. Estos procesadores se basan en la arquitectura Arm, pero consumen menos energía que los chips Intel o AMD. Amazon promete un aumento del 30 por ciento en el rendimiento general cuando se utiliza un modelo de IA entrenado integrado en un procesador Graviton4. Esto debería reducir los costos de computación en la nube para las organizaciones que emplean regularmente modelos de IA y ofrecer un ligero aumento en la velocidad para los usuarios habituales que simplemente buscan tomar algunas fotos falsas de Harry Potter en una fiesta rave o lo que sea.

En total, Graviton4 debería permitir a los clientes de AWS «procesar mayores cantidades de datos, escalar sus cargas de trabajo, mejorar el tiempo de obtención de resultados y reducir el costo total de propiedad». Está disponible hoy en versión preliminar y se planea un lanzamiento más amplio para los próximos meses.

Normalmente, cuando una empresa anuncia nuevos chips internos, eso significa problemas para los proveedores externos actuales como NVIDIA. La empresa es un actor importante en el espacio de la IA empresarial, gracias a que las empresas utilizan sus GPU para capacitación y su CPU Grace de centro de datos basado en Arm. En lugar de evitar la asociación en favor de chips propietarios, Amazon está consolidando aún más la relación al ofrecer a los clientes empresariales acceso en la nube a las últimas GPU H200 AI de NVIDIA. También operará más de 16.000 Superchips Nvidia GH200 Grace Hopper expresamente para el equipo de investigación y desarrollo de NVIDIA. Se trata de un enfoque similar al de su principal rival en IA, Microsoft, que también anunció una asociación mejorada con NVIDIA al mismo tiempo que

Amazon también anunció un nombre que probablemente se inspiró en el semidiós de Star Trek y no en el vendedor ambulante de conspiraciones adyacente a Trump. Se describe como un “nuevo tipo de asistente personal generativo impulsado por IA” y está diseñado específicamente para ayudar a optimizar los proyectos de trabajo y las tareas de servicio al cliente. Puede adaptarse a cualquier negocio y ofrece respuestas relevantes a las preguntas más frecuentes. Amazon Q también puede generar contenido por sí solo y tomar acciones basadas en las solicitudes de los clientes. Incluso personalizará las interacciones según la función del usuario dentro de una empresa.

Existirá en aplicaciones de comunicación como Slack y en aplicaciones de edición de texto comúnmente utilizadas por los desarrolladores de software. Con ese fin, Q puede cambiar el código fuente y conectarse a más de 40 sistemas empresariales, incluidos Microsoft 365, Dropbox, Salesforce y Zendesk, entre otros. Amazon Q está actualmente disponible en versión preliminar, y próximamente habrá un lanzamiento más amplio. Costará entre $ 20 y $ 30 por usuario cada mes, según las funciones disponibles.

Entonces que hemos aprendido aquí? Amazon está apostando fuerte por la IA, como todos los demás. Más específicamente, está luchando con su antiguo rival de la nube, Microsoft, para ser la empresa a la que recurrir para la IA empresarial. También está utilizando la IA para continuar su dominio en el espacio de la computación en la nube, con la esperanza de minimizar cualquier aumento en la participación de mercado de Microsoft y otros actores como Google y Alibaba.



Source link-47