La plataforma de transcripción de AWS ahora funciona con IA generativa


AWS agregó nuevos idiomas a su producto Amazon Transcribe, ofreciendo transcripción generativa basada en IA para 100 idiomas y una serie de nuevas capacidades de IA para los clientes.

Anunciado durante el evento AWS re: Invent, Amazon Transcribe ahora puede reconocer más idiomas hablados y activar una transcripción de llamadas. Los clientes de AWS utilizan Transcribe para agregar capacidades de voz a texto a sus aplicaciones en la nube de AWS.

La empresa dijo en una publicación de blog que Transcribe se entrenó con “millones de horas de datos de audio sin etiquetar de más de 100 idiomas” y utiliza algoritmos autosupervisados ​​para aprender patrones del habla humana en diferentes idiomas y acentos. AWS dijo que se aseguró de que algunos idiomas no estuvieran sobrerrepresentados en los datos de capacitación para garantizar que los idiomas menos utilizados pudieran ser tan precisos como los que se hablan con más frecuencia.

A finales de 2022, Amazon Transcribe admitía 79 idiomas.

Amazon Transcribe tiene entre un 20 y un 50 por ciento de precisión en muchos idiomas, según AWS. También ofrece puntuación automática, vocabulario personalizado, identificación automática de idioma y filtros de vocabulario personalizados. Puede reconocer voz en formatos de audio y vídeo y en entornos ruidosos.

El borde Se comunicó con AWS para obtener información sobre la precisión anterior y qué modelos básicos utilizó para Amazon Transcribe.

Con un mejor reconocimiento del idioma, AWS dijo que los avances con Amazon Transcribe también se traducen en una mayor precisión con su plataforma Call Analytics, que los clientes de su centro de contacto utilizan con frecuencia. Amazon Transcribe Call Analytics, ahora también impulsado por modelos de IA generativa, resume las interacciones entre un agente y un cliente. AWS dijo que esto reduce el trabajo posterior a la llamada para crear informes y los gerentes pueden leer rápidamente la información sin necesidad de revisar la transcripción completa.

Por supuesto, AWS no es la única empresa que ofrece servicios de transcripción basados ​​en IA. Otter ha estado proporcionando transcripciones de IA a consumidores y empresas durante un tiempo y lanzó una herramienta de resumen en junio. Si bien no es exactamente lo mismo, meta anunciado está trabajando en un modelo de traducción generativo impulsado por IA que reconoce casi 100 idiomas hablados.

AWS también anunció capacidades adicionales para su producto Amazon Personality, que permite a los clientes ofrecer productos o mostrar recomendaciones a los clientes, como cómo los servicios de transmisión pueden sugerir nuevos programas según la actividad anterior. AWS agregó Content Generation, que escribirá títulos o líneas de asunto de correo electrónico para conectar temáticamente listas de recomendaciones.



Source link-37