El surgimiento de herramientas de IA como ChatGPT y Google Bard ha presentado la oportunidad perfecta para dar saltos significativos en proyectos de habla multilingüe, avanzar en la tecnología lingüística y promover la diversidad lingüística en todo el mundo.
Meta aceptó el desafío y presentó su último modelo de lenguaje de IA, que puede reconocer y generar voz en más de 4000 idiomas hablados.
El habla masivamente multilingüe (MMS) proyecto significa que la nueva IA de Meta no es una mera réplica de ChatGPT. El modelo utiliza fuentes de datos no convencionales para superar las barreras del habla y permitir que las personas se comuniquen en sus idiomas nativos sin pasar por un proceso de traducción exhaustivo.
Lo más emocionante es que Meta ha hecho que MMS sea de código abierto, invitando a los investigadores a aprender y ampliar la base que proporciona. Este movimiento sugiere que la compañía está profundamente interesada en dominar el espacio de traducción de idiomas de IA, pero también fomenta la colaboración en el campo.
Incorporar más idiomas a la conversación
Normalmente, los programas de IA de reconocimiento de voz y texto a voz necesitan una amplia capacitación en una gran cantidad de conjuntos de datos de audio, combinados con etiquetas de transcripción meticulosas. Muchos idiomas en peligro que se encuentran fuera de las naciones industrializadas carecen de grandes conjuntos de datos como este, lo que los pone en riesgo de desaparecer o ser excluidos de las herramientas de traducción.
De acuerdo a Gizmochina, Meta tomó un enfoque interesante sobre este tema y se sumergió en los textos religiosos. Estos textos brindan diversas interpretaciones lingüísticas que permiten a Meta obtener una mirada ‘cruda’ y sin explotar de los idiomas menos conocidos para la investigación basada en texto.
El lanzamiento de MMS como recurso de código abierto y proyecto de investigación demuestra que Meta está dedicando mucho tiempo y esfuerzo a la falta de diversidad lingüística en el campo de la tecnología, que con frecuencia se limita a los idiomas más hablados.
Es un desarrollo emocionante en el mundo de la IA, y que podría acercarnos mucho más a tener el tipo de ‘traductores universales’ que actualmente solo existen en la ciencia ficción. Imagine un auricular que, a través del poder de la IA, no solo pueda traducirle el idioma extranjero en tiempo real, sino también filtrar el idioma original para que solo escuche su lengua materna.
A medida que más investigadores trabajen con el MMS de Meta y se incluyan más idiomas, podríamos ver un mundo en el que la tecnología de asistencia y el texto a voz podrían permitirnos hablar con personas independientemente de su idioma nativo, compartiendo información mucho más rápido. Estoy muy entusiasmado con el desarrollo como alguien que intenta aprender un idioma por sí mismo, ya que hará que la práctica conversacional de la vida real sea mucho más fácil y ayudará al gueto a lidiar con palabras y frases informales y coloquiales que solo los hablantes nativos sabrían.