Acapela permite que cualquiera haga una copia de seguridad de su propia voz de forma gratuita en minutos, por si acaso


El habla sintética puede ser un objeto temible en estos días cuando se combina con falsificaciones profundas y otros engaños de IA, pero también es una herramienta indispensable para cualquiera que ya no pueda hablar por sí mismo. Acapela Group tiene en mente a estas personas con su nuevo servicio «mi propia voz», que permite que cualquier persona entrene un perfil de voz de IA de forma gratuita.

Acapela ha estado en el espacio de texto a voz durante aproximadamente 25 años y fue adquirida recientemente por el gigante tecnológico de accesibilidad Tobii Dynavox, aunque todavía operan de forma independiente.

Al igual que muchas industrias, la accesibilidad se ha visto fuertemente influenciada por la llegada de los procesos de aprendizaje automático a escala del consumidor. Hace siete u ocho años, recuerda el cofundador de Acapela, Remy Cadic, no solo era tedioso personalizar una voz sintética para uno mismo, sino que los resultados no eran particularmente buenos.

“Tomó mucho tiempo: el paciente tuvo que entrenar durante 8 horas. Ahora podemos depositar una voz con solo 50 frases grabadas; tarda unos 10 minutos y la voz está lista al día siguiente”, dijo. «Definitivamente se está produciendo una revolución con las técnicas neuronales de texto a voz».

Tener un generador de voz que usa la propia voz es ciertamente algo que un número creciente de personas puede apreciar: elegir de una lista es un poco deshumanizante. Muchos tienen voces que preferirían usar, pero no fue hasta hace poco que fue una opción.

No bromeaban sobre lo rápido y fácil que es: pasé por el nuevo proceso de «mi propia voz», y realmente eran solo 50 oraciones cortas, extraídas de un corpus (al azar, al parecer) de novelas, libros de recetas, y artículos. La interfaz de grabación era simple y fácil de navegar y, efectivamente, un día más tarde mi voz estaba lista para usar. La calidad es buena, no extraña como pueden ser algunos modelos, pero claramente mi propia voz (como se anuncia) y capaz de manejar cualquier oración que le lancé en la página de demostración.

Ahora que está ahí, si alguna vez lo necesito, puedo ir y descargarlo por una tarifa para usarlo en cualquier sistema de generación de voz compatible. Obviamente, esto incluye los dispositivos y TD Talk de Tobii Dynavox; la compañía acaba de lanzar uno nuevo la semana pasada, de hecho, estas cosas se están volviendo bastante elegantes.

Delaina prueba el nuevo dispositivo Tobii Dynavox. Créditos de imagen: Grupo Acapela

Y ese es el verdadero punto de todo esto: no es una demostración técnica del poder de la tecnología de voz neuronal o una demostración que permite que cualquiera lo alimente con la voz de una celebridad para clonar. Es una herramienta hecha específicamente para personas que hasta hace poco no tenían opciones o, en el mejor de los casos, un proceso difícil y complejo si querían preservar su voz.

Muchos que enfrentan condiciones degenerativas, cáncer o ciertos procedimientos saben que dentro de unos meses o años es posible que no puedan hablar bien o que ya no puedan hablar. Hacer que el proceso de bancarizar su voz sea lo más fácil posible es un servicio que muchos apreciarán.

“Una gran ventaja es que también personalizamos para niños: hemos hecho que el guión de grabación sea más fácil de leer y hemos ajustado el sistema para mejorar la calidad de las voces sintéticas de los niños. Fuimos los primeros en el mundo en hacer eso, y todavía vamos en esta dirección”, dijo Cadic.

Ser capaz de grabar y volver a grabar o envejecer artificialmente la voz almacenada es una capacidad nueva y desafiante, pero que parece estar dando resultados:

La compatibilidad con dispositivos fuera de línea que no tienen el último chip de procesamiento neuronal también es un diferenciador clave. “Existen soluciones en línea donde es fácil crear una voz, pero solo está disponible a través de la nube, y eso no es práctico”, dijo.

Por cierto, si bien las 50 oraciones son geniales para las personas que aún pueden leer y hablar, también se puede entrenar una voz con grabaciones de voz de personas que ya han perdido esa capacidad; simplemente no es tan simple.

La empresa también descubrió que la diversidad y la consideración en el proceso de capacitación son tan importantes como en otras aplicaciones de IA. Cadic señaló que un problema con algunas técnicas de capacitación superrápidas es que “prácticamente solo intentará encontrar al orador en el material de capacitación más cercano al usuario. Pero si no hay un orador en el entrenamiento cercano a la voz original, simplemente no sonará como tal”.

El gerente de producto de Acapela, Nicolas Mazars, agregó que, al igual que muchos problemas de IA que tienen su origen en datos de capacitación insuficientes, este no se distribuye uniformemente: “Ese proceso funciona bien para el hombre blanco promedio de 50 años, pero no si eres un Hombre afroamericano, o no hablas bien el inglés. Trabajamos en 23 idiomas y tenemos muchos usuarios con discapacidades. Intentamos confiar en los comentarios de los usuarios y desarrollar algo para ellos, por ellos”.

El proceso de registro y banca es gratuito; puede registrarse para obtener una cuenta aquí y entrenar su propia voz sintética en minutos. Solo pagas si quieres descargarlo e instalarlo en un dispositivo.



Source link-48