Meta ha presentado una nueva herramienta de IA, denominada ‘Voicebox’, que, según afirma, representa un gran avance en la generación de voz impulsada por IA. Sin embargo, la compañía no lo lanzará al público todavía, porque hacerlo podría ser desastroso.
Actualmente, Voicebox puede producir clips de audio de discursos en seis idiomas (todos ellos de origen europeo) y, según un publicación de blog de Meta – es el primer modelo de IA de su tipo capaz de completar tareas más allá de lo que fue ‘entrenado específicamente para realizar’. Meta afirma que Voicebox supera fácilmente a las IA de generación de voz de la competencia en prácticamente todas las áreas.
Entonces, ¿de qué es capaz exactamente? Bueno, para empezar, puede arrojar réplicas de texto a voz razonablemente precisas de la voz de una persona usando un archivo de audio de muestra de tan solo dos segundos, una habilidad aparentemente inocua que tiene una gran cantidad de potencial destructivo en las manos equivocadas.
El dudoso poder de la IA
Incluso dejando de lado la cosas raras que se arrastra en Internet han estado haciendo con ChatGPT y otras herramientas de inteligencia artificial (Voicebox ciertamente parece que podría ser una bendición para cualquiera que haga porno falso de venganza), este es el tipo de tecnología que literalmente podría comenzar una guerra.
Después de todo, la mayoría de las figuras públicas importantes, incluidos los políticos, tienen muchas grabaciones de audio circulando por Internet. No sería difícil recopilar algunos fragmentos de discursos de un líder político en ejercicio y usar Voicebox para producir una réplica sorprendentemente realista de su voz, algo que luego podría usarse para propósitos nefastos.
Tales herramientas ya existen, por supuesto, pero son menos convincentes; Es posible que hayas visto videos divertidos en las redes sociales con gente como Joe Biden, Donald Trump y Barack Obama supuestamente jugando. Fortnite juntos. Es bueno para reír, pero el audio no es convincente. Imita los gestos de cada jugador presidencial lo suficiente como para que sean reconocibles, pero no tan bien como para que cualquier persona con un cerebro en realidad creer son ellos
Sin embargo, Meta claramente cree que su nueva herramienta es lo suficientemente buena como para engañar al menos a la mayoría de las personas, ya que explícitamente no lanza Voicebox al público, sino que publica un trabajo de investigación y detallar una herramienta clasificadora que puede identificar el habla generada por Voicebox a partir del habla humana real. Meta describe el clasificador como «altamente efectivo», aunque notablemente no perfectamente eficaz.
maquinas parlantes
Por supuesto, si bien Meta desea enfatizar que reconoce el «potencial de uso indebido y daño no intencionado» que rodea a herramientas como Voicebox, es importante no perder de vista los beneficios potenciales que la generación de voz de IA podría tener en el futuro.
Voicebox, acorde con su nombre, podría proporcionar un habla mucho más natural a las personas mudas o incapaces de comunicarse, eliminando algunas de las barreras a la interacción causadas por la ‘voz de robot’ de texto a voz existente que se hizo famosa por el físico Stephen Hawking. También podría realizar la traducción en tiempo real, acercándonos un paso más al tipo de dispositivos de «traductor universal» que actualmente solo existen en la ciencia ficción.
También hay otras aplicaciones; más pequeño, pero no menos útil. Meta explica en su publicación de blog que Voicebox se puede usar para editar y mejorar el discurso grabado. Si grabó algún audio pero pronunció mal una palabra o fue interrumpido por el ruido de fondo, Voicebox puede aislar el segmento ofensivo y ‘volver a grabar’ un fragmento de voz usando su voz. Impresionante, y solo un poco aterrador.
En cualquier caso, es bueno ver que Meta adopta un enfoque serio y considerado aquí. El afán frenético de Microsoft por empujar IA de Bing en todo lo que tiene lo aterricé en agua caliente más de una vez, y OpenAI desatar ChatGPT en el mundo ha llevado a todo tipo de rarezas durante el último año. Estamos en la fiebre del oro de la IA, y estas herramientas se están abriendo paso en cada parte de nuestras vidas.
Un poco de precaución, paciencia y respeto por la magnitud de esta tecnología es un espectáculo bienvenido, aunque dudo que Meta se siente en Voicebox por también mucho tiempo, ya que los accionistas sin duda se preguntarán cuánto dinero les puede hacer…