AI puede clonar la voz de su presentador de podcast favorito


Balasubramaniyan dice que los servicios de IA de voz deben ofrecer seguridad a la par con la de otras empresas que almacenan datos personales, como información financiera o médica.

“Tienes que preguntarle a la empresa, ‘¿cómo se va a almacenar mi voz de IA? ¿Estás realmente almacenando mis grabaciones? ¿Lo estás almacenando encriptado? ¿Quién tiene acceso a él?’”, dice Balasubramaniyan. «Es parte de mi. Es mi yo íntimo. Necesito protegerlo igual de bien.

Podcastle dice que los modelos de voz están encriptados de extremo a extremo y que la empresa no guarda ninguna grabación después de crear el modelo. Solo el titular de la cuenta que grabó los clips de voz puede acceder a ellos. Podcastle tampoco permite cargar o analizar otros audios en Revoice. De hecho, la persona que crea una copia de su voz tiene que grabar las líneas de texto preescrito directamente en la aplicación de Revoice. No pueden simplemente cargar un archivo pregrabado.

“Tú eres el que da el permiso y crea el contenido”, dice Yeritsyan de Podcastle. “Ya sea artificial u original, si esta no es una voz falsa, es la voz de esta persona y él la puso ahí. No veo problemas”.

Podcastle espera que poder reproducir audio solo con la voz clonada de una persona que consienta desincentivaría a las personas a decir algo demasiado horrible. Actualmente, el servicio no tiene moderación de contenido ni restricciones sobre palabras o frases específicas. Yeritsyan dice que depende de cualquier servicio o medio que publique el audio, como Spotify, Apple Podcasts o YouTube, controlar el contenido que se envía a sus plataformas.

“Hay enormes equipos de moderación en cualquier plataforma social o plataforma de transmisión”, dice Yeritsyan. “Así que ese es su trabajo para no permitir que nadie más use la voz falsa y cree algo estúpido o algo no ético y lo publique allí”.

Incluso si se aborda el tema muy espinoso de las falsificaciones profundas de voz y los clones de IA no consensuados, aún no está claro si las personas aceptarán un clon computarizado como un sustituto aceptable de un humano.

A fines de marzo, el comediante Drew Carey utilizó otro servicio de IA de voz, ElevenLabs, para lanzar un episodio completo de un programa de radio que fue leído por su clon de voz. En su mayor parte, la gente lo odiaba. El podcasting es un medio íntimo, y la clara conexión humana que sientes cuando escuchas a las personas tener una conversación o contar historias se pierde fácilmente cuando los robots se acercan al micrófono.

Pero, ¿qué sucede cuando la tecnología avanza hasta el punto en que no se puede notar la diferencia? ¿Importa que no sea realmente tu podcaster favorito en tu oído? El habla de IA clonada tiene mucho camino por recorrer antes de que sea indistinguible del habla humana, pero seguramente se está poniendo al día rápidamente. Hace apenas un año, las imágenes generadas por IA parecían caricaturescas, y ahora son lo suficientemente realistas como para engañar a millones y hacerles creer que el Papa tenía ropa de abrigo nueva y espectacular. Es fácil imaginar que el audio generado por IA tendrá una trayectoria similar.

También hay otro rasgo muy humano que genera interés en estas herramientas impulsadas por IA: la pereza. La tecnología de voz de IA, suponiendo que llegue al punto en que pueda imitar con precisión las voces reales, facilitará la realización de ediciones rápidas o retomas sin tener que llevar al anfitrión de vuelta al estudio.

“En última instancia, la economía del creador va a ganar”, dice Balasubramaniyan. “No importa cuánto pensemos en las implicaciones éticas, va a ganar porque acabas de simplificar la vida de las personas”.



Source link-46