{"id":403550,"date":"2023-01-14T10:16:50","date_gmt":"2023-01-14T10:16:50","guid":{"rendered":"https:\/\/magazineoffice.com\/las-falsificaciones-rapidas-de-voz-de-vall-e-deberian-preocuparte-si-aun-no-estabas-preocupado-techcrunch\/"},"modified":"2023-01-14T10:16:52","modified_gmt":"2023-01-14T10:16:52","slug":"las-falsificaciones-rapidas-de-voz-de-vall-e-deberian-preocuparte-si-aun-no-estabas-preocupado-techcrunch","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/las-falsificaciones-rapidas-de-voz-de-vall-e-deberian-preocuparte-si-aun-no-estabas-preocupado-techcrunch\/","title":{"rendered":"Las falsificaciones r\u00e1pidas de voz de VALL-E deber\u00edan preocuparte, si a\u00fan no estabas preocupado \u2022 TechCrunch"},"content":{"rendered":"
\n<\/p>\n
El surgimiento en la \u00faltima semana de un modelo de aprendizaje autom\u00e1tico de s\u00edntesis de voz particularmente efectivo llamado VALL-E ha provocado una nueva ola de preocupaci\u00f3n sobre la posibilidad de que las voces falsas profundas se vuelvan r\u00e1pidas y f\u00e1ciles, falsificaciones r\u00e1pidas, por as\u00ed decirlo. Pero VALL-E es m\u00e1s iterativo que innovador, y las capacidades no son tan nuevas como podr\u00eda pensar. Depende de usted si eso significa que deber\u00eda estar m\u00e1s o menos preocupado.<\/p>\n
La replicaci\u00f3n de voz ha sido objeto de intensas investigaciones durante a\u00f1os, y los resultados han sido lo suficientemente buenos como para impulsar muchas nuevas empresas, como WellSaid, Papercup y Respeecher. Este \u00faltimo incluso se est\u00e1 utilizando para crear reproducciones de voz autorizadas de actores como James Earl Jones. S\u00ed: a partir de ahora Darth Vader ser\u00e1 generado por IA.<\/p>\n
VALL-E, publicado en GitHub por sus creadores en Microsoft la semana pasada, es un \u00abmodelo de lenguaje de c\u00f3dec neuronal\u00bb que utiliza un enfoque diferente para representar voces que muchos antes. Su corpus de entrenamiento m\u00e1s grande y algunos m\u00e9todos nuevos le permiten crear un \u00abhabla personalizada de alta calidad\u00bb utilizando solo tres segundos de audio de un hablante de destino.<\/p>\n
Es decir, todo lo que necesita es un clip extremadamente corto como el siguiente (todos los clips del documento de Microsoft):<\/p>\n