{"id":395876,"date":"2023-01-10T17:48:26","date_gmt":"2023-01-10T17:48:26","guid":{"rendered":"https:\/\/magazineoffice.com\/esta-ia-puede-suplantar-tu-voz-despues-de-solo-tres-segundos\/"},"modified":"2023-01-10T17:48:28","modified_gmt":"2023-01-10T17:48:28","slug":"esta-ia-puede-suplantar-tu-voz-despues-de-solo-tres-segundos","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/esta-ia-puede-suplantar-tu-voz-despues-de-solo-tres-segundos\/","title":{"rendered":"Esta IA puede suplantar tu voz despu\u00e9s de solo tres segundos"},"content":{"rendered":"


\n<\/p>\n

\n

La inteligencia artificial (IA) est\u00e1 teniendo un momento en este momento, y el viento sigue soplando con la noticia de que Microsoft est\u00e1 trabajando en una IA que puede imitar la voz de cualquier persona despu\u00e9s de recibir una breve muestra de tres segundos.<\/p>\n

La nueva herramienta, denominada VALL-E, ha sido entrenada en aproximadamente 60.000 horas de datos de voz en ingl\u00e9s, que seg\u00fan Microsoft es \u00abcientos de veces m\u00e1s grande que los sistemas existentes\u00bb. Usando ese conocimiento, sus creadores afirman que solo necesita una peque\u00f1a cantidad de informaci\u00f3n vocal para comprender c\u00f3mo replicar la voz de un usuario.<\/p>\n

Fizkes\/Shutterstock<\/span><\/figcaption><\/figure>\n

M\u00e1s impresionante, VALL-E puede reproducir las emociones, los tonos vocales y el entorno ac\u00fastico que se encuentran en cada muestra, algo con lo que otros programas de IA de voz han tenido problemas. Eso le da un aura m\u00e1s realista y acerca sus resultados a algo que podr\u00eda pasar como un habla humana genuina.<\/p>\n

Cuando se compara con otros competidores de texto a voz (TTS), Microsoft dice que VALL-E \u00absupera significativamente al sistema TTS de disparo cero de \u00faltima generaci\u00f3n en t\u00e9rminos de naturalidad del habla y similitud del hablante\u00bb. En otras palabras, VALL-E suena mucho m\u00e1s como humanos reales que las IA rivales que encuentran entradas de audio en las que no han sido entrenados.<\/p>\n

En GitHub, Microsoft ha creado una peque\u00f1a biblioteca de muestras creadas con VALL-E. Los resultados son en su mayor\u00eda muy impresionantes, con muchas muestras que reproducen la cadencia y el acento de las voces de los oradores. Algunos de los ejemplos son menos convincentes, lo que indica que VALL-E probablemente no sea un producto terminado, pero en general el resultado es convincente.<\/p>\n

Enorme potencial y riesgos<\/h2>\n
\"Una
Microsoft\/Unsplash<\/span><\/figcaption><\/figure>\n

En un documento que presenta VALL-E, Microsoft explica que VALL-E \u00abpuede conllevar riesgos potenciales en el uso indebido del modelo, como falsificar la identificaci\u00f3n de voz o hacerse pasar por un hablante espec\u00edfico\u00bb. Una herramienta tan capaz para generar un discurso que suene realista plantea el espectro de falsificaciones profundas cada vez m\u00e1s convincentes, que podr\u00edan usarse para imitar cualquier cosa, desde una ex pareja rom\u00e1ntica hasta una personalidad internacional prominente.<\/p>\n

Para mitigar esa amenaza, Microsoft dice que \u00abes posible construir un modelo de detecci\u00f3n para discriminar si un clip de audio fue sintetizado por VALL-E\u00bb. La compa\u00f1\u00eda dice que tambi\u00e9n utilizar\u00e1 sus propios principios de IA al desarrollar su trabajo. Esos principios cubren \u00e1reas como la equidad, la seguridad, la privacidad y la responsabilidad.<\/p>\n

VALL-E es solo el \u00faltimo ejemplo de la experimentaci\u00f3n de Microsoft con la IA. Recientemente, la compa\u00f1\u00eda ha estado trabajando en la integraci\u00f3n de ChatGPT en Bing, usando IA para recapitular las reuniones de Teams e injertando herramientas avanzadas en aplicaciones como Outlook, Word y PowerPoint. Y seg\u00fan Semafor, Microsoft est\u00e1 buscando invertir $ 10 mil millones en OpenAI, el fabricante de ChatGPT, una compa\u00f1\u00eda en la que ya ha invertido importantes fondos.<\/p>\n

A pesar de los aparentes riesgos, herramientas como VALL-E podr\u00edan ser especialmente \u00fatiles en medicina, por ejemplo, para ayudar a las personas a recuperar la voz despu\u00e9s de un accidente. Ser capaz de replicar el habla con un conjunto de entrada tan peque\u00f1o podr\u00eda ser inmensamente prometedor en estas situaciones, siempre que se haga correctamente. Pero con todo el dinero que se gasta en IA, tanto por parte de Microsoft como de otros, est\u00e1 claro que no desaparecer\u00e1 pronto.<\/p>\n