Anuncio publicitario <\/span> <\/p>\n<\/aside>\nCuando se le pregunt\u00f3 qu\u00e9 tipo espec\u00edfico de IA impulsa la transformaci\u00f3n de voz de Recast bajo el cap\u00f3, Near retuvo los detalles, pero generaliz\u00f3 c\u00f3mo funciona: \u00abPodemos sumergirnos y alterar las caracter\u00edsticas de las voces dentro del espacio de incrustaci\u00f3n que hemos creado. Nuestro El objetivo, entonces, es modificar las partes del audio que corresponden al estilo o timbre personal de un hablante mientras se preservan las partes del audio que corresponden al contenido hablado, como la prosodia y las palabras. Esto nos permite cambiar el estilo de la voz de alguien para cualquier otro estilo, incluido su g\u00e9nero percibido, edad, etnia, etc.<\/p>\n
Recast admite 10 voces diferentes y hay m\u00e1s en camino. \u00abActualmente no est\u00e1 decidido si ofreceremos voces existentes de celebridades u otras personas conocidas\u00bb, dijo Near.<\/p>\n
Sin embargo, ofrecer voces de celebridades (o aquellas que imitan a personas vivas que no son celebridades) puede plantear cuestiones \u00e9ticas y legales. Cuando se le pregunt\u00f3 sobre el posible uso indebido de Recast, Near respondi\u00f3: \u00abAl igual que con cualquier tecnolog\u00eda, es posible que haya tanto aspectos positivos como negativos, pero creo que la gran mayor\u00eda de la humanidad est\u00e1 formada por personas maravillosas y se beneficiar\u00e1n enormemente de esto\u00bb. Near tambi\u00e9n se\u00f1al\u00f3 que Recast incluye una pol\u00edtica de T\u00e9rminos de servicio que proh\u00edbe el uso ilegal y odioso.<\/p>\n
En cuanto a la l\u00ednea de tiempo de lanzamiento, Near est\u00e1 buscando opciones comerciales, pero no descarta un lanzamiento de c\u00f3digo abierto, que podr\u00eda tener un impacto similar a Stable Diffusion al poner audios falsos realistas en manos de muchos sin restricciones estrictas. \u00abEstamos explorando algunas estrategias de monetizaci\u00f3n\u00bb, dijo Near. \u00abSi los modelos de ganancias que tengo en mente no funcionan, el c\u00f3digo abierto de esta tecnolog\u00eda puede ser una opci\u00f3n en el futuro\u00bb.<\/p>\n
A medida que la tecnolog\u00eda de aprendizaje profundo contin\u00faa eliminando el concepto del siglo XX (o algunos podr\u00edan decir \u00abilusi\u00f3n\u00bb) de los medios como un registro fijo y preciso de la realidad, estamos viendo un futuro cercano en el que las representaciones digitales de la voz de un ser humano vivo, al igual que las im\u00e1genes y los videos, ser\u00e1 una cosa m\u00e1s que no puede tomar al pie de la letra sin una confianza significativa en la fuente. A\u00fan as\u00ed, la tecnolog\u00eda podr\u00eda empoderar a muchas personas que de otro modo ser\u00edan discriminadas mientras hacen negocios, o simplemente se divierten, en l\u00ednea.<\/p>\n<\/p><\/div>\n