\n<\/aside>\n<\/p>\n
La s\u00edntesis de voz ha recorrido un largo camino desde el juguete Speak & Spell de 1978, que alguna vez cautiv\u00f3 a la gente con su capacidad de \u00faltima generaci\u00f3n para leer palabras en voz alta usando una voz electr\u00f3nica. Ahora, utilizando modelos de inteligencia artificial de aprendizaje profundo, el software puede crear no solo voces que suenan realistas, sino tambi\u00e9n imitar de manera convincente voces existentes utilizando peque\u00f1as muestras de audio.<\/p>\n
En ese sentido, OpenAI acaba de anunciar Voice Engine, un modelo de inteligencia artificial de texto a voz para crear voces sint\u00e9ticas basadas en un segmento de audio grabado de 15 segundos. Ha proporcionado muestras de audio del Voice Engine en acci\u00f3n en su sitio web.<\/p>\n
Una vez que se clona una voz, un usuario puede ingresar texto en Voice Engine y obtener un resultado de voz generado por IA. Pero OpenAI a\u00fan no est\u00e1 listo para lanzar ampliamente su tecnolog\u00eda. Inicialmente, la compa\u00f1\u00eda plane\u00f3 lanzar un programa piloto para que los desarrolladores se registraran en la API Voice Engine a principios de este mes. Pero despu\u00e9s de considerar m\u00e1s a fondo las implicaciones \u00e9ticas, la empresa decidi\u00f3 reducir sus ambiciones por ahora.<\/p>\n
\u00abEn l\u00ednea con nuestro enfoque hacia la seguridad de la IA y nuestros compromisos voluntarios, estamos eligiendo una vista previa, pero no lanzar ampliamente esta tecnolog\u00eda en este momento\u00bb, escribe la compa\u00f1\u00eda. \u00abEsperamos que esta vista previa de Voice Engine destaque su potencial y tambi\u00e9n motive la necesidad de reforzar la resiliencia de la sociedad frente a los desaf\u00edos que plantean modelos generativos cada vez m\u00e1s convincentes\u00bb.<\/p>\n\n Anuncio <\/span> <\/p>\n<\/aside>\nLa tecnolog\u00eda de clonaci\u00f3n de voz en general no es particularmente nueva: hemos cubierto varios modelos de s\u00edntesis de voz con IA desde 2022 y la tecnolog\u00eda est\u00e1 activa en la comunidad de c\u00f3digo abierto con paquetes como OpenVoice y XTTSv2. Pero la idea de que OpenAI est\u00e9 avanzando poco a poco hacia permitir que cualquiera use su marca particular de tecnolog\u00eda de voz es notable. Y en cierto modo, la reticencia de la empresa a publicarlo en su totalidad podr\u00eda ser la historia m\u00e1s importante.<\/p>\n
OpenAI dice que los beneficios de su tecnolog\u00eda de voz incluyen brindar asistencia de lectura a trav\u00e9s de voces que suenan naturales, permitir un alcance global para los creadores al traducir contenido mientras se preservan los acentos nativos, apoyar a las personas no verbales con opciones de habla personalizadas y ayudar a los pacientes a recuperar su propia voz despu\u00e9s. condiciones que afectan el habla.<\/p>\n
Pero tambi\u00e9n significa que cualquier persona con 15 segundos de la voz grabada de alguien podr\u00eda clonarla efectivamente, y eso tiene implicaciones obvias para un posible uso indebido. Incluso si OpenAI nunca lanza ampliamente su motor de voz, la capacidad de clonar voces ya ha causado problemas en la sociedad a trav\u00e9s de estafas telef\u00f3nicas en las que alguien imita la voz de un ser querido y llamadas autom\u00e1ticas de campa\u00f1as electorales con voces clonadas de pol\u00edticos como Joe Biden.<\/p>\n
Adem\u00e1s, investigadores y periodistas han demostrado que la tecnolog\u00eda de clonaci\u00f3n de voz se puede utilizar para acceder a cuentas bancarias que utilizan autenticaci\u00f3n de voz (como el Voice ID de Chase), lo que llev\u00f3 al senador Sherrod Brown (dem\u00f3crata por Ohio), presidente del Senado de Estados Unidos. Comit\u00e9 de Banca, Vivienda y Asuntos Urbanos, enviar\u00e1 una carta a los directores ejecutivos de varios bancos importantes en mayo de 2023 para preguntar sobre las medidas de seguridad que est\u00e1n tomando los bancos para contrarrestar los riesgos impulsados \u200b\u200bpor la IA.<\/p>\n<\/p><\/div>\n
\nSource link-49<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"La s\u00edntesis de voz ha recorrido un largo camino desde el juguete Speak & Spell de 1978, que alguna vez cautiv\u00f3 a la gente con su capacidad de \u00faltima generaci\u00f3n…<\/p>\n","protected":false},"author":1,"featured_media":1071058,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[21980],"tags":[27662,478,5474,66333,18552,349,49133,4460,15,4491,2219,3869],"_links":{"self":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1071057"}],"collection":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/comments?post=1071057"}],"version-history":[{"count":1,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1071057\/revisions"}],"predecessor-version":[{"id":1071059,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1071057\/revisions\/1071059"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media\/1071058"}],"wp:attachment":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media?parent=1071057"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/categories?post=1071057"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/tags?post=1071057"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}