{"id":1070570,"date":"2024-03-30T00:28:58","date_gmt":"2024-03-30T00:28:58","guid":{"rendered":"https:\/\/magazineoffice.com\/el-modelo-de-ia-de-clonacion-de-voz-de-openai-solo-necesita-una-muestra-de-15-segundos-para-funcionar\/"},"modified":"2024-03-30T00:29:01","modified_gmt":"2024-03-30T00:29:01","slug":"el-modelo-de-ia-de-clonacion-de-voz-de-openai-solo-necesita-una-muestra-de-15-segundos-para-funcionar","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/el-modelo-de-ia-de-clonacion-de-voz-de-openai-solo-necesita-una-muestra-de-15-segundos-para-funcionar\/","title":{"rendered":"El modelo de IA de clonaci\u00f3n de voz de OpenAI solo necesita una muestra de 15 segundos para funcionar"},"content":{"rendered":"


\n<\/p>\n

\n

OpenAI ofrece acceso limitado a una plataforma de generaci\u00f3n de texto a voz que desarroll\u00f3 llamada Voice Engine, que puede crear una voz sint\u00e9tica basada en un clip de 15 segundos de la voz de alguien. La voz generada por IA puede leer indicaciones de texto cuando se le ordena en el mismo idioma que el hablante o en varios otros idiomas. \u00abEstas implementaciones a peque\u00f1a escala est\u00e1n ayudando a informar nuestro enfoque, salvaguardas y pensamiento sobre c\u00f3mo Voice Engine podr\u00eda usarse para el bien en varias industrias\u00bb, OpenAI. dijo en su publicaci\u00f3n de blog<\/a>. <\/p>\n<\/div>\n

\n

Las empresas con acceso incluyen la empresa de tecnolog\u00eda educativa Age of Learning, la plataforma de narraci\u00f3n visual HeyGen, el fabricante de software de salud de primera l\u00ednea Dimagi, el creador de aplicaciones de comunicaci\u00f3n de inteligencia artificial Livox y el sistema de salud Lifespan.<\/p>\n<\/div>\n

\n

En estos ejemplos publicados por OpenAI, puedes escuchar lo que Era del aprendizaje<\/a> ha estado haciendo con la tecnolog\u00eda para generar contenido de voz en off preguionado, adem\u00e1s de leer en voz alta \u201crespuestas personalizadas en tiempo real\u201d a los estudiantes escritas por GPT-4.<\/p>\n<\/div>\n

\n

Primero, el audio de referencia en ingl\u00e9s:<\/p>\n<\/div>\n

\n

Y aqu\u00ed hay tres clips de audio generados por IA basados \u200b\u200ben esa muestra, <\/p>\n<\/div>\n

\n

OpenAI dijo que comenz\u00f3 a desarrollar Voice Engine a fines de 2022 y que la tecnolog\u00eda ya ha impulsado voces preestablecidas para la API de texto a voz y Funci\u00f3n de lectura en voz alta de ChatGPT<\/a>. En una entrevista con TechCrunch<\/em>, Jeff Harris, miembro del equipo de productos de OpenAI para Voice Engine, dijo que el modelo fue entrenado en \u00abuna combinaci\u00f3n de datos con licencia y disponibles p\u00fablicamente\u00bb. OpenAI dijo a la publicaci\u00f3n que el modelo s\u00f3lo estar\u00e1 disponible para unos 10 desarrolladores. <\/p>\n<\/div>\n

\n

La generaci\u00f3n de texto a audio con IA es un \u00e1rea de la IA generativa que contin\u00faa evolucionando. Si bien la mayor\u00eda se centra en sonidos instrumentales o naturales, menos se han centrado en la generaci\u00f3n de voz, en parte debido a las preguntas citadas por OpenAI. Algunos nombres en el espacio incluyen empresas como Podcastle y ElevenLabs, que proporcionan tecnolog\u00eda de clonaci\u00f3n de voz mediante IA y herramientas el Vergecast<\/em> explorado el a\u00f1o pasado<\/a>. <\/p>\n<\/div>\n

\n

Seg\u00fan OpenAI, sus socios acordaron cumplir con sus pol\u00edticas de uso que dicen que no utilizar\u00e1n Voice Generation para hacerse pasar por personas u organizaciones sin su consentimiento. Tambi\u00e9n requiere que los socios obtengan el \u201cconsentimiento expl\u00edcito e informado\u201d del hablante original, no creen formas para que los usuarios individuales creen sus propias voces y revelen a los oyentes que las voces son generadas por IA. OpenAI tambi\u00e9n agreg\u00f3 marca de agua<\/a> a los clips de audio para rastrear su origen y monitorear activamente c\u00f3mo se usa el audio. <\/p>\n<\/div>\n

\n

OpenAI sugiri\u00f3 varios pasos que cree que podr\u00edan limitar los riesgos en torno a herramientas como estas, incluida la eliminaci\u00f3n gradual de la autenticaci\u00f3n basada en voz para acceder a cuentas bancarias, pol\u00edticas para proteger el uso de las voces de las personas en la IA, una mayor educaci\u00f3n sobre los deepfakes de IA y el desarrollo de sistemas de seguimiento. de contenido de IA. <\/p>\n<\/div>\n


\n
Source link-37 <\/a><\/p>\n","protected":false},"excerpt":{"rendered":"

OpenAI ofrece acceso limitado a una plataforma de generaci\u00f3n de texto a voz que desarroll\u00f3 llamada Voice Engine, que puede crear una voz sint\u00e9tica basada en un clip de 15…<\/p>\n","protected":false},"author":1,"featured_media":823912,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[21980],"tags":[27662,4405,1488,739,1897,49133,107,13128,1126,73,3869],"_links":{"self":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1070570"}],"collection":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/comments?post=1070570"}],"version-history":[{"count":1,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1070570\/revisions"}],"predecessor-version":[{"id":1070571,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1070570\/revisions\/1070571"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media\/823912"}],"wp:attachment":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media?parent=1070570"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/categories?post=1070570"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/tags?post=1070570"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}