{"id":352767,"date":"2022-12-16T09:41:20","date_gmt":"2022-12-16T09:41:20","guid":{"rendered":"https:\/\/magazineoffice.com\/ai-image-generator-tambien-puede-producir-musica-con-resultados-de-otro-mundo\/"},"modified":"2022-12-16T09:41:22","modified_gmt":"2022-12-16T09:41:22","slug":"ai-image-generator-tambien-puede-producir-musica-con-resultados-de-otro-mundo","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/ai-image-generator-tambien-puede-producir-musica-con-resultados-de-otro-mundo\/","title":{"rendered":"AI Image Generator tambi\u00e9n puede producir m\u00fasica (con resultados de otro mundo)"},"content":{"rendered":"


\n<\/p>\n

\n

Aparentemente, los generadores de im\u00e1genes de IA pueden hacer m\u00e1s que generar arte profesional. Un par de compa\u00f1eros de banda est\u00e1n usando los mismos algoritmos para crear m\u00fasica.<\/p>\n

El proyecto, llamado Riffusion, est\u00e1 utilizando la generaci\u00f3n de texto a imagen de IA para producir espectrogramas, o representaciones visuales de m\u00fasica, que luego se pueden convertir en clips de audio. <\/p>\n

La IA entrena algoritmos inform\u00e1ticos para reconocer im\u00e1genes de objetos y lugares, y los utiliza para replicar im\u00e1genes similares. Los programas que incluyen DALL-E 2, Midjourney y Stable Diffusion son tan expertos en la generaci\u00f3n de im\u00e1genes que pueden intentar visualizar cualquier cosa que desee a trav\u00e9s de varios estilos art\u00edsticos, basados \u200b\u200ben un simple mensaje de texto. <\/p>\n

La generaci\u00f3n de im\u00e1genes inspir\u00f3 al desarrollador de software Seth Forsgren y al especialista en rob\u00f3tica Hayk Martiros para ver si los mismos programas de inteligencia artificial podr\u00edan aplicarse al \u00e1mbito del audio. \u201cHayk y yo tocamos juntos en una peque\u00f1a banda, y comenzamos el proyecto simplemente porque amamos la m\u00fasica\u201d, dice Forsgren a PCMag. \u201cAl ver los incre\u00edbles resultados de Stable Diffusion para la generaci\u00f3n de im\u00e1genes, nos preguntamos c\u00f3mo ser\u00eda usar un enfoque de difusi\u00f3n para crear m\u00fasica\u201d.<\/p>\n

\n<\/p>\n

(Cr\u00e9dito: rifa)
\n<\/small>\n<\/p>\n

Para averiguarlo, los dos entrenaron el Stable Diffusion de c\u00f3digo abierto en im\u00e1genes de espectrogramas emparejados con texto. Luego, el programa pudo producir espectrogramas de m\u00fasica basados \u200b\u200b\u200b\u200ben un mensaje dado.<\/p>\n

\u201cAl principio no sab\u00edamos si ser\u00eda posible que la arquitectura del modelo Stable Diffusion creara una imagen de espectrograma con suficiente fidelidad para convertirla en audio, pero resulta que puede hacer eso y m\u00e1s\u201d, dice Forgren. \u201cEn cada paso del camino nos ha impresionado cada vez m\u00e1s lo que es posible, y una idea lleva a la siguiente\u201d.<\/p>\n

\"El<\/p>\n

\n<\/p>\n

(Cr\u00e9dito: rifa)
\n<\/small>\n<\/p>\n

Forsgren y Martiros publican sus resultados(Se abre en una nueva ventana)<\/span> en el sitio web de Riffusion, que pretende ser un proyecto de pasatiempo. Pero lo m\u00e1s importante, los visitantes del sitio pueden conectar sus propios avisos de texto(Se abre en una nueva ventana)<\/span>y Riffusion producir\u00e1 un espectrograma de su solicitud, que se reproducir\u00e1 en el sitio como un clip de audio. <\/p>\n

Adem\u00e1s, el programa puede crear nuevas variaciones del espectrograma a medida que lo escuchas. Aqu\u00ed hay un ejemplo de Riffusion tratando de crear un \u00abevangelio \u00e1rabe\u00bb.<\/p>\n

Los resultados son sorprendentemente buenos. Disfrutamos de este fragmento de jazz, que se produjo con el mensaje: \u00abl\u00ednea de bajo funk con un solo de saxof\u00f3n de jazz\u00bb.<\/p>\n

Riffusion tambi\u00e9n puede intentar replicar canciones, incluyendo K-Pop o un \u00abrap de ira estilo Eminem\u00bb.(Se abre en una nueva ventana)<\/span>\u00absin la letra. En cambio, las melod\u00edas presentar\u00e1n un galimat\u00edas mel\u00f3dico con un sonido humano que a\u00fan coincide con el tono general de la canci\u00f3n. <\/p>\n

\n
\n

Recomendado por Nuestros Editores<\/h3>\n<\/div>\n<\/div>\n

Por ejemplo, a continuaci\u00f3n hay una \u00abbalada de fantas\u00eda, voz femenina\u00bb que se transforma en una melod\u00eda de \u00abestrella del pop adolescente\u00bb. Para nosotros, la canci\u00f3n resultante suena humana y alien\u00edgena al mismo tiempo. <\/p>\n

Forsgren dice que la letra del programa puede sonar \u00abun poco de otro mundo\u00bb. Otra limitaci\u00f3n \u00abes que el modelo a\u00fan no est\u00e1 dise\u00f1ado para comprender la estructura de la canci\u00f3n de nivel superior, como si no intentara repetir coros ni nada por el estilo. Podr\u00edas imaginar construir un modelo abstracto encima de este para hacer eso\u00bb.<\/p>\n

Entonces, la tecnolog\u00eda no puede reemplazar la m\u00fasica creada por humanos. Pero el proyecto muestra que los algoritmos de imagen de IA pueden tener un gran potencial desbloqueado para otros fines, incluida la posibilidad de ofrecer algo de inspiraci\u00f3n a los creadores de m\u00fasica. Forsgren y Martiros hicieron p\u00fablico Riffusion el jueves, y muchos usuarios ya est\u00e1n revisando su proyecto. <\/p>\n

\u201cEstamos viendo una gran cantidad de tr\u00e1fico en el sitio web; ha sido un esfuerzo vertiginoso mantener suficientes GPU en funcionamiento para atender todas las solicitudes, pero estamos teniendo un d\u00eda divertido\u201d, dice Forsgren. Por lo tanto, el sitio de Riffusion puede tener dificultades para procesar su solicitud debido a la carga de tr\u00e1fico. Sin embargo, los dos tambi\u00e9n publicaron el c\u00f3digo de su proyecto en GitHub.(Se abre en una nueva ventana)<\/span>. <\/p>\n

\n
\n

\u00a1Obtenga nuestras mejores historias!<\/h4>\n

Matricularse en \u00bfQu\u00e9 hay de nuevo ahora?<\/strong> para recibir nuestras mejores historias en su bandeja de entrada todas las ma\u00f1anas.<\/p>\n

Este bolet\u00edn puede contener publicidad, ofertas o enlaces de afiliados. Suscribirse a un bolet\u00edn informativo indica su consentimiento a nuestros T\u00e9rminos de uso y Pol\u00edtica de privacidad. Puede darse de baja de los boletines en cualquier momento.<\/p>\n<\/p><\/div>\n<\/div>\n<\/div>\n