{"id":352767,"date":"2022-12-16T09:41:20","date_gmt":"2022-12-16T09:41:20","guid":{"rendered":"https:\/\/magazineoffice.com\/ai-image-generator-tambien-puede-producir-musica-con-resultados-de-otro-mundo\/"},"modified":"2022-12-16T09:41:22","modified_gmt":"2022-12-16T09:41:22","slug":"ai-image-generator-tambien-puede-producir-musica-con-resultados-de-otro-mundo","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/ai-image-generator-tambien-puede-producir-musica-con-resultados-de-otro-mundo\/","title":{"rendered":"AI Image Generator tambi\u00e9n puede producir m\u00fasica (con resultados de otro mundo)"},"content":{"rendered":"
\n<\/p>\n
Aparentemente, los generadores de im\u00e1genes de IA pueden hacer m\u00e1s que generar arte profesional. Un par de compa\u00f1eros de banda est\u00e1n usando los mismos algoritmos para crear m\u00fasica.<\/p>\n
El proyecto, llamado Riffusion, est\u00e1 utilizando la generaci\u00f3n de texto a imagen de IA para producir espectrogramas, o representaciones visuales de m\u00fasica, que luego se pueden convertir en clips de audio. <\/p>\n
La IA entrena algoritmos inform\u00e1ticos para reconocer im\u00e1genes de objetos y lugares, y los utiliza para replicar im\u00e1genes similares. Los programas que incluyen DALL-E 2, Midjourney y Stable Diffusion son tan expertos en la generaci\u00f3n de im\u00e1genes que pueden intentar visualizar cualquier cosa que desee a trav\u00e9s de varios estilos art\u00edsticos, basados \u200b\u200ben un simple mensaje de texto. <\/p>\n
La generaci\u00f3n de im\u00e1genes inspir\u00f3 al desarrollador de software Seth Forsgren y al especialista en rob\u00f3tica Hayk Martiros para ver si los mismos programas de inteligencia artificial podr\u00edan aplicarse al \u00e1mbito del audio. \u201cHayk y yo tocamos juntos en una peque\u00f1a banda, y comenzamos el proyecto simplemente porque amamos la m\u00fasica\u201d, dice Forsgren a PCMag. \u201cAl ver los incre\u00edbles resultados de Stable Diffusion para la generaci\u00f3n de im\u00e1genes, nos preguntamos c\u00f3mo ser\u00eda usar un enfoque de difusi\u00f3n para crear m\u00fasica\u201d.<\/p>\n
\n<\/p>\n
(Cr\u00e9dito: rifa)
\n<\/small>\n<\/p>\n
Para averiguarlo, los dos entrenaron el Stable Diffusion de c\u00f3digo abierto en im\u00e1genes de espectrogramas emparejados con texto. Luego, el programa pudo producir espectrogramas de m\u00fasica basados \u200b\u200b\u200b\u200ben un mensaje dado.<\/p>\n
\u201cAl principio no sab\u00edamos si ser\u00eda posible que la arquitectura del modelo Stable Diffusion creara una imagen de espectrograma con suficiente fidelidad para convertirla en audio, pero resulta que puede hacer eso y m\u00e1s\u201d, dice Forgren. \u201cEn cada paso del camino nos ha impresionado cada vez m\u00e1s lo que es posible, y una idea lleva a la siguiente\u201d.<\/p>\n
<\/p>\n
\n<\/p>\n
(Cr\u00e9dito: rifa)
\n<\/small>\n<\/p>\n
Forsgren y Martiros publican sus resultados(Se abre en una nueva ventana)<\/span> en el sitio web de Riffusion, que pretende ser un proyecto de pasatiempo. Pero lo m\u00e1s importante, los visitantes del sitio pueden conectar sus propios avisos de texto(Se abre en una nueva ventana)<\/span>y Riffusion producir\u00e1 un espectrograma de su solicitud, que se reproducir\u00e1 en el sitio como un clip de audio. <\/p>\n Adem\u00e1s, el programa puede crear nuevas variaciones del espectrograma a medida que lo escuchas. Aqu\u00ed hay un ejemplo de Riffusion tratando de crear un \u00abevangelio \u00e1rabe\u00bb.<\/p>\n