“Impresionante”: la actualización de Midjourney sorprende a los artistas de IA con una función similar a una cámara


Agrandar / Midjourney 5.2 permite «alejar» las imágenes sintetizadas. La imagen sintética original se muestra aquí en el cuadro de puntos rojos.

a mitad de camino

El jueves, Midjourney presentó la versión 5.2 de su modelo de síntesis de imágenes impulsado por IA, que incluye una nueva función de «alejar» que permite mantener una imagen central sintetizada mientras construye automáticamente una escena más grande a su alrededor, simulando alejarse con una lente de cámara.

Similar a la pintura exterior, una técnica de imágenes de IA introducida por DALL-E 2 de OpenAI en agosto de 2022, la función de alejamiento de Midjourney puede tomar una imagen generada por IA existente y expandir sus bordes mientras mantiene su sujeto original centrado en la nueva imagen. Pero a diferencia de DALL-E y la función de relleno generativo de Photoshop, no puede seleccionar una imagen personalizada para expandirla. Por el momento, el zoom-out de v5.2 solo funciona en imágenes generadas dentro de Midjourney, un servicio de generación de imágenes de IA por suscripción.

En el servidor Midjourney Discord (todavía la interfaz oficial de Midjourney, aunque hay planes en marcha para cambiar eso), los usuarios pueden experimentar con el alejamiento generando cualquier imagen v5.2 (ahora la predeterminada) y escalando un resultado. Después de eso, aparecen botones especiales de «Zoom» debajo de la salida. Puede alejar por un factor de 1,5x, 2x o un valor personalizado entre 1 y 2. Otro botón, llamado «Hacer cuadrado», generará material alrededor de la imagen existente de una manera que crea una relación de aspecto cuadrada de 1:1 .

David Holz, el creador de Midjourney, anunció las nuevas funciones y mejoras v5.2 en el servidor de Discord el jueves por la noche. Además de «alejar», las adiciones más significativas incluyen un sistema estético revisado, que promete una mejor calidad de imagen y un comando «–estilizar» más fuerte que influye de manera efectiva en el aspecto no realista de una imagen. También hay un nuevo «modo de alta variación», activado de forma predeterminada, que aumenta la variedad de composición entre las generaciones de imágenes. Además, un nuevo comando «/ acortar» permite a los usuarios evaluar las indicaciones en un intento de recortar palabras no esenciales.

A pesar del lanzamiento inmediato de v5.2, Holz enfatizó en su anuncio que los cambios pueden ocurrir sin previo aviso. Las versiones anteriores del modelo Midjourney todavía están disponibles usando el comando «/settings» o el argumento de comando en línea «–v 5.1».

Una comparación entre la salida de Midjourney v3 (izquierda), v4 (centro-izquierda), v5 (centro-derecha) y v5.2 (derecha) con el indicador
Agrandar / Una comparación entre la salida de Midjourney v3 (izquierda), v4 (centro-izquierda), v5 (centro-derecha) y v5.2 (derecha) con el mensaje «un bárbaro musculoso con armas al lado de un televisor CRT, cinematográfico, 8K , iluminación de estudio».

a mitad de camino

Para los fanáticos de esta nueva forma de arte de síntesis de imágenes que a veces se llama «sintografía» por defensores como Julie Wieland, los cambios en v5.2 son bienvenidos, y algunos usuarios de Midjourney los llaman «impresionante» y «alucinante«, que no son superlativos inusuales en el mundo de la IA en este momento. Pero los fanáticos probablemente argumentarán que las mejoras visuales de Midjourney justifican el asombro reacciones entre ellos.

La última actualización es parte de una serie de mejoras de calidad desde marzo de 2022, cuando el modelo generó imágenes relativamente mal definidas que carecían de detalles. Más recientemente, Midjourney presentó la versión 5.0 en marzo y la versión 5.1 en mayo de este año, las cuales mejoraron el realismo y el detalle de la imagen. La introducción de la serie de modelos v5 permitió la creación de imágenes realistas del Papa Francisco y Donald Trump que despertaron preocupaciones sobre las falsificaciones profundas en las redes sociales.

A pesar del entusiasmo por las nuevas funciones entre los entusiastas de Midjourney, la síntesis de imágenes sigue siendo muy controvertida entre algunos artistas debido a cómo se entrenan estos sistemas de inteligencia artificial, utilizando millones de imágenes extraídas de la web sin consulta, crédito o permiso del artista. Midjourney nunca ha revelado oficialmente el contenido exacto de sus datos de entrenamiento. Adobe está intentando seguir un camino más ético con Firefly, pero Venture Beat informó recientemente que el consentimiento activo del artista sigue siendo marginal.

Por ahora, es difícil no apreciar los avances técnicos reveladores de Midjourney y al mismo tiempo preguntarse si existe un camino más ético para esta tecnología, uno que complazca a los artistas, tanto tradicionales como sintógrafos.





Source link-49