“Demasiado fácil”: Midjourney prueba una nueva y espectacular versión de su generador de imágenes de IA


Agrandar / Ocho imágenes que generamos con la versión alfa de Midjourney v4.

Ars Technica

El sábado, el servicio de imágenes de IA Midjourney comenzó la prueba alfa de la versión 4 («v4») de su modelo de síntesis de texto a imagen, que está disponible para suscriptores en su servidor Discord. El nuevo modelo brinda más detalles que los disponibles anteriormente en el servicio, lo que inspiró a algunos artistas de IA a comentar que v4 casi hace que sea «demasiado fácil» obtener resultados de alta calidad a partir de indicaciones simples.

Midjourney se abrió al público en marzo como parte de una ola temprana de modelos de síntesis de imágenes de IA. Rápidamente ganó muchos seguidores debido a su estilo distintivo y por estar disponible públicamente antes que DALL-E y Stable Diffusion. En poco tiempo, las obras de arte creadas por Midjourney llegaron a las noticias al ganar concursos de arte, proporcionar material para registros de derechos de autor potencialmente históricos y aparecer en sitios web de ilustraciones de archivo (que luego fueron prohibidos).

Con el tiempo, Midjourney perfeccionó su modelo con más capacitación, nuevas características y mayor detalle. El modelo predeterminado actual, conocido como «v3», debutó en agosto. Ahora, Midjourney v4 está siendo puesto a prueba por miles de miembros del servidor Discord del servicio que crean imágenes a través del bot Midjourney. Actualmente, los usuarios pueden probar v4 agregando «–v 4» a sus indicaciones.

«V4 es una base de código completamente nueva y una arquitectura de IA totalmente nueva», escribió el fundador de Midjourney, David Holz, en un anuncio de Discord. «Es nuestro primer modelo entrenado en un nuevo supercúmulo de IA de Midjourney y ha estado en proceso durante más de 9 meses».

Salida de comparación entre Midjourney v3 (izquierda) y v4 (derecha) con el aviso
Agrandar / Salida de comparación entre Midjourney v3 (izquierda) y v4 (derecha) con el mensaje «un bárbaro musculoso con armas al lado de un televisor CRT, cinematográfico, 8K, iluminación de estudio».

Ars Technica

En nuestras pruebas del modelo v4 de Midjourney, encontramos que proporciona una cantidad mucho mayor de detalles que v3, una mejor comprensión de las indicaciones, mejores composiciones de escena y, a veces, mejor proporcionalidad en sus temas. Cuando buscamos imágenes fotorrealistas, algunos resultados que hemos visto pueden ser difíciles de distinguir de las fotos reales con resoluciones más bajas.

Según Holz, otras características de v4 incluyen:

– Mucho más conocimiento (de criaturas, lugares y más)
– Mucho mejor para acertar con los pequeños detalles (en todas las situaciones)
– Maneja indicaciones más complejas (con múltiples niveles de detalle)
– Mejor con escenas multi-objeto/multi-personaje
– Admite funciones avanzadas como indicaciones de imágenes y múltiples indicaciones
– Admite –chaos arg (configúrelo de 0 a 100) para controlar la variedad de cuadrículas de imágenes

La reacción a Midjourney v4 ha sido positiva en Discord del servicio, y los fanáticos de otros modelos de síntesis de imágenes, que regularmente luchan con indicaciones complejas para obtener buenos resultados, están tomando nota.

Un usuario de Reddit llamado Jon Bristow publicó en la comunidad r/StableDiffusion: «¿Alguien más siente que Midjourney v4 es ‘demasiado fácil’? Esta fue una ‘fotografía de primer plano de una cara’ y parece que no lo lograste. Me gusta estaba prefabricado». En respuesta, alguien bromeó: «Triste por los apuntadores profesionales que perderán su nuevo trabajo creado hace un mes».

Midjourney dice que v4 todavía está en alfa, por lo que continuará corrigiendo las peculiaridades del nuevo modelo con el tiempo. La compañía planea aumentar la resolución y la calidad de las imágenes mejoradas de v4, agregando relaciones de aspecto personalizadas (como v3), aumentando la nitidez de la imagen y reduciendo los artefactos de texto. Midjourney está disponible por una tarifa de suscripción mensual que oscila entre US $ 10 y $ 50 por mes.

Teniendo en cuenta el progreso que Midjourney ha logrado durante ocho meses de trabajo, nos preguntamos qué traerá el progreso del próximo año en la síntesis de imágenes.

Ir a debate…



Source link-49