La próxima versión de Stable Diffusion no producirá manos de espagueti


La próxima versión del generador de imágenes de IA basado en indicaciones, Stable Diffusion, producirá imágenes más fotorrealistas y será mejor para hacer manos. SDXL 0.9, una continuación de Stable Diffusion XL, «produce una imagen y un detalle de composición enormemente mejorados en comparación con su predecesor», según Stability AI. El anuncio apareció en una publicación de blog eliminada desde entonces y fue informado por Bloomberg.

Stability AI describe el nuevo modelo como «un salto en los casos de uso creativo para las imágenes generativas de IA». Las imágenes de muestra incluidas en la publicación del blog revelaron avances al usar las mismas indicaciones en Stable Diffusion XL beta y SDXL 0.9. Las imágenes generadas con el modelo más nuevo, incluidos extraterrestres, un lobo y una persona que sostiene una taza de café, parecen mostrar detalles más finos y manos más convincentes. Las manos eran un «indicador» fácil para detectar el arte generado por IA, al menos hasta Midjourney v5, una plataforma rival que se ejecuta en Discord, lanzada en marzo.

Estabilidad IA

“A pesar de su capacidad para ejecutarse en una computadora doméstica estándar, SDXL 0.9 presenta un salto en los casos de uso creativo para imágenes de IA generativa”, dijo Stability AI. “La capacidad de generar creaciones hiperrealistas para películas, televisión, música y videos instructivos, además de ofrecer avances para el diseño y el uso industrial, coloca a SDXL a la vanguardia de las aplicaciones del mundo real para imágenes de IA”.

Stability AI escribe que el «aumento significativo en el recuento de parámetros (la suma de todos los pesos y sesgos en la red neuronal en la que se entrena el modelo)» del nuevo modelo permite obtener mejores resultados. Ejecutar SDXL 0.9 localmente en una PC requerirá un mínimo de 16 GB de RAM y una tarjeta gráfica GeForce RTX 20 (o superior) con 8 GB de VRAM. Es compatible con Windows 11/10 y Linux.

Imágenes de muestra en pantalla dividida de una foto de un lobo generada por IA
Izquierda: SDXL Beta, Derecha: SDXL 0.9

Estabilidad IA

Según la publicación del blog eliminada, el modelo pronto estará disponible en la herramienta web Clipdrop de Stability AI y se agregará a la aplicación DreamStudio de la startup. La startup dice que la versión de código abierto de SDXL 1.0 llegará a mediados de julio.



Source link-47