Stability AI intenta mantenerse a la vanguardia con un nuevo modelo de IA generador de imágenes


El modelo más nuevo de Stability AI para la generación de imágenes es Cascada estable promete ser más rápido y más poderoso que su predecesor líder en la industria, Stable Diffusion, que es la base de muchas otras herramientas de inteligencia artificial de generación de texto a imagen.

Stable Cascade puede generar fotografías y ofrecer variaciones de la imagen exacta que creó, o intentar aumentar la resolución de una imagen existente. Otras funciones de edición de texto a imagen incluyen pintura interna y externa, donde el modelo editará solo una parte específica de la imagen, así como Canny Edge, donde los usuarios pueden crear una nueva foto simplemente usando los bordes de una imagen existente.

a: flotar]:text-gray-63 [&>a:hover]:sombra-subrayado-negro oscuro:[&>a:hover]:texto-gris-bd oscuro:[&>a:hover]:sombra-subrayado-gris [&>a]:sombra-subrayado-gris-63 oscuro:[&>a]:texto-gris-bd oscuro:[&>a]:shadow-underline-gray»>Imagen: Estabilidad AI

El nuevo modelo está disponible. en GitHub para investigadores pero no para uso comercial, y ofrece más opciones incluso cuando empresas como Google e incluso Apple lanzan sus propios modelos de generación de imágenes.

A diferencia de los modelos emblemáticos de Difusión Estable de Stability, Stable Cascade no es un modelo de lenguaje grande: son tres modelos diferentes que se basan en el arquitectura würstchenLa primera etapa, la etapa C, comprime las indicaciones de texto en latentes (o fragmentos de código más pequeños) que luego se pasan a las etapas A y B para decodificar la solicitud.

a: flotar]:text-gray-63 [&>a:hover]:sombra-subrayado-negro oscuro:[&>a:hover]:texto-gris-bd oscuro:[&>a:hover]:sombra-subrayado-gris [&>a]:sombra-subrayado-gris-63 oscuro:[&>a]:texto-gris-bd oscuro:[&>a]:shadow-underline-gray»>Estabilidad AI

Dividir las solicitudes en bits más pequeños comprime la solicitud para requerir menos memoria (y menos horas de entrenamiento). en esas GPU difíciles de encontrar) y corre más rápido. al mismo tiempo que funciona mejor “tanto en pronta alineación como en calidad estética”. Se necesitaron unos 10 segundos para crear una imagen, en comparación con los 22 segundos del modelo SDXL que se utiliza actualmente.

Stability AI ayudó a popularizar el método de difusión estable y también ha sido objeto de varias demandas que alegan que Stable Diffusion se entrenó en datos protegidos por derechos de autor sin el permiso de los titulares de derechos; está programada una demanda de Getty Images en el Reino Unido contra Stability AI. ir a juicio en diciembre. Comenzó a ofrecer licencias comerciales. a través de una suscripción en diciembre, que la compañía dijo que era necesario para ayudar a financiar su investigación.



Source link-37