El nuevo generador de imágenes con IA de Meta se entrenó en 1.100 millones de fotos de Instagram y Facebook


Agrandar / Tres imágenes generadas por «Imagine with Meta AI» utilizando el modelo Emu AI.

Meta | Benj Edwards

El miércoles, Meta lanzó un sitio web independiente y gratuito de generación de imágenes de IA, «Imagine with Meta AI», basado en su modelo de síntesis de imágenes Emu. Meta utilizó 1.100 millones de imágenes públicamente visibles de Facebook e Instagram para entrenar el modelo de IA, que puede representar una imagen novedosa a partir de un mensaje escrito. Anteriormente, la versión Meta de esta tecnología, que utilizaba los mismos datos, solo estaba disponible en aplicaciones de mensajería y redes sociales como Instagram.

Si estás en Facebook o Instagram, es muy posible que una foto tuya (o una que tomaste) haya ayudado a entrenar a Emu. En cierto modo, el viejo dicho: «Si no pagas por ello, tú eres el producto» ha adquirido un significado completamente nuevo. Aunque, en 2016, los usuarios de Instagram subían más de 95 millones de fotos al día, por lo que el conjunto de datos que Meta utilizó para entrenar su modelo de IA era un pequeño subconjunto de su biblioteca de fotos general.

Dado que Meta dice que solo utiliza fotos disponibles públicamente para la capacitación, configurar sus fotos como privadas en Instagram o Facebook debería evitar su inclusión en la futura capacitación del modelo de IA de la compañía (a menos que cambie esa política, por supuesto).

Imagínese con Meta AI

Al igual que Stable Diffusion, DALL-E 3 y Midjourney, Imagine with Meta AI genera nuevas imágenes basadas en lo que el modelo de IA «sabe» sobre los conceptos visuales aprendidos de los datos de entrenamiento. La creación de imágenes utilizando el nuevo sitio web requiere una cuenta Meta, que se puede importar desde una cuenta existente de Facebook o Instagram. Cada generación crea cuatro imágenes de 1280×1280 píxeles que se pueden guardar en formato JPEG. Las imágenes incluyen un pequeño logotipo de marca de agua «Imagined with AI» en la esquina inferior izquierda.

«Hemos disfrutado escuchar a la gente acerca de cómo están usando imagine, la función de generación de texto a imagen de Meta AI, para crear contenido divertido y creativo en los chats», dice Meta en su comunicado de prensa. «Hoy, estamos ampliando el acceso a imaginar fuera de los chats, haciéndolo disponible en los EE. UU. a partir de imagine.meta.com. Esta experiencia independiente para aficionados creativos les permite crear imágenes con tecnología de Emu, nuestro modelo básico de imágenes».

Sometimos el nuevo generador de imágenes de IA de Meta a una batería de pruebas informales de bajo riesgo utilizando nuestro protocolo de síntesis de imágenes «Bárbaro con un CRT» y «Gato con una cerveza» y encontramos resultados estéticamente novedosos, como se puede ver arriba. (Además, al generar imágenes de personas con Emu, notamos que muchas parecían publicaciones de moda típicas de Instagram).

También probamos suerte en las pruebas adversas. El generador parece filtrar la mayor parte de la violencia, malas palabras, temas sexuales y nombres de celebridades y figuras históricas (lamentablemente no es Abraham Lincoln), pero permite personajes comerciales como Elmo (sí, incluso «con un cuchillo») y Mickey. Ratón (aunque no con ametralladora).

El modelo de Meta generalmente crea bien imágenes fotorrealistas, pero no tan bien como Midjourney. Puede manejar indicaciones complejas mejor que Stable Diffusion XL, pero quizás no tan bien como DALL-E 3. No parece representar bien el texto en absoluto y maneja diferentes tipos de medios como acuarelas, bordados y bolígrafos. -tinta con resultados mixtos. Sus imágenes de personas parecen incluir diversidad de orígenes étnicos. En general, parece promedio en estos días en términos de síntesis de imágenes de IA.



Source link-49