Lo que necesitas saber
- Los investigadores de Apple han presentado una nueva herramienta de imágenes de IA que permite a los usuarios editar imágenes mediante indicaciones de texto.
- La herramienta de edición de imágenes guiada por MLLM (MGIE) puede cambiar el tamaño, voltear, recortar e incluso agregar filtros a las imágenes mediante mensajes de texto.
- Puedes descargarlo en GitHub, aunque Apple no ha declarado categóricamente sus planes para el modelo.
Con la rápida adopción de tecnología de IA generativaherramientas de generación de imágenes como Creador de imágenes de Microsoft de Designer (anteriormente Bing Image Creator), Midjourney y más están surgiendo cada vez más. Como ávido usuario de estos modelos, me resulta molesto que no exista una forma rápida de editar una imagen que ya has generado.
Google está en camino de solucionar este problema con su herramienta experimental de generación de imágenes, ImageFX. Lo que lo distingue de la multitud es que más allá de generar imágenes mediante indicaciones, permite a los usuarios modificar indicaciones usando chips expresivoslo que facilita el ajuste de la salida.
Y ahora, Apple aparentemente se ha unido a la refriega con un nuevo modelo impulsado por IA que permite a los usuarios describir los cambios que les gustaría realizar en una foto sin navegar por el software. El modelo de edición de imágenes guiada por MLLM (MGIE) puede cambiar el tamaño, voltear, recortar e incluso agregar filtros a las imágenes mediante mensajes de texto.
El modelo MGIE interpreta el mensaje y luego «imagina» los cambios que describe el usuario antes de aplicarlos en tiempo real. En el trabajo de investigación, los investigadores utilizaron una foto de una pizza de pepperoni y el mensaje «hazla más saludable» como instrucciones para los cambios que les gustaría implementar en la foto. En consecuencia, la modelo añadió verduras a la pizza de pepperoni.
Según los investigadores:
«En lugar de una guía breve pero ambigua, MGIE deriva una intención visual explícita y conduce a una edición de imágenes razonable. Realizamos estudios extensos desde varios aspectos de edición y demostramos que nuestro MGIE mejora efectivamente el rendimiento mientras mantiene la eficiencia competitiva. También creemos que la guía MLLM «El marco puede contribuir a la futura investigación sobre visión y lenguaje».
Es fantástico ver un modelo de IA con esta característica tan necesaria que potencialmente hará que la generación de imágenes sea más fácil y rápida.
Los deepfakes de IA siguen siendo un problema
Generar imágenes usando IA es todo diversión y juegos hasta que la gente comienza a usar la tecnología para crear imágenes falsas y contenido explícito. La estrella del pop Taylor Swift apareció recientemente en los titulares después de que aparecieran en las redes sociales imágenes explícitas de ella, que se cree que fueron generadas con Microsoft Designer.
Vale la pena señalar que Microsoft Designer se ha actualizado con nuevas regulaciones y medidas de seguridad que impiden a los usuarios generar contenido explícito utilizando la herramienta. Esto se suma a la recién impuesta Ley de Interrupción de Imágenes Falsificadas Explícitas y Ediciones No Consensuales (DEFIANCE), diseñada para regular y prevenir tales sucesos.
Si bien las barreras de seguridad y la censura reducen significativamente las posibilidades de que algo así vuelva a ocurrir, los usuarios se han quejado de que algunas de estas medidas son exageradas y aparentemente han abandonado herramientas como Creador de imágenes del diseñador lobotomizado.
En el pasado, hemos visto a varios usuarios engañar a los chatbots de IA para que realicen tareas restringidas. Por ejemplo, cuando un usuario engañó a ChatGPT para que generara claves de Windows. Por lo tanto, los investigadores de Apple deben investigar este asunto exhaustivamente para cubrir todas las lagunas.
Aún no está claro cuáles son los planes de Apple para MGIE más allá de la investigación, aunque el modelo está disponible para descargar en GitHub. Apple ha estado relativamente silenciosa en el panorama de la IA, pero desde que comenzó el año, ha estado dando pasos sutiles y acercándose a la tecnología. Por otro lado, Microsoft está en plena forma, habiendo tomado una temprana ventaja en IA, haciendo un inversión multimillonariaque ahora lo ha situado en el en lo más alto de la lista de la empresa más valiosa del mundo.