Apple logra otro avance y presenta un nuevo modelo de inteligencia artificial que puede manipular imágenes con comandos de lenguaje natural


Apple está por detrás de ChatGPT y Gemini de Google en muchos aspectos. Sin embargo, la compañía ha invertido mucho en IA con el objetivo de llevar la tecnología a la línea iPhone 16 a finales de este año con el lanzamiento de iOS 18. Ahora se informa que los investigadores de Apple han lanzado un nuevo modelo de IA que puede editar imágenes según Comandos en lenguaje natural por parte del usuario. Es posible que la tecnología se muestre en el evento WWDC 2024 de la compañía en junio.

El nuevo modelo de IA de Apple puede interpretar entradas de lenguaje natural y manipular imágenes

El nuevo modelo de IA de Apple, llamado «MGIE,» o Edición de imágenes guiada por MLLMes un modelo de lenguaje grande multimodal que puede interpretar y ejecutar comandos de usuario a nivel de píxel (a través de VentureBeat). La herramienta puede manipular y editar una gran cantidad de áreas de una imagen, incluido el brillo, la nitidez, el contraste y mucho más. También puede manipular una imagen para agregar efectos artísticos.

Aparte de esto, la edición local podría alterar la forma, el color, el tamaño y la textura del sujeto en una foto. La edición similar a Photoshop incluye cambiar el tamaño de la imagen o recortar, rotar y agregar filtros. Los usuarios también pueden cambiar el fondo de la imagen. El nuevo modelo de IA de Apple comprende el contexto y el razonamiento común. Por ejemplo, puedes agregar una imagen de una pizza y un mensaje para hacerla más saludable. El modelo de IA agregará automáticamente vegetales a la imagen, entendiendo que la salud está asociada con los vegetales en los alimentos.

Utilizando las solicitudes de optimización global, la herramienta puede manipular la iluminación y el contraste de una imagen. Además, la edición similar a Photoshop también puede eliminar objetos del fondo a petición del usuario. Puedes ver el modelo de IA de Apple en acción en la imagen agregada a continuación. La empresa se ha asociado con investigadores de la Universidad de California para crear MGIE y, una vez que la tecnología esté lista, la empresa creará varias aplicaciones para sus dispositivos. El artículo fue presentado en la Conferencia Internacional sobre Representaciones del Aprendizaje (ICLR) 2024.

Apple AI Model puede manipular imágenes con entrada de lenguaje natural

Si está interesado en comprobar el modelo de IA, el código y los datos con modelos previamente entrenados están disponibles en GitHub. Apple ha estado trabajando en IA durante bastante tiempo y, aunque es tarde para implementarla, las características podrían ser diferentes a las de la industria. En diciembre del año pasado, la compañía inventó la técnica de utilización de memoria flash, lo que permite que modelos de lenguaje grandes funcionen en el iPhone y otros productos de Apple.

Apple anunciará algunas funciones de IA a finales de este año, potencialmente en el evento WWDC 2024 junto con iOS 18 y otras actualizaciones de software. Informes anteriores mencionaron que Apple implementará funciones de inteligencia artificial generativa con el lanzamiento de los nuevos modelos de iPhone a finales de este año. iOS 18 utilizará IA para poner a Siri en esteroides, ya que actualmente está por detrás de Google Assistant y Alexa de Amazon.

Comparte esta historia

Facebook

Gorjeo



Source link-29