Meta lanza una nueva herramienta de segmentación de fotos basada en IA para todos


Meta tiene algunas grandes ambiciones de IA, incluso cuando parece que hace mucho tiempo que se pone al día con OpenAI, Microsoft y incluso Google. Para causar un poco de revuelo, el miércoles la compañía mostró su nuevo Segment Anything Model basado en IA que es sorprendentemente capaz de identificar y separar objetos específicos en imágenes y videos. Aquí está el truco, Meta lo está lanzando a cualquiera al hacer que su nuevo software sea de código abierto.

Hay bastantes buenas aplicaciones para borrar objetos no deseados de las imágenes, y todos ellos ya emplean modelos de IA para buscar y reemplazar objetos en las fotos. En mis propias pruebas de la Demostración de segmentar cualquier cosa, Meta ha ido un paso más allá con su propia oferta. El sistema de demostración ofrece una especie de herramienta ‘Varita mágica’ de Photoshop con esteroides. Lo probé usando algunas imágenes llenas de gente, como una foto de El enorme set de Rivendel de Lego. No solo adivinó colectivamente que estaba tratando de seleccionar minifiguras específicas del fondo, sino que cuando recogió algunos píxeles rebeldes, rápidamente pude decirle que eliminara todo lo que no fuera un señor de los Anillos personaje con un solo clic.

Después de calcular una nueva imagen, el sistema hace un trabajo sólido al resaltar diferentes objetos en una foto. en una imagen de yo mismo sentado en un sillón de masaje extremadamente limitado, fue capaz de identificarme a mí, a la silla e incluso a mi barba individualmente. Por supuesto, Meta no está solo creando algoritmos de aprendizaje automático para identificar aspectos de las imágenes. Apple ha hablado de su Tecnología de segmentación de imágenes AI desde 2021.

Pero lo que podría diferenciar a Meta es tanto la función como la facilidad de uso. En mis propias pruebas, descubrí que SAM es incluso mejor para seleccionar objetos pequeños de fotos abarrotadas que Magic Eraser de Google o la herramienta gratuita en línea Inpaint, aunque no hay una función para eliminar aspectos de una foto y reemplazar su fondo.

Meta dijo que SAM es capaz de generar múltiples máscaras incluso cuando hay «ambigüedad» sobre el objeto. Incluso entonces, la compañía describió esto como solo un «modelo básico» útil para la segmentación de imágenes, tanto interactiva como automática. El sistema se describe como «solicitable», lo que significa que puede recibir información como la mirada de los usuarios en un auricular VR o mediante clics e incluso mensajes de texto.

Quizás lo más sorprendente de Meta es que está lanzando SAM bajo una licencia abierta, y además está proporcionando detalles completos sobre su conjunto de datos de 1000 millones de máscaras, que según la compañía era «el conjunto de datos de segmentación más grande jamás visto». Este SA-1B es un segmentación semántica conjunto de datos que clasifica cada píxel de una imagen, lo que facilita estilizar o eliminar objetos de las fotos. Según Meta, el sistema en sí está entrenado en 11 millones de imágenes con un promedio de 100 máscaras por imagen.

De acuerdo a Trabajo de investigación de Meta sobre SAM, el conjunto de datos utilizó imágenes «de un proveedor que trabaja directamente con fotógrafos», aunque no especificó de qué proveedor se trataba. Algunas de esas imágenes en las que se entrenó el sistema incluían caras y matrículas, aunque el periódico dice que Meta las borró cuando publicó el conjunto de datos.

Es genial ver a Meta dispuesta a abrir el código fuente de uno de sus modelos y datos, aunque no es como si debiéramos esperar muchas más cosas gratis. Meta ha hecho recientemente un cambio radical para AItanto es así que el jefe de la división de metaverso de la compañía, Andrew Bosworth, y otros ejecutivos están hablando de cómo la compañía planea usar IA generativa para creando anuncios junto con otros productos del lado comercial. La compañía todavía está trabajando para hacer un lanzamiento público de su Competidor de ChatGPT llamado LLaMAa pesar de que ya se había filtrado en línea.

Claro, SAM podría usarse en una capacidad AR o VR para identificar objetos por la mirada de un usuario, algo que es bastante importante para las ambiciones de Meta para sus auriculares y anteojos AR. Todavía hay mucho espacio para el abuso. El sistema de detección de IA DeepMind de Google ha demostrado su eficacia en identificación de células cancerosas, pero se han utilizado sistemas similares para el reconocimiento facial. La ACLU reveló recientemente la El FBI había probado software de reconocimiento facial en ciudadanos estadounidenses durante años. A medida que esta tecnología se vuelve más sofisticada, EE. UU. necesita desesperadamente una prohibición biométrica y facial federal o en el mismo menos más regulación.

¿Quiere saber más sobre la IA, los chatbots y el futuro del aprendizaje automático? Consulte nuestra cobertura completa de inteligencia artificialo explore nuestras guías para Los mejores generadores de arte de IA gratuitos, Las mejores alternativas de ChatGPT, y Todo lo que sabemos sobre ChatGPT de OpenAI.



Source link-45