Meta comparte un modelo de IA que puede detectar objetos que no ha visto antes


La IA normalmente necesita ser entrenada en el material existente para detectar objetos, pero Meta tiene una forma para que la tecnología detecte elementos sin ayuda. El gigante de las redes sociales ha publicado un modelo de IA «Segment Anything» que puede detectar objetos en imágenes y videos, incluso si no formaban parte del conjunto de entrenamiento. Puede seleccionar elementos haciendo clic en ellos o utilizando indicaciones de texto de formato libre. Como Reuters explica, puedes escribir la palabra «gato» y ver cómo la IA resalta todos los felinos en una foto determinada.

El modelo también puede funcionar en conjunto con otros modelos. Puede ayudar a reconstruir un objeto en 3D utilizando una sola imagen o dibujar a partir de vistas desde un casco de realidad mixta. Efectivamente, Segment Anything puede limitar la necesidad de capacitación adicional en IA.

Tanto el modelo de IA como el conjunto de datos se podrán descargar con una licencia no comercial. Es decir, los creadores no pueden usarlo para productos. Esto es principalmente para la investigación y la ampliación del acceso a la tecnología. En este momento, Meta usa una tecnología algo similar para moderar el contenido prohibido, recomendar publicaciones y etiquetar fotos.

Los desarrolladores reconocen que el modelo existente tiene fallas. Puede pasar por alto detalles más finos y no es tan preciso para detectar los límites como algunos modelos. Y aunque Segment Anything puede manejar indicaciones en tiempo real, se atasca cuando se trata de un procesamiento de imágenes exigente. Es probable que algunas herramientas de IA más especializadas superen este modelo en sus respectivos campos, dice Meta.

No verá esta IA en robots u otros dispositivos donde la detección rápida y precisa de objetos es (generalmente) vital. Sin embargo, modelos como este aún pueden ayudar en situaciones en las que no es práctico depender exclusivamente de los datos de entrenamiento. Una red social podría usar la tecnología para mantenerse al día con un volumen de contenido que crece rápidamente. Si nada más, esto muestra que Meta quiere generalizar la visión por computadora.

Meta no es ajeno a compartir los avances de la IA, como un traductor de idiomas no escritos. Dicho esto, hay presión sobre la empresa para que demuestre que es una potencia en la categoría tanto como los pesos pesados ​​de la tecnología como Google y Microsoft. Ya está planeando «personajes» generativos de IA para sus aplicaciones sociales, e inventos como Segment Anything muestran que tiene algunas ventajas propias.



Source link-47