Viso no busca códigos para el futuro de la visión por computadora y obtiene financiación a escala


La visión por computadora se ha convertido en algo común en innumerables industrias, pero los métodos para crear y controlar estos modelos visuales de IA no son tan fáciles. Viso está construyendo una plataforma de extremo a extremo con poco o ningún código que permite a las empresas implementar su propia pila de visión por computadora, y acaban de recaudar 9,2 millones de dólares para ampliarla.

Por supuesto, existen toneladas de modelos y servicios de visión por computadora, pero muchos de ellos se ajustan a la descripción de «modelo como API». Supongamos que desea reconocer a una persona y calificarla si está de pie o sentada, para poder saber qué tan concurrida está una estación de tren o un restaurante.

Existen opciones completamente formadas para el reconocimiento de personas y poses, pero es posible que no se ajusten a su caso de uso o modelo de seguridad, o que sean demasiado costosas para escalar. Crear el tuyo propio es una opción, pero la experiencia necesaria para entrenar e implementar modelos CV modernos no es trivial: a menos que tengas el tiempo y el dinero para formar un equipo real, puede estar fuera de tu alcance.

Ese es el tipo de situación que Viso quiere remediar, proporcionando una plataforma para crear su propio modelo de CV de nivel empresarial sin dedicar el tipo de tiempo y recursos que a menudo requiere.

“Al principio del ciclo de adopción, las empresas recurren a la compra o alquiler de sistemas de visión por computadora prefabricados. Sin embargo, eventualmente necesitarán reunir todas las iniciativas de visión por computadora (simplificarlas) e integrarlas y personalizarlas profundamente, y también «poseerlas» porque los datos son confidenciales y la tecnología tiene un valor estratégico. Por eso las empresas de esos sectores están empezando a contratar ingenieros en inteligencia artificial”, explicó el cofundador y codirector ejecutivo de Viso, Gaudenz Boesch.

Ejemplos de aplicaciones de visión por computadora basadas en Viso.

Pero a diferencia de muchas otras necesidades a nivel empresarial, la visión por computadora carece de una “infraestructura especializada” para construirla e implementarla de manera eficiente.

«Las empresas tienen que construirlo desde cero, intentando ensamblar una gran cantidad de plataformas de software y hardware desconectadas (cámaras, servidores) en toda la organización», continuó. Esto, a su vez, requiere experiencia en numerosos dominios, lo que rápidamente resulta demasiado costoso.

El enfoque de Viso probablemente le resultará familiar a cualquiera que haya utilizado herramientas sin código en otros contextos. Se trata de una serie de módulos, tanto prediseñados como personalizables, que permiten al usuario seleccionar, entrenar e implementar modelos de visión por computadora según sea necesario.

Una vista del proceso de creación del modelo.

Por supuesto, aún necesitarás cierto nivel de experiencia: ¿qué modelo de reconocimiento de objetos debería ejecutar? ¿Dónde se guardarán los datos de entrenamiento? ¿Cómo se maneja la inferencia? Pero un puñado de ingenieros pueden hacer mucho más trabajo, y todo en un solo lugar, en lugar de estar dispersos en una docena de herramientas, API y cuadernos de códigos.

Viso dice que es de extremo a extremo, y eso no parece una exageración. La visión por computadora requiere datos para empezar, y procesos de capacitación, y luego implementación, alojamiento, trabajo de cumplimiento, etc., y parece ser realmente una solución “de la sopa a las nueces” que pone todo eso en un solo lugar:

¡Esa es una lista grande!

Entonces, si estuvieras haciendo ese “detector de ocupado” de antes, posiblemente podrías comenzar con nada más que cien horas de metraje y salir del otro extremo una semana o dos después con un producto completo. Eso incluiría análisis y almacenamiento de bajo nivel de los datos sin procesar, anotaciones y etiquetado, capacitación y pruebas del modelo base, integración de productos, implementación en línea o fuera de línea, análisis, actualizaciones y copias de seguridad, así como acceso y seguridad… todo sin salir. Viso, y probablemente sin tocar las teclas de punto y coma o corchetes. (Hay varios estudios de casos aquí.)

Aunque existen otras plataformas de visión por computadora, Boesch dijo que ninguna fue «creada para administrar aplicaciones de visión por computadora altamente complejas a escala y mantenerlas continuamente», sino que se centró más en un puñado de tareas de la lista anterior. Viso tiene como objetivo admitir tantos modelos, métodos, hardware y casos de uso como sea posible, al tiempo que garantiza que el cliente sea dueño del resultado final.

Al no ser desarrollador, no puedo hablar de lo difíciles o fáciles que pueden ser los diferentes casos de uso, pero ciertamente existe una atracción fundamental (como lo demuestra la popularidad de otras herramientas de bajo código y de extremo a extremo) por usar Menos plataformas y más completas en lugar de unir una serie de plataformas desconectadas.

Los inversores de Viso parecen pensar que sí, y la compañía ha recaudado 9,2 millones de dólares en financiación inicial, liderada por Accel y con la participación de varios ángeles. Curiosamente, la empresa se ha iniciado desde su fundación en 2018 en Suiza.

Boesch dijo que la explosión de la demanda hizo que la empresa hiciera el aumento, que según los términos de las empresas de IA es bastante modesto en comparación con los productos en oferta y los clientes existentes. Dijo que Viso ya ha sido adoptado por varias empresas grandes, incluidas Pricewaterhouse Cooper, DHL y Orange, y ha experimentado un crecimiento de nuevos clientes seis veces mayor desde 2022.



Source link-48