La API de Parallel Domain permite a los clientes usar IA generativa para crear conjuntos de datos sintéticos


Dominio paralelo está poniendo la capacidad de generar conjuntos de datos sintéticos en manos de sus clientes. La startup con sede en San Francisco ha lanzado una nueva API llamada Data Lab que se apoya en los hombros de los gigantes de la IA generativa, dando a los ingenieros de aprendizaje automático control sobre mundos virtuales dinámicos para simular cualquier escenario imaginable.

«Todo lo que tiene que hacer es ir a GitHub, instalar la API y luego puede comenzar a escribir el código Python que genera conjuntos de datos», dijo a TechCrunch Kevin McNamara, fundador y director ejecutivo de Parallel Domain.

Data Lab permite a los ingenieros generar objetos que antes no estaban disponibles en la biblioteca de activos de la startup. La API utiliza la simulación 3D para proporcionar una base sobre la cual un ingeniero, a través de una serie de indicaciones simples, puede superponer el mundo real en toda su aleatoriedad. ¿Quiere entrenar a su modelo para que conduzca en una autopista con una cabina volteada en dos carriles? Fácil. ¿Crees que tu robotaxi debería saber cómo identificar a un humano vestido con un traje de dinosaurio inflable? Hecho.

El objetivo es dar a las empresas de autonomía, drones y robótica más control y más eficiencia en la construcción de grandes conjuntos de datos para que puedan entrenar sus modelos más rápido y a un nivel más profundo.

«El tiempo de iteración ahora se reduce esencialmente a qué tan rápido puede usted, como ingeniero de ML, pensar en lo que quiere y traducirlo en una llamada API, un conjunto de código». dijo McNamara. “Hay un nivel casi infinito e ilimitado de cosas que un cliente puede escribir para un aviso, y el sistema simplemente funciona”.

Parallel Domain cuenta como clientes con los principales OEM que desarrollan sistemas avanzados de asistencia al conductor (ADAS) y empresas de conducción autónoma. Históricamente, la puesta en marcha podría haber tardado semanas o meses en crear conjuntos de datos basados ​​en los parámetros específicos de un cliente. Con la API de autoservicio, los clientes pueden formar nuevos conjuntos de datos «casi en tiempo real», según McNamara.

A mayor escala, Data Lab podría ayudar a escalar los sistemas de conducción autónoma aún más rápido. McNamara dijo que la puesta en marcha probó ciertos modelos AV en conjuntos de datos sintéticos de cochecitos contra conjuntos de datos del mundo real de cochecitos, y descubrió que el modelo funcionaba mejor cuando se entrenaba con datos sintéticos.

Si bien Parallel Domain no utiliza ninguna de las API de OpenAI que han ganado popularidad en los últimos meses, como ChatGPT, la startup está construyendo componentes de su tecnología sobre los grandes modelos básicos que se han abierto en los últimos dos años.

“Cosas como Stable Diffusion nos permiten ajustar nuestras propias versiones de estos modelos básicos y luego usar la entrada de texto para impulsar la generación de imágenes y contenido”, dijo McNamara, y señaló que su equipo desarrolló pilas de tecnología personalizadas para etiquetar objetos a medida que se generan.

Parallel Domain lanzó inicialmente su motor de generación de datos sintéticos, llamado Reactor, en mayo para uso interno y pruebas beta con clientes de confianza. Ahora que Reactor se ofrece a los clientes a través de la API de Data Lab, es probable que el modelo comercial de Parallel Domain cambie, ya que los clientes prefieren un acceso fácil a la IA generativa.

La estrategia comercial actual de la startup implica que los clientes compren asignaciones de datos y luego usen esos créditos durante todo el año. Data Lab puede ayudar a Parallel Domain a pasar a un modelo de software como servicio (SaaS), en el que los clientes pueden suscribirse para acceder a la plataforma y pagar en función de cuánto la usan, dijo McNamara.

La API también tiene el potencial de ayudar a Parallel Domain a escalar en cualquier espacio donde la tecnología habilitada para la visión por computadora está haciendo que las industrias sean más eficientes, como la agricultura, el comercio minorista o la fabricación.

“La habilitación de la IA en la agricultura se considera una de las cosas más importantes que mejorarán la eficiencia, y queremos perseguir esos casos de uso y, finalmente, tener una plataforma en la que no importa en qué dominio esté operando, si necesita entrenar una IA. para ver el mundo con algún tipo de sensor, el lugar donde comenzaría es Parallel Domain”, dijo McNamara.



Source link-48