XetHub recauda $ 7,5 millones para su plataforma de colaboración de datos basada en Git • TechCrunch


XetHub, con sede en Seattle, una startup que facilita a las empresas el uso de Git para la gestión de datos, anunció hoy que ha recaudado una ronda de financiación inicial de 7,5 millones de dólares dirigida por Madrona. La idea básica aquí es permitir que los desarrolladores trabajen con datos de la misma manera que trabajan con código, incluidas todas las funciones de colaboración que permite una herramienta como Git. El equipo describe XetHub como una «plataforma de almacenamiento colaborativo para la gestión de datos».

La empresa fue cofundada por Yucheng Low (CEO), Ajit Banerjee y Rajat Arya, un equipo con años de experiencia trabajando con grandes plataformas de datos. De hecho, Low cofundó previamente la startup de ML Turi, donde Arya fue la primera empleada. Apple adquirió la empresa en 2016, lo que permitió a Low y Arya trabajar en varias partes de la pila de la plataforma ML de Apple, con Arya a la cabeza del equipo de plataforma de datos de Apple, por ejemplo. También fue en Apple donde los dos conocieron a Banerjee, quien anteriormente trabajó en Inktomi, Amazon y Facebook. Anteriormente también fundó dos startups.

La vista de repositorio de XetHub está diseñada para navegar y visualizar repositorios de datos manteniendo las sensibilidades de GitHub. XetHub resume automáticamente los formatos de archivo comunes (CSV) y admite visualizaciones personalizadas.

Durante el tiempo que trabajaron en la plataforma de datos de Apple, el equipo se dio cuenta de que aún quedaba mucho por mejorar en el ámbito de la gestión de datos.

“Realmente no debería ser una sorpresa, pero los datos son mucho más importantes que todo lo demás. Más importante que el modelo, que cualquier otra cosa”, me dijo Low. “Administrar dónde almacena estos datos, cómo colabora con estos datos es realmente fundamental. Sin embargo, lo que vemos es que la forma en que administramos los datos hoy realmente se parece a cómo se hizo el código fuente hace 30 años, lo que significa que el control de versiones o la colaboración se realiza copiando y pegando. A veces hay una versión más elaborada, pero en última instancia, todavía es copiar y pegar si quiero asegurarme de que nadie más toque lo que estoy haciendo”.

Al igual que los desarrolladores se han pasado a herramientas como Git para colaborar en su código fuente, XetHub quiere permitirles usar estas mismas primitivas familiares para trabajar con datos.

“La forma en que lo pensamos es que, por primera vez, realmente permitimos que los desarrolladores trabajen en los datos exactamente de la misma manera que el código”, dijo Low. Señaló que el equipo tenía como objetivo crear una herramienta que no solo imitara una experiencia similar a Git, sino que preservara la experiencia central del usuario de Git, incluidas todas las integraciones con las que los desarrolladores están familiarizados.

XetHub amplía Git para admitir archivos de gran tamaño, lo que ofrece almacenamiento y transferencia eficientes con deduplicación de datos y, al mismo tiempo, mantiene la compatibilidad total con Git.

Actualmente, el servicio puede manejar repositorios con hasta 1 TB de datos, con planes de expandir esto a 100 TB pronto. Pocos desarrolladores querrán clonar un repositorio grande como este, por lo que una característica ingeniosa aquí es que los desarrolladores también pueden montar estos repositorios y hacer que se comporten como un sistema de archivos local, sin importar si está en su computadora portátil o en un clúster de GPU grande. También vale la pena señalar que la herramienta es independiente de los formatos de archivo.

Desde una perspectiva de marketing, el equipo está enfocando sus esfuerzos en los equipos de IA/ML, pero los usuarios obviamente pueden usar XetHub para administrar cualquier tipo de datos.

Xethub ahora está disponible públicamente con una edición comunitaria gratuita que puede usar para administrar hasta 20 GB de almacenamiento deduplicado. Low me dice que la compañía ya está hablando con algunos clientes empresariales, pero el equipo aún no está listo para dar nombres.

“Yucheng y el excepcional equipo de XetHub han estado innovando con el aprendizaje automático durante más de una década y luego han aplicado sus habilidades en la empresa de tecnología de consumo más icónica: Apple. XetHub permite a los desarrolladores trabajar con grandes conjuntos de datos, en colaboración con otros, para crear aplicaciones inteligentes y generativas”, dijo Matt McIlwain, director general de Madrona. “El desarrollo y la implementación de estas aplicaciones están limitados por la infraestructura heredada y los flujos de trabajo de datos complejos, y XetHub aborda estos puntos débiles desde el punto de vista del desarrollador”.



Source link-48