¿Puede dltHub resolver el problema de la biblioteca de Python para la IA? Dig Ventures cree que sí


Python es el lenguaje de programación preferido en IA; sin embargo, la mayoría de las organizaciones no pueden incorporar a sus desarrolladores de Python en la infraestructura de datos heredada. Eso significa que se pierden la oportunidad de aprovechar los beneficios de la IA en la organización. Sin embargo, ha faltado una biblioteca Python de código abierto para desarrolladores diseñada en torno a flujos de trabajo de IA.

DLT (abreviatura de herramienta de carga de datos), una startup con sede en Berlín, cree que puede tener la solución. Está construyendo exactamente esa biblioteca de Python de código abierto que, según afirma, está diseñada para esta nueva ola de IA.

La startup dice que su biblioteca se integrará en los flujos de trabajo existentes, incluidos los flujos de trabajo de Python donde antes no se cargaban datos, como un cuaderno de Google Colab, una función de AWS Lambda, un DAG de Airflow o documentos asistidos por GPT-4 o áreas de desarrollo de GPT-4.

La puesta en marcha ahora ha recaudado $ 1.5 millones en fondos iniciales de Dig Ventures, fundada por Ross Mason, quien creó Mule Project y fundó MuleSoft (MULE: NYSE). Se unen a la ronda fundadores de empresas e inteligencia artificial de empresas como Huggingface, Instana, Miro y Matillion.

El CEO Matthaus Krzykowski me dijo por correo electrónico: “La mayoría de las aplicaciones GPT-4 que se muestran en los medios son demoware. Los usuarios que las prueban las abandonan rápidamente. Otras herramientas de IA en las que los capitalistas de riesgo han estado acumulando mucho dinero recientemente (bases de datos/marcos vectoriales) tienen muchos desafíos similares».

Él dice que dlt ahora tiene una comunidad creciente de desarrolladores de Python y se está «implementando en producción en varias compañías tecnológicas de escalamiento», incluida la compañía de entrega de software Harness, con sede en San Francisco, que cubrimos anteriormente.

En un comunicado, Alexander Butler, ingeniero de datos sénior de Harness, dijo: “Aprovechar dlt ha cambiado nuestras operaciones de datos. Ha… acelerado el ritmo de nuestro equipo de DataOps: dedicamos menos tiempo a EL (extracción y carga) y más a T, al mismo tiempo que podemos personalizar profundamente nuestros extractores a medida que evolucionan los requisitos comerciales”.

Julien Chaumond, CTO/cofundador de Huggingface e inversionista ángel en dltHub agregó: “La revolución actual del aprendizaje automático ha sido posible gracias a la explosión cámbrica de las herramientas de código abierto de Python que se han vuelto tan accesibles que una amplia gama de profesionales pueden usarlas. Como biblioteca de Python fácil de usar, dlt es la primera herramienta que esta nueva ola de personas puede usar”.

Con respecto a los competidores potenciales, Krzykowski admite que las nuevas empresas «compiten con empresas ETL como Meltano, Stitch Data, Airbyte y, en menor grado, Fivetran».

Sin embargo, dice que «desde una perspectiva más amplia, operamos en el espacio de las empresas de almacenamiento de datos como Snowflake, Databricks, Microsoft Fabric, que también quieren construir para llevar la IA a la empresa».



Source link-48