{"id":1100073,"date":"2024-04-22T03:52:32","date_gmt":"2024-04-22T03:52:32","guid":{"rendered":"https:\/\/magazineoffice.com\/por-que-las-bases-de-datos-vectoriales-estan-teniendo-un-momento-en-el-que-el-ciclo-de-exageracion-de-la-ia-alcanza-su-punto-maximo\/"},"modified":"2024-04-22T03:52:35","modified_gmt":"2024-04-22T03:52:35","slug":"por-que-las-bases-de-datos-vectoriales-estan-teniendo-un-momento-en-el-que-el-ciclo-de-exageracion-de-la-ia-alcanza-su-punto-maximo","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/por-que-las-bases-de-datos-vectoriales-estan-teniendo-un-momento-en-el-que-el-ciclo-de-exageracion-de-la-ia-alcanza-su-punto-maximo\/","title":{"rendered":"Por qu\u00e9 las bases de datos vectoriales est\u00e1n teniendo un momento en el que el ciclo de exageraci\u00f3n de la IA alcanza su punto m\u00e1ximo"},"content":{"rendered":"


\n<\/p>\n

\n

Las bases de datos vectoriales est\u00e1n de moda, a juzgar por la cantidad de nuevas empresas que ingresan al espacio y los inversores que pagan por una porci\u00f3n del pastel. La proliferaci\u00f3n de grandes modelos de lenguaje (LLM) y el movimiento de IA generativa (GenAI) han creado un terreno f\u00e9rtil para que florezcan las tecnolog\u00edas de bases de datos vectoriales.<\/p>\n

Si bien las bases de datos relacionales tradicionales como Postgres o MySQL son adecuadas para datos estructurados (tipos de datos predefinidos que se pueden archivar ordenadamente en filas y columnas), esto no funciona tan bien para datos no estructurados como im\u00e1genes, videos, correos electr\u00f3nicos, redes sociales. publicaciones y cualquier dato que no se adhiera a un modelo de datos predefinido.<\/p>\n

Las bases de datos vectoriales, por otro lado, almacenan y procesan datos en forma de incrustaciones de vectores, que convierten texto, documentos, im\u00e1genes y otros datos en representaciones num\u00e9ricas que capturan el significado y las relaciones entre los diferentes puntos de datos. Esto es perfecto para el aprendizaje autom\u00e1tico, ya que la base de datos almacena datos espacialmente seg\u00fan la relevancia de cada elemento con respecto al otro, lo que facilita la recuperaci\u00f3n de datos sem\u00e1nticamente similares.<\/p>\n

Esto es particularmente \u00fatil para LLM, como GPT-4 de OpenAI, ya que permite que el chatbot de IA comprenda mejor el contexto de una conversaci\u00f3n analizando conversaciones similares anteriores. La b\u00fasqueda vectorial tambi\u00e9n es \u00fatil para todo tipo de aplicaciones en tiempo real, como recomendaciones de contenido en redes sociales o aplicaciones de comercio electr\u00f3nico, ya que puede ver lo que un usuario ha buscado y recuperar elementos similares en un instante. <\/span><\/p>\n

La b\u00fasqueda de vectores tambi\u00e9n puede ayudar a reducir las \u00abalucinaciones\u00bb en las aplicaciones de LLM, al proporcionar informaci\u00f3n adicional que podr\u00eda no haber estado disponible en el conjunto de datos de entrenamiento original.<\/p>\n

\u00abSin utilizar la b\u00fasqueda de similitud de vectores, a\u00fan se pueden desarrollar aplicaciones de IA\/ML, pero ser\u00eda necesario realizar m\u00e1s reentrenamiento y ajustes\u00bb. Andre Zayarni<\/span>, explic\u00f3 a TechCrunch el director ejecutivo y cofundador de la startup de b\u00fasqueda vectorial Qdrant. \u00abLas bases de datos vectoriales entran en juego cuando hay un gran conjunto de datos y se necesita una herramienta para trabajar con incrustaciones de vectores de una manera eficiente y conveniente\u00bb.<\/p>\n

En enero, Qdrant obtuvo 28 millones de d\u00f3lares en financiaci\u00f3n para capitalizar el crecimiento que la llev\u00f3 a convertirse en una de las 10 empresas emergentes comerciales de c\u00f3digo abierto de m\u00e1s r\u00e1pido crecimiento el a\u00f1o pasado. Y est\u00e1 lejos de ser la \u00fanica startup de bases de datos vectoriales que ha recaudado efectivo \u00faltimamente: Vespa, Weaviate, Pinecone y Chroma recaudaron colectivamente 200 millones de d\u00f3lares el a\u00f1o pasado para varias ofertas de vectores.<\/p>\n

\n

Equipo fundador de Qdrant. Cr\u00e9ditos de imagen<\/strong>: Qdrant<\/p>\n<\/div>\n

Desde principios de a\u00f1o, tambi\u00e9n hemos visto a Index Ventures liderar una ronda inicial de 9,5 millones de d\u00f3lares en Superlinked, una plataforma que transforma datos complejos en incrustaciones de vectores. Y hace unas semanas, Y Combinator (YC) present\u00f3 su cohorte Winter ’24, que inclu\u00eda a Lantern, una startup que vende un motor de b\u00fasqueda vectorial alojado para Postgres.<\/p>\n

Por otra parte, Marqo recaud\u00f3 una ronda inicial de 4,4 millones de d\u00f3lares a finales del a\u00f1o pasado, seguida r\u00e1pidamente por una ronda Serie A de 12,5 millones de d\u00f3lares en febrero. La plataforma Marqo proporciona una gama completa de herramientas vectoriales listas para usar, que abarcan la generaci\u00f3n, el almacenamiento y la recuperaci\u00f3n de vectores, lo que permite a los usuarios eludir herramientas de terceros como OpenAI o Hugging Face, y ofrece todo a trav\u00e9s de una \u00fanica API.<\/p>\n

Los cofundadores de Marqo, Tom Hamer y Jesse N. Clark, trabajaron anteriormente en puestos de ingenier\u00eda en Amazon, donde se dieron cuenta de la \u00abenorme necesidad insatisfecha\u00bb de b\u00fasqueda sem\u00e1ntica y flexible en diferentes modalidades, como texto e im\u00e1genes. Y fue entonces cuando abandonaron el barco para formar Marqo en 2021.<\/p>\n

\u00abTrabajar con b\u00fasqueda visual y rob\u00f3tica en Amazon fue cuando realmente mir\u00e9 la b\u00fasqueda de vectores; estaba pensando en nuevas formas de descubrir productos, y eso convergi\u00f3 muy r\u00e1pidamente en la b\u00fasqueda de vectores\u00bb, dijo Clark a TechCrunch. \u201cEn rob\u00f3tica, estaba usando la b\u00fasqueda multimodal para buscar en muchas de nuestras im\u00e1genes e identificar si hab\u00eda cosas errantes como mangueras y paquetes. De lo contrario, esto ser\u00eda muy dif\u00edcil de resolver\u201d.<\/p>\n

\"Cofundadores<\/p>\n

Los cofundadores de Marqo, Jesse Clark y Tom Hamer. Cr\u00e9ditos de imagen<\/strong>: Marqo<\/p>\n<\/div>\n

Ingrese a la empresa<\/h2>\n

Si bien las bases de datos vectoriales est\u00e1n teniendo un momento en medio del alboroto de ChatGPT y el movimiento GenAI, no son la panacea para todos los escenarios de b\u00fasqueda empresarial.<\/p>\n

\u00abLas bases de datos dedicadas tienden a centrarse completamente en casos de uso espec\u00edficos y, por lo tanto, pueden dise\u00f1ar su arquitectura para el desempe\u00f1o de las tareas necesarias, as\u00ed como la experiencia del usuario, en comparaci\u00f3n con las bases de datos de prop\u00f3sito general, que deben adaptarse al dise\u00f1o actual\u00bb, Peter Zaitsev, fundador de la empresa de servicios y soporte de bases de datos Percona, explic\u00f3 a TechCrunch.<\/p>\n

Si bien las bases de datos especializadas pueden sobresalir en una cosa excluyendo otras, es por eso que estamos empezando a ver titulares de bases de datos <\/span>como el\u00e1stico, <\/span>Redis, <\/span>B\u00fasqueda abierta, <\/span>casandra, <\/span>Or\u00e1culoy <\/span>MongoDB agregando inteligencia de b\u00fasqueda de bases de datos vectoriales a la mezcla, al igual que los proveedores de servicios en la nube como <\/span>Azure de Microsoft, <\/span>AWS de Amazony <\/span>Llamarada de nube.<\/span><\/p>\n

Zaitsev compara esta \u00faltima tendencia con lo que sucedi\u00f3 con JSON hace m\u00e1s de una d\u00e9cada, cuando las aplicaciones web se volvieron m\u00e1s frecuentes y los desarrolladores necesitaban un formato de datos independiente del lenguaje que fuera f\u00e1cil de leer y escribir para los humanos. En ese caso, surgi\u00f3 una nueva clase de base de datos en forma de bases de datos de documentos como MongoDB, mientras que las bases de datos relacionales existentes tambi\u00e9n introdujeron soporte JSON.<\/p>\n

\u00abCreo que es probable que suceda lo mismo con las bases de datos vectoriales\u00bb, dijo Zaitsev a TechCrunch. \u201cLos usuarios que est\u00e1n creando aplicaciones de IA muy complicadas y a gran escala utilizar\u00e1n bases de datos de b\u00fasqueda de vectores dedicadas, mientras que las personas que necesitan crear un poco de funcionalidad de IA para su aplicaci\u00f3n existente tienen m\u00e1s probabilidades de utilizar la funcionalidad de b\u00fasqueda de vectores en las bases de datos que ya utilizan. \u00ab<\/p>\n

Pero Zayarni y sus colegas de Qdrant est\u00e1n apostando a que las soluciones nativas construidas enteramente alrededor de vectores proporcionar\u00e1n la \u201cvelocidad, seguridad de la memoria y escala\u201d necesarias a medida que los datos vectoriales explotan, en comparaci\u00f3n con las empresas que incorporan la b\u00fasqueda de vectores como una ocurrencia tard\u00eda.<\/p>\n

\u00abSu argumento es: ‘tambi\u00e9n podemos realizar b\u00fasquedas vectoriales, si es necesario'\u00bb, dijo Zayarni. \u201cNuestro argumento es: ‘hacemos b\u00fasqueda vectorial avanzada de la mejor manera posible’. Todo es cuesti\u00f3n de especializaci\u00f3n. De hecho, recomendamos comenzar con cualquier base de datos que ya tenga en su pila tecnol\u00f3gica. En alg\u00fan momento, los usuarios enfrentar\u00e1n limitaciones si la b\u00fasqueda vectorial es un componente cr\u00edtico de su soluci\u00f3n\u201d.<\/p>\n<\/p><\/div>\n


\n
Source link-48<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"

Las bases de datos vectoriales est\u00e1n de moda, a juzgar por la cantidad de nuevas empresas que ingresan al espacio y los inversores que pagan por una porci\u00f3n del pastel.…<\/p>\n","protected":false},"author":1,"featured_media":1100074,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[21980],"tags":[11485,18753,7904,121,681,19397,246,12967,294,110,2935,111,4838,27891],"_links":{"self":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1100073"}],"collection":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/comments?post=1100073"}],"version-history":[{"count":1,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1100073\/revisions"}],"predecessor-version":[{"id":1100075,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1100073\/revisions\/1100075"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media\/1100074"}],"wp:attachment":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media?parent=1100073"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/categories?post=1100073"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/tags?post=1100073"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}