Elicit está construyendo una herramienta para automatizar la revisión de la literatura científica


Para los investigadores, leer artículos científicos puede llevar mucho tiempo. Según una encuesta, los científicos dedican siete horas a la semana a buscar información. Otra encuesta sugiere que las revisiones sistemáticas de la literatura (síntesis académicas de la evidencia sobre un tema en particular) toman un promedio de 41 semanas para un equipo de investigación de cinco personas.

Pero no tiene por qué ser así.

Al menos, ese es el mensaje de Andreas Stuhlmüller, cofundador de una startup de IA, Elicit, que ha diseñado un «asistente de investigación» para científicos y laboratorios de I+D. Con patrocinadores que incluyen a Fifty Years, Basis Set, Illusion y los inversionistas ángeles Jeff Dean (científico jefe de Google) y Thomas Ebeling (ex director ejecutivo de Novartis), Elicit está construyendo una herramienta impulsada por inteligencia artificial para abstraer los aspectos más tediosos de la revisión de la literatura.

«Obtener es un asistente de investigación que automatiza la investigación científica con modelos de lenguaje”, dijo Stuhlmüller a TechCrunch en una entrevista por correo electrónico. «Específicamente, automatiza la revisión de la literatura al encontrar artículos relevantes, extraer información clave sobre los estudios y organizar la información en conceptos».

Elicit es una empresa con fines de lucro derivada de Ought, una fundación de investigación sin fines de lucro lanzada en 2017 por Stuhlmüller, un ex investigador del laboratorio de computación y cognición de Stanford. El otro cofundador de Elicit, Jungwon Byun, se unió a la startup en 2019 después de liderar el crecimiento de la firma de préstamos en línea Upstart.

Utilizando una variedad de modelos propios y de terceros, Elicit busca y descubre conceptos en todos los artículos, lo que permite a los usuarios hacer preguntas como «¿Cuáles son todos los efectos de la creatina?» o «¿Cuáles son todos los conjuntos de datos que se han utilizado para estudiar el razonamiento lógico?» y obtenga una lista de respuestas de la literatura académica.

«Al automatizar el proceso de revisión sistemática, podemos ofrecer inmediatamente ahorros de costos y tiempo a las organizaciones de investigación académicas e industriales que producen estas revisiones», dijo Stuhlmüller. «Al reducir el costo lo suficiente, desbloqueamos nuevos casos de uso que antes tenían un costo prohibitivo, como actualizaciones justo a tiempo cuando cambia el estado del conocimiento en un campo».

Pero espera, se podría decir: ¿no tienen los modelos lingüísticos una tendencia a inventar cosas? De hecho lo hacen. El intento de Meta de crear un modelo de lenguaje para agilizar la investigación científica, Galactica, fue cancelado solo tres días después del lanzamiento, una vez que se descubrió que el modelo frecuentemente hacía referencia a artículos de investigación falsos que parecían correctos pero que en realidad no eran reales.

Sin embargo, Stuhlmüller afirma que Elicit ha tomado medidas para garantizar que su IA sea más confiable que muchas de las plataformas especialmente diseñadas que existen.

Por un lado, Elicit divide en partes «comprensibles para los humanos» las complejas tareas que realizan sus modelos. Esto permite a Elicit saber, por ejemplo, con qué frecuencia diferentes modelos inventan cosas cuando generan resúmenes y, posteriormente, ayuda a los usuarios a identificar qué respuestas verificar y cuándo.

Elicit también intenta calcular la «confiabilidad» general de un artículo científico, teniendo en cuenta factores como si los ensayos realizados en la investigación fueron controlados o aleatorios, la fuente de financiación y los conflictos potenciales y el tamaño de los ensayos.

La herramienta de búsqueda de Elicit para literatura sobre IA. Créditos de imagen: Obtener

«No hacemos interfaces de chat», dijo Stuhlmüller. «Los usuarios de Elicit aplican modelos de lenguaje como trabajos por lotes… Nunca generamos respuestas usando modelos, siempre vinculamos las respuestas a la literatura científica para reducir las alucinaciones y facilitar la verificación del trabajo de los modelos».

No estoy necesariamente convencido de que Elicit haya resuelto algunos de los principales problemas que afectan a los modelos lingüísticos actuales, dada su intratabilidad. Pero sus esfuerzos ciertamente parecen haber despertado el interés (y tal vez incluso la confianza) de la comunidad investigadora.

Stuhlmüller afirma que más de 200.000 personas utilizan Elicit cada mes, lo que representa un crecimiento interanual tres veces mayor (a partir de enero de 2023), de organizaciones como el Banco Mundial, Genentech y Stanford. «Nuestros usuarios piden pagar por funciones más potentes y ejecutar Elicit a mayor escala», añadió.

Presumiblemente, fue este impulso el que condujo a la primera ronda de financiación de Elicit: un tramo de 9 millones de dólares liderado por Fifty Years. El plan es destinar la mayor parte del nuevo efectivo a un mayor desarrollo del producto de Elicit, así como a ampliar el equipo de gerentes de producto e ingenieros de software de Elicit.

¿Pero cuál es el plan de Elicit para ganar dinero? Buena pregunta, y se la hice a Stuhlmüller sin rodeos. Señaló el nivel pago de Elicit, lanzado esta semana, que permite a los usuarios buscar artículos, extraer datos y resumir conceptos a una escala mayor que la que admite el nivel gratuito. La estrategia a más largo plazo es convertir a Elicit en una herramienta general de investigación y razonamiento, una herramienta por la que empresas enteras desembolsarían dinero.

Un posible obstáculo para el éxito comercial de Elicit son los esfuerzos de código abierto como el Modelo de Lenguaje Abierto del Instituto Allen de IA, cuyo objetivo es desarrollar un modelo de lenguaje grande de uso gratuito optimizado para la ciencia. Pero Stuhlmüller dice que ve el código abierto más como un complemento que como una amenaza.

«La principal competencia en este momento es el trabajo humano: asistentes de investigación que son contratados para extraer minuciosamente datos de los artículos», dijo Stuhlmüller. “La investigación científica es un mercado enorme y las herramientas de flujo de trabajo de investigación no tienen grandes protagonistas. Aquí es donde veremos surgir flujos de trabajo completamente nuevos centrados en la IA”.



Source link-48