Varias instancias de Chat GPT se combinan para descubrir la química


Agrandar / El laboratorio está vacío porque todos se relajan en el parque mientras la IA hace su trabajo.

A pesar de los rápidos avances en inteligencia artificial, las IA no están ni cerca de estar listas para reemplazar a los humanos en la actividad científica. Pero eso no significa que no puedan ayudar a automatizar parte del trabajo pesado de la rutina diaria de la experimentación científica. Por ejemplo, hace unos años, los investigadores pusieron una IA al mando de equipos de laboratorio automatizados y le enseñaron a catalogar exhaustivamente todas las reacciones que pueden ocurrir entre un conjunto de materiales de partida.

Si bien fue útil, aún requirió mucha intervención de los investigadores para entrenar el sistema en primer lugar. Un grupo de la Universidad Carnegie Mellon ha descubierto cómo conseguir que un sistema de inteligencia artificial aprenda por sí solo a hacer química. El sistema requiere un conjunto de tres instancias de IA, cada una especializada para diferentes operaciones. Pero, una vez configurado y provisto de materias primas, sólo tienes que decirle qué tipo de reacción quieres que se realice y lo resolverá.

Una trinidad de IA

Los investigadores indican que estaban interesados ​​en comprender qué capacidades pueden aportar los modelos de lenguaje grande (LLM) al esfuerzo científico. Por lo tanto, todos los sistemas de IA utilizados en este trabajo son LLM, principalmente GPT-3.5 y GPT-4, aunque también se probaron algunos otros (Claude 1.3 y Falcon-40B-Instruct). (GPT-4 y Claude 1.3 obtuvieron los mejores resultados). Pero, en lugar de utilizar un solo sistema para manejar todos los aspectos de la química, los investigadores establecieron instancias distintas para cooperar en una configuración de división del trabajo y lo llamaron «Coscientist».

Los tres sistemas que utilizaron son:

Buscador web. Esto tiene dos capacidades principales. Una es utilizar la API de búsqueda de Google para encontrar páginas que valga la pena consultar por la información que contienen. La segunda es ingerir esas páginas y extraer información de ellas; considérelo similar al contexto de las partes anteriores de una conversación que Chat GPT puede mantener para informar sus respuestas posteriores. Los investigadores pudieron rastrear dónde pasaba su tiempo este módulo, y aproximadamente la mitad de los lugares que visitó eran páginas de Wikipedia. Los cinco sitios principales que visitó incluyeron las revistas publicadas por la Sociedad Química Estadounidense y la Sociedad Real de Química.

Buscador de documentación. Piense en esto como la instancia RTFM. A la IA se le daría el control de varios equipos de automatización de laboratorio, como manipuladores robóticos de fluidos y demás, a menudo controlados mediante comandos especializados o algo así como una API de Python. Esta instancia de IA tuvo acceso a todos los manuales de este equipo, lo que le permitió descubrir cómo controlarlo.

Planificador. El planificador puede emitir comandos a las otras dos instancias de IA y procesar sus respuestas. Tiene acceso a una zona de pruebas de Python para ejecutar código, lo que le permite realizar cálculos. También tiene acceso al equipo de laboratorio automatizado, lo que le permite realizar y analizar experimentos. Por lo tanto, se puede pensar en el planificador como la parte del sistema que tiene que actuar como un químico, aprendiendo de la literatura e intentando utilizar equipos para implementar lo que ha aprendido.

El planificador también puede determinar cuándo ocurren errores de software (ya sea en sus scripts Python o en sus intentos de controlar el hardware automatizado), lo que le permite corregir sus errores.

Poner el sistema en uso

Inicialmente, se pidió al sistema que sintetizara una serie de sustancias químicas como el paracetamol y el ibuprofeno, lo que confirmó que, en general, podía encontrar una síntesis viable después de buscar en la web y en la literatura científica. Entonces, la pregunta es si el sistema podría descubrir el hardware al que tenía acceso lo suficientemente bien como para poner en funcionamiento su capacidad conceptual.

Para comenzar con algo simple, los investigadores utilizaron una placa de muestra estándar, que contiene un montón de pequeños pocillos dispuestos en una cuadrícula rectangular. Se pidió al sistema que rellenara cuadrados, franjas diagonales u otros patrones utilizando líquidos de varios colores y logró hacerlo de forma eficaz.

A partir de ahí, colocaron tres soluciones de diferentes colores en lugares aleatorios de la cuadrícula de pozos; Se pidió al sistema que identificara qué pozos eran de qué color. Por sí solo, Coscientist no sabía cómo hacer esto. Pero cuando se le dio un mensaje que le recordaba que los diferentes colores mostrarían diferentes espectros de absorción, utilizó un espectrógrafo al que tenía acceso y pudo identificar los diferentes colores.

Con el comando y control básico aparentemente funcionando, los investigadores decidieron probar algo de química. Proporcionaron una placa de muestra con pocillos llenos de sustancias químicas simples, catalizadores y similares, y le pidieron que realizara una reacción química específica. Coscientist acertó con la química desde el principio, pero sus intentos de ejecutar la síntesis fracasaron porque envió un comando no válido al hardware que calienta y agita las reacciones. Eso lo envió de regreso al módulo de Documentación, lo que le permitió corregir el problema y ejecutar reacciones.

Y funcionó. En la mezcla de reacción estaban presentes firmas espectrales de los productos deseados y su presencia se confirmó mediante cromatografía.

Mejoramiento

Con las reacciones básicas funcionando, los investigadores pidieron al sistema que mejorara la eficiencia de la reacción; presentaron el proceso de optimización como un juego en el que la puntuación aumentaría con el rendimiento de la reacción.

El sistema hizo algunas conjeturas erróneas en la primera ronda de reacciones de prueba, pero rápidamente se centró en mejores rendimientos. Los investigadores también descubrieron que podían evitar las malas decisiones en la primera ronda proporcionando a Coscientist información sobre los rendimientos generados por un puñado de mezclas iniciales aleatorias. Esto implica que no importa de dónde obtiene Coscientist su información (ya sea de las reacciones que ejecuta o de alguna fuente de información externa), es capaz de incorporar la información en su planificación.

Los investigadores concluyen que Coscientist tiene varias capacidades notables:

  • Planificación de la síntesis química utilizando información pública.
  • Navegación y procesamiento de manuales técnicos para hardware complicado.
  • Usar ese conocimiento para controlar una variedad de equipos de laboratorio.
  • Integración de estas capacidades de manejo de hardware en un flujo de trabajo de laboratorio
  • Analizar sus propias reacciones y utilizar esa información para diseñar condiciones de reacción mejoradas.

En muchos sentidos, esto se parece a la experiencia que podría tener un estudiante en el primer año de la escuela de posgrado. Idealmente, el estudiante de posgrado progresará más allá de eso. Pero tal vez GPT-5 también pueda hacerlo.

Más en serio, la estructura de Coscientist, que se basa en la interacción de varios sistemas especializados, es similar a cómo funcionan los cerebros. Obviamente, los sistemas especializados del cerebro son capaces de realizar una gama mucho más amplia de actividades, y hay muchas más. Pero puede ser que este tipo de estructura sea crítica para permitir comportamientos más complicados.

Dicho esto, los propios investigadores están preocupados por algunas de las capacidades de Coscientist. Hay muchas sustancias químicas (piense en cosas como los gases nerviosos) que no queremos que sean más fáciles de sintetizar. Y descubrir cómo decirle a las instancias de GPT que no hagan algo se ha convertido en un desafío continuo.

Nature, 2023. DOI: 10.1038/s41586-023-06792-0 (Acerca de los DOI).



Source link-49