2024 - Meta desarrolla un bot de lenguaje AI que puede usar herramientas de software externas

Agrandar / Impresión de un artista de una mano robótica usando una calculadora de escritorio.

Los modelos de lenguaje como ChatGPT han revolucionado el campo del procesamiento del lenguaje natural, pero aún tienen dificultades con algunas tareas básicas como la aritmética y la verificación de hechos. El jueves pasado, los investigadores de Meta revelaron Toolformer, un modelo de lenguaje de IA que puede aprender a usar herramientas externas como motores de búsqueda, calculadoras y calendarios sin sacrificar sus capacidades básicas de modelado de lenguaje.

La clave de Toolformer es que puede usar API (interfaces de programación de aplicaciones), que son un conjunto de protocolos que permiten que diferentes aplicaciones se comuniquen entre sí, a menudo de manera transparente y automatizada. Durante la capacitación, los investigadores le dieron a Toolformer un pequeño conjunto de ejemplos escritos por humanos que demostraban cómo se usa cada API y luego le permitieron anotar un gran conjunto de datos de modelado de lenguaje con posibles llamadas a la API. Hizo esto de una manera «autosupervisada», lo que significa que podía aprender sin necesidad de una guía humana explícita.

El modelo aprendió a predecir cada llamada API basada en texto como si fuera cualquier otra forma de texto. Cuando está en funcionamiento, generando texto como resultado de una entrada humana, puede insertar las llamadas cuando sea necesario. Además, Toolformer puede «decidir» por sí mismo qué herramienta usar para el contexto adecuado y cómo usarla.

Esta capacidad de llamar a la API permite que Toolformer utilice herramientas de software externas como motores de búsqueda, calculadoras, traductores de idiomas y referencias fácticas. Por ejemplo, los modelos de lenguaje extenso (LLM) son bien conocidos por no ser particularmente bueno en aritmética. Toolformer puede sortear esa limitación mediante el uso de un programa de calculadora. O si alguien quisiera un asistente basado en LLM para agregar una fecha a su calendario, Toolformer podría manejar esa tarea usando un enlace API a una aplicación de calendario.

Una ilustración proporcionada por el investigador de Meta Timo Schick muestra un ejemplo de Toolformer haciendo una llamada API a la aplicación de calendario.
Una ilustración proporcionada por el investigador de Meta Timo Schick muestra un ejemplo de Toolformer haciendo una llamada API a la aplicación de calculadora.
Una ilustración proporcionada por el investigador de Meta Timo Schick muestra un ejemplo de Toolformer haciendo una llamada API a una referencia fáctica externa.

Toolformer se basa en un modelo GPT-J preentrenado con 6.700 millones de parámetros. Los experimentos realizados por los investigadores en varias tareas de uso de herramientas parecen demostrar que Toolformer logra un rendimiento mucho mayor que el modelo GPT-3, mucho más grande, que contiene 175 mil millones de parámetros.

Esta no es la primera vez que los investigadores intentan compensar las limitaciones en los modelos de lenguaje. De hecho, el modelo reciente de Bing Chat que fue noticia esta semana puede realizar búsquedas web por sí mismo cuando sea necesario, y otros han intentado integraciones con navegadores, calculadoras y motores de búsqueda. Según los investigadores de Meta, la mayoría de los enfoques existentes para integrar herramientas en modelos de lenguaje se han basado en grandes cantidades de anotaciones humanas o se han limitado a configuraciones específicas de tareas específicas. Por el contrario, Toolformer puede aprender a usar una variedad de herramientas de forma generalizada que no requiere capacitación especializada para tareas específicas.

Con técnicas como las que se encuentran en Toolformer, estamos viendo un futuro potencial en el que los LLM aumentados con la capacidad de usar aplicaciones externas se convertirán en asistentes mucho más versátiles y confiables (ostensiblemente). Pero la capacidad de realizar llamadas API también podría aumentar la capacidad de un LLM para dañar los datos del usuario (en aplicaciones) o crear problemas en el mundo exterior (a través de un navegador web o herramientas de comunicación), capacidades que podrían invocar accidentalmente mientras brindan una respuesta. .

Source link-49

‘Aquellos a punto de morir’: primer vistazo a Anthony Hopkins y más en la serie Roman Empire de Roland Emmerich

Kino Lorber Boss explica por qué los DVD “siguen siendo una parte importante de nuestro negocio”

Adria Arjona y Edgar Ramírez coprotagonizarán el thriller distópico de Jayro Bustamante ‘El Sombreron’ Más popular Lectura obligada Suscríbase a los boletines de variedades Más de nuestras marcas

Cómo envainar tu espada en Ghost of Tsushima

Meta desarrolla un bot de lenguaje AI que puede usar herramientas de software externas