¿Qué es Auto-GPT y por qué es importante?


La búsqueda de Silicon Valley para automatizar todo es incesante, lo que explica su última obsesión: Auto-GPT.

En esencia, Auto-GPT utiliza la versatilidad de los últimos modelos de IA de OpenAI para interactuar con el software y los servicios en línea, lo que le permite realizar tareas «autónomas» como X e Y. Pero a medida que aprendemos con modelos de lenguaje grandes, esta capacidad parece ser tan ancho como un océano pero tan profundo como un charco.

Auto-GPT, que es posible que hayas visto explotar recientemente en las redes sociales, es una aplicación de código abierto creada por el desarrollador de juegos Toran Bruce Richards. que utiliza los modelos de generación de texto de OpenAI, principalmente GPT-3.5 y GPT-4, para actuar de forma “autónoma”.

No hay magia en esa autonomía. Auto-GPT simplemente maneja los seguimientos de un aviso inicial de los modelos de OpenAI, preguntándolos y respondiéndolos hasta que se complete una tarea.

Auto-GPT, básicamente, es GPT-3.5 y GPT-4 combinados con un bot complementario que indica a GPT-3.5 y GPT-4 qué hacer. Un usuario le dice a Auto-GPT cuál es su objetivo y el bot, a su vez, usa GPT-3.5 y GPT-4 y varios programas para llevar a cabo todos los pasos necesarios para lograr cualquier objetivo que se haya fijado.

Lo que hace que Auto-GPT sea razonablemente capaz es su capacidad para interactuar con aplicaciones, software y servicios tanto en línea como locales, como navegadores web y procesadores de texto. Por ejemplo, ante un aviso como «ayúdame a hacer crecer mi negocio de flores», Auto-GPT puede desarrollar una estrategia publicitaria algo plausible y construir un sitio web básico.

Como Joe Koen, un desarrollador de software que experimentó con Auto-GPT, le explicó a TechCrunch por correo electrónico, Auto-GPT esencialmente automatiza proyectos de varios pasos que habrían requerido indicaciones de ida y vuelta con un modelo de IA orientado a chatbot como, digamos , ChatGPT de OpenAI.

“Auto-GPT define un agente que se comunica con la API de OpenAI”, dijo Koen. “El objetivo de este agente es ejecutar una variedad de comandos que la IA genera en respuesta a las solicitudes del agente. Se le solicita al usuario que ingrese para especificar el rol y los objetivos de la IA antes de que el agente comience a ejecutar los comandos”.

En una terminal, los usuarios describen el nombre, la función y el objetivo del agente Auto-GPT y especifican hasta cinco formas de lograr ese objetivo. Por ejemplo:

  • Nombre: Smartphone-GPT
  • Role: Una IA diseñada para encontrar el mejor smartphone
  • Objetivo: Encuentra los mejores smartphones del mercado
  • Meta 1: Realice estudios de mercado para diferentes teléfonos inteligentes en el mercado actual
  • Meta 2: Obtenga los cinco mejores teléfonos inteligentes y enumere sus ventajas y desventajas

Detrás de escena, Auto-GPT se basa en funciones como la gestión de memoria para ejecutar tareas, junto con GPT-4 y GPT-3.5 para la generación de texto, almacenamiento de archivos y resumen.

Auto-GPT también se puede conectar a sintetizadores de voz, como los de ElevenLabs, para que pueda «realizar» llamadas telefónicas, por ejemplo.

Auto-GPT está disponible públicamente en GitHub, pero requiere cierta configuración y conocimientos para ponerse en marcha. Para usarlo, Auto-GPT debe estar instalado en un entorno de desarrollo como Docker, y debe estar registrado con una clave API de OpenAI, lo que requiere una cuenta paga de OpenAI.

Podría valer la pena, aunque el jurado está deliberando sobre eso. Los primeros usuarios han utilizado Auto-GPT para asumir el tipo de tareas mundanas que es mejor delegar en un bot. Por ejemplo, Auto-GPT puede incluir elementos como depurar código y escribir un correo electrónico o cosas más avanzadas, como crear un plan de negocios para un nuevo inicio.

«Si Auto-GPT encuentra algún obstáculo o incapacidad para terminar la tarea, desarrollará nuevas indicaciones para ayudarlo a navegar la situación y determinar los próximos pasos apropiados», dijo Adnan Masood, el arquitecto jefe de UST, una firma de consultoría tecnológica. TechCrunch en un correo electrónico. “Los modelos de lenguaje grandes sobresalen en la generación de respuestas similares a las humanas, pero dependen de las indicaciones e interacciones del usuario para brindar los resultados deseados. Por el contrario, Auto-GPT aprovecha las capacidades avanzadas de la API de OpenAI para operar de forma independiente sin la intervención del usuario”.

En las últimas semanas, han surgido nuevas aplicaciones para hacer que Auto-GPT sea aún más fácil de usar, como AgentGPT y GodMode, que brindan una interfaz simple donde los usuarios pueden ingresar lo que desean lograr directamente en una página del navegador. Tenga en cuenta que, al igual que Agent-GPT, ambos requieren una clave API de OpenAI para desbloquear todas sus capacidades.

Sin embargo, como cualquier herramienta poderosa, Auto-GPT tiene sus limitaciones y riesgos.

Dependiendo del objetivo que proporcione la herramienta, Auto-GPT puede comportarse de maneras muy… inesperadas. Un usuario de Reddit afirma que, dado un presupuesto de $100 para gastar dentro de una instancia de servidor, Auto-GPT creó una página wiki sobre gatos, explotó una falla en la instancia para obtener acceso de nivel de administrador y se hizo cargo del entorno de Python en el que estaba. corriendo, y luego se «mató» a sí mismo.

También está ChaosGPT, una versión modificada de Auto-GPT con objetivos como «destruir a la humanidad» y «establecer el dominio global». Como era de esperar, ChaosGPT no se ha acercado a provocar el apocalipsis de los robots, pero ha twitteado de manera bastante poco halagadora sobre la humanidad.

Sin embargo, podría decirse que más peligrosos que el Auto-GPT que intenta «destruir a la humanidad» son los problemas imprevistos que pueden surgir en escenarios perfectamente normales. Debido a que se basa en los modelos de lenguaje de OpenAI, modelos que, como todos los modelos de lenguaje, son propensos a imprecisiones, puede cometer errores.

Ese no es el único problema. Después de completar con éxito una tarea, Auto-GPT generalmente no recuerda cómo realizarla para su uso posterior e, incluso cuando lo hace, a menudo no recuerda usar el programa. Auto-GPT también tiene dificultades para dividir de manera efectiva las tareas complejas en subtareas más simples y tiene problemas para comprender cómo se superponen los diferentes objetivos.

«Auto-GPT ilustra el poder y los riesgos desconocidos de la IA generativa», dijo Clara Shih, directora ejecutiva de Service Cloud de Salesforce y entusiasta de Auto-GPT, por correo electrónico. “Para las empresas, es especialmente importante incluir un enfoque humano en el circuito al desarrollar y utilizar tecnologías de IA generativa como Auto-GPT”.





Source link-48