Esta nueva generación de asistentes de IA quiere hacer las aburridas tareas de la oficina


Esta semana, OpenAI anunció un servicio que permite a casi cualquier persona crear una versión personalizada de ChatGPT, sin necesidad de conocimientos de codificación. La compañía sugiere que los usuarios quieran crear un bot que conozca las reglas de todos los juegos de mesa, enseñe matemáticas a los niños o pueda ofrecer consejos culinarios. Estos GPT, como los llama OpenAI, también pueden realizar acciones simples al conectarse a servicios de Internet, por ejemplo, buscar en correos electrónicos o pedir productos en una tienda en línea.

No se puede culpar a OpenAI por intentar aprovechar el éxito de su gran éxito ChatGPT. ¿Pero tal vez más chatbots no es lo que necesitamos?

Adept AI, una startup de San Francisco fundada por veteranos de OpenAI, Google y DeepMind, lanza hoy un agente de IA experimental que automatiza tareas comunes de una manera más sofisticada y potencialmente poderosa que los chatbots como ChatGPT. En lugar de limitarse a utilizar servicios en línea que proporcionan API para hacerlos accesibles al software, ACT-2 intenta usar una computadora más como un ser humano: dando sentido a los píxeles en una pantalla y luego tomando medidas para controlar un navegador y un navegador en línea. servicios.

Las demostraciones de Adept muestran cómo se puede utilizar ACT-2 para hacer cosas como recopilar información de correos electrónicos y documentos para completar reclamos de seguros, ingresar información de facturas enviadas por correo electrónico en software de cuentas por pagar y crear un recorrido a pie por una ciudad interactuando con Mapas de Google.

La forma en que ACT-2 intenta utilizar las mismas interfaces de usuario que los humanos promete hacerlo mucho más capaz y expansivo. En teoría, ese enfoque podría permitir que un chatbot haga literalmente cualquier cosa que una persona pueda hacer en su teléfono o computadora. Pero operar de esa manera también es más desafiante para los algoritmos y, por ahora, hace que el agente sea más propenso a errores.

Debajo del capó, ACT-2 utiliza un modelo de lenguaje grande llamado Fuyu. Es similar al que impulsa muchos chatbots, pero al igual que ChatGPT, puede manejar tanto texto como imágenes (lo que lo convierte en un «modelo multimodal»). El modelo analiza lo que ve en la pantalla de una computadora e intenta traducir la solicitud que un usuario escribió en acciones útiles que el bot debe realizar. Adept utiliza el aprendizaje por refuerzo, una técnica utilizada para enseñar a las computadoras tareas que incluyen juegos de mesa y videojuegos, para instruir a su IA sobre cómo realizar diferentes tareas. Esto implica observar a muchos humanos realizar tareas específicas y tratar de lograr un desempeño similar por sí mismos.

David Luan, fundador y director ejecutivo de Adept y anteriormente vicepresidente de ingeniería de OpenAI, dice que si bien los chatbots han cautivado a todos con sus capacidades, ha resultado un desafío lograr que los agentes de IA trabajen de manera confiable. Pero cree que Adept y otros están cada vez más cerca de resolver ese problema.

«Este año simplemente no estaban allí», dice Luan sobre los agentes actuales, incluido el suyo. «Creo que lo que va a pasar es que el año que viene habrá una guerra gigante en torno a agentes que realmente funcionan». Inicialmente, Adept está diseñando sus agentes para realizar sólo un número limitado de tareas de oficina simples pero comunes, y dice que ahora son al menos 95 por ciento confiables, lo que es suficiente para implementarlos comercialmente en unas pocas empresas.

Alcanzar ese nivel de confiabilidad solo para las tareas iniciales limitadas para las que está diseñado ACT-2 es un gran avance. Durante años, han existido herramientas para automatizar tareas de oficina (lo que se conoce como automatización robótica de procesos), pero su construcción es complicada y propensa a romperse. Si Adept y otros pueden utilizar la IA para automatizar de manera confiable muchas más tareas, podría transformar el trabajo de oficina y aumentar la productividad.

Si Luan tiene razón, entonces la batalla para automatizar sus tareas más tediosas podría hacer que las guerras de chatbots de 2023 parezcan relativamente tranquilas.



Source link-46