Cómo usar Jarvis, el bot de IA único de Microsoft para gobernarlos a todos


Con toda la charla sobre chatbots como ChatGPT, es fácil olvidar que el chat basado en texto es solo una de las muchas funciones de IA. La IA generativa ideal sería capaz de trabajar en diferentes modelos según sea necesario, interpretando y generando imágenes, audio y video.

Ingrese a Jarvis, un nuevo proyecto de Microsoft que promete un bot para gobernarlos a todos. Jarvis usa ChatGPT como controlador de un sistema en el que puede emplear una variedad de otros modelos según sea necesario para responder a su solicitud. en un papel (se abre en una pestaña nueva) publicado por la Universidad de Cornell, los investigadores de Microsoft (Yongliang Shen, Kaitao Song, Xu Tan, Dongsheng Li, Weiming Lu y Yueting Zhuang) explican cómo funciona este marco. Un usuario realiza una solicitud al bot, planifica la tarea, elige qué modelos necesita, hace que esos modelos realicen la tarea y luego genera y emite una respuesta.

El siguiente gráfico, proporcionado en el trabajo de investigación, muestra cómo funciona este proceso en el mundo real. Un usuario le pide al bot que cree una imagen en la que una niña lee un libro y se coloca de la misma manera que un niño en una imagen de muestra. El bot planifica la tarea, usa un modelo para interpretar la pose del niño en la imagen original y luego implementa otro modelo para dibujar el resultado.

(Crédito de la imagen: Investigación de Microsoft)

Microsoft tiene una página de Github (se abre en una pestaña nueva) donde puede descargar y probar Jarvis en una PC con Linux. La compañía recomienda que use Ubuntu (específicamente la versión obsoleta 16 LTS), pero pude obtener la característica principal, un chatbot basado en terminal, que funciona en Ubuntu 22.04 LTS y en Windows Subsystem para Linux.



Source link-41