Esta IA usó GPT-4 para convertirse en un jugador experto de Minecraft


Los investigadores de IA han creado un bot de Minecraft que puede explorar y expandir sus capacidades en el mundo abierto del juego, pero a diferencia de otros bots, este básicamente escribió su propio código a través de prueba y error y lotes de consultas GPT-4.

Llamado Voyager, este sistema experimental es un ejemplo de un «agente encarnado», una IA que puede moverse y actuar libremente y con un propósito en un entorno simulado o real. Las IA de tipo asistente personal y los chatbots no tienen que hacer cosas, y mucho menos navegar en un mundo complejo para hacer esas cosas. Pero eso es exactamente lo que se espera que haga un robot doméstico en el futuro, por lo que hay mucha investigación sobre cómo podrían hacerlo.

Minecraft es un buen lugar para probar este tipo de cosas porque es una representación muy (muy) aproximada del mundo real, con reglas y física simples y directas, pero también es lo suficientemente complejo y abierto como para lograr o intentar muchas cosas. Los simuladores especialmente diseñados también son geniales, pero tienen sus propias limitaciones.

MineDojo es un marco de simulación construido alrededor de Minecraft, ya que no puedes simplemente colocar una IA aleatoria allí y esperar que entienda lo que están haciendo todos estos bloques y cerdos. Sus creadores (muy superpuestos con el equipo de Voyager) compilaron videos de YouTube sobre el juego, transcripciones, artículos de wiki y una gran cantidad de publicaciones de Reddit de r/minecraft, entre otros datos, para que los usuarios puedan crear o ajustar una IA. modelo sobre ellos. También permite que esos modelos se evalúen de manera más o menos objetiva al ver qué tan bien hacen cosas como construir una cerca alrededor de una llama o encontrar y extraer un diamante.

La Voyager sobresale en estas tareas, con un rendimiento mucho mejor que el único otro modelo que se le acerca, Auto-GPT. Pero tienen un enfoque similar: usan GPT-4 para escribir su propio código sobre la marcha.

Normalmente, solo entrenarías a un modelo con todos esos buenos datos de Minecraft y esperarías que descubra cómo luchar contra los esqueletos cuando se pone el sol. Voyager, sin embargo, comienza relativamente ingenuo y, a medida que encuentra cosas en el juego, tiene una pequeña conversación interna con GPT-4 sobre lo que debe hacer y cómo.

Dirigir la siguiente acción y agregar habilidades a la pila. Créditos de imagen: MineDojo

Por ejemplo, cae la noche y salen esos esqueletos. El agente tiene una idea general de esto, pero se pregunta ¿Qué haría un buen jugador de este juego cuando hay monstruos cerca? Bueno, dice GPT-4, si quieres explorar el mundo de manera segura, querrás hacer y equipar una espada, luego golpear el esqueleto con ella y evitar que te golpeen. Y ese sentido general de qué hacer se traduce en objetivos concretos: recoger piedra y madera, construir una espada en la mesa de trabajo, equiparla y luchar contra un esqueleto.

Una vez que ha hecho esas cosas, se ingresan en una biblioteca de habilidades generales para que más tarde, cuando la tarea sea «adentrarse en una cueva para encontrar mineral de hierro», no tenga que aprender a pelear nuevamente desde cero. Todavía usa GPT, pero usa el GPT-3.5 más barato y rápido, que le indica las habilidades más relevantes para una situación determinada, por lo que no intenta extraer el esqueleto y luchar contra el mineral.

Es similar a un agente como Auto-GPT que, cuando se enfrenta a una interfaz que aún no conoce, tiene que aprender a navegar por ella para lograr su objetivo. Pero Minecraft es un entorno mucho más profundo de lo que está acostumbrado a resolver, por lo que un agente especializado como Voyager lo hace mucho mejor. Encuentra más cosas, aprende más habilidades y explora un área mucho más grande que los otros bots.

Curiosamente, pero quizás no sorprendentemente, GPT-4 arrasa con GPT-3.5 (es decir, ChatGPT) cuando se trata de generar código útil. Una prueba que reemplazó la primera con la última hizo que el agente chocara contra una pared desde el principio, tal vez incluso literalmente, y no pudo mejorar. Al hablar con los dos modelos, puede que no sea obvio que uno es mucho más inteligente, pero la verdad es que no tienes que ser particularmente inteligente para mantener una conversación aparentemente inteligente (pregúntame cómo lo sé). La codificación es mucho más difícil y GPT-4 fue una gran actualización allí.

El objetivo de esta investigación no es dejar obsoletos a los jugadores de Minecraft, sino encontrar métodos mediante los cuales los modelos de IA relativamente simples puedan mejorar en función de sus «experiencias», a falta de una palabra mejor. Si vamos a tener robots que nos ayuden en nuestros hogares, hospitales y oficinas, deberán aprender y aplicar esas lecciones en acciones futuras.

Puede leer más sobre Voyager aquí.



Source link-48