El último agente de inteligencia artificial de Google DeepMind aprendió a jugar ‘Goat Simulator 3’


«SIMA va un paso más allá y muestra una generalización más fuerte a nuevos juegos», afirma. “El número de entornos es todavía muy reducido, pero creo que SIMA va por buen camino.

Una nueva forma de jugar

SIMA muestra a DeepMind dándole un nuevo giro a los agentes de juego, una tecnología de inteligencia artificial en la que la compañía ha sido pionera en el pasado.

En 2013, antes de que Google adquiriera DeepMind, la startup con sede en Londres mostró cómo una técnica llamada aprendizaje por refuerzo, que implica entrenar un algoritmo con retroalimentación positiva y negativa sobre su rendimiento, podría ayudar a las computadoras a jugar videojuegos clásicos de Atari. En 2016, como parte de Google, DeepMind desarrolló AlphaGo, un programa que utilizó el mismo enfoque para derrotar a un campeón mundial de Go, un antiguo juego de mesa que requiere una habilidad sutil e instintiva.

Para el proyecto SIMA, el equipo de Google DeepMind colaboró ​​con varios estudios de juegos para recopilar datos de teclado y mouse de humanos que juegan 10 juegos diferentes con entornos 3D, incluidos El cielo de nadie, Demoler, hidroneroy Satisfactorio. Más tarde, DeepMind agregó etiquetas descriptivas a esos datos para asociar los clics y toques con las acciones que realizaron los usuarios, por ejemplo, si eran una cabra buscando su mochila propulsora o un personaje humano excavando en busca de oro.

Los datos obtenidos de los jugadores humanos se introdujeron en un modelo de lenguaje del tipo que impulsa los chatbots modernos, que habían adquirido la capacidad de procesar el lenguaje al digerir una enorme base de datos de texto. Luego, SIMA podría llevar a cabo acciones en respuesta a comandos escritos. Y finalmente, los humanos evaluaron los esfuerzos de SIMA dentro de diferentes juegos, generando datos que se utilizaron para ajustar su rendimiento.

El software SIMA AI se entrenó utilizando datos de humanos que jugaban 10 juegos diferentes con entornos 3D.

Cortesía de Google DeepMind

Después de todo ese entrenamiento, SIMA es capaz de realizar acciones en respuesta a cientos de comandos dados por un jugador humano, como «Gira a la izquierda» o «Ve a la nave espacial» o «Atraviesa la puerta» o «Tala un árbol». » El programa puede realizar más de 600 acciones, que van desde exploración hasta combate y uso de herramientas. Los investigadores evitaron los juegos que presentaban acciones violentas, de acuerdo con las directrices éticas de Google sobre IA.

«Sigue siendo en gran medida un proyecto de investigación», dice Tim Harley, otro miembro del equipo de Google DeepMind. «Sin embargo, uno podría imaginarse algún día tener agentes como SIMA jugando junto a ti en juegos contigo y con tus amigos».

Los videojuegos proporcionan un entorno relativamente seguro para encargar a los agentes de IA que hagan cosas. Para que los agentes realicen tareas útiles de oficina o administrativas cotidianas, deberán volverse más confiables. Harley y Besse de DeepMind dicen que están trabajando en técnicas para hacer que los agentes sean más confiables.

Actualizado el 13/03/2024 a las 10:20 am ET: comentario agregado de Linxi «Jim» Fan.



Source link-46