Meta ha anunciado lo que llama un «avance» en un área específica de la IA para juegos: el software llamado Cicero, que es la primera IA en lograr un «rendimiento a nivel humano en el popular juego de estrategia Diplomacy». Diplomacy es originalmente un juego de mesa, que tiene muchos sucesores digitales oficiales y no oficiales, y la razón por la que es una opción tan interesante es que el núcleo del juego es la negociación: es decir, es un juego multijugador en el que los jugadores tienen que negociar constantemente con unos y otros.
La publicación que anuncia a Cicero reconoce varias ‘victorias’ de la IA sobre los humanos (verificación de hechos: Deep Blue perdió ante Garry Kasparov antes de vencerlo varios años después, después de lo cual IBM rechazó una revancha), pero dice que «los agentes versátiles y verdaderamente útiles tendrán que ir más allá simplemente moviendo piezas en un tablero». Por lo tanto, se pretende que Cicero pueda negociar, persuadir y trabajar con jugadores humanos para lograr objetivos estratégicos de la misma manera que lo haría un humano.
La diplomacia se ha visto durante mucho tiempo como uno de los grandes desafíos de la IA exactamente por estas razones. Debe comprender las motivaciones de otros jugadores, ajustar las estrategias sobre la marcha y, en última instancia, ganárselos para su lado. Bueno… Cicero jugó en webDiplomacy.net, una versión en línea del juego, y «obtuvo más del doble del puntaje promedio de los jugadores humanos y se ubicó en el 10 por ciento superior de los participantes que jugaron más de un juego».
De hecho: «Cicerón es tan eficaz en el uso del lenguaje natural para negociar con personas en Diplomacia que a menudo preferían trabajar con Cicero sobre otros participantes humanos».
¡Traición! Rango, sucia traición!
Parte del logro es que Cicero no se ha construido sobre el método tradicional de refuerzo de juego propio a través del cual la IA aprende juegos (jugando millones de juegos contra sí misma o contra humanos y analizando los datos). Meta dice que incorpora dos elementos principales: «razonamiento estratégico, como se usa en agentes como AlphaGo y Pluribus, y procesamiento de lenguaje natural, como se usa en modelos como GPT-3, BlenderBot 3, LaMDA y OPT-175B».
Una parte especialmente crucial es que Cicero puede reconocer a qué jugadores necesita ganar y proponer una estrategia para ponerlos de su lado. El software «ejecuta un algoritmo de planificación iterativo que equilibra la consistencia del diálogo con la racionalidad», prediciendo los movimientos futuros de los jugadores en función del diálogo antes de elaborar un plan que incorpore estas predicciones.
Todavía no se va a apoderar del mundo: Cicero solo es capaz de jugar Diplomacy, aunque, por supuesto, las ambiciones de Meta para este software se extienden mucho más allá de un viejo juego de mesa. La compañía considera que esto podría tener un gran impacto en los asistentes de chat de IA, permitiéndoles, por ejemplo, mantener conversaciones y diálogos de aprendizaje que enseñan a los humanos nuevas habilidades.
«Alternativamente, imagina un videojuego en el que los personajes no jugadores (NPC) puedan planificar y conversar como lo hace la gente, entendiendo tus motivaciones y adaptando la conversación en consecuencia, para ayudarte en tu búsqueda de asaltar el castillo».
Eso es algo interesante: tal vez la revista Edge tenía razón sobre Doom. Que si tu pudo hablar con los monstruos? Puedes leer más sobre el lado técnico de Cicero y encuentre el trabajo de investigación aquío míralo jugar contra algunos expertos humanos (se abre en una pestaña nueva).