{"id":311667,"date":"2022-11-23T11:26:47","date_gmt":"2022-11-23T11:26:47","guid":{"rendered":"https:\/\/magazineoffice.com\/agregue-diplomacia-a-la-lista-de-juegos-que-la-ia-puede-jugar-tan-bien-como-los-humanos\/"},"modified":"2022-11-23T11:26:51","modified_gmt":"2022-11-23T11:26:51","slug":"agregue-diplomacia-a-la-lista-de-juegos-que-la-ia-puede-jugar-tan-bien-como-los-humanos","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/agregue-diplomacia-a-la-lista-de-juegos-que-la-ia-puede-jugar-tan-bien-como-los-humanos\/","title":{"rendered":"Agregue ‘Diplomacia’ a la lista de juegos que la IA puede jugar tan bien como los humanos"},"content":{"rendered":"


\n<\/p>\n

\n

Los sistemas de aprendizaje autom\u00e1tico han estado limpiando el piso con sus oponentes humanos durante m\u00e1s de una d\u00e9cada (en serio, la primera victoria de Watson Jeopardy fue en 2011), aunque los tipos de juegos en los que sobresalen son bastante limitados. Por lo general, los juegos de mesa o videojuegos competitivos que utilizan un campo de juego limitado, movimientos secuenciales y al menos un oponente claramente definido, cualquier juego que requiera el c\u00e1lculo de n\u00fameros es una ventaja para ellos. La diplomacia, sin embargo, requiere muy pocos c\u00e1lculos, en lugar de eso, exige que los jugadores negocien directamente con sus oponentes y hagan las jugadas respectivas simult\u00e1neamente, algo para lo que los sistemas ML modernos generalmente no est\u00e1n dise\u00f1ados. Pero eso no ha impedido que los investigadores de Meta dise\u00f1en un agente de IA que pueda negociar posiciones de pol\u00edtica global tan bien como cualquier embajador de la ONU.<\/p>\n

Diplomacy se lanz\u00f3 por primera vez en 1959 y funciona como una versi\u00f3n m\u00e1s refinada de RISK en la que entre dos y siete jugadores asumen los roles de una potencia europea e intentan ganar el juego conquistando los territorios de sus oponentes. A diferencia de RISK, donde el resultado de los conflictos se decide simplemente tirando los dados, Diplomacy exige que los jugadores primero negocien entre s\u00ed (estableciendo alianzas, pu\u00f1aladas por la espalda, todas esas cosas buenas) antes de que todos muevan sus piezas simult\u00e1neamente durante la siguiente fase del juego. Las habilidades para leer y manipular a los oponentes, convencer a los jugadores para formar alianzas y planificar estrategias complejas, navegar en asociaciones delicadas y saber cu\u00e1ndo cambiar de bando, son una gran parte del juego, y todas las habilidades de las que generalmente carecen los sistemas de aprendizaje autom\u00e1tico.<\/p>\n

<\/p>\n

El mi\u00e9rcoles, los investigadores de Meta AI anunciaron que hab\u00edan superado esas deficiencias de aprendizaje autom\u00e1tico con CICERO, la primera IA que muestra un rendimiento a nivel humano en Diplomacia. El equipo entren\u00f3 a Cicero en 2700 millones de par\u00e1metros en el transcurso de 50 000 rondas en webDiplomacy.net, una versi\u00f3n en l\u00ednea del juego, donde termin\u00f3 en segundo lugar (de 19 participantes) en un torneo de liga de 5 juegos, todo mientras duplicaba la puntuaci\u00f3n media de sus oponentes.<\/p>\n

El agente de IA demostr\u00f3 ser tan h\u00e1bil \u00aben el uso del lenguaje natural para negociar con personas en Diplomacia que a menudo prefer\u00edan trabajar con CICERO sobre otros participantes humanos\u00bb, se\u00f1al\u00f3 el equipo de Meta en un comunicado de prensa el mi\u00e9rcoles. \u00abLa diplomacia es un juego de personas m\u00e1s que de piezas. Si un agente no puede reconocer que alguien probablemente est\u00e1 mintiendo o que otro jugador considerar\u00eda un movimiento determinado como agresivo, perder\u00e1 r\u00e1pidamente el juego. Del mismo modo, si no habla como una persona real, mostrando empat\u00eda, construyendo relaciones y hablando con conocimiento sobre el juego, no encontrar\u00e1 a otros jugadores dispuestos a trabajar con \u00e9l\u00bb.<\/p>\n

\n

Meta<\/p>\n<\/figure>\n

Esencialmente, Cicero combina la mentalidad estrat\u00e9gica de Pluribot o AlphaGO con las habilidades de procesamiento de lenguaje natural (NLP) de Blenderbot o GPT-3. El agente es incluso capaz de previsi\u00f3n. \u00abCicer\u00f3n puede deducir, por ejemplo, que m\u00e1s adelante en el juego necesitar\u00e1 el apoyo de un jugador en particular, y luego elaborar una estrategia para ganar el favor de esa persona, e incluso reconocer los riesgos y oportunidades que ese jugador ve desde su punto de vista particular\u00bb. vista\u00bb, anot\u00f3 el equipo de investigaci\u00f3n.<\/p>\n

El agente no entrena a trav\u00e9s de un esquema de aprendizaje por refuerzo est\u00e1ndar como lo hacen sistemas similares. El equipo de Meta explica que hacerlo conducir\u00eda a un rendimiento sub\u00f3ptimo ya que \u00abdepender \u00fanicamente del aprendizaje supervisado para elegir acciones basadas en di\u00e1logos anteriores da como resultado un agente que es relativamente d\u00e9bil y altamente explotable\u00bb.<\/p>\n

En cambio, Cicero usa un \u00abalgoritmo de planificaci\u00f3n iterativo que equilibra la consistencia del di\u00e1logo con la racionalidad\u00bb. Primero predecir\u00e1 las jugadas de sus oponentes en funci\u00f3n de lo que sucedi\u00f3 durante la ronda de negociaci\u00f3n, as\u00ed como la jugada que cree que sus oponentes creen que har\u00e1 antes de \u00abmejorar iterativamente estas predicciones tratando de elegir nuevas pol\u00edticas que tengan un valor esperado m\u00e1s alto dado el otro las pol\u00edticas predichas de los jugadores, al mismo tiempo que intenta mantener las nuevas predicciones cercanas a las predicciones de la pol\u00edtica original\u00bb. F\u00e1cil, \u00bfverdad?<\/p>\n

El sistema a\u00fan no es infalible, ya que en ocasiones el agente se volver\u00e1 demasiado inteligente y terminar\u00e1 jugando a s\u00ed mismo adoptando posiciones de negociaci\u00f3n contradictorias. A\u00fan as\u00ed, su desempe\u00f1o en estos primeros ensayos es superior al de muchos pol\u00edticos humanos. Meta planea continuar desarrollando el sistema para \u00abservir como una caja de arena segura para avanzar en la investigaci\u00f3n en la interacci\u00f3n humano-IA\u00bb.<\/p>\n<\/div>\n

Todos los productos recomendados por Engadget son seleccionados por nuestro equipo editorial, independiente de nuestra empresa matriz. Algunas de nuestras historias incluyen enlaces de afiliados. Si compra algo a trav\u00e9s de uno de estos enlaces, podemos ganar una comisi\u00f3n de afiliado. Todos los precios son correctos en el momento de la publicaci\u00f3n.<\/em><\/p>\n


\n
Source link-47<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"

Los sistemas de aprendizaje autom\u00e1tico han estado limpiando el piso con sus oponentes humanos durante m\u00e1s de una d\u00e9cada (en serio, la primera victoria de Watson Jeopardy fue en 2011),…<\/p>\n","protected":false},"author":1,"featured_media":311668,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[21981],"tags":[26226,261,216,11917,3275,278,1313,100,8,495,1435],"_links":{"self":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/311667"}],"collection":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/comments?post=311667"}],"version-history":[{"count":1,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/311667\/revisions"}],"predecessor-version":[{"id":311669,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/311667\/revisions\/311669"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media\/311668"}],"wp:attachment":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media?parent=311667"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/categories?post=311667"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/tags?post=311667"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}