Google planea integrar técnicas de un sistema de inteligencia artificial creado para ganar juegos del complejo juego de mesa Go, con el fin de aumentar su modelo de lenguaje grande de próxima generación y su rival ChatGPT de OpenAI.
El nuevo modelo de lenguaje grande (LLM), conocido como Gemini, aprovechará el sistema de inteligencia artificial ganador del juego para aprovechar sus habilidades en el aprendizaje por refuerzo. Se espera que esto ofrezca mejoras en las tareas con las que los LLM actuales, como ChatGPT o Bard de Google, pueden tener dificultades o abrir nuevas oportunidades para su uso.
«En un nivel alto, puede pensar en Gemini como una combinación de algunas de las fortalezas de los sistemas tipo AlphaGo con las asombrosas capacidades de lenguaje de los modelos grandes», dice Demis Hassabis, CEO de Google DeepMind, en una historia de Wired.
Desde abril de este año, DeepMind se fusionó con el propio equipo interno de IA de Google para crear Google DeepMind.
Google adquirió inicialmente DeepMind en 2014 después de que mostró que su modelo de IA, conocido como AlphaGo, era el líder en un juego de mesa extremadamente complejo llamado Go. Poco después, en 2016, AlphaGo derrotó al entonces campeón Lee Sedol en cuatro de cinco juegos.
Más tarde, Lee se retiró por completo del juego, ya que afirmó que la IA «no puede ser derrotada».
Lee no estaba del todo en lo correcto en esa suposición, ya que Kellin Pelgrine derrotó a otra IA que juega Go, KataGo, por 14 juegos a 15 a principios de este año. Aunque Pelgrine fue asistido por una IA que detectó las debilidades de KataGo, por lo que tal vez sea más una victoria pírrica para nosotros, los humanos carnosos.
Entonces, lo que es de interés para el desarrollo de LLM de Google es cómo AlphaGo utiliza el aprendizaje por refuerzo para convertirse en un oponente formidable. Este es esencialmente un sistema a través del cual hace intentos y recibe comentarios sobre qué tan bien lo hizo, que cuando se combina con la capacidad de trazar muchos movimientos posibles en un juego, eventualmente lo llevó a derrotar a un oponente con dominio del juego.
Combine esa habilidad con los medios de un LLM para extraer información de Internet y regurgitarla en un lenguaje que suene natural y podría estar en una herramienta de IA más inteligente que las que existen hoy. Al menos esa es la creencia de Google, ya que sugiere que este tipo de nuevo razonamiento y refuerzo podría ayudar a que sus modelos de IA finalmente alcancen al ChatGPT dominante de OpenAI.
Aunque Gemini todavía está en proceso, y probablemente se desarrollará mucho más antes de que esté listo para un lanzamiento amplio.