Después de tres años, la búsqueda de un jugador de Trackmania para construir una IA de carreras «imbatible» finalmente parece haber llegado a su fin.
Si no estás familiarizado con Trackmania, es una versión bastante salvaje de los juegos de carreras, centrada principalmente en contrarreloj a través de pistas creadas por usuarios llenas de curvas absurdas, sacacorchos y otros obstáculos muy poco realistas. Lo conozco principalmente por servidores personalizados extraños con vibraciones relajadas y listas de reproducción de música pirateada, pero tiene un modelo de conducción robusto que también lo convierte en un pasatiempo competitivo popular.
El hecho de que se trate de contrarreloj y pistas personalizadas también significa que Trackmania es un excelente banco de pruebas para el entrenamiento de la IA; como mínimo, inspiró a un jugador llamado Yosh a comenzar a construir una IA que pudiera superar sus tiempos. Ha estado dirigiendo un canal de YouTube que documenta el proceso de entrenamiento de IA durante algún tiempo, y tres años después finalmente lo logró. (Gracias, jugador de PC).
Para empezar, Yosh construyó una pista simple hecha de curvas simples, un poco como una forma de onda suavemente inclinada. A través de numerosas iteraciones, la IA aprendió rápidamente cómo completar la pista en un tiempo decente, pero todavía estaba muy por detrás de los tiempos de Yosh. «Entonces, al igual que mi IA», explica Yosh, «entré en un ciclo de prueba y error en el que adivinaba qué arreglar, volvía a ejecutar el entrenamiento y esperaba a ver si mejoraba. Por lo general, no era así. Fue un proceso doloroso». proceso.»
Al final, ese proceso de prueba y error dio sus frutos: la IA superó el tiempo de Yosh y siguió mejorando, recortando cada vez más fracciones de segundo del récord. Pero eso era sólo una pista simple, por lo que Yosh construyó un nuevo campo de entrenamiento en forma de un enorme laberinto sin límites. Aquí, la IA necesitó unas 35 horas de entrenamiento para superar el tiempo de Yosh, lo cual no está mal si se tiene en cuenta que se trata de competir contra un humano con 17 años de experiencia.
Pero en este punto faltaba algo: la IA aún no había sido entrenada para usar los frenos. Para ser justos, Yosh tampoco había estado usando los frenos, pero después de los éxitos de la IA decidió intentar algo injusto. Marcó un mejor tiempo unos nueve segundos más rápido al derrapar en las curvas con los frenos, y la IA casi instantáneamente logró superar ese tiempo también, a pesar de que todavía sufría la desventaja de no frenar.
Finalmente, Yosh logró entrenar a la IA en el arte místico de frenar y derrapar, y en este punto es efectivamente imparable, particularmente en una pista con estilo de laberinto enorme, donde la consistencia de una máquina es más capaz de superar los obstáculos. Pequeños errores que un humano podría cometer en una pista tan larga, pero la IA también ha podido superar sus tiempos en versiones mucho más cortas.
Para mí, la parte interesante no es tanto que una IA pueda superar los tiempos de un humano (por ejemplo, sí, espero que una computadora sea buena jugando a un juego de computadora), sino más bien la idea de cómo funciona el aprendizaje automático y la cantidad de trabajo. Se necesita entrenar un algoritmo de IA para un propósito determinado. Recientemente tuvimos otro excelente ejemplo de este tipo de cosas con la IA de Pokémon Rojo que tardó 7.000 horas en vencer al primer gimnasio.
El contenido generado por IA sigue siendo controvertido, con razón, pero es probable que la tecnología de aprendizaje automático esté con nosotros durante mucho tiempo. Este tipo de proyectos sirven como una forma muy interesante de aprender cómo funciona realmente esa tecnología.
Disfruta de tus propios momentos en el mejores juegos de carreras antes de que la IA venga inevitablemente a por ellos.