Go: Las IA enseñan a jugar y a diseñar mejor

En 2016, AlphaGo de Google DeepMind derrotó al campeón mundial de Go, Lee Sedol, en una partida que sacudió al mundo de los juegos de estrategia. Y eso cambió la manera humana de jugar.

El sistema ganó cuatro de las cinco rondas, y la comparación obligada fue con la caída de Garry Kasparov ante Deep Blue en 1997. Go llevaba tiempo considerado un desafío fuera del alcance de las máquinas, más complejo que el ajedrez por la cantidad de posiciones posibles.

La reacción inmediata fue la que se repite cada vez que una IA supera a humanos en un dominio que se creía exclusivamente nuestro: preocupación por el futuro de la creatividad y el trabajo humano. Pero hubo algo distinto en la respuesta de los propios jugadores. Sedol reconoció después de su derrota que el estilo de la IA fue tan distinto que necesitó tiempo para adaptarse, y que esa experiencia lo llevó a estudiar Go con más profundidad.

El campeón europeo Fan Hui, que también había perdido contra AlphaGo, dijo que las partidas le mostraron el juego de una forma completamente distinta, y que su ranking mundial mejoró notablemente después de eso. ¿Qué tal?

Durante años, esas declaraciones quedaron como anécdotas. Ahora hay datos.

La evidencia: 5.800 millones de movimientos

Un estudio publicado en marzo de 2023 en PNAS, liderado por Minkyu Shin (City University of Hong Kong), analizó una base de datos de 5.800 millones de movimientos jugados en torneos entre 1950 y 2021. El equipo usó otra IA, KataGo, para evaluar la calidad de cada decisión humana: simularon 10.000 posibles desarrollos de partida después de cada uno de esos millones de movimientos para construir un índice de calidad.

Con eso, también midieron la «novedad», es decir, cuándo aparecía por primera vez un movimiento nunca registrado antes en la historia del juego, algo similar a lo que hacen los ajedrecistas para identificar nuevas aperturas.

Los resultados son contundentes. Durante 66 años, la calidad de las decisiones humanas se mantuvo estable. Después del período 2016-2017, comenzó a subir. Los movimientos novedosos también empezaron a aparecer antes en las partidas y, a partir de ese momento, esos movimientos contribuyeron más que los ya conocidos a mejorar la calidad de las decisiones, algo que antes no pasaba.

Los investigadores también descartaron que esto fuera simple memorización de jugadas: la memorización no alcanza para explicar la mejora, y resultó poco probable que explique el aumento de novedad observado después de 2016-2017.

¿Por qué le importa esto a alguien que diseña juegos?

Porque el patrón describe exactamente lo que nos interesa cuando pensamos en sistemas de juego, aprendizaje y diseño de experiencias: un agente (humano o no) se enfrenta a un oponente que opera con una lógica distinta, y ese choque genera no solo derrota sino una reorganización del propio repertorio de jugadas.

A David Silver, uno de los líderes del proyecto AlphaGo, le sorprende la velocidad con la que los jugadores humanos incorporaron estos descubrimientos a su propio juego, y considera que esto sugiere que los humanos van a construir sobre estos hallazgos para aumentar su potencial.

Si hablamos de diseño de juegos, esto sugiere algo concreto: enfrentar a los jugadores con sistemas, reglas o IAs que jueguen «distinto» no es solo un obstáculo, puede ser una herramienta de aprendizaje. Un oponente que rompe las heurísticas habituales obliga a los jugadores a salir de sus patrones automáticos y a explorar el espacio de posibilidades de un juego de una forma que la práctica contra pares similares no logra.

El otro lado: confianza

Murat Kantarcioglu, de la Universidad de Texas en Dallas, plantea el problema que sigue abierto: si la IA puede ayudar a mejorar la toma de decisiones humanas en dominios complejos, el desafío central pasa a ser la confianza que depositamos en esos sistemas.

Es la misma tensión que atraviesa cualquier herramienta de IA que usamos hoy para producir, iterar o aprender: el valor está ahí, pero la pregunta de cómo y cuánto confiar en lo que esa herramienta nos devuelve sigue siendo nuestra. Humans won! 🎲

– –
Fuente: «AI’s Victories in Go Inspire Better Human Game Playing», en Scientific American.

Comentarios

¿Algo para aportar o compartir? Te leemos en nuestro grupo de Telegram.

COMPARTIR

Nuestros libros de diseño

DISEÑO DE JUEGOS EN AMÉRICA LATINA

Te enseñamos a pensar y trabajar

Colección completa

I. Diseño de juegos de video y mesa

II. Transmedia Storytelling

III. Historia del juego

IV. Narrativa interactiva

V. Game Level Design

Más entradas de blog

Blog

Matar al dragón: Crónicas del taller I

Durante el taller de Narrativa interactiva, además de aprender cómo contar una historia y crear personajes memorables, jugamos al rol con MAD y escribimos una crónica de la aventura. Aquí el resultado del último taller.

LEER MÁS »
Flipper, por Umberto Eco
Blog

Flipper, por Umberto Eco

“Al flipper no se juega sólo con las manos, sino también con el pubis. En el flipper el problema no consiste en detener la bola antes de que sea engullida por el agujero, ni en volver a lanzarla hacia el centro del campo con la furia de un defensa, sino en obligarla a entretenerse arriba, donde las metas luminosas son más abundantes, rebotando de unas a otras, vagando desconcertada y demente…

LEER MÁS »