Ahora la IA puede superarte tanto en Stratego como en Diplomacy

Ahora la IA puede superarte tanto en Stratego como en Diplomacy

Si bien la inteligencia artificial superó hace mucho tiempo la capacidad humana en el ajedrez y, más recientemente, en Go (y no olvidemos a Doom), otros juegos de mesa más complejos aún presentan un desafío para los sistemas informáticos. Hasta hace muy poco, Stratego y Diplomacy eran dos de esos juegos, pero ahora la IA se ha vuelto buena en el primero y aceptablemente humana en el segundo.

En la superficie, podría pensar que es solo porque estos juegos requieren un cierto nivel de planificación y estrategia a largo plazo. Pero también lo hacen el go y el ajedrez, solo que de una manera diferente.

La diferencia crucial es que Stratego y Diplomacy son juegos de estrategia basados ​​en información imperfecta. En chess and Go, puedes ver cada pieza en el tablero. Stratego oculta la identidad de las piezas hasta que se encuentran con otra pieza, y Diplomacia se trata principalmente de establecer acuerdos, alianzas y, por supuesto, vendettas que se mantienen en secreto pero que son fundamentales para el juego. Ningún juego de ajedrez honesto involucrará a un tercero que se abalanza para proteger el alfil de tu oponente con una torre azul.

Ambos juegos no requieren un cálculo crudo de los caminos hacia la victoria, sino habilidades más suaves como adivinar lo que el oponente está pensando y lo que cree que está pensando la computadora, y hacer movimientos que se adapten y, con suerte, alteren esas suposiciones. En otras palabras, tiene que farolear y convencer a otro jugador de algo, no solo dominarlo con los mejores movimientos posibles.

El modelo de juego Stratego, de DeepMind, se llama DeepNash, por el famoso equilibrio. Se centra menos en movimientos inteligentes y más en el juego que no se puede explotar ni predecir. En algunos casos, esto puede ser audaz, como un juego que el equipo vio contra un jugador humano donde la IA sacrificó varias piezas de alto nivel, dejándolo en una desventaja material, pero todo fue un riesgo calculado para sacar las armas grandes del otro jugador. , por lo que podría elaborar una estrategia en torno a ellos. (Ganó.)

DeepNash es lo suficientemente bueno como para vencer a otros sistemas de Stratego casi todas las veces, y el 84 % de las veces en comparación con humanos experimentados. Debido a que los algoritmos que funcionan bien en Go y el ajedrez no funcionan bien aquí, inventaron un nuevo método algorítmico llamado Regularized Nash Dynamics, pero tendrás que Lee el papel si quieres entenderlo más profundamente que eso. Mientras tanto, aquí hay un juego comentado:

En el lado de la Diplomacia, tenemos una IA llamada Cicero (¡ah, arrogancia!) de Meta y CSAIL que se las arregla para jugar el juego a un nivel humano, y si eso suena condenatorio con un leve elogio, recuerde que Diplomacy es difícil para la mayoría de los humanos jugar a un nivel humano. El nivel de intrigas, puñaladas por la espalda, falsas promesas y travesuras maquiavélicas generales que la gente hace en el juego es tal que está prohibido en muchos grupos de juego amistosos. ¿Es una computadora realmente capaz de ese nivel de travesuras?

Parece que sí, y los avances que lo hacen posible son interesantes. Después de todo, la parte interesante de Diplomacy no es el mapa del mundo y las piezas, que son bastante sencillas de leer y evaluar, sino el potencial de esquemas latente en esos arreglos. ¿Venecia está siendo amenazada en dos frentes, o está atrayendo al frente occidental a un envolvimiento a través de un cambio de actitud contemplado durante mucho tiempo?

No solo eso, sino que para participar en la intriga, uno debe hablar (o chatear, en línea) con otros jugadores y convencerlos de su sinceridad e intención. ¡Esto requiere más que ciclos de CPU!

Créditos de imagen: Meta

Así es como funciona Cicerón:

Usando el estado del tablero y el diálogo actual, haga una predicción inicial de lo que harán todos. Refine esa predicción usando la planificación y luego use esas predicciones para formar una intención para sí mismo y su socio. Genere varios mensajes de candidatos según el estado del tablero, el diálogo y sus intenciones. Filtre el mensaje del candidato para reducir las tonterías, maximizar el valor y garantizar la coherencia con nuestras intenciones.

Luego, defiende tu caso y espera que el otro jugador no esté planeando tu desaparición.

Cuando se lanzó a webDiplomacy.net, Cicero jugó bastante bien contra sus oponentes, ubicándose segundo de 19 en una liga y, en general, superando a los demás.

Todavía es un trabajo en progreso, puede perder el rastro de lo que se le dice a los demás, o cometer otros errores que los humanos probablemente no cometerían, pero es bastante notable que pueda ser competitivo.


Source link