MarioGPT insinúa un glorioso futuro generado por IA en el que todos jugaremos a Nintendo para siempre

MarioGPT insinúa un glorioso futuro generado por IA en el que todos jugaremos a Nintendo para siempre

Nunca puede haber demasiado Mario en el mundo. Claro, probablemente haya pasado un tiempo desde que jugaste uno de los juegos originales de NES, pero probablemente porque te son tan familiares. ¿Qué pasaría si les dijera que los investigadores han creado una forma de generar infinitos niveles de Mario para que puedas jugar uno nuevo todos los días hasta que el sol se apague?

Un equipo de la Universidad de TI de Copenhague acaba de publicar un papel (pre-publicación) y GitHub página que muestra un nuevo método para codificar y generar niveles de Super Mario Bros, al que llaman MarioGPT. (En algún lugar de Redmond, un abogado toma un sorbo de café y comienza a escribir).

MarioGPT se basa en GPT-2, no en una de estas IA conversacionales novedosas. Estos grandes modelos de lenguaje son buenos no solo para tomar palabras en oraciones como estas y sacar más como ellas: son máquinas de replicación y reconocimiento de patrones de propósito general.

“¡Honestamente, elegimos el más pequeño para ver si funcionaba!” dijo Shyam Sudhakaran, autor principal del artículo, en un correo electrónico a TechCrunch. “Creo que, en general, con conjuntos de datos pequeños, GPT2 es más adecuado que GPT3, al mismo tiempo que es mucho más liviano y más fácil de entrenar. Sin embargo, en el futuro, con conjuntos de datos más grandes y avisos más complicados, es posible que necesitemos usar un modelo más sofisticado como GPT3″.

Incluso un LLM muy grande no comprenderá los niveles de Mario de forma nativa, por lo que los investigadores primero tuvieron que representar un conjunto de ellos como texto, produciendo una especie de versión Dwarf Fortress de Mario que, sinceramente, jugaría:

Cada mosaico se representa como un carácter diferente. Créditos de imagen: Universidad de TI de Copenhague

¿Quieres ganar dinero? Mario en la terminal. Solo digo.

Una vez que el nivel se representa como una serie de caracteres ordinarios, el modelo puede ingerirlo de la misma manera que cualquier otra serie de caracteres, ya sea en lenguaje escrito o en código. Y una vez que comprende los patrones que se correlacionan con las características, puede reproducirlos.

Su salida incluye un “camino” representado como x minúsculas, mostrando esencialmente que el nivel es técnicamente jugable. Encontraron que de 250 niveles, nueve de cada 10 pudieron ser completados por el agente de software de juego A*.

Por supuesto, eso no sería un gran éxito si los niveles fueran planos con tuberías ocasionales para limpiar. Pero incluyeron algunas funciones para medir qué tan simple es la ruta y también para compararla con los niveles del conjunto de datos. Las trayectorias de ruta de alta novedad e “interesantes” significan niveles factibles que no se parecen a los existentes, pero no dejan que el jugador simplemente los recorra.

La entrada etiquetada también hizo que el modelo pueda entender las indicaciones del lenguaje natural, como pedirle que haga un nivel con “muchas tuberías y muchos enemigos” o “muchos bloques, gran elevación, sin enemigos”.

Ejemplos de niveles creados por avisos de texto. Créditos de imagen: Universidad de TI de Copenhague

Una limitación es que, debido a la forma en que se codifican sus datos de origen en el Corpus de niveles de videojuegos, solo hay un símbolo para “enemigo”, en lugar de uno para goombas, koopas, etc. Pero esto se puede cambiar si es necesario: el El concepto que necesitaba probarse era más bien que se podían generar buenos niveles. (Lamentablemente, los niveles de agua tampoco son posibles actualmente debido a que no están representados en el conjunto de datos).

“¡En el trabajo futuro, exploraremos algunos conjuntos de datos más ricos!” dijo Sudhakaran.

Coincidentemente, Julian Togelius en NYU GameLab y su grupo acaba de escribir un papel mostrando un proceso similar para “sokoban” o juegos de rompecabezas de empujar bloques. Los principios son similares, pero puedes leer sobre las diferencias. aquí.

El hecho de que estos enfoques funcionaran para dos géneros diferentes sugiere que podría funcionar para otros de complejidad similar, sin generar un Chrono Trigger infinito, pero un Sonic 2D impulsado por IA no está fuera de discusión.

Debe decirse que este no es el primer generador de Mario que hemos visto, pero otros tienden a confiar no en una IA generativa sino en ensamblar niveles a partir de secuencias y conjuntos de mosaicos creados previamente. Por lo tanto, puede obtener una nueva secuencia, pero no será original mosaico por mosaico, solo pantalla por pantalla.

Como la primera versión de MarioGPT, esta es puramente experimental y, con suerte, evitará la mirada de Sauron de Nintendo, que es conocida por impulsar proyectos de fanáticos que involucran sus propiedades. Pero, por supuesto, aunque Infinite Mario suena divertido, el encanto de los juegos originales está en su dificultad y temas hechos a mano, algo que no es tan fácil de recrear.




Source link