Intentó que una IA aprendiese a jugar a Pokémon, pero salió tan mal que desarrolló "pánico" a la enfermera Joy y capturó 10.000 Magikarp

Entre una prueba y otra, la IA pareció desarrollar ciertos manerismos, pero los resultados no han sido del todo satisfactorios

Pokemon Rojo
Sin comentarios Facebook Twitter Flipboard E-mail

Peter Whidden tuvo, tiempo atrás, una idea muy curiosa: intentar que una IA aprendiese a jugar a Pokémon Rojo mediante un emulador. Por desgracia, o al menos hasta ahora, su experimento no ha ido demasiado muy bien, puesto que, 50.000 horas después, no ha sido capaz ni de completar el gimnasio de ciudad Azulona.

De buenas a primeras, partió de la premisa de que las IA han sido diseñadas para funcionar mediante aprendizaje. Con esto en mente, a través Proximal Policy Optimization y ChatGPT, diseñó un sistema de recompensas para impulsar a la IA debido a que, de buenas a primeras, no hacía nada.

Intentó que una IA superase Pokémon Rojo, pero no salió bien

Por esto mismo diseñó un sistema mediante el cual esta misma IA podía obtener una serie de puntos al capturar nuevos Pokémon, descubrir nuevas secciones de mapa, aumentar el nivel de su equipo, etc., pero no le fue demasiado bien. Para empezar, debido a que obtenía puntos al descubrir nuevos píxeles, desarrolló una suerte de obsesión con el mar.

Así pues, en lugar de avanzar por cualquier camino, permanecía contemplando el horizonte durante horas. Tras esto, al incluir puntos al atrapar Pokémon, ganar combates o vencer en gimnasios, la IA decidió no pisar nunca jamás un centro Pokémon. Al usar el PC, dejó a varias de sus criaturas en ella, lo que provocó que perdiese puntos.

Como consecuencia, no curó a sus Pokémon durante muchos "parches" al analizar que le quitarían puntos. Del mismo modo, sabiendo que también se los arrebatarían al ser derrotada en un combate, cuando llegaba a un punto de no retorno en el que la victoria era imposible, se negaba a continuar, por lo que las batallas nunca terminaban.

No quería darle instrucciones individuales de cada proceso

Aparte, era incapaz de analizar debilidades. Por ejemplo, en su duelo contra el primer gimnasio de roca, no usó ataques de agua hasta que agotó todos los demás. Por si fuera poco, durante sus viajes conoció al vendedor de Magikarp. Como resultado, determinó que lo mejor que podía hacer era comprarlos. Repitiendo el proceso una y otra vez al incluir mejoras, acabó comprando más de 10.000 unidades del mismo.

Todo este proceso lo realizó repitiendo el juego una y otra vez. Es decir, que no lo hizo mediante una sola partida, sino en miles de ellas. Lo curioso es que, gracias a esto, Whidden descubrió que la IA siempre repetía una misma ruta en concreto al encontrar un bug que le permitía atrapar al primer Pokémon que apareciese con un 100% de efectividad.

Por lo tanto, con muchas preverás y errores, Peter ha sido incapaz de hacer que la IA supere el juego —tal y como cuenta mein-mmotras más de 50.000 horas de experimentos. Durante todo este tipo, ha visitado diversas ciudades, combatido en numerosas ocasiones y superado algunos baches, pero sigue siendo incapaz de completar Pokémon Rojo.

En 3DJuegos PC | Si vuelves a Dead Space en Halloween, fíjate en este detalle de la Ishimura que la vuelve mucho más escalofriante

En 3DJuegos PC | Squadron 42 está oficialmente completo, y los autores de Star Citizen hablan al fin sobre la fecha de lanzamiento de la campaña

En 3DJuegos PC | El modo battle royale llega a Halo Infinite gracias a la comunidad y a la IA del nuevo kit de herramientas para Forge

Inicio