IA vs. Pokémon Red: Los Desafíos Inesperados al Enseñar a una Máquina a Jugar
Se supone que la IA resolverá problemas de la humanidad: le enseñan a jugar ‘Pokémon Rojo’ y no puede encontrar una arena después de 50,000 horas
Los videojuegos, más que simples actividades de ocio, se han transformado en campos de prueba para la tecnología emergente. El último giro en este creciente mundo lo aporta Peter Whidden, un youtuber que ha enseñado a una inteligencia artificial a jugar ‘Pokémon Red’. Pero no todo fue pan comido, la IA presentó reacciones y «miedos» inesperados.
Whidden desarrolló este proyecto con una mezcla de curiosidad y asombro. El objetivo principal era ver cómo una inteligencia artificial, a través de «recompensas», podía aprender a jugar y avanzar en la historia del juego. Cada vez que la IA lograba capturar un Pokémon, derrotar a un rival o superar un gimnasio, se le otorgaban puntos. No obstante, a pesar de estas recompensas, la IA presentó comportamientos curiosos.
Por ejemplo, en varias ocasiones, la inteligencia artificial simplemente se detenía, observando con detenimiento el agua pixelada del juego. Aunque no podemos deducir qué «piensa» o «siente» la IA en esos momentos, su reacción sugiere una interpretación particular del entorno digital.
El reto más notable y llamativo fue el «miedo» aparente de la IA hacia los centros Pokémon. Para muchos jugadores, estos lugares representan una oportunidad para curar y revitalizar a sus criaturas. Para la IA, sin embargo, dejar a los Pokémon en otro sitio parecía equivaler a perderlos. Whidden tuvo que idear incentivos adicionales para que el programa entendiera la utilidad y positividad de estos centros.
Las luchas tampoco fueron sencillas. Durante la batalla contra Brock, la IA no lograba comprender que los ataques de agua son efectivos contra los Pokémon de tipo roca. Después de incontables horas de juego, la inteligencia artificial finalmente usó el ataque burbuja de Squirtle y triunfó.
Por otro lado, la orientación no es el fuerte de esta IA. Whidden debió asistirla en varias ocasiones, ya que no conseguía encontrar su camino a Ciudad Azuria. Y, curiosamente, cuando la IA llegó a la Montaña Lunar, simplemente decidió abandonarla.
Para llevar a cabo este intrigante experimento, Whidden usó Proximal Policy Optimization en el algoritmo de aprendizaje. Además, ChatGPT fue una herramienta útil durante el proceso.
El mundo de los videojuegos y la inteligencia artificial sigue evolucionando, y proyectos como este nos muestran lo lejos que podemos llegar al combinar estas dos pasiones. Con curiosidades, aprendizajes y algunos obstáculos en el camino, es emocionante imaginar qué otros desafíos podrán enfrentar las IA en el futuro.