Martes 24 de Octubre de 2023, 22:13
Un solo
programador de software emprendió un viaje para entrenar a una
inteligencia artificial en el juego de Pokémon Rojo. Después de más de 50,000 horas de esfuerzo, esta IA está demostrando comportamientos sorprendentemente similares a los humanos.
Hace casi una década, el fenómeno de "Twitch Plays Pokémon" cautivó a la comunidad en línea. Esta legendaria experiencia inspiró a creadores como Mizkif y tuvo resurgimientos en TikTok.
Ahora, el caos famoso de "Twitch Plays Pokémon" ha inspirado un nuevo experimento que gira en torno al uso de la inteligencia artificial. Pero, no te preocupes, no tiene nada que ver con el inusual final de "Pokémon Escarlata y Púrpura".
Una IA juega Pokémon Rojo después de más de 50,000 horas de entrenamiento
Peter Whidden, un ingeniero de software con sede en Seattle, se ha embarcado en un minucioso proceso para entrenar a una IA en el juego Pokémon Rojo. Compartió un video explicativo en su canal de YouTube que ya ha alcanzado más de 2.5 millones de visitas.
En el video, Whidden detalla que la IA ha pasado más de 50,000 horas jugando el juego y es capaz de capturar Pokémon y vencer a los líderes de gimnasio. Esta IA se basa en un modelo de refuerzo pavloviano que utiliza "incentivos basados en puntos" para mejorar las habilidades de los Pokémon, explorar nuevas áreas y ganar batallas.
Whidden está asombrado por los logros de su programación, pero admite que "lo más fascinante son las formas en que falla". La IA interpreta el sistema de recompensas de manera única, lo que da como resultado comportamientos sorprendentemente parecidos a los humanos.
Además de disfrutar de las vistas panorámicas durante horas, la IA experimenta algo parecido a un trauma cuando se produce un incidente en un Centro Pokémon. Un simple error que implica depositar accidentalmente un Pokémon en una PC reduce a la mitad el nivel general de su equipo. Esto desencadena una reacción negativa que la IA asocia con el Centro Pokémon en cuestión.
"No posee emociones humanas, pero un evento único con un alto valor de recompensa puede tener un impacto duradero en su comportamiento", explica Whidden. "En este caso, perder un Pokémon una sola vez es suficiente para que la IA forme una asociación negativa con todos los Centros Pokémon, y evitará visitarlos en futuros juegos".
La IA de Whidden todavía se encuentra en las etapas iniciales de su aventura Pokémon, después de haber quedado atrapada en la frustrante cueva del Monte Luna. Sin embargo, ha informado a su audiencia de que un reciente cambio en su sistema de recompensas le permitió finalmente salir de la cueva y llegar a Ciudad Cerúlea.
El ingeniero de software también ha compartido el código de su proyecto y se siente "entusiasmado" por la cantidad de personas que lo están utilizando. Un seguidor astuto incluso ha logrado aplicar su código en Pokémon Cristal, aunque no sabemos cómo le ha ido en la Generación 2.