Los algoritmos crean estrategias para los videojuegos
Las nuevas técnicas de 'Deep Reinforcement Learning' se ponen a prueba jugando.
Aunque la Inteligencia Artificial sea capaz de resolver problemas de gran complejidad, todavía existen tareas difíciles de aprender para una máquina, sobre todo las relacionadas con la percepción, visual o sonora, y la planificación o toma de decisiones.
Lo que para los seres humanos es intuitivo y natural, puede ser un reto para las máquinas. Sin embargo, cada vez son más los avances y los videojuegos parecen ser un entorno ideal para poner a prueba a los nuevos algoritmos de aprendizaje profundo por refuerzo, pensados para desarrollar estrategias aprendiendo por sí solos.
Las tareas de planificación son especialmente complejas de resolver para la Inteligencia Artificial. Dirigir un dron o elegir la publicidad que se muestra en nuestra página web son tareas que necesitan algoritmos capaces de aprender estrategias, que recomienden las acciones a realizar para conseguir un resultado final.
El ajedrez refleja bien este proceso. Para jugar, tenemos que planificar nuestros movimientos, sacrificar piezas para conseguir ventajas a largo plazo. Es aquí donde se aplica el aprendizaje profundo por refuerzo.
El Deep Reinforcement Learning supone un paso más entre las técnicas de Machine Learning o aprendizaje automático. Los nuevos algoritmos tienen iniciativa, exploran y adquieren datos del entorno, prueban diferentes estrategias y son recompensados cuando toman decisiones correctas. De esta forma, aprenden y diseñan automáticamente estrategias que den solución a determinados problemas.
Con estas técnicas, DeepMind desarrolló una inteligencia artificial imbatible no solo al ajedrez, sino también a las damas y al Go con su algoritmo AlphaZero. Sin embargo, existen problemas más complejos y reales que el ajedrez. Problemas que dependen de detalles y de su percepción, y para los que hay que seguir trabajando.
Los videojuegos se han convertido en un terreno ideal para seguir desarrollando los algoritmos de aprendizaje profundo por refuerzo, experimentando con millones de partidas por hora para planificar estrategias ganadoras.
¿Podría ganar un algoritmo a su contrincante humano en un videojuego? Las últimas investigaciones de DeepMind indicaron que, además de resolver los videojuegos de Atari, en algunos de ellos la inteligencia artificial podía alcanzar un nivel de un jugador profesional. Prueba de ello es su algoritmo AlphaStar, que logró ganar a dos de los profesionales de StarCraft. En esta línea, OpenAI también consiguió grandes logros contra los mejores jugadores de Dota2.
Tras estos éxitos, el Deep Reinforcement Learning es cada vez más accesible entre entidades de investigación de todo el mundo. En España, el Instituto de Ingeniería del Conocimiento (IIC) lleva más de un año trabajando en esta línea y también ha utilizado los videojuegos como campo de pruebas para diferentes tareas de percepción y planificación. Según explica Álvaro Barbero, chief data scientist en el IIC, los resultados son positivos y siguen trabajando para aplicar esta nueva forma de inteligencia artificial a otros campos y problemas más reales.
Como ejemplo, en este vídeo puedes ver algunas de las pruebas realizadas en el IIC con videojuegos, entrenando a los algoritmos de aprendizaje profundo por refuerzo. Recuerda que es una inteligencia artificial la que juega.