Por qué StarCraft es el campo de batalla perfecto para probar la inteligencia artificial

DeepMind, una rama de la empresa matriz de Google, lanzó en enero un programa de computadora capaz de vencer a jugadores profesionales en uno de los videojuegos más difíciles del mundo. StarCraft es una franquicia militar de ciencia ficción ambientada en un universo plagado de conflictos, donde los ejércitos de oponentes se enfrentan para convertirse en los más poderosos. Y el programa DeepMind, llamado AlphaStar, alcanzó el rango más alto de StarCraft II : Gran Maestro. Puede derrotar al 99.8 por ciento de los jugadores humanos, según un estudio publicado en la revista Nature en octubre.

StarCraft es uno de los deportes electrónicos más populares y difíciles del mundo. Y ese estado ha estimulado un puñado de escritores de códigos para usarlo como un campo de entrenamiento para la inteligencia artificial. No solo los grupos de investigación corporativos como DeepMind ponen a prueba StarCraft . Los jugadores aficionados y los académicos también han asumido el desafío de intentar vencer a los jugadores humanos de StarCraft con robots autónomos.

¿Pero por qué StarCraft ? A primera vista, el videojuego tiene las características distintivas estándar de sus contrapartes de fantasía: lucha en un mundo post-apocalíptico, una carrera para convertirte en el oponente más poderoso y una batalla para derrotar a tus enemigos. Pero en lugar de controlar a un solo agente de disparos en primera persona, como en juegos como Halo o Overwatch , los jugadores manejan toda una economía de constructores, luchadores y sistemas de defensa que funcionan simbióticamente para evitar que pierdan.

Aunque de naturaleza fantástica, el mundo multifacético de StarCraft crea complejidades que reflejan las nuestras. Y usar el juego como una incubadora para entrenar computadoras podría ayudar a los investigadores a construir mejores bots con efectos del mundo real.

El entrenamiento de algoritmos de IA para ganar juegos contra humanos tiene una larga historia. Incluso antes de que existieran las computadoras, las personas creaban "robots" ilusorios que podían vencer a los jugadores en juegos como el ajedrez . En 1997, Deep Blue de IBM derrotó al campeón mundial de ajedrez, y otros algoritmos informáticos poderosos, como AlphaZero y AlphaGo de DeepMind, hicieron lo mismo al derrotar a los maestros de juegos de mesa humanos en su oficio.

Pero los videojuegos llevan la complejidad al siguiente nivel. En StarCraft , los jugadores compiten en una de las tres razas: terran, protoss o zerg, cada una con ciertas fortalezas y debilidades. Por ejemplo, los protoss son luchadores poderosos, pero no se generan rápidamente. Por otro lado, Zerg genera el más rápido, pero no son luchadores fuertes, por lo que su poder viene en números.

[contenido incrustado]

Y además de simplemente seleccionar las fortalezas y debilidades de tu raza, también controlas múltiples facetas: trabajadores que reúnen recursos, constructores que crean sistemas de defensa y luchadores que atacan a los enemigos. Debes vigilar tus unidades mientras te aseguras de que otros jugadores no aprovechen tus puntos débiles.

A partir de esas facetas, los investigadores estudian cómo ciertas técnicas conducen a la jugabilidad más efectiva. En 2011, el científico informático de la Universidad de Newfoundland, David Churchill, fue coautor de un artículo sobre el orden de construcción en StarCraft II , estudiando cómo la priorización de la creación de recursos podría afectar el éxito en el juego.

La investigación, dice Churchill, nos da una comprensión más clara de cómo funcionan los algoritmos de aprendizaje automático para resolver problemas en un entorno simulado.

"Hay una cierta sensualidad en la IA del juego que permite que sea digerida por el público en general", dice Churchill. Y los juegos también proporcionan una forma de probar la "inteligencia" de un algoritmo: qué tan bien aprende, calcula y ejecuta comandos de forma autónoma.

Antes de StarCraft , Churchill comenzó a jugar con algoritmos diseñados para derrotar a los juegos de mesa. El programa que creó para su tesis doctoral fue diseñado para ganar un juego llamado Ataxx , un juego de estrategia de estilo arcade de la década de 1990 jugado en un tablero virtual.

"Esa fue la primera vez que sucedió en mi vida", dice. "Había creado una cosa inteligente que era más inteligente que el creador".

[contenido incrustado]

Desde entonces, su investigación se ha centrado en la IA de los videojuegos, con StarCraft como favorito. Un elemento que separa una IA del juego de mesa de la IA del videojuego es aparentemente simple: la capacidad del jugador de ver todo el paisaje a la vez.

A diferencia de Ataxx , no puede ver todo el mapa en StarCraft sin desplazarse, lo que hace que sea más difícil vigilar todos sus recursos. También hace que sea más difícil ver lo que está tramando tu enemigo o, como dice Churchill, te envuelve en la "niebla de la guerra".

"No sabes lo que está haciendo tu enemigo hasta que estás parado junto a él", dice. Es una representación más cercana a la vida real; En la mayoría de los escenarios, su conocimiento de un problema no será omnisciente.

Y juegos como damas o ajedrez no ocurren en tiempo real: una vez que un jugador hace un movimiento, no hay límite de tiempo para que un oponente haga el suyo. Pero, como dice Churchill, "en StarCraft , si no te estoy disparando, me estás disparando a mí".

Incluso lo compara con algo tan aparentemente simple como el fútbol. Si estás parado en el campo, los jugadores continuarán pateando la pelota, los goles se seguirán marcando y el juego continuará progresando. Lo mismo ocurre con StarCraft : independientemente de si mantienes estrechamente tus fuerzas o luchas activamente contra tus enemigos, el juego continuará con o sin tu intervención.

Enfrentarse a juegos complejos como StarCraft puede ayudar a los científicos a entrenar algoritmos para aprender nuevas habilidades en un entorno con muchas variables. Churchill dice que los videojuegos pueden ser una puerta de entrada a las máquinas de enseñanza para ser mejores en el reconocimiento de imágenes, sugerencias de búsqueda o cualquier algoritmo que tenga que ayudar a los humanos a tomar decisiones.

"Ese nivel de complejidad (en los juegos) comienza a acercarse a lo que vemos en el mundo real", dice.

Desde 2011, Churchill ha organizado una competencia internacional anual llamada Inteligencia Artificial para Entretenimiento Digital Interactivo (AIIDE), donde los entusiastas de los juegos y los profesionales se unen para construir y probar algoritmos para juegos. Uno de esos juegos es StarCraft , aunque usan StarCraft: Brood War como campo de pruebas, en lugar de StarCraft II .

Pero los bots que los equipos construyen para AIIDE son diferentes a proyectos como AlphaStar, dice Churchill. Algunos son "IA verdadera", o bots que usan redes neuronales para aprender patrones y construir sobre el conocimiento pasado para ganar un juego. Otros adoptan un enfoque más simple con reglas codificadas que indican a una unidad que se mueva de cierta manera si sucede algo específico durante el juego.

Y cada año, los organizadores hacen cumplir una regla de que los equipos deben abrir su código después de la competencia. De esa manera, los competidores pueden construir sobre algoritmos pasados ​​para hacer que sus bots sean más fuertes, más inteligentes y más potentes.

Incluso con AlphaStar en los titulares, Churchill dice que la competencia no va a ninguna parte. Mientras que el equipo de DeepMind promociona la alta tasa de éxito del algoritmo, la cantidad de recursos puestos en el proyecto alcanza un estándar de poder que va mucho más allá de las habilidades del codificador promedio.

"Es una empresa insondable", dice Churchill. Y los desafíos que quedan muestran que más grande no siempre es mejor.

Cuando AlphaStar debutó por primera vez, el algoritmo funcionó con capacidades sobrehumanas. Tenía ciertas ventajas sobre los humanos; por ejemplo, la computadora podía ver todo el tablero a la vez y completaba acciones más rápidamente que un jugador profesional haciendo clic con el mouse.

Entonces, para el artículo de Nature , DeepMind puso limitaciones a la velocidad y las habilidades del algoritmo para competir en un nivel más cercano a un jugador humano. Incluso con los límites, todavía era capaz de derrotar a jugadores profesionales.

Pero el poder detrás de la máquina era más fuerte que cualquier bot de StarCraft creado anteriormente. DeepMind creó múltiples jugadores automatizados para especializarse como ciertas razas, y entrenó a cada uno de ellos para que vieran repeticiones de juegos humanos durante 44 días. El poder de procesamiento fue respaldado por la Unidad de Procesamiento de Tensor (TPU) de tercera generación de Google, un chip enormemente poderoso utilizado en sus programas de aprendizaje automático para aplicaciones como Google Translate.

AlphaGo, el algoritmo diseñado por DeepMind para derrotar al juego de mesa Go, utiliza 4 TPU . AlphaStar, por otro lado, utiliza la friolera de 32.

"Lo que han creado es un algoritmo que solo DeepMind puede usar", dice Churchill. Para él, el próximo desafío es que los investigadores reduzcan los algoritmos del juego para que consuman un poco menos de energía y trabajen con un poco más de elegancia.

Los juegos de equipo, a diferencia de las batallas 1 a 1, también podrían representar un nuevo desafío para los bots no tripulados. Y a medida que los algoritmos continúan mezclándose con los jugadores humanos, puede haber un momento en que los humanos y la IA jueguen en el mismo equipo.

Pero por ahora, juegos como StarCraft continuarán marcando el comienzo de la investigación sobre qué tan bien el aprendizaje automático puede resolver problemas complejos. Para Churchill, los mundos de fantasía y realidad son casi indistinguibles.

"Son todos estos pros y contras, más y menos", dice Churchill. "Cada persona tiene algo que está tratando de maximizar … estás jugando el juego de maximizar los números". Eso es lo que estamos haciendo en los juegos ".

from https://ift.tt/37XbZqg

Deja un comentario