在 AlphaGo 战胜了韩国围棋棋手李世石后,DeepMind 创始人戴密斯·哈萨比斯(Demis Hassabis)就曾表示将研究以人工智能与人类玩其他游戏,例如即时战略游戏《星际争霸》。不过目前看来,DeepMind AI 要跟人类比赛打《星际争霸》这事,还是有点儿悬。
早在 2015 年,DeepMind AI 就开始用已经雅达利 1977 年发行的游戏机 Atari 2600 来进行游戏训练,整个训练过程团队没有提供任何额外信息帮助,全依靠 AI 自己来一步步学习如何打怪升级。在这些游戏里,有一款游戏始终让 DeepMind AI 很苦恼,那就是《Montezuma’s revenge》,这是雅达利一款难度超高的游戏。
后来团队找到了“好奇心”激励机制,来让 DeepMind AI 获胜。他们给 AI 变成编程输入”人工好奇心“,在 AI 探索更多的玩法的时候给予它更多的奖励,鼓励它去用不同的途径来获取更高的分数。在新版本里,DeepMind AI 在好奇心的驱动下探索了 15 个房间的游戏。在没有好奇心的时候,它只玩了 2 个房间。
今年 3 月低,在 AlphaGo 五局四胜赢了李世石之后,暴雪娱乐制作总监 Tim Morten 就在 WCS 中国区总决赛上确认,DeepMind AI 将挑战《星际争霸 2》,当时 Tim Morten 就直言 DeepMind AI 不会在《星际争霸 2 》中战胜人类。直接目前,这一场人机游戏争霸战,官方都没透露更多的细节。
实际上,《星际争霸》作为一款即时战略类的游戏,给 DeepMind 的挑战比围棋更大。单单是对战局面的数据获取方面,两者就相差巨大。围棋棋盘上就只有数量不等的黑白两色棋子作为数据,而游戏中则包括了双方兵力数量、兵种构成、能力属性、时间等等等。另外作为即时战略游戏,《星际争霸》需要在极短时间内执行策略,而围棋相对来说则有充足的时间给 AI 运算思考。
目前,DeepMind AI 想要打赢《星际争霸》 还是需要更长的时间学习和摸索。