AlphaGo 正在以惊人的速度自我进化,让人细思极恐。
此前,《自然》杂志报道称,MeepMind 为 AlphaGo 引入了“强化学习”(reinforcement learning)的 AI 技术,让 AlphaGo 具备了超强的自我学习的能力。它不再需要人类棋谱,就能通过自我对弈获得超人类的围棋技艺。
新版的 AlphaGo 被称为 AlphaGo Zero,它不再依靠人类数据。通过机器学习系统,仅训练 3 天就战胜了 AlphaGo Lee,比分为 100:0,后者就是当初战败李世石的那款。经过 40 天训练后,Alpha Zero 又以 89:11 战胜了 Alpha Master,即横扫柯洁的版本。
据外媒报道,日前 DeepMind 在 arXiv 发表论文,展示了 Alpha Zero 的最新进展。官方表示,Alpha Zero 已经具备很强的通用性,除了围棋之外,还可以学习其它任务,比如国际象棋和将棋。
在上述两个案例中,AlphaGo Zero 可在 24 小时内,获得超人的棋艺,甚至达到了世界冠军的水平。
当然,并非所有东西 AlphaGo Zero 都能掌控,目前 AI 面对最大的挑战——复杂的即时战略游戏,比如《星际争霸》。
不过,相信随着 AI 的不断进化,过不了多久人类就被战胜了。