5 月 24 日,在新版本 AlphaGo 首战以1/4 子微弱优势战胜中国围棋职业九段棋手柯洁之后,“阿法狗之父”DeepMind 创始人兼 CEO Demis Hassabis、AlphaGo 团队负责人 David Silver 以及棋手樊麾接受了腾讯科技的专访。
“祝贺柯洁昨天的突出表现,为大家呈现了精彩的对弈。”Demis Hassabis 说:“之所以高调进行人机比赛,就是想吸引最顶级的棋手和 AlphaGo 对战。之所以和柯洁这样比赛而不是在网上比赛,是因为人们不会认真对待线上游戏,线上游戏也不够正式,人们的注意力不够集中。AlphaGo 的很多学习都是自我对弈。因为和顶级棋手对弈的机会并不多,我们希望通过这样的比赛来找到 AlphaGo 的弱点。”
David Silver 则表示围棋非常困难,“事实上,我们在算法上实现了效率的提升,从计算量来说现在是之前的十分之一,从所需训练时间来说,从“月”缩减到“星期”。AlphaGo 已经不依赖于外在的导师,它可以自我学习。”David Silver 说:“我们的想法是,AlphaGo 的高效算法不光是围棋领域的,也可以应用于其他领域。
在此前的演讲中,他们详细阐述了围棋的难度:其复杂程度让穷举搜索都难以解决,而对于计算机来说,围棋有两项难题:“不可能”写出评估程序以决定谁赢,搜索空间太过庞大。围棋不像象棋等游戏靠计算,而是靠直觉。围棋中没有等级概念,所有棋子都一样。围棋是筑防游戏,因此需要盘算未来。小小一子可撼全局,“妙手”如受天启。
理论上 AlphaGo 下棋越到后面,需要计算的步数越少,常理来看,用时应该更短。但实际上 AlphaGo 的用时很均匀。对于这个现象,David 表示:“在训练时我们就已经发现,AlphaGo 在自我对弈的过程中,整个棋局的计算量是恒定的、稳定的。我们为 AlphaGo 制定了稳定的策略,让它最大限度地利用时间。因此 AlphaGo 下棋的速度相对均匀。”
樊麾是“AlphaGo”选择一较高下的第一名职业棋手,他已加入 AlphaGo 团队。他说:“AlphaGo 对于围棋的震撼不是谁赢谁输,而是一种全新的下法,比如跟李世石的第二局的第 37 手。柯洁昨日的点三三也是借鉴了 AlphaGo 的下法。AlphaGo 就像一个未来的棋手回到今天跟我们下棋。所有的职业棋手下完都不会离场而是会复盘这盘棋,对棋手来说重要的不是胜负而是我们学到了什么。”而同样接受了 AlphaGo 挑战的柯洁也在昨天向媒体表示:“AlphaGo 在改变我们的下棋理念,我也受了它的影响,开拓思维,没有什么棋是不可以下的。”
围棋之外,AlphaGo 背后的技术也在其他领域有所应用。“AlphaGo 背后的支撑技术非常多,目前在其他领域的应用还在探索阶段。大家要理解的是,在未来我们肯定会推广 AlphaGo 背后的技术,也有可能在中国推广。”
至于科幻小说里的场景,Demis Hassabis 表示,人工智能还有很远的路要走,还有很多的关键问题没有攻克下来,科幻片里的场景恐怕在几十年内不会出现。他说:“我们必须正确使用人工智能。这有两个方面——人工智能的用途必须是造福人类的,比如科学、制药。同时,人工智能不能是少数几家公司的专利,而应该由全人类共享。”