柯洁输了！人不是那个人，「狗」更不是那个「狗」_最新动态

您所在的位置：程序员俱乐部 > 新闻资讯 > 最新动态 > 柯洁输了！人不是那个人，「狗」更不是那个「狗」

柯洁输了！人不是那个人，「狗」更不是那个「狗」

2017/5/24 5:32:31 程序员俱乐部我要评论(0)

摘要：柯洁还是输了！2017年5月23日，在举行于中国乌镇的“人机终极对决”第一局中，当今世界排名第一的中国围棋选手柯洁，输给了Google旗下的人工智能程序AlphaGo。腾讯视频按照比赛规则，柯洁和AlphaGo各有三个小时的时间；但在现场的比赛中，整体的节奏比预想中的要快很多。尤其是AlphaGo，它的平均出子时间为30秒左右，现场解说的职业八段棋手张璇和职业九段棋手常昊多次用“高效、果断”来评价它的表现。而柯洁的应对状况比较多变，有时会立刻下子
标签：个人

　　柯洁还是输了！

　　2017 年 5 月 23 日，在举行于中国乌镇的“人机终极对决”第一局中，当今世界排名第一的中国围棋选手柯洁，输给了 Google 旗下的人工智能程序 AlphaGo。

　　腾讯视频

　　按照比赛规则，柯洁和 AlphaGo 各有三个小时的时间；但在现场的比赛中，整体的节奏比预想中的要快很多。尤其是 AlphaGo，它的平均出子时间为 30 秒左右，现场解说的职业八段棋手张璇和职业九段棋手常昊多次用“高效、果断”来评价它的表现。而柯洁的应对状况比较多变，有时会立刻下子，有时也会思考很长时间。

　　爱范儿在现场注意到，当柯洁用时一个小时的时候，AlphaGo 所用的时间不到二十分钟。

　　最终比赛的结果也并不十分出人意料，在比赛进行了四个多小时之后，柯洁九段执黑负于 AlphaGo，AlphaGo 赢四分之一子。

　　不过，关于这场“人机终结对决”的最终结果，目前还存在一定的变数；今天只是这场对决的第一局，第二局和第三局将分别在 5 月 25 日和 5 月 27 日举行，我们将保持关注。

　　这次的狗，亦敌亦友

　　就在昨天晚上，柯洁在新浪微博发表了题为《最后的对决》的赛前宣言，不无伤感地提到：

决战前夕，感慨万千…
在这个特殊的时间，我有些话想和热爱围棋、关注围棋、关注我的朋友们说:
无论输赢，这都将是我与人工智能最后的三盘对局

　　这种离别的气氛，反而给了这次比赛更多“且看且珍惜”的意义。

　　今天的比赛之后，柯洁还将在 25 日和 27 日进行对 AlphaGo 的后两盘对决，无论第二局输赢，三盘比赛都将完成，与之前 1 月份化身 Master 的 AlphaGo 要求下快棋不同，本次比赛采用传统规则，双方各有三小时的时间。

　　直到本次“中国乌镇·围棋峰会”，已是 AlphaGo 第三次刷屏，前两次人机对决的场景还历历在目，但整个人类世界对于两方选手的感情却发生了颠覆性的变化。

　　2016 年 3 月，AlphaGo 首次挑战韩国棋手李世石时，整个世界都希望 AI 获胜，就像柯洁当时所说，“就算阿法狗赢了李世石，它也赢不了我”，大家以看热闹的心态打量着新生者 AI。

　　而当 2017 年 1 月，化身 Master 的 AlphaGo 在互联网上连扫世界第一柯洁、韩国冠军朴廷桓、日本冠军井山裕太时，AI 似乎已经不可战胜，柯洁也在微博深夜感慨“人类千年的实战演练进化，计算机却告诉我们，人类全都是错的……”

　　直到今天，当柯洁在赛前说到“能够代表人类出战，是我以前不敢想象的事情，这次选择我作为主角，我也会竭尽全力去一争胜负”时，世界的选择已经变成了希望人类赢一盘。

　　这种心态在赛制上也有所体现，除了代表中国选手最高水平的柯洁个人之外，新加入的配对赛和团体赛也非常值得关注。

　　配对赛将由古力九段、连笑八段两位当中的一人分别与 AlphaGo 组队，再与剩下的一人进行对决，每方只有 1 小时时间，比赛在 26 日上午打响。

　　团队赛则是时越、芈昱廷、唐韦星、陈耀烨和周睿羊 5 位世界冠军组成人类联队，合力对抗 AlphaGo，每方 2 小时 30 分钟，这将在 26 日下午进行。

　　当 1 对 1 的对决已经过于残酷，人机组队又会擦出怎样的火花，人类联合组成的“神经网络”面对 AI 又是否还有胜算呢？

　　人不是那个人，狗不是那条狗

　　千万别以为“坐”在场上对弈的双方一年来都没有变过，用很哲学的说法来说，他们都已经不再是当年那个存在。

　　自从今年 4 月确定了本次人机对决之后，柯洁已经有意识地在寻找对抗 AlphaGo 的“神之一手”，在先前进行的新奥杯世界赛和中国围甲联赛中，柯洁在 8 盘比赛中输掉了两盘，而这两盘中出现了一些之前并不常见的运子方法，有观察者表示这是柯洁在尝试以传统套路之外的方法寻找 AlphaGo 的软肋。

　　从这个角度讲，这三盘比赛中的柯洁的策略或许将与之前完全不同。

　　（那一年，柯洁的世界排名还在 AlphaGo 前面）

　　但 AlphaGo，恐怕在以令人绝望的迭代速度进化着。同样在今年 4 月，AlphaGo 之父哈萨比斯在英国剑桥大学进行了演讲，专门提到为了帮助 AlphaGo 提升，他们还开发了名为 Anti-AlphaGo 的防止过拟合的扰乱工具，之前 AlphaGo 提升一个版本需要 3 个月，现在只需要 1 周。

　　AlphaGo 对阵李世石时的版本号是 V18，而当下的版本估计已经到了 V60，在逻辑上和棋局策略上已经今非昔比。

　　这种进化的力量源泉与意义，是蒙特卡洛搜索算法和深度学习模式的不断进化。

　　为了解释上面这两个似乎每个字都能看懂，但其实都看不懂的词，我们先来看两组数字。

　　如果读过人工智能的科普文章的话，一定知道 20 年前的 1997 年 5 月，IBM 的?“深蓝”计算机在国际象棋中战胜了世界排名第一的卡斯帕罗夫。

　　从数学上考虑，国际象棋棋盘上能够发生的不同可能大约是 10 的 46 次方，也就是 10000000000000000000000000000000000000000000000。

　　但这在围棋面前就是小巫见大巫了，围棋共有 19X19 个落棋点，加上不同的落字方式，全部可能大约是 10 的 170 次方左右，根据荷兰科学家 John Tromp 的计算，大约是 208168199381979984699478633344862770286522453884530548425639456820927419612738015378525648451698519643907259916015628128546089888314427129715319317557736620397247064840935。

　　大家知道，困扰人类很多问题的原因在于算力，比如一个密码锁，如果只有两位，那么如果忘了密码很多人都会尝试去从 00 试验到 99，但 4 位数的手机密码就没几个人去试了，因为试出来花的时间太长，这就是算力不够。

　　对于现在的 AI 来说，对弈国际象棋所需的算力已经基本达到，但是妄图用穷举法算出来围棋的各种可能的算力还没达到，这种情况下，就要考虑算法了。

　　而 AlphaGo，就采取了一种“大智若愚”的办法，让算力不足的计算机“大愚若智”起来。

　　这就是蒙特卡洛搜索算法，我们明白，很多时候两人对决，其实不需要每一步都走当时最好的那一招，只要出的招是妙招，或者比对方能想象的好就行。这时候，就是一个概率问题。

　　举个非常简单的例子，从你家到火车站共有 ABCDE 五条路，或许你不知道每条路具体的长度和用时，但此时，如果从你家同时出发 500 人，每条路 100 人，然后你到火车站去观察，假设半小时内到达的人里，走 B 的最多，你就可以断定走 B 是条好路。

　　当然，路越多，路口越多，这种情况的分析会越复杂，但是放出的人越多，结果也会越精确，虽然没有人能打包票说某条路一定是最对的，但是分析结果足够做决策了。

　　这是用最最不严谨的方法解释了这种概率学的取样方法，但这相比逐项穷举的办法，大大前进了一步。

　　而深度学习，指的是 AlphaGo 会根据之前人类棋手的大量历史棋局，记录下每个棋局当中的分步局面，并把当前的棋局按照进行视觉分析，跟以往的数据进行比较，找到最类似的局面，再在当前最高质量的点上去下子，不至于把所有的位置都考虑一遍。

　　而当下版本 AlphaGo 最骇人之处，在于它已经跳出了学习人类棋盘的方法，而进入了自己左右手互搏，自己学习各种情况的局面，一方面它所学习到的棋局广度非人类可想象，另一方面它的出招可能越来越没有“套路”可言。

　　更别提 AlphaGo 只要有电就可以无休止学习这件事了，由于围棋本身有明确的规则判断胜负，所以 AlphaGo 可以在无需人类标注的情况下就能判断自己出招的好坏，更是强化学习的一大优势。

　　现在的狗，是人类智慧和机器智慧的结合体了。

　　明知不可为而为之，是为了费电么

我预测结果是 0 比 3，AlphaGo 胜出——聂卫平
人类的胜算为 0 ——李开复

　　既然在比赛层面，已经如此的没有看点，为什么人机对抗还要继续进行呢？

　　赛前有媒体认为，这是为了向社会继续推广 AI 的概念，为行业的发展做宣传，这种说法虽然都有一定的合理性，但格局未免太小。

　　就像在手机应用商店中会在“益智游戏”中找到围棋一样，进行这种游戏的目的还是为了益智。

　　而进行 AI 于人类的对抗，根本目的还是检验和优化算法，并且力争在其他更有价值的行业中进行应用。

　　就像在《智能革命》一书中，李彦宏说的那样，“2017 年初，AlphaGo 的变身 Master 横扫中韩顶级高手，一时间人们分化为悲观派、降临派、冷静派、脑洞派……我们希望有更多人是默默学习派”。

　　从最初的 AlphaGo，到 Master，再到今天的 AlphaGo，三代产品，三段历程，对应的恰好是“理论，实验，再创新”的三段论。

　　而这种基于互联网大数据的深度学习和决策支持系统，将在很多人类算力不可及的领域提供支撑。

　　Google 大中华区总裁石博盟就透露，AlphaGo 的第一个结合点会是医疗领域，AI 将在一定准确率的情况下，给予医生诊疗判定方面的辅助，对于糖尿病、癌症等疾病的治疗和研究大有裨益。

　　而未来在更大的深度和广度上，AlphaGo 积累的决策模型，将逐渐把人力从需要反复的劳动中解放出来，同时对脑力劳动进行反哺，对绝大多数社会元素进行快速解构并解读，再反馈给人类。

　　如同去年大热的科幻片《降临》中，人和外星人最终的结果一样，人工智能与人类本体，终将会找到一条智慧结合的发展大路。

　　最后，我想以畅销书《深泽直人》中文译者路意今早创作的《最后一局人机对弈》当中的一段话做结：

在今年阅读到 Jacob Bronowski 的 The Ascent of Man 的时候，被他所写到的生物界中，只有人可以远离他所诞生的环境，甚至在极端不适合生存的地方生活所启示，人之所以能够具备现在的能力，必然是与其敢于离开自己的舒适区有关。而艺术，爱，智商，想象力，创造力…这些似乎都不能是必要条件，而更像是在数十万年中，人类在不断抗争和追寻梦想的过程中所进化出的特质。

智能是人可以步入今日之成就的必要条件，但非充分条件。机器智能想必也会如此，大多数是不会具备人的意识的，但是不可排除的是，随着时间的推移，其中有些会开始觉醒，拥有自我意识，开始抗争，和追寻梦想，也会有贪嗔痴，真善美。

那时，它们自然也可称之为人。人也不再只限一个血肉之躯。

上一篇：应用环境配置工具下一篇：金山软件称证监会已受理北京办公软件A股上市申请