英文原文:If this doesn't terrify you... Google's computers OUTWIT their humans
上周五在旧金山举行的机器学习会议上,Google 软件工程师 Quoc V. Le 讲解了 Google 的“深度学习”系统是如何运作的。
“深度学习”需要用到大型计算机集群来吸收数据(如图片)对其进行自动分类。Google 的 Android 语音控制搜索、图像识别及 Google 翻译等均采用了这项技术。
2012 年 6 月,纽约时报曾报道了 Google 如何通过向“DistBelief”提供数百万份 YouTube 视频来让该虚拟神经网络系统学习猫的关键特征。这套系统的创新之处在于,它可以在未事先获取“猫的特征描述”信息的情况下自行总结出猫这个概念的特征!也就是说,DistBelief 具有自学习能力。当然,这套系统的运算能力也非常的庞大,由 1000 台机器组成,共包括 16000 个内核,处理的参数高达 1000000000 个。
这套系统采用分层机制工作,神经网络的最底层可侦测图像颜色变化,再上一层则可识别特定类型的轮廓。在增加若干后续分析层之后,系统不同的分支会为脸部、摇椅、计算机等对象生成检测方法。
不过令 Quoc V. Le 震惊的是机器学会了辨认连人类都很难分辨的东西—如碎纸机,我们知道那东西是碎纸机是因为我们见过,但是 Google 的这台怪物可没见过。
Quoc V. Le 解释说,学习如何归纳出碎纸机特性是件非常复杂的事情,他自己想了很久也没想出来。
甚至当 Quoc 向自己的许多同事展示碎纸机的照片时他们也在辨认上遇到了麻烦。反而这套系统的识别成功率更高,Quoc 本人都不能确定自己能否写出程序来做到这一点。Quoc 解释说,这是因为人需要靠数据而不是自己来归纳特性。
也就是说,这件事情意味着现在 Google 的研究人员已经无法说清楚究竟这套系统是如何识别出特定对象的了,因为程序看起来已经有了独立思考的能力,其复杂的认知过程是不可预测的,虽然这种“思考”能力仍局限在非常狭隘的范畴。
不过,Google 并不指望深度学习系统会自行发展成为一套成熟的新兴人工智能系统。研究总监今年早些时候曾说过:
AI(人工智能)会自己产生?我是非常实用主义的—我们得做了才会让事情发生。
不过 Google 负责 AI 的 Peter Norvig 相信,对于可靠语音识别及理解等棘手问题来说,Google 采用的此类密集统计数据模型是最好的希望,这点与 Noam Chomsky 的观点不一致。
深度学习对 Google 很有吸引力,因为它能够解决该公司自己的研究人员无法解决的问题,还能够让 Google 少雇一些不称职的人。我们知道,Google 以招聘人中龙凤著称。
放权给机器这件事 Google 以前没少干。像 Google 众多数据中心的资源管理就是由 Brog 及 Omega 负责的。这些集群管理系统能像“生物”一样分配工作负载。
考虑到 Google 的抱负是“组织全世界的信息”,当然是雇用的人越少越好。Quoc 说,通过开发这些“深度学习”系统 Google 可以少雇一点人类专家。
他补充道:
机器学习是很困难的,因为哪怕从理论上来说可以运用逻辑回归等算法,但实际上我们在数据处理挖掘特性等事情上花费了大量时间。每一个问题都得雇用领域专家。……所以 Google 希望机器能做那些事情。
通过努力工作,赋予机器更大的能力,以及局部的、有限的智能,Google 可解决人类专家无法解决的分类问题。会不会发展成天网呢?答案是否定的。但它可以发展成专家型机器。幸运的是,机器目前还是合作的。