文/脑极体
当我们一直在讨论 AI 能给互联网安全带来什么影响的时候,可能一直都忽略了一个问题:AI 本身也不安全。
这两天的新闻恰如其分地提醒了我们这一点。近日,谷歌被爆其机器学习框架 TensorFlow 中存在的严重安全风险,可被黑客用来制造安全威胁,谷歌方面已经确认了该漏洞并做出了整改回应。
虽然是提前发现,这些漏洞本身没有带来实质威胁。但这条消息还是让我们看到了某种蠢蠢欲动的不安。TensorFlow、Torch、Caffe 这些机器学习开发框架,差不多是如今 AI 开发者与研究者的标准配置,但这些平台最近却纷纷被爆出存在安全漏洞和被黑客利用的可能性。
某种意义上来说,这些消息在提醒我们同一个问题:当我们急切的将资金与用户关系聚集在机器学习周围时,也可能是将巨大的危险捆绑在了身上。
更重要的是,面临 AI 安全问题,我们中的大部分人还处在很傻很天真的“懵懂状态”,对它的逻辑和危害性近乎一无所知。
本文希望来科普一下这些内容,毕竟防患于未然,等到真正出现大事件再惊叹也就晚了。另外必须提醒开发者和企业的是,在谷歌这些大公司不遗余力的推广自家机器学习平台,并且为了吸引使用者而快速迭代、大量发布免费资源时,开发者本身一定要留个心眼,不能不假思索的使用。
比起心血毁于一旦,更多的审查机制和更严密的安全服务是非常值得的。
说机器学习平台的漏洞,有可能让开发者心血付诸东流绝不是开玩笑。在今年上半年的勒索病毒事件里,我们已经见识过了如今的黑客攻击有多恐怖。而勒索病毒本身就是利用了微软系统中的漏洞,进行针对式攻击锁死终端。
可以说,在勒索病毒的洗礼之后,信息产业已经进入了“漏洞霸权时代”。只要拥有了更多漏洞,就拥有了大范围的控制权与支配权。随着黑客攻击的工具化和门槛降低,能力一般的攻击者也可以利用平台漏洞发动广泛攻击。
但在我们愈发重视“漏洞产业”带给今天世界的安全隐患时,却不自主的产生了一个视线盲区。那就是人工智能。
这里普及一下今天大部分 AI 开发任务的基本流程:一般来说,一个开发者想要从头开始开发深度学习应用或者系统,是一件极其麻烦,几乎不可能的事。所以开发者会选择利用主流的开发框架。比如这次被爆出隐患的谷歌 TensorFlow。
利用这类平台,开发者可以用平台提供的 AI 能力,结合开源的算法与模型,训练自己的 AI 应用。这样速度快效率高,也可以吸收最先进的技术能力。这种“不能让造车者从开发轮子做起”的逻辑当然是对的,但问题也随之到来了:假如轮子里面有问题呢?
由于大量开发者集中利用机器学习框架训练 AI 是近两年的事情,此前也没有爆出过类似平台存在安全问题,所以这个领域的安全因素一直没有被重视过,可能大部分 AI 开发者从来都没有想过会存在安全问题。
但这次被发现的漏洞却表明:利用 TensorFlow 本身的系统漏洞,黑客可以很容易的制造恶意模型,从而控制、篡改使用恶意文件的 AI 应用。
由于一个投入使用的深度学习应用往往需要复杂的训练过程,所以恶意模型的攻击点很难短时间被察觉。但由于智能体内部的逻辑关联性,一个点被黑客攻击很可能将会全盘受控。这种情况下造成的安全隐患,显然比互联网时代的黑客攻击更加严重。
理解了这些,我们可能会达成一个并不美好的共识:我们一直在担心的 AI 失控,可能根本不是因为 AI 太聪明想夺权,而是居心不良的黑客发动的。
AI“失控”:一个今天不得不面对的问题
相比于经典计算的信息存储与交互模式,人工智能,尤其是机器学习类任务,最大的改变之一就是展现出了信息处理的整体性和聚合性。比如著名 AlphaGo,它不是对每种棋路给出固定的应对模式,而是对棋局进行预判和自我推理。它的智慧不是若干信息组成的集合,而是一个完整的“能力”。
这是 AI 的优点,但很可能也是 AI 的弱点。试想,假如 AlphaGo 中的某个训练模型被黑客攻击了,让系统在该打吃的时候偏偏就不。那么最终展现出的将不是某个棋招运算失当,而是干脆一盘棋也赢不了。
说白了,AI 注定是一个牵一发动全身的东西,所以平台漏洞带来的安全风险才格外可怕。
AlphaGo 毕竟还只是封闭的系统,即使被攻击了大不了也就是下棋不赢。但越来越多的 AI 开始被训练出来处理真实的任务,甚至极其关键的任务。那么一旦在平台层面被攻克,将带来无法估计的危险。
比如说自动驾驶汽车的判断力集体失灵、IoT 体系被黑客控制、金融服务中的 AI 突然瘫痪、企业级服务的 AI 系统崩溃等等情况,都是不出现还好,一旦出现就要搞个大事情。
由于 AI 系统紧密而复杂的连接关系,很多关键应用将从属于后端的 AI 体系,而这个体系又依赖平台提供的训练模型。那么一旦最后端的平台失守,几乎必然引发规模化、连锁式的崩盘——这或许才是我们今天最应该担心的 AI 失控。
AI 产业的风险,在于某个黑客一旦攻克了机器学习平台的底层漏洞,就相当于把整个大厦的最下一层给炸掉。这个逻辑此前很少被人关注,却已经被证明了其可能性存在。而最可怕的是,面对更多未知的漏洞和危险,世界范围内的 AI 开发者近乎是束手无策的。
家与国:无法逃避的 AI 战略角力
在认识到 AI 开发平台可能出现的底层问题,以及其严重的危害性之后,一个顺理成章的联想也会浮出我们的脑海:国家层面的 AI 安全与战略角力。
有人说,百度等公司代表的中国 AI 力量崛起,已经让美国科技界感到了威胁。事实上,这种角力绝不只是存在于产业层面。今年 7 月,哈佛大学肯尼迪政治学院贝尔弗科学与国际事务中心发布的《人工智能与国家安全》报告里,就专门指出 AI 很可能在接下来一段时间内,对多数国民产业形成革命性的影响,成为产业中的关键应用。那么一旦 AI 安全受到威胁,整个美国经济将受到重大打击。
同样的道理,当然也适用于今天与美国抗衡的 AI 大国,中国。这次 TensorFlow 安全漏洞曝光后,我们联系了一家国内机器视觉方向的创业公司,他们所使用的训练模型全部来自于 TensorFlow 中的社区分享。沟通之后的结论是,如果真受到黑客恶意模型的袭击,他们的产品将瞬间瘫痪。
这仅仅是一家创业公司,据了解,国内使用 TensorFlow 进行训练的还包括京东、小米、中兴等大型企业,以及不少科研院所的研发项目。未来,很有可能还有更多更重要的中国 AI 项目在欧美的平台上进行训练部署,当这些东西暴露在黑客攻击的面前,甚至控制权掌握在别国手中,我们真的可以放心这样的 AI 发展之路吗?
这也绝不是杞人忧天。勒索病毒爆发之后,追根溯源就会发现,这些黑客工具的源头来自美国情报系统研发的网络攻击武器。武器这种东西,制造出来就是为了杀伤的,无论是制造者使用,还是被盗后流出,最终吃亏的只能是没有防范的那群人。
各种可能性之下,AI 安全问题在今天已经绝不是儿戏。而中国产业至少能做两件事:1 是组建专业的 AI 防护产业,将互联网安全升级为 AI 安全;2 是必须逐步降低对欧美平台的依赖度,这里当然不是民粹主义的闭关锁国。而是应该给开发者更多选择,让整个产业自然而然地向国家 AI 安全战略靠拢。比如百度打造的从芯片到框架,再到平台体系与安全监督机制的开发者赋能计划,就在一步步将本应属于中国的 AI 开发根基留在中国。
总之,AI 本身的安全防护,已经成为了开发者必须在意、大平台需要承担责任、国家竞争需要争抢的一个环节。希望最终一起人为的 AI 失控事件都不要到来。毕竟吃一堑长一智的事情在互联网历史上已经发生太多了。
希望这次我们可以预见危险,而不是痛而后悟吧。