坊间流传着这么一个说法:谷歌想回中国,必须靠 AI;而靠 AI 回中国,必须搞个大事情。于是,上周四的晚上李飞飞发布了一篇博文,然后连着发了三条推特,宣布一个叫 AutoML 的 AI 产品了。
一夜之间,中国的科技媒体就爆炸了,空气中似乎回荡着那一句话:搞事情了、搞事情了、搞事情了……AutoML 是不是跟谷歌的中国战略有关,我们不做讨论。这里希望帮大家搞清楚的,是这个 AutoML 到底要搞什么事情。
按照谷歌云 AI 项目首席科学家李飞飞的说法,AutoML 的目标是降低开发者、研究者和企业群体使用人工智能相关工具和框架的门槛。而通俗的理解大概就是,这个产品让你不需要写任何代码,就训练出一个企业级的机器学习模型。AutoML 也就是“自动机器学习”的意思。
惊不惊喜?意不意外?传说中学会机器学习年入 50 万呢,说好的 BAT 疯抢 AI 工程师呢?是不是感觉刚掏出去的培训费被风吹走了?更有网友惊奇地评论道:“不是说一起用 AI 去革一大堆工作的命吗?怎么我辛辛苦苦学 AI,结果先被革命了?”
当然了,现实并没有这么残酷。但谷歌的动作并不是孤例,背后隐含着的,是一直被反复提及的“AI 民主化”,并且也折射出“我们今天学的 AI 技术也许是没用的”。
搞笑的吧?原来最先被 AI 革命的是 AI 工程师?
谷歌宣布的这个让码农界风声鹤唳的东西,叫做 AutoML Vision,是整个 AutoML 体系的第一款产品,专注自动生产图像识别领域的模型。
我们用简单易懂的方式描述一下这个系统是如何工作的:
假如以前我想要做一个能够进行图像识别的 AI 系统,那么我需要在开发框架上自己搭建训练过程,完成各种训练部署,导入数据集,整个过程需要使用编程的方式来完成。
但在 AutoML Vision 上,我一行代码都不用写,只需要按照说明,把我希望训练用的图片都拖进系统里,然后耐心等待,一个训练好的机器学习模型就趁热出炉了。
举个例子,假如你想训练一个模型,用来识别你家的猫主子是不是生气了(这得有多无聊......),那么就只需要在 AutoML Vision 中放入你家猫的照片、它生气时候的照片、高兴时候的照片等等,然后你就会得到一个识别程序。用它连上手机拍照,就可以让 AI 去理解猫大人的喜怒哀乐了。
是不是挺神的?
AutoML Vision 拖放图片界面
这背后,是谷歌利用了深度学习领域中的迁移学习(Transfer Learning)技术。把此前谷歌训练图像识别模型时积累下来的训练过程,迁移到 AutoML 当中,这样就节省下后续类似模型的开发过程。
简单来说,AutoML 有点像谷歌云搭建的一个“解题公式”。之后的考生并不需要知道公式是怎么来的,只需要把问题套进去就可以得到答案。当然了,这只是简单交代一下它的工作原理,实际上没有那么容易。尤其在调试进程中,不同模型需求和系统的兼容度是个大问题。
总而言之,这个产品以及背后的思路,对于想做机器学习又缺乏专业技术和人才的企业来说确实是个福音。它取消的,是通过代码搭建机器学习模型的过程,以及复杂的调试工作。仅为码农们保留了输入特定数据这个操作。很大程度上降低了机器学习训练中的工作量,尤其是编程工作。
但也别太乐观。虽然 AutoML 目前还没有正式发布,真实效果有待考量,使用价格也是未知数。但就目前信息来看,AutoML 生成定制化模型需要的数据量还是很大的,不是毫无基础的开发者能够搞定的。
而且它只能完成相对简单的任务,且只能套用谷歌给出的训练方案。如果想要制作比较复杂的机器学习系统,使用独特算法进行训练,那么编程还是不可避免的。
所以呢,目前来看真正用心且努力进入 AI 开发领域的朋友大可放心。除了图像识别,谷歌未来还计划将 AutoML 服务拓展到翻译、视频和自然语言处理等领域。这或许意味着初级的 AI 程序被自动生成、快速复制到各行业已经不远了。
虽然谷歌表示 AutoML 是目前唯一一个此类产品,但其实各家也都在部署类似的业务。比如亚马逊的 Amazon SageMaker,以及微软还未正式发布的定制图像识别模型服务。包括国内的百度,也在旗下 AI 开放平台中推出过定制化图像服务。
之所以说谷歌这次“搞了个大事”,主要是因为 AutoML 的自动化程度更高,尤其是解决了自动搭建训练模型和调参这两大问题。
不过在谷歌这么卖力的背后,似乎写着五个大字:AI 民主化。
AI 民主化,要取消了谁的集权?
去年 3 月,刚刚加盟谷歌不久的李飞飞就表示,人工智能的下一步是完成“AI 民主化”。在这次发布 AutoML 之后,她又一次表示由于资源稀缺,多数企业无法开发个性化模型,所以 AutoML 的出现是为了进一步推进 AI 民主化。
那么问题来了:AI 民主化,到底是针对谁的专政?要取消谁的集权?
有人说了,大部分先进的 AI 技术现在是掌握在几家大公司手里的。AI 民主化当然是要让人人成为 AI 的主人,破解巨头专政。
我只能说,你当人家傻啊?
难道谷歌们会费了好大力气,为了瓦解自己的霸权?当然不会。就像 AutoML 的产品思路中展示的那样,省略掉了开发者的技术门槛,谷歌吃亏了吗?没有。谷歌拥有了更多的用户,自身的算法优势无形中得到了扩张。并且 AutoML 的用户训练模型是要直接部署在谷歌云上的,显然这也是个变相捆绑,希望从刁钻角度刺 AWS 几刀。
对于最迫切希望得到“民主”的小公司和个人开发者而言,巨头兜售的开发者赋能和去技术门槛式“民主”,绝不是仁慈的馈赠,换取而来的是小开发者们紧密依赖关系的生态。真正被 AI 民主化瓦解的,其实是夹在大公司和小开发者之间的中层公司,或者叫算法公司、技术公司。
目前在世界各地的 AI 市场上,这类中型公司都普遍存在。当然其存在是有意义和价值的。对于巨头来讲,将技术能力打入各行各业,开发各种各样的应用是完全不可能的,那么就有赖于开发者去做这些事,自己做平台服务和技术能力的输出者就好了。
但小团队和个人开发者能去做这些深入行业,或者极具创意的开发吗?其实也不行,因为从零开始的话技术太复杂,对人才的要求太高,一般开发者和小企业根本玩不起。
于是就出现了大量夹层公司,他们以技术壁垒为主要产业支撑点。利用重技术和人才去做一些其实看起来不那么“重”的小应用,或者以开发定制化 AI 模型的方式向第三方收费。
而谷歌、英特尔等巨头企业都在倡导的 AI 民主化,事实上是将需要大量“AI 劳动力”完成的工作装入自动化模型里。向上收回底层技术开发权,向下直接触达细分开发场景。
说白了,小公司、个人创业者、人才稀薄地区想要引入 AI,就必须能从成本上越过技术公司,自己玩得起 AI。巨头的 AI 民主化,当然是希望瓦解那些凭借“二手技术”和“雇佣能力”卡位的企业,把他们的份额分给更小的开发者。让开发者仅仅提供创意和运营、市场等能力来激活 AI 的广泛前景。
所以所谓 AI 民主化,真正瓦解的是 AI 当中非创造性工作制造的准入壁垒。
而在 AutoML 代表的自动化战略进一步实施后,最可能带来的影响是 AI 产业链的去中层化。一些看似很大的公司,却只创造了很小的价值,仅仅依靠 AI 技术壁垒来占据市场份额和资本关注,大概是这场“民主运动”中最危险的一方。
今天的 AI,会不会是跑不过马的汽车?
最后,我们可能还要开另一个脑洞:AI 民主化虽然听起来很美,但未必全是好消息。
毋庸讳言,AutoML 这样的产品所带来的 AI 民主化进度,可以说是肉眼可见的。如果回头看看一两年前,很容易就会发现 AI 的产业链和开发规则已经大变样了。
但这对产业边缘徘徊不前的企业来说一定是好事吗?就像文章开头提到的,AutoML 一发布,很多程序员朋友第一反应是调侃自己的 AI 白学了。但要知道,他们可才学了没有多长时间。那么对于想要进入这个领域的企业来说,类似的恐惧会不会更深?
我们知道,在绝大多数共识里,今天以机器学习为主导的 AI 复兴,核心是由三个因素构成的:算法、算力和数据。有趣的是,这三个因素现在都在快速“被民主”。
算法上,AI 开发框架开始越来越智能,AutoML 这样的产品甚至能自动编程,实现算法工具化和模块化。算力上,各种新的硬件和处理到来,算力成本近乎每一天都在跌落。数据上,越来越多的免费数据分享成为常态。并且前沿的 AI 技术争论中,已经开始质疑大量数据对于深度学习的必须性。
总而言之,差不多每隔一段时间,AI 的门槛就会下调一次。但从企业和开发者的角度来看,这样的情况就有点苦恼:现在部署的 AI 能力,会不会一个月之后就被淘汰了?
我们知道,汽车最开始是跑不过马车的。虽然最终证明了汽车绝对强过马车,购入汽车是正确的,但大家都不希望成为那辆超级老爷车的乘客。何况 AI 这东西,连老爷车那样的收藏价值都没有。
就像此时此刻,不知道有没有一位刚刚组建了豪华机器学习专家团队的企业家,突然发现原来自己想做的,随便找个人操作下谷歌的新产品,再等上一天就搞定了......
也许在今天,企业收获的不是 AI 开发门槛逐步降低带来的好处,而是面对 AI 体系快速迭代产生的恐慌。毕竟我们都不知道,今天做的事会不会在几个月之后就被证明毫无意义。
尤其对于中国企业来说,习惯于追风口,风来则上,风小则退。这么复杂且天天都在变的 AI,谁有心情跟它躲猫猫啊?