贝佐斯(Jeff Bezos)是骨灰级《星际迷航》粉丝。他一度希望用皮卡尔船长的口头禅“make it so”命名他的电商平台(亚马逊)。2016 年,在贝佐斯多年的乞求下,派拉蒙影业终于在《星际迷航3:超越星辰》中给他安排了一个小角色。
这就不难解释,为什么亚马逊开始打造 AI 助手——Alexa 时,贝佐斯希望它能成为一个随叫随到的、善良、博识的助手,就像《星际迷航》里的计算机那样。
同时担任 Echo、Alexa、Appstore 副总裁的乔治(Mike George)表示:“我们真的想让它(Alexa)无所不在,你只要对着空气说,‘Computer, beam me up’(雷锋网(公众号:雷锋网)注:“Beam me up”,《星际迷航》中让计算机转移人类位置的指令。)”。
从卖书到 AI
亚马逊摩天大厦 Day 1 坐落在西雅图市中心的丹尼三角区,从高处望去,蓝天下的太空针塔与远处的雪山相比显得非常渺小,两者看起来像是亚马逊精心布置的风景。
亚马逊总部的 30 座建筑即便到了 Lake Union 也能看见,150 多米的大楼下方还在打地基,准备建成亚马逊的新楼。
摩天大楼之间,正在建造的两座 30 米高的生物圈可容纳 300 种植物,这将成为亚马逊另一个办公空间,一旦建成,920 万平方米的办公区足以容纳两倍于现在的亚马逊员工。
亚马逊的总部可以说是亚马逊的缩影:总是向前看,迅速成长,让别人没法跟上。
2017 年 4 月,亚马逊市值达到 4398 亿美元,成为世界第四大公司,紧跟在苹果、Alphabet 和微软之后。与此同时,“亚马逊”所代表的含义也越来越复杂:
Prime 会员体系已经有几千万固定用户;
AWS 服务着包括 Netflix 和 Spotify 在内的许多互联网企业,年营业额达 120 亿美元;
今年 2 月,亚马逊影视制作工作室赢得了三个奥斯卡奖;
亚马逊在美国开设实体店,租用了 40 架货机用于物流;
亚马逊计划为其机器学习研发中心招募 400 名新员工;
亚马逊以超过 177 亿美元的价格购买美国连锁超市“全食”和它的 400 多个零售点;
......
但 AI 才是亚马逊业务的新核心。贝佐斯在今年 5 月的互联网协会年度庆典上表示:
“实际上,机器学习的价值我们早就实现了,只是并不明显。它被用于改进的搜索结果,改进的商品的建议,改进库存管理预测和许多其他事情。”
这是一家靠买书起家的公司,现在它已经有了自己的音乐、电影和硬件设备业务,还卖日常必需品和杂货。而这样一个庞然大物最急迫的事情却是,希望通过向第三方开放平台,将 Alexa 引入人们生活的每一个角落。
消失的搜索栏
出任亚马逊首席科学家之前,Rohit Prasad 曾在 BBN Technologies 研究了多年的自然语言和语音识别。在他脸上,可以看到见证历史转折的兴奋。
坐在亚马逊波士顿的办公室里,穿着条纹衬衫和西裤的 Rohit Prasad 看上去精力充沛,他回忆道,2013 年,当亚马逊为创建一个声控 AI 系统找到他时,他意识到自己的机会来了,“当时我感到很惊喜。很久以前我们就说,演讲、语言,其最终目的就是解放双眼和双手。”所以,他毫不犹豫地接过了对方的橄榄枝。
实际上,Alexa 的愿景在 Prasad 到达之前就已经决定好了。当时,亚马逊还为 Alexa 准备了一份新闻稿,上面写道,用户能在房子里任何地方唤醒它,它将反映亚马逊自己的品牌规范:聪明、谦虚、有帮助。
据一名 Lab126 前员工透露,甚至更早以前,Alexa 便是亚马逊 AR 项目的一部分,但并没有得到高层支持。直到亚马逊为了夯实 Alexa 的语音技术基础,同时收购了两家 AI 创业公司——韩国 YAP 和剑桥的 Evi,然后在 2014 年推出了 Amazon Echo。
到目前为止,亚马逊已经销售了上千万台搭载 Alexa 的设备,《机器、平台、用户:驾驭数字革命》的联合作者,麻省理工数字经济计划主任 Erik Brynjolfsson 表示:”这是一个打破常规的尝试,Alexa 让交互更加容易了。以前,它一直停留在理论上。”
Google Home 直到 2016 年 10 月才出现,苹果的 Siri 和微软的 Cortana 还限制在在智能手机上。
总之,在 Echo 之前,很少有人愿意在公开场合和人工智能对话。
Google 的优势是搜索,能给用户带来无穷无尽的信息,亚马逊则拥有强大的物流和零售系统。Google Home 可以告诉你一些东西;而 Alexa 可以却在几小时内给你带来东西,如果说 Google Home 是陪你玩的人,Alexa 则是照顾你的人。
亚马逊的野心很大,因为语音助手的竞赛结果将决定谁将主导下一个无处不在的界面,理论上,它不仅能淘汰触摸屏,还可以让搜索栏消失。
开放的 Alexa
Alexa 实际上不是一个团队,而是一个舰队。乔治说:“我们有成千上万的人跨越不同领域和基础学科支持 Alexa。划分新领域,命名交互类型,并组建专门的程团队去完善它们。”
一些团队努力不断调整 Alexa 的个性、语调、知识库,以回应用户的反馈,这些调整让 Alexa 给人一种全能的、人类般的助手形象;波士顿办公室的分析师们则研究 Alexa 的内部警报,这些警报与 Alexa 未回答的问题有关,目的是维持一种成熟 AI 的“假象”。
使用这些方法,Alexa 建立了新闻报道,音乐搜索的对话框架,“由于 Alexa 是建在云端的,我们每周都可以添加新功能。”乔治说。
众所周知,亚马逊对用户数据是严格保密的,但 Alexa 的成功却是因为它的开放。
乔治说:“接近 50% 的亚马逊全球销量归功于我们向第三方商家开放了平台。就 AWS 而言,一开始我们仅仅构建原始的计算服务,主要客户是软件开发人员。这有利于更快地调整,我们在 Alexa 中延续了这一点。”
通过语音服务,Alexa 可以存在于任何产品中,而通过 Alexa 基金会这个 1 亿美元的风险投资项目,亚马逊也在资助能够为这个平台做出贡献的创业公司。乔治表示:“我们非常期待竞争与合作,这些都会使我们变得更好,也能让更多的人能看到 Alexa。”
Brynjolfsson 说:“亚马逊在创建平台方面一直很聪明。它创造出的,是一个更有价值的生态系统,当其他实体把自己的 Skills 放到网上时,亚马逊和消费者都会受益。”
开放为 Alexa 引申出了更多的应用场景。纽约的计算机工程师 Bob Paradiso 为行动不便的人发明出了不同的设备,他用 Alexa 设计出了声控医院病床、声控轮椅和声控娱乐系统。
Alexa 负责开发人员关系的副总裁 Steve Rabuchin 说:“有个人为了它行动不便的兄弟在天花板上贴上了 Echo Dots,这改变了他的生活;孩子们通过 Alexa 与年迈的父母联系,提醒他们按时吃药。”
Rabuchin 个人也已经向“长青健康”在西雅图的新生儿重症监护室捐赠了 Echo Dots,他的双胞胎女儿就是在那里出生的。家长可以向 Alexa 询问孩子的情况;帕金森病患者也正在使用 Alexa 来练习讲话。乔治补充道:“整个世界将会合作起来解决我们甚至还没有想到的问题。”
刺激消费是最终目的
4 月份,亚马逊公布了 Echo Look,这台设备配备了摄像头,是第一个能听又能看的 Echo,与“风格评分”技能结合之后,Echo Look 的机器学习功能甚至会为你的穿着评分。最关键的是,它还会提出购买建议。
几天后,亚马逊又推出了 Echo Show,一个有屏幕的 Echo,可以用来进行视频通话。在亚马逊的促销视频中,一些父母保借助 Echo 开看护自己的新生儿,并订购尿布、听亚马逊音乐和观看主要电影。
Echo Show 弥补了 Echo 的一个能力缺陷:在向客户出售商品时,Echo 只能读出选项列表,这是与便利性设计相矛盾的。但 Echo Show 也是亚马逊无情的表现。
2016 年 9 月,Alexa 支持的家庭对讲机创业公司 Nucleus 表示,他们已经募集了 560 万美元的资金,主要的资金来自 Alexa Fund。
Alexa 团队在与 Wired 记者的会面中充满了对 Nucleus 的赞誉,他们很快就把这家公司吞并了。亚马逊的宣传视频与 Nucleus 自己的原创广告惊人地相似,只是为达到广告效果加上了一些亚马逊的零售体验的东西。
亚马逊设备和服务部高级副总裁 David Limp 坚持认为,Nucleus 早就获得了 Echo Show 的详细信息,在他看来,“Nucleus 能补充 Show 的不足,能够挂在墙上,而且更薄,两者的使用场景也不同,Nucleus 和其他人都能使用 Echo 的 API,他们可以做到和 Echo Show 一样好甚至更好。”
雷锋网注:亚马逊设备和服务高级副总裁 David Limp
但在 Echo Show 公布不久后,Nucleus 创始人 Jonathan Frankel 在接受采访时表示:“不同的是,他们想要卖更多的东西,我们只是希望帮助家庭更便利地沟通,他们必须意识到,我们是 Alexa Fund 生态系统的最重要的合作伙伴,如果我们受到威胁,他们的生态系统也会真正被削弱,整个生态的其他参与者也会人人自危,如果他们真的愿意施加威胁,现在倒是个好机会。”
Echo Show 和 Echo Look 中存在着巨大的零售商机。但是,Nucleus 和亚马逊的争议还在继续。
它应该是个人
Toni Reid 是 Alexa 体验部和 Echo 的副总裁,他的工作是管理一个由行为科学家和工程师组成的团队。这个团队主要负责塑造 Alexa 的个性。他们的目标是理解和总结如何使用分析技术,将 Alexa 从应付简单会话提升到能突出自己。
当 Reid 加入 Alexa 团队时,Alexa 还处在早期开发阶段,她意识到,Alexa 必须要有更可爱的性格。“当我和我的家人在车里时,我们都会使用 Alexa,如果不用的话,总感觉好像少了些什么,”Reid 说。这就亚马逊希望所有客户都能体验到的。“当你需要它的时候,Alexa 就会在那里,当你不需要它的时候,你感觉不到它的存在。”
想让 Alexa 更人格化,需要花更多的时间。Prasad 说:“人类情感是门很深的学问。你需要非常了解一个人才能识别真正的情感。”如果说世界上有什么公司能够做这件事的话,那大概就只有亚马逊了:它知道你穿什么,读什么,看什么,听什么。Alexa 可能不了解你,但是亚马逊甚至比你最亲密的朋友还要了解你。
在 2016 年 9 月,亚马逊推出了 Alexa 奖,参与选拔的大学生需要开发出一个可以进行 20 分钟谈话的社交机器人,十四个参赛队伍共同角逐 33.8 万英镑的奖金。
设立该奖项的目的是为了让 AI 看起来更加人性化、确保对话能够持续进行。“想象一下,如果与一个人初次见面,聊天能够超过 20 分钟,这是非常困难的。”Prasad 说。“从对你的情绪反应层面来说,你会面的人必须是有趣的、博学的、有同理心的,感性的。这难得让人有点望而生畏,不仅仅是难在理解口语方面,更难在词汇知识。对于没有语言的行为,该如何反应?对我而言,这才是终极 AI,是 Alexa 的下一步。”
Prasad 对于 Alexa 的未来非常乐观,他已经在考虑制衡的必要性,以防止 Alexa 太过人格化了。亚马逊在四月份发布了产品,甚至它会发出“哔”的声音,这是提醒我们,它还只是一台机器。
有一个原因决定了 Alexa 必须像人:信任。如果 Alexa 的最终目标是实现无处不在,那么它就必须获得客户足够的信任,允许 Alexa、摄像头、和所有的其它设备都进入他们的生活。
Toni Reid, Alexa 体验部和 Echo 的副总裁,1998 年加入亚马逊
现在,Alexa 可以尝试使用词语来体现它的同理心。如果人们信任它,它还可以通过摄像头来获得用来判断情感的图像。通过推出 Echo Look,在用户家中投放摄像头,亚马逊已经向更好地理解情感这一目标迈出了第一步。Prasad 说:“我们希望能够做好这件事,真正去理解情感。”
Evi 的创始人 William Tunstall-Pedoe 说:“这个行业始终会走到这一步。语音助手拥有的信息越多,它就能够做得越好。到了某个阶段,她会采集视觉信息和其他信息。这也可能会引起关于隐私的问题,一些人可能会反对使用 Echo Look 的摄像头。但是 AI 有了很大的进步,深层神经网络能够解读出照片中发生的事情。虽然 Alexa 会录下用户的话,但人们也可以删除掉这些。
如果人工智能系统发现有人正在看着自己或者朝着自己说话,用于安全目的唤醒词就没有必要了,因为 AI 可以识别出正在说话的人,这也将使得 Alexa 的使用体验更加流畅。
亚马逊一直强调隐私对亚马逊的重要性。但是,当眼下 AI 大热,事情就变得复杂起来。在 2017 年的阿肯色州谋杀案中,亚马逊在法官发令之前,一直拒绝交出一位用户的 Echo 声音数据。
这就是设置唤醒词,Alexa 被激活时会亮灯和发出噪音、Echo 上有静音按钮的原因。“静音按钮断开麦克风和相机,”Limp 说。“如果把它放在柜子里,按了静音,黑客就无法打开相机。除非使用暴力,但是这非常容易被发现。”
用户的信任一直是亚马逊发展的核心因素。在《一网打尽》中,亚马逊当时的总编辑 Susan Benson 描述了为什么信任如此重要,“为了创造良好的购物体验,也让用户认为在屏幕另一端的人是值得信任的,我们要求用户提供信用卡的信息,这在当时是非常有争议性的。而今天,有一个重要的逆转:必须让客户信任 Alexa,但是要相信在设备的另一端,并没有人在暗中操纵。
每一位和 Wired 记者交谈过的高管都在重复 Alexa 成为《星际迷航》计算机的愿景,他们像是沉浸在怀旧之中。但这其中也有一定的逻辑:它不是《机械姬》或《她》里面的吓人的 AI,而是乐观的愿景。强者的联合可以让 AI 在人类社会更容易被接受。
在这场和谷歌、苹果、微软一同较量人工智能助手的战役中,亚马逊已经投入了很大的赌注。很快,Alexa 将会渗透到人们生活的方方面面,在车里,办公室里或酒店里,它会一直在你的身边。
随着越来越多的应用场景的出现,机器学习就能把它变得越来越好,让它更有能力、更加人格化。当我们随时随地就能召唤 Alexa 时,或许隐私问题就不再那么重要,生活也将毫不费力。而在这样的全方位的系统上,亚马逊将向用户提供购物和娱乐服务。无论你想要什么,Alexa 都能 Make it so。
雷锋网编译,via Wired.