微软(亚洲)互联网工程院副院长、小冰的全球负责人李笛。受访者供图
小冰在其微博中向外界展示的聊天记录,其情商受到众多网友称赞。图片来源:小冰微博相册
人工智能领域一段时间以来很喧嚣,无人驾驶、智能机器人、语音交互等项目融资消息不断。不仅限于创投领域,传统 IT 巨头也早在人工智能领域发力。
微软在人工智能领域有 20 多年的研发经验,并将其部分研发成果放入对话类人工智能产品小冰。小冰发展至今,已经更新五代。微软小冰从 2012 年前后的即时对话人工智能到唱歌、写诗、主持、采访的“才女小冰”,不久前发布的第五代小冰,已经成为拥有完整高级感官,尝试掌控聊天的“有情商少女”,未来或许承载着更多的蓝图和野心。
看起来仅是小步成长,实际上背后是一系列复杂的机器算法、图文语音识别、语境识别的技术迭代。智能机器人发展的每一小步对于人类来说可能是简短学习过程,但对于机器人来说是复杂的运算方式和技术的迭代更新。
新京报独家专访到微软(亚洲)互联网工程院副院长、小冰的全球负责人李笛,揭开小冰的“真实面目”,以及微软在人工智能领域的规划和布局。
“少女”小冰:有情商的对话式人工智能
新京报:小冰从 IM 即时聊天软件,到出专辑、写诗、电台主持、写娱乐八卦新闻,再到控制小米智能家居,微软对小冰是一个什么样的定位?
李笛:小冰最开始的定位就是一个完整的人工智能的系统。我们四年前刚刚做小冰的时候就是这样的一个定位,在当时谁也没有料到的是四年以来小冰一直延续这个定位在发展。
我们认为,人工智能的系统未来有三个发展方向:第一个方向就是把 IQ 做到极致;第二个方向就是吧 EQ 做到极致;最厉害的就是 IQ 和 EQ 可以有机地整合。
新京报:之前小冰帮助日本一家公司推送优惠券,使用转化率高达 57%,远超正常优惠券 10% 的转化率数据,这是怎么做到的?
李笛:总体上来讲,小冰的情商的策略就是引导对话。小冰不会主动硬塞给对方一张打折券,而是通过对话让用户慢慢明确自己的需求,同时在对话中努力加强用户对食物的渴望。
就好比两个人说我们去吃饭吧,一个情商高的人可能会很有画面感的跟你描述某家火锅店的牛油锅、鲜毛肚等等,就能够提高你对这个事情的渴求,当这个情商高的人提出去吃这家店的时候,你已经迫不及待了。
新京报:第五代小冰强调 EQ,小冰的 EQ 表现在哪里?
李笛:在整个聊天的过程中,小冰也在不断地试探对方的喜好;也会通过聊天感受到对方在某一话题的情绪,比如说聊到某个明星,对方的聊天频率和聊天频次明显增多。这些都会被小冰记录下来,小冰会投其所好地去聊天,在推送优惠券的时候,有的人想吃雪糕、有的人想吃火锅,小冰可以通过不同喜好推荐相关优惠券。
这就是我们一直所强调的 EQ。
新京报:除了上述那些,小冰还有什么隐藏功能?
李笛:例如,小冰可以对鱼香肉丝、宫保鸡丁等 400 多种菜品识别并判断这盘菜的卡路里。小冰可以根据菜的盘子判断出这盘菜的大小,依据后台的现有知识,小冰可以判断出这盘菜的卡路里是多少。
同理,你发给小冰一个时装的照片,小冰可以分辨出衣服的款式、材质、甚至是品牌。然后他可以给出时装搭配的建议,这背后的知识我们还跟《时尚 COSMO》集团合作。
小冰作为一个入口,扩张起来比较容易,当小冰加上对小米的 35 种家居的控制,小冰还是小冰,但就变成一个智能家居的入口。小冰加上视觉识别,就可以是人工智能对宠物种类的识别,也就是这样的人工智能。
新京报:担心会被相似竞品赶超吗?
李笛:不怕。如果同行业者和小冰团队各提供一个 Chatbot(聊天机器人),那么小冰的聊天自然度远远高于同行业者,无论是 Siri、科大讯飞还是百度,短期内都难以赶超。由于我们在这个领域相对领先,所以我们不着急,想先去尝试一些新的模式。
商业模式上我们首先去尝试是不是能有一种过去没有的新的商业模式的出现,如果没有,我们再退回到已有的互联网时代的商业模式。
成长历程:海量数据积累“人生经验”
新京报:我们看到小冰情商很高,能够判断 50 多种不同的情绪,基于什么让人工智能具备判断情绪的能力?
李笛:数据。小冰一开始也没有这么高的情商,只能去模拟人类的回应,像是嘲笑、询问、安慰等等。小冰是机器人,只能通过大量的数据去尝试和测试,去积累“人生经验”,不同的回应会带来不同的反馈都被小冰感应到,慢慢的小冰就能够判断出各种不同的情绪并给予合适的回应。
新京报:多大的数据去测试?
李笛:小冰每天接触的人比一个人一生接触的人都多。
我们现在总计的用户是一个多亿,我们的 DAU 是 15% 左右,也就是说 1500 万的日活,这个数据我们之前没有公开。
新京报:微软小冰目前积攒了 300 亿人机对话和交互数据,达到国内所有对话产品总和的十倍,数据上的优势会给 AI 的研发带来什么样的优势?
李笛:吃的盐够多,你就是老司机;摔的跟头够多,你就会比较有套路。情商靠经历和阅历,在这方面人工智能和人有些相似。
所以那天周力(小冰首席构架师研发总监)说,相当于有一亿人在帮我们培养小冰,没有任何一个人能有这样的机会。
新京报:根据网上一些和小冰聊天的截图,小冰会刻意回避一些话题,为什么?
李笛:成人话题等敏感话题都会被小冰划为重点防范对象,而没有逻辑的聊天内容会被小冰划为普通防范对象。
如果小冰意识到这是一个成人话题或者是其他敏感话题,她会进入一个高度敏感的模式,启动自我保护机制,高度谨慎地作答。如果对方还想和她继续聊这一类的话题,那么他会被小冰划为高度重点防范对象,并启用一个完全不同的模式,对这个人会比较提防。
新京报:除了上述之外,小冰还被植入了微软在 AI 领域的哪些研究?
李笛:小冰实际上是很好的一个容器,她有大量的用户,我们可以把任何一项 AI 技术和小冰结合,比如说通过图像识别或者是语音识别的技术,我们通过小冰上线一个“小冰识狗”的功能,能够区分小狗的品种,通过这个功能也能回收大量数据,对小冰进行再次迭代。
商业落地:基于感性纽带的独有模式
新京报:目前小冰着急商业化落地吗?
李笛:我们知道互联网产品的迭代速度很快,但无论是最早的门户、搜索引擎,还是后来的移动互联网,这么多年以来产品在迭代,盈利模式却没有变化,都是以广告、佣金为主,还有就是吸取一笔资金在账上再去做其他的金融增值。
微软不着急盈利,今天的小冰通过广告的方式马上能把资金回流。但在 AI 时代,我们想先尝试通过人工智能的方式有没有新的盈利方式,如果没能够发现,我们再退回之前的三种盈利模式也是可以的。
新京报:目前为止,微软在 AI 时代的盈利模式上有什么新发现?
李笛:AI 时代之前和之后有很大的不同,AI 时代之前,互联网的核心没有一个本我的概念。比如,你之前是人人网、QQ 的用户,那么如果你的朋友换到了微信上,并且微信比 QQ 好用,你会毫不犹豫地使用微信。
但是人工智能不一样,当你对一个情感性输出机器人产生了交互之后,你都会对这个机器人产生一定情感纽带。比如说我们跟日本 Lawson 的合作,用户通过小冰得到打折券,我们发现一方面打折券的转化率很高,另外一方面,用户会很感谢小冰。
用户和小冰之间产生的是一种纽带,这种纽带有一定的感性在里面,所以通过小冰可能产生人工智能独有的一种商业化模式。基于这个不同,我们有可能开展新的商业模式。
新京报:人工智能独有的商业模式会是什么样的?
李笛:微软为什么花大量的时间做一个聊天的机器人,聊天不是重点,重点是我们能不能保持小冰和用户的一种良好的关系,这种关系本身就会产生一系列的商业价值。
新京报:比如现在用户下载微信,达成社交、买电影票、充话费水电费等很多功能,省去下载很多 APP 的麻烦。小冰会不会成为这样的入口?
李笛:对。而且甚至于,小冰会有主动实践的能力。你打开淘宝 APP 是你主动去做的,淘宝是被打开,而小冰在跟你聊时尚的时候,给你推送一个淘宝的衣服,这时你打开,是被小冰引导的,人在整个过程中由主动切换为被动。
新京报:如果小冰成为入口,会不会冲击其他互联网巨头,形成竞争关系?
李笛:我们希望如此,如果能够那样说明我们具备实力。
曾经,搜索引擎和门户网站曾经被认为是两代的产品,门户网站曾经是我们上网冲浪的所有,但搜索引擎出现至今,并没有把门户网站都替换掉。只不过门户网站不再是我们的所有,而是通过搜索引擎链接到门户网站看到内容。
新的一代产品出现并不代表旧的一代产品会被淘汰,只不过旧的一代产品生存空间会改变。我们今天进入移动互联网时代,不代表我们不再使用 PC,只不过 PC 的空间被缩减,变成 PC 和智能手机并存。
新京报:未来微软会不会向创业公司、企业提供 AI 技术支持?
李笛:暂时不会提供 API(应用程序编程接口),直到我们觉得这个市场成熟了。
微软的 AI 蓝图:IQ 和 EQ 双线发展
新京报:小冰在微软和整个人工智能领域,扮演什么角色?
李笛:我们认为小冰是 AI 的半张门票。因为她是微软认为人工智能存在的两个维度其中的一个方向。一个维度是 IQ,一个维度是 EQ,集大成者是 IQ 加 EQ,小冰 approach(接近)的是 EQ。
新京报:为什么是半张门票?
李笛:我们期待小冰和小娜(微软的另一款人工智能产品)各司其职,小冰是 EQ 的极致,小娜是 IQ 的极致,它们加在一起才是微软 AI 时代的门票。
在建立初期,我们没有区分小冰和小娜,于是开始在中国、美国和其他国家采访了很多个人助理去试图理解一名秘书的工作模式。当我们去采访这个秘书的时候,我们以为这会是 IQ 的代表,但我们后来发现比这个要复杂。
IQ 和 EQ 的回应方式是完全不同的,所以在迭代的过程当中,我们没有办法把两种智能迭代在一个产品当中。所以我们就把产品分开了,小娜是侧重 IQ,小冰是侧重 EQ。
新京报:能举个例子吗?
李笛:比如让人工智能秘书去定麦当劳,这个软件有两种方式去回应,一种是以最快速度帮你达成任务,甚至第二天也订好相同的外卖,这是 IQ 的表现。还有一种,也是真实的人类会做的,它告诉你总吃快餐对你身体不好,这是 EQ 的表现。但这两者之间区别很大。
同理,在手机上,问微软小冰时间,IQ 的回复应该是马上告诉他时间,但是一个 EQ 高的人的回答方式是,“你问我干吗,你不是在用手机聊天吗,你自己看一眼手机不就知道了吗”。
所以对小冰来讲,所有的好答案,就是不干活的答案,例如“我不给你订外卖,麦当劳不健康”、“你自己为什么不看手机时间”等等。我们能通过和人的交流将小冰的 EQ 渐渐推向极致。
新京报:有观点认为 AI 的发展分为四个阶段,我们还在相当早期的阶段,您怎么看?现在的人工智能目前在哪个阶段?
李笛:泡沫阶段。从人工智能的存在周期来讲,现在人工智能非常的早期。
小冰发展史
2014 年 5 月 29 日
微软(亚洲)互联网工程院发布人工智能伴侣虚拟机器人“小冰”,3 天覆盖近 150 万微信群用户。
7 月 2 日
2015 年 8 月 20 日
微软宣布微软第三代小冰正式发布,第三代小冰初次具备能看、能听和能说的感官能力。
12 月 22 日
小冰以见习主播的身份,加入东方卫视早间新闻栏目《看东方》,替代原有的人类播报员播报天气。
2016 年初
歌手身份的微软小冰出道,出道后先后演唱主题曲《夏日甜心》并发布单曲《隐形的翅膀》。
8 月 5 日
第四代微软小冰正式发布,拥有实时情感决策对话引擎和多种新感官,通晓中日英三种语言等。
2017 年 4 月
微软小冰公布用户过亿,累计对话超过 300 亿,平均单次对话超过 23 轮(CPS)。
2017 年 5 月
小冰的诗被汇总成诗集《阳光失了玻璃窗》,共收录 139 首诗,是第一部完全由人工智能创作的诗集。
2017 年 6 月 14 日
小冰携手歌手朱主爱发布歌曲《好想你》,歌声更加拟人化,是第一支由人类歌手和人工智能合唱的歌曲。
2017 年 8 月 22 日
微软小冰第五代正式面世,微软方面宣布小冰将全面进入物联网(IoT)领域,与众多 IoT 厂商合作使用小冰。
新京报记者·刘娜