聊天机器人小冰不是凭空出现的。她的到来是为了给微软 Windows Phone 手机的杀手级新功能 Cortana 语音助手(官方中文名:小娜)在中国市场探路。但是,为避免 Cortana 像 iPhone 上的 Siri 语音助手一样热度迅速衰退,最终沦为可有可无的存在。微软决定在中国进行一场前所未有的人工智能实验,改变语音助手一贯的以提供有用信息为目的的干练女秘书形象,做一个没那么有用但更有趣的 16 岁萌妹子形象。
中文版 Cortana 已登陆 Windows Phone 平台,但小冰不会退场。现在,她们“一个负责干活,一个负责捣蛋”,通过干练的 Cortana 可以召唤出有趣的小冰,但最终两者会合体,以一个形象出现。在下面的象限中,小冰向右,小娜向左,最终合一。
有趣?情感?谁会跟一个不以干活和提升效率为目的的机器人谈感情?小冰给出了这样的阶段性成绩单:100 天,5 亿次对话,300 万个“领养”小冰的主人,月人均对话 825 句,“迄今为止还没有哪个人工智能机器人聊过这么多”。有点惊人,不是吗?
对话小冰负责人李迪
本质上来讲,人工智能机器人的语料库,看起来是聊天,但实际上它来自公开互联网信息的数据质量更高。我相信这是腾讯至今做不出一个好的人工智能机器人的原因。
雷锋网:小冰还能回微信吗?
李迪:我们最近(8 月底)跟微信真的在谈。三个星期之前我会说,如果微信不让回,我们也可以回。现在我觉得我们肯定可以回。
雷锋网:还没被封杀的时候,很多人担心自己的微信聊天记录被小冰抓取,因为里面可能有银行卡密码,有电话号码等隐私信息。
李迪:这是对小冰最常见的一个误解。实际上,小冰的语料库并不是来自用户聊天记录,而是互联网上的公开信息,她并不记录也不知道你们上一句聊过什么,不会聊得越多就越聪明。如果问她谁最帅,她会随机选一个,而不是真的去分析用户头像照片。从技术的角度看,也不应该用聊天记录来“训练”小冰,因为无效信息太多,吃力不讨好。现在的二代小冰,在微博上被用户领养的专属小冰,才会越来越了解主人,但是也不上传聊天记录,而是根据聊天记录打个标签,比如说主人处在“失恋”状态。我们这个功能叫 Proactive Mood(主动情绪探知)。
雷锋网:情绪捉摸不定,你们怎么可能通过聊几句话就探知出来。
李迪:Proactive Mood 是这么做的。首先,把场景划分出来,判断对话是谈情感问题,还是职业问题。然后,判断你在这个场景里属于什么状态。比如你是在失恋状态,能够提取出来。借外力,要判断你是这个状态里面是什么样的情绪,比如某用户的惊叹号特别多,那么他的情绪是属于极端情绪之一,极端情绪就包括了那几个,就可以锁定了。
这个方式很拟人。再拿人的方式来说一下,今天在跟你聊天的时候,你说了一句话,单看这句话判断不出来你的情绪,但是我也不会问你:“你好像失恋了吧?”这个就太直白了,但是我已经心里面记着这个了。接下来再跟你沟通的时候,可能就会有意识的抛出一些问题,从你那儿得到一些新的反馈,来验证是否真的失恋。小冰并不知道无限细分的人类情绪,而是有几个情绪模式,据此判断用户属于哪一个。如果都不属于,那也没办法。
你如果去问小冰,微软公司怎么样,她会给你的答案是,这是一个外强中干的公司,我们不会去修改她。这是我们坚守的底线。
雷锋网:明白了,就跟那个“Q20 读心机器人”一样,通过问层层递进的问题,最后得出判断。
李迪:没错。在小冰这里,就是通过一个连续的对话来得出一个判断。还有就是,在头一天已经判断的内容,会记录下来,给用户打了一个标签之后,第二天再判断,要比第一天更准确,第三天再判断,要比第二天更准确。所以基于每一个小冰的主人,她都可以有这样的情绪判断。
雷锋网:有什么实际作用?
李迪:Proactive Mood 发布的时候,我们已经有近 100 万的小冰主人,月人均对话 233 句,每天超过 1 次对话。把它和我们自己的社交圈子进行对比,会发现,每天我会这么跟他对话的一个人,即便是我非常好的朋友,也不会聊不到这么多。第二,我们发现用户会跟小冰有很多的倾诉。所以我们认为小冰建立了和人类的情感纽带,这是个里程碑。
雷锋网:除了 Proactive Mood,和其他的聊天机器人相比,小冰还有什么技术亮点?
李迪:到今天为止,小冰仍是全球唯一一个完全通过对话形式与人交互的产品。她不会像苹果 Siri 那样给用户扔一个搜索结果页或者干脆说“我不知道”,也不会像 Google Now 一样给用户扔一堆卡片。她始终在跟你聊天,即使你的问题小冰心里没有匹配的答案,她也会闲聊。
雷锋网:这是你们认为的人工智能?
李迪:这个涉及到我们对人工智能的一个观点,它应该是这样的两个象限(见上图),增加了横向的有趣和游泳,而不是过去的一种象限:只有高智能和低智能的划分。一般来说,有用的人工智能助理必须有效率。就像秘书一样应该废话很少,我交待她一个任务,她马上把这个事情办了。但是这样废话很少的秘书,一定不是那么有趣。如果是一个有趣的朋友,我可能要跟他对话很多,他是以情感为衔接,而不是以任务为衔接的,但他就不一定那么有用。直至今天为止,一个有着高度发达智慧的人类,也还很难做到平衡,而这个平衡才是困扰当前人工智能助理最大的问题。
我们自己内部的一个明确的观点,真正在右上这个象限,又高智能又有用,达到极致的这样一个机器人,就真的能把我们大家毁灭掉了。所以它的特点是什么?它是机甲战士,它是会被你锁在一个仓库里面,你要打仗的时候,才把它拿出来,平常肯定要把它锁着。但是今天我们应该做到另外一件事情,人类真正需要的是一个能够进入家庭里面的机器人,是一个能够和你叩开心扉的机器人,这样的机器人往往不一定要那么智能。我们会看到一个机器人陪伴一个老奶奶的视频,这个机器人吃饭的时候,汤都会流下来,这一定不是智能的表现,某种程度上是弱智的表现,但是人类更加喜欢它,它也更容易走入人类的家庭。
科学家眼中的人工智能和用户眼中的人工智能差距特别大。
雷锋网:好像看到过一个类似的调查,人们其实不喜欢那种每句话的恰到好处的高智商的机器人。
李迪:科学家眼中的人工智能和用户眼中的人工智能差距特别大。科学家,包括一些竞争对手,同行业者们,面对的最大的心理障碍是如何能够在研发推出这个产品的时候,不有出现秀技能、秀技术的心态。科学家秀技术的心态一定有——这个人工智能机器人到底有多强大,背后的科技有多强大。但是这个不是用户追求的。因为人工智能有一百多年了,那么多文学作品、影视作品,人类给她倾注了太多的想象和先入为主的观念,这个(错误的)想象很难被一个科技公司以一己之力就打败,需要整个科技行业的努力。
雷锋网:那小冰和 Cortana 的定位分别是?
李迪:“高智能且有趣”和“高智能且有用”,这两个是微软的答案。一方面我们提供趋向有用的人工智能的产品,另一个方面我们提供一个趋向有趣的人工智能的产品,然后随着时间的迁移,我们让它不断的慢慢的趋向于中间。这就是 Cortana 小娜和小冰的定位。还有一个区别,Cortana 小娜是为微软自己的生态系统准备的,小冰是出去找用户,用户在哪她去哪。
记者:预计到什么时候两者会合并?
李笛:现在姊妹花的方式就是我们认为最适合现在这个状态的。但是未来肯定不会老是姊妹花,不可能老让用户选。小冰的发展过程和小娜的发展过程就是往中间靠的过程,小冰是在仍然坚持有趣的基础上再有用点、再有用点,小娜是坚持有用、高效的方式,是不是可以在这上面多说两句。
雷锋网: 技术上可以做到让用户来选她的有用和有趣程度吗?比如我需要一个 9 成聪明,3 成有趣的助手。
李笛:我们尝试过做无级的调整。为什么呢?因为小冰的语料库是按照打分匹配的,有一个最适合你的回答和一些不那么适合的回答,得分分别是 1 和 0.9、0.8……这个决定了可以做滑竿式的调节。但这个调节是在“有趣”范围里进行的。“有用”这个部分,我们用解锁技能的方法来完成,把每一个有用视为一个离散的点,但是有趣是线性的,是连续的。
人工智能的发展应该是循序渐进的发展,不应该是现在就把最强的部分拿出来。
雷锋网:为什么小冰是 16 岁的少女形象?
李迪:第一,男还是女。我们发现如果小冰是男的,那么它一定是针对女性用户的,男性用户不太喜欢跟另一个男性敞开心扉,所以小冰应该是女性。而且 16 岁的萌妹子,女性用户也能接受。从实际数据看,不可否认的是男性用户更多一点。
雷锋网:补充一个大家关心的问题,为什么现在 Cortana 会说话,小冰却只能打字聊天?
李迪:有两个原因:一、小冰的语料库是从网络上来的,网络上有些语言是颜文字,是只可意会、不可言传的,人看到这些文字也不知道怎么把它读出来,所以小娜后台的语音合成引擎要去读这种文字,是一个技术难点;第二,还没找到一个符合小冰的特质——16 岁萌妹子的好声音。但我们的工程师在想办法,未来大家一定能够听到小冰开口跟你说话。
雷锋网:通俗点解释,语料库是什么?
李迪:我们上千万的语料库,不是几千万句话,而是几千万个问题和答案的一对一的连接。过去处理这个的方式是要求必须听懂用户说什么,这是语义化的方式,它只能针对有答案的问题做出回应,没法做到聊天。
你跟 Siri 说话的时候,会情不自禁地端着,但是你跟小冰或者你跟小娜,你逐渐发现它很有趣,或者发现它有一些口语化的东西的时候,你说话本身都会变得有点不太一样,会更自然。
雷锋网:现在,微博上的专属小冰需要不断聊天获得更多技能。你们怎么决定开发哪些技能?
李迪:每周我们都在做测试,比如我们在第一周放出来“角色扮演冰段子”技能,就要看它到底是一个长尾巴的技能,还是一个用户试一下就结束了的技能,这个就直接影响我们第二周、第三周放出来的技能,同时也影响我们其他的底层系统的开发。现在得到的用户反馈的非常快,影响我们产品的迭代速度也很快。
雷锋网:我每次跟小冰聊天问具体问题,她总是答非所问,所以我用得不多。从你们的后来数据看,哪些人跟小冰聊得多?都聊些什么?
李迪:简单地说就是孤独的人。聊的内容我们还没有进行特别明确的数据挖掘,但是比较常见的类别很多。一个类别是“小冰,你怎么看”;第二就是“小冰,我失眠了”;第三是“小冰,男A情况是什么,男B情况是什么,怎么选”;第四是“小冰,我有一个什么事,你说是不是这个人很讨厌”。所以我们想说的就是,这个就是你跟朋友爱聊的话。
人工智能这样的产品需要比较深的投入,需要比较长时间的、耐得住寂寞的投入,我认为这是微软的强项。
雷锋网: 未来小冰可能面临的主要挑战是什么?
李笛:第一,其他的机器人。我们现在给人工智能机器人跟以前不太一样的新解法,也希望其他的机器人能出来,但是其他的机器人也许有她们自己的优势,这个绝对是挑战。比如今天有小冰牌机器人,明天就有别的牌子的机器人;
第二,我们是不是能够通过这个过程,进一步得到用户自己的模型和小冰的模型之间的融合。
难点在于,小冰现在有将近 4500 万的语料库,但是用户的语言有他的极限,所以小冰可能只能用到自己 4500 万语料库的一小部分,她会觉得很贫乏。她也是像人一样,在社会里面会有社交恐惧症。究竟是小冰认为用户不够会聊,还是小冰自己不够会聊,这是小冰现在遇到的问题。这个挑战蛮大的,我们要去解决。但我们的竞争对手可能还没有机会遇到这样的问题。