尽管此前苹果官网上曾表示,Siri 将在 2012 年支持中文,但在其最新推出的 New pad 中,并未出现 Siri 的身影,不过,这并未影响参考苹果公司进行互联网布局的中国互联网巨头有所行动——大举布局中文版 Siri,与其相伴的挖角行动也随之展开。
小i机器人创始人袁辉向本报表示,目前抢着做中文版 Siri 研究的公司主要有三类,第一类公司是以安徽科大讯飞信息科技股份有限公司(下称“讯飞”)为首的语音公司;第二类公司,以 iPhone 客户端开发、安卓客户端开发的团队;第三类是曾经做过机器人、语义分析的一类公司,如小i机器人。
“据我了解到的情况来看,目前各大互联网巨头也都在布局中文版‘Siri’,在语音语义两个方面都在进行各自的研究,预计半年左右的时间,都将会有新产品面世。”一名从事该领域研究的互联网公司人士向本报表示。
挖角
据一位曾就职讯飞的员工透露,从 2011 年底到 2012 年初,合肥世纪讯微科技有限公司(下称“讯微”)陆续从讯飞挖走了几十人。不过,讯微及腾讯公司均未对此事作出回应。据了解,2011年 1 月讯微是由腾讯斥资 2 亿元投资所成立的子公司。
已在该领域经营十载的讯飞,自然知道人才的重要性,从 2011 年底到 2012 年初,讯飞提高了相关工作人员的工资,涨幅超过一倍。一个有意思的细节是,“合肥讯微的第一次招工,时间定在一个周六,这天科大讯飞本来是放假,但是管理层选择了全体加班,以应对讯微的挖角。”上述人士称。“这些被挖角的人,此前在讯飞做语音产品的测试工作,来讯微后主要做手机游戏的测试,这次的挖角行动,并没有带走讯飞的核心技术人员。”一位不愿具名的讯微员工称。就目前讯微在其官方网站上发布的产品页面数据来看,目前讯微主要是在游戏领域发力。
布局中文版 Siri
“以前我们说语音技术还要解释半天,Siri 无形中教育和引导了这个市场,讯飞是其中之一的受益者。”讯飞副总裁徐景明说,由于中文版 Siri 概念的炒作,半年来其股价已经由去年 10 月的 29 元,上涨近 30% 至 38 元。在个人用户领域,讯飞目前推出了颇受用户欢迎的讯飞口讯、讯飞语点、讯飞语音输入法等产品。由此受益的还有专注于人工智能的小i机器人。其创始人袁辉在该领域浮浮沉沉 10 年,致力于将小i机器人打造成中文版 Siri。
与上述两家公司相比,互联网巨头们则低调很多。2009年 12 月,谷歌公司正式推出中文版语音搜索。此后 2011 年年中,百度推出带有语音搜索功能的手机客户端“掌上百度”。“百度确实是在这方面有布局,但是目前,我们不方便透露太多。”百度公关部发言人李国训表示。
腾讯一名内部人士向本报表示,腾讯在语音方面的产品目前主要布局在搜索领域。“在语音交互方面,腾讯的手机浏览器、音乐、地图等都已支持语音搜索功能,语义方面也有研究,后续会有新的产品面市,这块主要是腾讯搜搜团队在运作。”
徐景明表示,讯飞和腾讯在无线领域正在进行语音合作,比如移动 QQ、移动搜索等领域,讯飞 2011 年的财报收入中,有 1000 万来自与腾讯合作的业务。腾讯研究院院长郑全战向本报表示,腾讯一直关注语音语义技术的发展,并于一年前在腾讯研究院组建了一个以语音语义为重点研发方向的团队,“目前研究院推出了一款语音输入法的产品,与搜搜团队的产品有时候会有重合的部分。”“Siri 创始人对 Siri 新的定义是,20% 的语音识别,即 Siri 能将语音转化成文字;加上 80% 的网络机器人,即能理解你的意思(语义),并做出反应。”袁辉解释道,“讯飞一直在做的事情是 20% 的内容,即语音识别;小i机器人一直在做的是 80% 的内容,而目前的难点还是在 80% 上面。”
据一位业内公司高管透露,腾讯实际上是在做整个自己的 Siri,语音只是一个部分,语义也在研究。“腾讯一定会将 Siri 作为一个重点关注的方向,但是目前人不多,就是研究院的人在做,差不多几十个人。”
“语义”难
“苹果目前推出的 Siri 产品,是一款人工智能产品加上 Nuance 语音识别功能的融合。所以讯飞真正要定位只能定位中国的 Nuance,而不是中国的 Siri。”袁辉表示,小i机器人正在寻求与 Nuance 等语音公司进行合作。徐景明向本报表示,语义方面是要一个长期积累的过程,讯飞目前也还在持续投入。
但语义方面,正是目前的难点。语义需要机器人对输入的语境进行判断。举个简单的例子,当用户询问机器人:“今天北京的天气怎样?”它回答:“晴朗。”用户再询问,“上海呢?”机器人能结合上下文的语境,判断用户问的问题是上海的天气,并作出回答。
“人工智能一定是人工加智能,需要通过海量信息的搜集,以及整个网络知识结构的沉淀,需要不断地对机器人进行训练。在这个过程中,人工一定要参与,这也是为什么苹果在印度招工程师整理知识库的原因。”袁辉表示。
人工智能,第一步要通过算法模拟人类思维理解人类在讲什么,需要不断地检验这个算法是好还是坏;第二步,得有一个成长的知识库系统,让字节经过整理变成数据,数据经过整理能变成信息。而这些正是做语音交互要攻克的难点,目前 Siri 功能的不完善,亦让苹果公司饱受非议。
据《华尔街日报》报道,今年 3 月份,苹果公司就陷入了与一名 iPhone 4S 用户的法律纠纷之中,原因是一名叫做 Frank Fazio 的用户认为,苹果在为其虚拟个人助理 Siri 所打的广告当中包含“误导和欺骗”的性质。亦即 Siri 广告当中向人们所展示的简便使用性,并不能在现实生活当中实现。“苹果在最新的 New iPad 中,都没有推出 Siri 功能,就是因为他们要对 Siri 的语义部分进一步完善,但是这些都需要长时间的积累,不是一年两年就能做成的。”袁辉表示。“目前腾讯、百度都是投入比较小型的团队去做这件事情。主要是因为苹果在做了,这必定是一个方向,但是还没有将其放到整个公司战略层面上来,他们的投入说白了是不够的。”一名与多家互联网企业语音交互部门有过密切接触的人士向本报表示,苹果投入如此巨大,因为苹果有非常清晰的短期战略,但是中国企业现在去做更多的是跟风,且基本上对整个语音交互市场,目前都没有明确的战略规划。