8 月 3 日下午消息,搜狗公司今日正式发布语音交互引擎“知音”,该引擎将成为搜狗在搜索方式方面的重要拓展。实际上,搜狗的语音交互技术已经在两周前有过公开亮相,当时搜狗 CEO 王小川在演讲现场实现了语音文字的实时转录。
搜狗方面称,知音引擎可以做到快速识别和纠错,并且支持更加复杂的多轮交互。具体来说,就是不仅要实现“能听会说”,还要求具有“能理解会思考”的能力。
搜狗举了三个例子。首先是语音识别和纠错,搜狗知音目前解决了用户在说话过程中因语速过快而导致吞音的问题,目前语音识别错误率相对下降了 30% 以上,语音识别速度提升了 3 倍。其次是搜狗知音能在语音交互中支持用户实时修改错误的识别结果,并在自然语言进行中改错。比如输入时可以说“把张改为立早章”。最后是多轮交互对话方面,比如前往首都机场时,它会回复“去 T1 还是 T2”,当航站楼确定后,它还会问是出发还是接人。
搜狗公司 CTO 杨洪涛表示,搜狗从 2012 年开始就研发智能语音技术,并且在 2013 年开始进行深度学习的研究,目前已经把智能语音技术应用到了全线产品中。
搜狗方面的数据显示,搜狗搜索日均语音搜索次数增长超过 4 倍,搜狗手机输入法日均语音输入超过 14 亿次,目前是国内语音输入功能使用量最大的移动产品。搜狗方面还表示,在语音输入上的准确性上,与科大讯飞大致持平,但领先百度。
搜狗方面称,除了在搜索和输入法方面的应用,未来还将把智能语音交互应用到物联网、车联网和人工智能等各个方面,并尝试接入更多的终端。