在一篇博客文章当中,微软宣布它已经在语音识别行业当中,实现了 6.3% 这个目前最低的字错误率(WER),这比 IBM 上周达到的 6.6%WER 下降了 0.3%,这是迄今为止报道的识别系统最佳性能。这条消息显示,微软继续提升语音识别技术中的各种服务,例如在 Windows 10 当中的个人助理柯塔娜,以及 Skype 翻译。这也在一定程度上改善了 AI,使得人类可以更好地与计算机进行互动。
微软表示,人类大脑的生物过程启发微软研发了深层神经网络来实现这一突破。它还赞扬了计算网络工具包(CNTK)的深层学习算法,以及 GPU 集群为这个进步所做的贡献。微软指出现在柯塔娜可以在相同的时间内吸收十倍以上的语音数据。