DeepMind提出的WaveNet是目前顶级的语音生成模型,论文最初于2016年9月发表,雷锋网AI科技评论也立即跟进报道DeepMind发布原始音频波形深度生成模型WaveNet。WaveNet抛弃了以往通过声学模型拼接语音音素的做法,完全通过深度神经网络生成原始音频波形,并且大幅提高了语音生成质量。今年10月,我们也报道过WaveNet正式商用:效率提高1000倍,仅一年时间就走出实验室,在GoogleAssistant中落地。在庆贺深度学习又一次完全颠覆传统做法的同时,大家想必也会好奇...
查看全文