百度发布DeepVoice最终版：模仿万人、半小时学会一种口音_最新动态_新闻资讯_程序员俱乐部

中国优秀的程序员网站

程序员频道

地图

最新资讯 | 百度新闻 | GOOGLE地图 | RSS订阅 | 更多

非技术区

生活休闲恋爱交友

职业发展求职面试程序人生

移动开发

开发工具

DB2

MySql Sybase

开发

JAVA .NET PHPC/C++

数据库

SQL Server Oracle

互联网

运营推广营销 SEO

系统

Linux UnixWindows

资讯

动态产品人物

创业

职场学习管理

您所在的位置：程序员俱乐部 > 新闻资讯 > 最新动态 > 百度发布DeepVoice最终版：模仿万人、半小时学会一种口音

百度发布DeepVoice最终版：模仿万人、半小时学会一种口音

2017/10/25 14:55:52 程序员俱乐部我要评论(0)

摘要：今年早些时候，搜索巨头百度推出了一个名叫DeepVoice的全新人工智能系统，借助热门的深度学习技术，它能够实现文本到语音（TTS）的转换。初版DeepVoice可以产生较短的语句，不仔细听还以为是个真人在说话。该系统还可以每次学习一种声音，在数小时后即可掌握。而今年5月份推出DeepVoice2，可以在一小时内模仿出一种口音，单系统就可以学习数百种不同的口音。现在，百度推出了DeepVoice的“最终版”，声称可以在每半个小时内完成对10000种语音的数据学习
标签：发布百度

　　今年早些时候，搜索巨头百度推出了一个名叫 DeepVoice 的全新人工智能系统，借助热门的深度学习技术，它能够实现文本到语音（TTS）的转换。初版 DeepVoice 可以产生较短的语句，不仔细听还以为是个真人在说话。该系统还可以每次学习一种声音，在数小时后即可掌握。而今年 5 月份推出 DeepVoice 2，可以在一小时内模仿出一种口音，单系统就可以学习数百种不同的口音。

　　现在，百度推出了 DeepVoice 的“最终版”，声称可以在每半个小时内完成对 10000 种语音的数据学习。这种高效生成各种各样声音的技术，为许多用例打开了大门。

　　例如，在有声书或视频游戏中，每个角色都可以有自己独特的声音，以获得更强的用户体验。不过与真人配音相比，百度 DeepVoice 产出的口音，其合成感还是很明显的。

　　对此，百度表示这并不是他们的目标：“如果只生成一两种口音的话，我们的系统早已证实能够合成相当自然的、接近真人的口音，且可以轻易将它用作数字助理”。

　　Deep Voice 3 架构图

　　百度所要尝试的，是制造出一种能够掌握多种口音或字符间细微差别的系统：

这只是最初的工作，展示了可伸缩的可能性。我们的系统成功地量训练扩大了一个规模，此前发表的 TTS 模型中尚未达到过。

我们相信，通过使用大型高质量数据集、和额外的机器学习工程训练，其质量可在不久的将来大幅提升。

　　需要指出的是，百度并不是唯一一家从事计算机语音合成工作的搜索巨头，Google 旗下的 DeepMind 部门也一直在进行一个名叫 WaveNet 的类似项目。

　　在最新的版本中，WaveNet 已经能够在掌握口音方面做到更好，甚至像真人那样产生“唇音”。现在，它已经被用到了英语和日语版本的 Google Assistant 上。

　　[编译自：TheVerge , 来源：百度研究院]

上一篇： Facebook开始测试4K视频落后YouTube 3年下一篇：谷歌推出Gmail附加组件：为收件箱带来大量业务工具

Ubuntu18.04 LTS代号Bionic Beaver 定于2018年4月26日发布

百度发布DeepVoice最终版：模仿万人、半小时学会一种口音

月入五万活得像五千？百度程序员不服：换装惊艳了

大批财报本周密集发布这几家科技公司最被看好

京东发布电竞级游戏手机标准将由消费者定制

查看所有评论(0)

发表评论

用户名: 匿名

最新文章

大学生点外卖送流浪者获阿里正能量奖金5000元全部捐出

大学生点外卖送..

Ubuntu18.04 LTS代号Bionic Beaver 定于2018年4月26日发布

Ubuntu1..

最新标签

今日热点

推荐文章

英国造出155个人兽杂交胚胎被警告是自我毁灭

英国造出155..

微信是什么？微信与手机QQ有何区别？

微信是什么？微..

English | 关于我们 | 诚聘英才 | 联系我们 | 网站大事 | 友情链接 | 意见反馈 | 网站地图

Powered by 程序员俱乐部程序提供： HugoCMS 2.0
网站备案：苏ICP备11048748号-1