Mozilla开源音频数据库已成为第二大公开语音数据集_最新动态_新闻资讯_程序员俱乐部

中国优秀的程序员网站程序员频道CXYCLUB技术地图
热搜:
更多>>
 
您所在的位置: 程序员俱乐部 > 新闻资讯 > 最新动态 > Mozilla开源音频数据库已成为第二大公开语音数据集

Mozilla开源音频数据库已成为第二大公开语音数据集

 2017/12/1 12:05:15    程序员俱乐部  我要评论(0)
  • 摘要:Mozilla的开源音频数据库CommonVoice已收集了来自20,000个人的近40万个录音,整体时间已超过500个小时,据称这是公开发布的第二大语音数据集。CommonVoice是Mozilla今年7月推出的一个大型公共数据集,并已开源。它允许用户通过iOS应用或网站捐赠他们的话语,提交他们自己阅读特定句子的简短音频记录。Mozilla新兴技术高级副总裁肖恩·怀特(SeanWhite)在一篇博客文章中曾表示,“商业上可用的语言服务很少的一个原因是缺乏数据
  • 标签:第二大 数据库 数据 开源 Mozilla
class="topic_img" alt=""/>

  Mozilla 的开源音频数据库 Common Voice 已收集了来自 20,000 个人的近 40 万个录音,整体时间已超过 500 个小时,据称这是公开发布的第二大语音数据集。

  Common Voice 是 Mozilla 今年 7 月推出的一个大型公共数据集,并已开源。它允许用户通过 iOS 应用或网站捐赠他们的话语,提交他们自己阅读特定句子的简短音频记录。

  Mozilla 新兴技术高级副总裁肖恩·怀特(Sean White)在一篇博客文章中曾表示,“商业上可用的语言服务很少的一个原因是缺乏数据。当我们开始打造语音识别系统时,我们发现我们可以在已有算法的基础上工作,并在算法方面进行一些创新。但是要想让语音识别系统真正起作用,数据的策划,创建和聚合是一个绕不开的挑战,如果你想做一个新的语音识别系统,你无法找到一个现成的高质量音频数据集。” 目前,Common Voice 收集的重点是英文,计划在 2018 年上半年将其扩展到其他语言。

发表评论
用户名: 匿名