请选择 进入手机版 | 继续访问电脑版
Mozilla

火狐社区

登录    注册

QQ互联

Mozilla 邀请你参与开源语音数据库项目贡献自己的声音

yingliu Mozilla员工 发表于 2019-4-19 16:22:50 | 显示全部楼层 [复制链接]
4 6296
本帖最后由 yingliu 于 2019-4-19 16:28 编辑

20190419162825.png


语音识别技术正在改变我们与机器进行交互的方式,不过目前可供使用的系统都相当昂贵并且是专有的技术。

为此谋智基金会(Mozilla)目前已经推出 Common Voice 项目,旨在让语音识别技术变得更好也能免费使用。

项目依靠全球用户捐赠的语音数据库可以让任何人或开发者快速轻松地训练出能够识别任何语音的应用程序。

此外作为配套设施谋智基金会还在构建名为 Deep Speech 的开源语音识别引擎且同样是为所有人免费使用。

20190419161756.png

为什么项目如此重要:

对于人类来说说话依然还是我们相互沟通最自然的方式,而语音技术将这种方便感带到计算机和移动设备上。

谋智基金会希望开发者能够打造效果极好的语音识别程序,比如实时翻译器和语音数字助理类应用程序等等。

但此时大多数打造这类应用所必须的语音数据都是私有且昂贵的,我们希望收集的数据能够满足开发者需求。

项目地址:


20190419162110.png

需要你贡献中文语音集:

现在谋智基金会正在全球发起号召邀请用户参与项目构建,用户只需按示例读出屏幕上的文字进行提交即可。

目前中文语音集也在收集中,如果你觉得你的口音不标准也没关系,语音识别也需要不同的口音来加强判断。

与英语系相比国内目前参与项目的用户并不多,所以需要更多用户录制语音为项目提供足够使用的中文语音。

20190419162203.png

也可以帮助进行人工识别:

如果你不想录制自己的语音的话也可以参与项目,将其他社区成员贡献的语音进行人工识别判断是否准确等。

目前中文语音集也已经有不少语音片段,单纯靠机器识别的准确率并没有那么高,所以需要你帮助辅助判断。

只需要前往项目网站播放语音片段然后与对应的文字内容核对即可,判断完成后点击是或者否提交判断结果。


原标题:谋智基金会邀请你参与开源语音数据库项目贡献自己的声音
本文来源 蓝点网,由 山外的鸭子哥 整理编辑

寒号鸟 老狐狸
发表于 2019-4-25 23:14:57 火狐社区移动版 | 显示全部楼层
你们应该先识别普通话,然后再有方言
绿色圣光 狐狸精
发表于 2019-4-28 11:11:02 | 显示全部楼层
赞!赞!赞!
Irvin Chen 社区新人
发表于 2019-5-2 20:49:18 | 显示全部楼层
寒号鸟 发表于 2019-4-25 23:14
你们应该先识别普通话,然后再有方言

目前的确从普通话开始收集的,暂时没有收集方言语音的计划。
荣耀属于跪拜猫 社区新人
发表于 2019-5-9 08:47:32 | 显示全部楼层
看了两眼,为毛都是古汉语?

据我所知,贝叶斯对语言文本是有要求的。古汉语的文本和读音训练的集合很可能在现代汉语上不好用。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表