AI实践哪家强?来 AICon, 解锁技术前沿,探寻产业新机! 了解详情
写点什么

Mozilla “Common Voice” 开源语音识别项目

  • 2017-07-31
  • 本文字数:654 字

    阅读完需:约 2 分钟

语音识别技术可能会彻底改变我们与机器的交互方式,但通常技术开发代价昂贵,而且有专利上的使用限制。大多数语音识别技术都被封锁在少数的大公司内。Mozilla 认为这样会阻碍创新,因此它发起了“Common Voice”这一开源语音识别项目。

在“Common Voice”项目中,你可以捐献语音到一个大型数据库里,这些语音会被用于构建开源的语音识别引擎,任何人都可以访问这些数据从而轻松又快速地训练基于语音的应用程序。通过“Common Voice”,程序员们可以开发很多有趣的应用程序,如实时语音翻译、基于语音的管理助手等等。用户也可以帮助验证语音,根据显示的文本判断听到的语音是否正确,该判断结果也会被用于改进语音识别模型。

Mozilla 计划从 2017 年六月份开始收集总时长约 10,000 个小时的语音(这是训练一个语音文本转换系统所需要的数据量),之后会开源语音数据库。目前的源文本来自人们的捐献,以及一些公开的电影剧本,如电影“风云人物”(It’s a Wonderful Life)。考虑到实际生活中人们的语音变化多样,Mozilla 希望能收集到多样化的语音,让语音识别引擎能够准确无误地处理不同场景下的语音,比如带有背景对话声、汽车噪音、风扇噪音的场景。在将来,Mozilla 有可能会将该语音识别引擎集成到 Firefox 中。

该项目在 Github 上的链接: https://github.com/mozilla/voice-web

查看英文原文: Project Common Voice


感谢蔡芳芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-07-31 19:009494
用户头像

发布了 21 篇内容, 共 10.5 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

三周学习总结

水浴清风

性能压测的时候,随着并发压力的增加,系统响应时间和吞吐量如何变化,为什么?

知行合一

架构师训练营第 1 期 week7 总结

张建亮

极客大学架构师训练营

抽象工厂模式

猴子胖胖

设计模式 Go 语言

一期二班-吴水金-第五课总结

吴水金

训练营第七周作业2

仲夏

第8周作业

静海

Week_07 总结

golangboy

极客大学架构师训练营

架构师训练营第三周心得

小兵

架构是训练营-第三周总结

第三周作业

皮蛋

架构师

架构训练营第三周作业

小兵

三周 作业

水浴清风

架构师训练营 Week03 作业-手写单例模式

极客时间 - 架构师一期 - 第七周作业

_

极客大学架构师训练营 第七周作业

第七周作业(作业一)

Geek_83908e

极客大学架构师训练营

第七周作业

极客大学架构师训练营

工厂方法模式

猴子胖胖

设计模式 Go 语言

架构师训练营-第七周

袭望

性能压测的时候,随着并发压力的增加,系统响应时间和吞吐量如何变化

Jacky.Chen

架构师 01 期,第七周课后作业

子文

第七周架构师训练学习笔记

郎哲158

极客大学架构师训练营

架构师训练营 - 第 7 周课后作业 -性能压测

树森

服务器性能监控神器nmon使用介绍

MySQL从删库到跑路

Linux nmon 性能监控

性能优化(1)

wing

极客大学架构师训练营

第 3 周 代码重构作业

心在那片海

架构师训练营-单例模式

手写单例

落朽

成为架构师 - 架构师训练营第 03 周

陈永龙Vincent

性能测试 课后作业

ABS

架构师训练营第二期 Week 3 总结

bigxiang

极客大学架构师训练营

Mozilla “Common Voice” 开源语音识别项目_Mozilla_CarolGuo_InfoQ精选文章