写点什么

Mozilla “Common Voice” 开源语音识别项目

  • 2017-07-31
  • 本文字数:654 字

    阅读完需:约 2 分钟

语音识别技术可能会彻底改变我们与机器的交互方式,但通常技术开发代价昂贵,而且有专利上的使用限制。大多数语音识别技术都被封锁在少数的大公司内。Mozilla 认为这样会阻碍创新,因此它发起了“Common Voice”这一开源语音识别项目。

在“Common Voice”项目中,你可以捐献语音到一个大型数据库里,这些语音会被用于构建开源的语音识别引擎,任何人都可以访问这些数据从而轻松又快速地训练基于语音的应用程序。通过“Common Voice”,程序员们可以开发很多有趣的应用程序,如实时语音翻译、基于语音的管理助手等等。用户也可以帮助验证语音,根据显示的文本判断听到的语音是否正确,该判断结果也会被用于改进语音识别模型。

Mozilla 计划从 2017 年六月份开始收集总时长约 10,000 个小时的语音(这是训练一个语音文本转换系统所需要的数据量),之后会开源语音数据库。目前的源文本来自人们的捐献,以及一些公开的电影剧本,如电影“风云人物”(It’s a Wonderful Life)。考虑到实际生活中人们的语音变化多样,Mozilla 希望能收集到多样化的语音,让语音识别引擎能够准确无误地处理不同场景下的语音,比如带有背景对话声、汽车噪音、风扇噪音的场景。在将来,Mozilla 有可能会将该语音识别引擎集成到 Firefox 中。

该项目在 Github 上的链接: https://github.com/mozilla/voice-web

查看英文原文: Project Common Voice


感谢蔡芳芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-07-31 19:009613
用户头像

发布了 21 篇内容, 共 10.7 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

《Screw Master 3D》成绩亮眼,背后推手 Supersonic 五年全球游戏下载量破 62 亿

极客天地

LRTimelapse Pro for Mac:让延时摄影变得简单而专业

小玖_苹果Mac软件

【干货】汽车制造业使用堡垒机情形简单分析

行云管家

网络安全 等保 堡垒机 等保测评

人工智能丨全网最简单的DeepSeek本地部署攻略:打造专属AI助手

测试人

人工智能

极兔速递2024全年收入增长15.9% 集团首次实现净利润转正

财见

钣金加工行业数字化转型MES方案

万界星空科技

制造业 mes 万界星空科技 钣金行业 钣金mes

CST软件分析:超材料SRR-wire单元和等效材料参数提取

思茂信息

cst cst仿真软件 CST软件

视频直播技术干货(十三):B站实时视频直播技术实践和音视频知识入门

JackJiang

网络编程 即时通讯 IM

从零开始搭建埋点采集体系:轻松解锁用户行为分析

ClkLog

开源 数据采集 埋点 sdk 用户画像

全级次总分一体化财务共享:破解大型集团财务共享的“不可能三角”

用友智能财务

财经 管理会计

手机APP与蓝牙通讯的协议

北京木奇移动技术有限公司

APP开发 软件外包公司 蓝牙开发

原生APP的开发成本

北京木奇移动技术有限公司

APP开发 软件外包公司 APP外包

AI 引领,共创数字新篇|第六届金蝶云苍穹追光者开发大赛圆满落幕

金蝶云·苍穹

开发者大赛 开发者生态 金蝶 金蝶云苍穹

25年温州等保测评机构有哪些?电话多少?

行云管家

等保 等保测评 温州

“套壳”的 Manus,告诉我们什么是真正的 AI Agent?

智领云科技

AI Agent AI 搜索引擎

向新向智向未来,且看天翼云!

天翼云开发者社区

云计算 数字化转型 云服务

如何快速CAD文字插入?两种方法详解来了!

在路上

cad cad看图 CAD看图软件

鸿蒙文件传输三方库上线开源鸿蒙社区 十行代码实现大文件高速传输

HarmonyOS开发者

harmoyos

夜莺监控巨大革新:抽象出通知规则,增强告警通知的灵活性

巴辉特

Nightingale 夜莺监控 运维监控

智能制造:工厂安灯落地方案

积木链小链

数字化转型 制造业 智能制造

Go 语言常见错误——控制结构

FunTester

海量数据融合互通丨TiDB 在安徽省住房公积金监管服务平台的应用实践

PingCAP

数据库 分布式 TiDB HTAP

CAD云批注功能怎么用?快速提升团队协作效率

在路上

cad CAD看图软件 CAD看图王

图表解析技术:逆向提取图表数据,需要哪几步?

合合技术团队

人工智能 算法 图表 图像处理 #大数据

vivo 大规模容器集群运维平台实践

vivo互联网技术

容器 运维 云原生 构架 Kubernets

Mozilla “Common Voice” 开源语音识别项目_Mozilla_CarolGuo_InfoQ精选文章