写点什么

Mozilla “Common Voice” 开源语音识别项目

  • 2017-07-31
  • 本文字数:654 字

    阅读完需:约 2 分钟

语音识别技术可能会彻底改变我们与机器的交互方式,但通常技术开发代价昂贵,而且有专利上的使用限制。大多数语音识别技术都被封锁在少数的大公司内。Mozilla 认为这样会阻碍创新,因此它发起了“Common Voice”这一开源语音识别项目。

在“Common Voice”项目中,你可以捐献语音到一个大型数据库里,这些语音会被用于构建开源的语音识别引擎,任何人都可以访问这些数据从而轻松又快速地训练基于语音的应用程序。通过“Common Voice”,程序员们可以开发很多有趣的应用程序,如实时语音翻译、基于语音的管理助手等等。用户也可以帮助验证语音,根据显示的文本判断听到的语音是否正确,该判断结果也会被用于改进语音识别模型。

Mozilla 计划从 2017 年六月份开始收集总时长约 10,000 个小时的语音(这是训练一个语音文本转换系统所需要的数据量),之后会开源语音数据库。目前的源文本来自人们的捐献,以及一些公开的电影剧本,如电影“风云人物”(It’s a Wonderful Life)。考虑到实际生活中人们的语音变化多样,Mozilla 希望能收集到多样化的语音,让语音识别引擎能够准确无误地处理不同场景下的语音,比如带有背景对话声、汽车噪音、风扇噪音的场景。在将来,Mozilla 有可能会将该语音识别引擎集成到 Firefox 中。

该项目在 Github 上的链接: https://github.com/mozilla/voice-web

查看英文原文: Project Common Voice


感谢蔡芳芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-07-31 19:009733
用户头像

发布了 21 篇内容, 共 11.0 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

速度提升10倍,腾讯基于Iceberg的数据治理与优化实践

腾讯云大数据

数据湖

仅使用 CSS 创建打字机动画效果

互联网工科生

CSS JavaScript 前端

杭钢集团:以一体化管控赋能为引领提升五大能力

用友BIP

数智化转型

软件测试 | 设计模式——代理设计

测吧(北京)科技有限公司

测试

软件测试/测试开发丨Python 内置库 日期与时间处理

测试人

Python 软件测试 内置库

以数驱动 | 智能分析云助力流程制造行业绿色高效运营

用友BIP

智能分析

实时入库不用愁,HStore帮分忧

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 8 月 PK 榜

golang trace view 视图详解

蓝胖子的编程梦

golang Profile pprof Trace go tool

使用TransBigData快速高效地处理、分析、挖掘出租车GPS数据

TiAmo

数据可视化 交互式可视化工具 TransBigData

Hybrid App 性能优化的一些技术探讨

Onegun

性能 Hybrid

华为阅读与商务印书馆达成全面合作 携手传承中外经典名著

最新动态

搭载KaihongOS的工业平板、机器人、无人机等产品通过OpenHarmony3.2 Release版本兼容性测评

极客天地

软件测试 | Java接口的实际应用—制定标准

测吧(北京)科技有限公司

测试

平台赋能技术创新,和鲸科技持续助力气象顶尖算法大赛

ModelWhale

人工智能 算法 气象 大气科学 在线编程

解锁Spring组件扫描的新视角

华为云开发者联盟

开发 华为云 华为云开发者联盟 企业号 8 月 PK 榜

什么是CAE软件?哪个CAE软件好用?

智造软件

CAE 仿真软件 CAE软件

C4D软件都应用在影视后期什么领域?

Finovy Cloud

亚信科技AntDB数据库与库瀚存储方案完成兼容性互认证,联合方案带来约20%性能提升

亚信AntDB数据库

数据库 AntDB AntDB数据库 企业号 8 月 PK 榜

软件测试 | Java设计模式——适配器设计

测吧(北京)科技有限公司

测试

关于ANCE OS兼容性评估 & Linux智能全栈调优KeenTune介绍 | 第 93-94 期

OpenAnolis小助手

QA sig 龙蜥大讲堂 KeenTune ANCE

一条SQL如何被MySQL架构中的各个组件操作执行的?

砖业洋__

MySQL MySQL架构 MySQL优化器 MySQL执行器 MySQL存储引擎

常见的CAE软件有哪些?

思茂信息

仿真软件 仿真技术 abaqus有限元仿真 CAE软件 结构分析软件

软件测试 | Java抽象类的实际应用——模版设计

测吧(北京)科技有限公司

测试

Hybrid技术的下一站是什么?

FinFish

Hybrid 小程序技术 小程序容器技术 Hybrid App

华为与二十多家伙伴达成游戏先锋合作,共筑鸿蒙生态繁荣

最新动态

利用uplugin对比Webpack和Rollup插件系统

OpenTiny社区

前端

AI概念引爆ChinaJoy,聆心智能助力数字娱乐产业新应用

硬科技星球

Mozilla “Common Voice” 开源语音识别项目_Mozilla_CarolGuo_InfoQ精选文章