时隔16年Jeff Barr重返10.23-25 QCon上海站,带你看透AI如何重塑软件开发! 了解详情
写点什么

Mozilla “Common Voice” 开源语音识别项目

  • 2017-07-31
  • 本文字数:654 字

    阅读完需:约 2 分钟

语音识别技术可能会彻底改变我们与机器的交互方式,但通常技术开发代价昂贵,而且有专利上的使用限制。大多数语音识别技术都被封锁在少数的大公司内。Mozilla 认为这样会阻碍创新,因此它发起了“Common Voice”这一开源语音识别项目。

在“Common Voice”项目中,你可以捐献语音到一个大型数据库里,这些语音会被用于构建开源的语音识别引擎,任何人都可以访问这些数据从而轻松又快速地训练基于语音的应用程序。通过“Common Voice”,程序员们可以开发很多有趣的应用程序,如实时语音翻译、基于语音的管理助手等等。用户也可以帮助验证语音,根据显示的文本判断听到的语音是否正确,该判断结果也会被用于改进语音识别模型。

Mozilla 计划从 2017 年六月份开始收集总时长约 10,000 个小时的语音(这是训练一个语音文本转换系统所需要的数据量),之后会开源语音数据库。目前的源文本来自人们的捐献,以及一些公开的电影剧本,如电影“风云人物”(It’s a Wonderful Life)。考虑到实际生活中人们的语音变化多样,Mozilla 希望能收集到多样化的语音,让语音识别引擎能够准确无误地处理不同场景下的语音,比如带有背景对话声、汽车噪音、风扇噪音的场景。在将来,Mozilla 有可能会将该语音识别引擎集成到 Firefox 中。

该项目在 Github 上的链接: https://github.com/mozilla/voice-web

查看英文原文: Project Common Voice


感谢蔡芳芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-07-31 19:009681
用户头像

发布了 21 篇内容, 共 10.8 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

SAP | 认识 abap 工作台(下)

暮春零贰

SAP abap 10月月更

leetcode 146. LRU Cache LRU 缓存 (简单)

okokabcd

LeetCode 数据结构与算法

微信红包体系设计分析

Johnny

「经验总结」高效开发,老代码可以这样动

叶一一

高效工作 前端 10月月更

从手动测试到自动化测试(下)

FunTester

层出不穷的机器学习框架到底在“卷”什么?

小红书技术REDtech

机器学习

「CSS畅想」定时+随机,开启今日上上签

叶一一

JavaScript 前端 10月月更

List的基础数据的处理

卢卡多多

List 10月月更

「Hive进阶篇」三、HQL底层执行过程及原理详解

大数据阶梯之路

大数据 hive 面试 数仓

「小程序开发」关于网页与小程序的通信

叶一一

前端 小程序开发 10月月更

【愚公系列】2022年10月 Go教学课程 028-函数小结案例(通讯录)

愚公搬代码

10月月更

容量管理的三个层次

阿泽🧸

10月月更 容量管理

面向对象之方法重载

魏铁锤

10月月更

全链路监控建设的4个重点

穿过生命散发芬芳

全链路监控 10月月更

「前端组件化」以Antd为例,快速打通UI组件开发的任督二脉

叶一一

前端 React 10月月更

cstdio的源码学习分析10-格式化输入输出函数fprintf---宏定义/辅助函数分析02

桑榆

源码刨析 10月月更 C++

Java面向对象之方法块+this关键字

魏铁锤

10月月更

「前端组件开发」越折腾越有趣,封装了一个表单组件

叶一一

前端 React 组件开发 10月月更

如何“阅读”数学?:上海顶尖中学学生的阅读笔记

图灵教育

数学 青少年

微信红包后台系统可用性设计实践

Johnny

微信红包系统设计分享 | 如何扛住100亿次请求?

Johnny

「Hive进阶篇」四、HQL 高级巧用

大数据阶梯之路

大数据 hive 面试

将系统划分为模块(微服务)的必要性

宇宙之一粟

微服务 系统设计 论文阅读 模块化 10月月更

「CSS畅想」我的发呆专属,反复解锁手机屏幕

叶一一

CSS JavaScript 前端 10月月更

【从0到1学算法】4.Bubble Sort算法-上

Geek_65222d

10月月更

如何“阅读”数学?:上海顶尖中学学生的阅读笔记

图灵社区

数学 青少年

一文彻底搞懂IP地址到底是什么?

長歌

「CSS畅想」自动打字效果,默写首诗来读读

叶一一

JavaScript 前端 10月月更

微信红包实现原理

Johnny

Java面向对象之构造方法

魏铁锤

10月月更

「React开发」梳理HOC的点点滴滴

叶一一

前端 React 10月月更

Mozilla “Common Voice” 开源语音识别项目_Mozilla_CarolGuo_InfoQ精选文章