AICon 上海站|日程100%上线,解锁Al未来! 了解详情
写点什么

Mozilla “Common Voice” 开源语音识别项目

  • 2017-07-31
  • 本文字数:654 字

    阅读完需:约 2 分钟

语音识别技术可能会彻底改变我们与机器的交互方式,但通常技术开发代价昂贵,而且有专利上的使用限制。大多数语音识别技术都被封锁在少数的大公司内。Mozilla 认为这样会阻碍创新,因此它发起了“Common Voice”这一开源语音识别项目。

在“Common Voice”项目中,你可以捐献语音到一个大型数据库里,这些语音会被用于构建开源的语音识别引擎,任何人都可以访问这些数据从而轻松又快速地训练基于语音的应用程序。通过“Common Voice”,程序员们可以开发很多有趣的应用程序,如实时语音翻译、基于语音的管理助手等等。用户也可以帮助验证语音,根据显示的文本判断听到的语音是否正确,该判断结果也会被用于改进语音识别模型。

Mozilla 计划从 2017 年六月份开始收集总时长约 10,000 个小时的语音(这是训练一个语音文本转换系统所需要的数据量),之后会开源语音数据库。目前的源文本来自人们的捐献,以及一些公开的电影剧本,如电影“风云人物”(It’s a Wonderful Life)。考虑到实际生活中人们的语音变化多样,Mozilla 希望能收集到多样化的语音,让语音识别引擎能够准确无误地处理不同场景下的语音,比如带有背景对话声、汽车噪音、风扇噪音的场景。在将来,Mozilla 有可能会将该语音识别引擎集成到 Firefox 中。

该项目在 Github 上的链接: https://github.com/mozilla/voice-web

查看英文原文: Project Common Voice


感谢蔡芳芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-07-31 19:009355
用户头像

发布了 21 篇内容, 共 10.2 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

2022-12-13:游戏玩法分析 I。写一条 SQL 查询语句获取每位玩家 第一次登陆平台的日期。 +-----------+-------------+ | player_id | first_l

福大大架构师每日一题

数据库 福大大

react源码分析:深度理解React.Context

flyzz177

React

浅谈字节码增强技术系列2-Asm与Cglib

京东科技开发者

spring asm cglib spring aop JDK 动态代理

天翼云云WAF通过信通院云Web应用防火墙评估

极客天地

新来了个同事,设计模式用的是真优雅呀!代码如诗!!

小小怪下士

Java 程序员 设计模式

使用JMeter模拟设备通过MQTT发送数据

石云升

测试 Jmeter mqtt

Zebec正在以流支付的方式,推动加密资产支付走上正轨

鳄鱼视界

深度分析React源码中的合成事件

flyzz177

React

JavaScript刷LeetCode拿offer-树的遍历

js2030code

JavaScript LeetCode

PPC Insights 系列:高效在线匿踪查询技术

洞见科技

隐私计算 数据隐私计算 匿踪查询

react源码分析:组件的创建和更新

flyzz177

React

秒云荣获2022爱分析·中国运维最佳实践案例大奖

MIAOYUN

运维 解决方案 容器云平台 云原生容器 IT解决方案

前端必会面试题汇总

loveX001

JavaScript

React面试:谈谈虚拟DOM,Diff算法与Key机制

beifeng1996

React

架构实战营 模块2作业

西山薄凉

「架构实战营」

react的useState源码分析

flyzz177

React

常见react面试题

beifeng1996

React

在vue的v-for中,key为什么不能用index?

bb_xiaxia1998

Vue

容量保障落地四步走

老张

性能测试 服务治理 稳定性保障 容量测试 容量保障

react的jsx和React.createElement是什么关系?面试常问

beifeng1996

React

深入React源码揭开渲染更新流程的面纱

flyzz177

React

手写一个react,看透react运行机制

flyzz177

React

前端一面高频面试题(附答案)

loveX001

JavaScript

数据驱动测试-从方法探研到最佳实践

京东科技开发者

测试 自动化测试 数据存储 自动化测试框架 测试数据构造

昇腾携手OpenMMLab,支持海量算法仓库的昇腾AI推理部署

华为云开发者联盟

人工智能 华为云 昇腾AI 12 月 PK 榜

鸿蒙开发实例 | 鸿蒙操作系统的前世今生

TiAmo

华为 华为云 鸿蒙开发 12月月更

工作中常用的设计模式--享元模式

lpe234

Java 设计模式 享元模式 spring-boot

JavaScript刷LeetCode拿offer-栈相关题目

js2030code

JavaScript LeetCode

面试官:说说Event Loop事件循环、微任务、宏任务

loveX001

JavaScript

22道js输出顺序问题,你能做出几道

loveX001

JavaScript

社招前端二面react面试题集锦

beifeng1996

React

Mozilla “Common Voice” 开源语音识别项目_Mozilla_CarolGuo_InfoQ精选文章