最新发布《数智时代的AI人才粮仓模型解读白皮书(2024版)》,立即领取! 了解详情
写点什么

Mozilla “Common Voice” 开源语音识别项目

  • 2017-07-31
  • 本文字数:654 字

    阅读完需:约 2 分钟

语音识别技术可能会彻底改变我们与机器的交互方式,但通常技术开发代价昂贵,而且有专利上的使用限制。大多数语音识别技术都被封锁在少数的大公司内。Mozilla 认为这样会阻碍创新,因此它发起了“Common Voice”这一开源语音识别项目。

在“Common Voice”项目中,你可以捐献语音到一个大型数据库里,这些语音会被用于构建开源的语音识别引擎,任何人都可以访问这些数据从而轻松又快速地训练基于语音的应用程序。通过“Common Voice”,程序员们可以开发很多有趣的应用程序,如实时语音翻译、基于语音的管理助手等等。用户也可以帮助验证语音,根据显示的文本判断听到的语音是否正确,该判断结果也会被用于改进语音识别模型。

Mozilla 计划从 2017 年六月份开始收集总时长约 10,000 个小时的语音(这是训练一个语音文本转换系统所需要的数据量),之后会开源语音数据库。目前的源文本来自人们的捐献,以及一些公开的电影剧本,如电影“风云人物”(It’s a Wonderful Life)。考虑到实际生活中人们的语音变化多样,Mozilla 希望能收集到多样化的语音,让语音识别引擎能够准确无误地处理不同场景下的语音,比如带有背景对话声、汽车噪音、风扇噪音的场景。在将来,Mozilla 有可能会将该语音识别引擎集成到 Firefox 中。

该项目在 Github 上的链接: https://github.com/mozilla/voice-web

查看英文原文: Project Common Voice


感谢蔡芳芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-07-31 19:008473
用户头像

发布了 21 篇内容, 共 88910 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

[Day8]-[动态规划] 最长公共子序列

方勇(gopher)

LeetCode 动态规划 数据结构与算法、

读《A Philosophy of Software Design》——(8)

术子米德

架构师成长笔记

模块七

Leo

架构实战营

读《A Philosophy of Software Design》——(10)

术子米德

架构师成长笔记

洞见科技深度参编的央行金科联盟「多方安全计算」及「联邦学习」金融应用研究报告正式发布

洞见科技

金融科技 隐私计算 金融创新

架构训练营 模块七

Geek_16d2b8

架构训练营 模块七

如何编写一个Linux内核模块,这次手把手教你

简说Linux内核

内存管理 Linux内核 进程管理 嵌入式开发 设备驱动

每个互联网人才都应该知道的SQL注入!

喀拉峻

网络安全 安全 渗透测试 SQL注入

适合 Kubernetes 初学者的一些实战练习 (五)

Jerry Wang

postgresql Kubernetes Cloud Native statefulset 4月月更

模块七作业

Geek_ec866b

架构训练营

王者荣耀商城异地多活架构设计

李大虾

#架构实战营 「架构实战营」

那些年我们一起优化的SQL

Java工程师

Java sql 程序员 索引 MySQL 数据库

浅谈加密算法 aes

奋飞安全

android 安全

Tapdata PDK 生态共建计划启动!Doris、OceanBase、PolarDB、SequoiaDB 等十余家厂商首批加入

tapdata

数据库 实时数据

读《A Philosophy of Software Design》——(12)

术子米德

架构师成长笔记

王者荣耀商城异地多活架构设计

AragornYang

架构训练营 架构实战营

现代间谍技术的演变:从“王牌特工”到“行走的50w”

脑极体

读《A Philosophy of Software Design》——(11)

术子米德

架构师成长笔记

数据库原理知识及SQL语言知识拓展

王小王-123

MySQL 数据库 MySQL 数据库 4月月更

模块七作业

blazar

「架构实战营」

区块链溯源!“有机”食品也要“有迹可循”

旺链科技

区块链 产业区块链 食品追溯

一文让你深度了解Linux内核架构和工作原理

简说Linux内核

内存管理 Linux内核 进程管理 驱动开发 嵌入式开发

模块7作业

Mr小公熊

读《A Philosophy of Software Design》——(14)

术子米德

架构师成长笔记

关于数据仓库架构及各组件方案选型

五分钟学大数据

数据仓库 4月月更

声网的混沌工程实践

声网

测试 混沌工程 质量保障 Dev for Dev

老项目改造返回值规范化

Rubble

4月日更

读《A Philosophy of Software Design》——(9)

术子米德

架构师成长笔记

读《A Philosophy of Software Design》——(13)

术子米德

架构师成长笔记

Redis+Caffeine两级缓存,让访问速度纵享丝滑

Java工程师

Java 数据库 redis 架构 高性能

SpringBoot接入轻量级分布式日志框架(GrayLog)

Java工程师

Java spring 分布式 springboot 组件

Mozilla “Common Voice” 开源语音识别项目_Mozilla_CarolGuo_InfoQ精选文章