写点什么

Mozilla “Common Voice” 开源语音识别项目

  • 2017-07-31
  • 本文字数:654 字

    阅读完需:约 2 分钟

语音识别技术可能会彻底改变我们与机器的交互方式,但通常技术开发代价昂贵,而且有专利上的使用限制。大多数语音识别技术都被封锁在少数的大公司内。Mozilla 认为这样会阻碍创新,因此它发起了“Common Voice”这一开源语音识别项目。

在“Common Voice”项目中,你可以捐献语音到一个大型数据库里,这些语音会被用于构建开源的语音识别引擎,任何人都可以访问这些数据从而轻松又快速地训练基于语音的应用程序。通过“Common Voice”,程序员们可以开发很多有趣的应用程序,如实时语音翻译、基于语音的管理助手等等。用户也可以帮助验证语音,根据显示的文本判断听到的语音是否正确,该判断结果也会被用于改进语音识别模型。

Mozilla 计划从 2017 年六月份开始收集总时长约 10,000 个小时的语音(这是训练一个语音文本转换系统所需要的数据量),之后会开源语音数据库。目前的源文本来自人们的捐献,以及一些公开的电影剧本,如电影“风云人物”(It’s a Wonderful Life)。考虑到实际生活中人们的语音变化多样,Mozilla 希望能收集到多样化的语音,让语音识别引擎能够准确无误地处理不同场景下的语音,比如带有背景对话声、汽车噪音、风扇噪音的场景。在将来,Mozilla 有可能会将该语音识别引擎集成到 Firefox 中。

该项目在 Github 上的链接: https://github.com/mozilla/voice-web

查看英文原文: Project Common Voice


感谢蔡芳芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-07-31 19:009439
用户头像

发布了 21 篇内容, 共 10.4 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

全国独家线下面授 | 杭州·大规模敏捷LeSS认证3月27-29日开班

ShineScrum

Scrum LeSS认证

京东、蚂蚁集团领衔,国内互联网大厂入局人形机器人赛道!

机器人头条

科技 蚂蚁集团 人形机器人 具身智能 京东集团

即时通讯安全篇(十五):详解硬编码密码的泄漏风险及其扫描原理和工具

JackJiang

网络编程 即时通讯 IM

【干货】2024年下半年最受欢迎的50篇数据库主题文章+文档

墨天轮

MySQL 数据库 oracle sql 性能优化

制造业上了MES后,生产过程透明化,实时掌握生产动态

万界星空科技

制造业 mes 制造业工厂 生产管理MES系统

项目调度管理系统(源码+文档+部署+讲解)

深圳亥时科技

开源低代码平台与 Vue.js

伤感汤姆布利柏

MarsCode 编程助手模型升级至豆包大模型1.5,同时支持切换DeepSeek R1 / V3!

Trae

AI编程 豆包MarsCode DeepSeek DeepSeek v3 DeepSeek-R1

DeepSeek冲击(含本地化部署实践)

京东零售技术

和鲸协办!2025 4C大赛大数据主题赛赛事 Q&A × 培训预告重磅来袭!

ModelWhale

大数据 数据应用 数据要素 中国大学生计算机设计大赛

和鲸协办!2025 4C大赛AI通识教育实验创新微课赛道 Q&A × 培训预告重磅来袭!

ModelWhale

鸿蒙APP的测试

北京木奇移动技术有限公司

鸿蒙app 软件外包公司 APP外包公司

千校关注!和鲸科技重磅发布人工智能通识课,助力高校一周内实现课程落地开花

ModelWhale

AI 人工智能通识课 DeepSeek 人工智能通识

当“天翼云息壤杯”高校AI大赛邂逅DeepSeek,福利来袭!

天翼云开发者社区

人工智能 AI 科研 DeepSeek

喜讯|麦杰科技CEO荣膺“闵行区优秀企业家”称号

麦杰研究院

线上机器CPU占用高分析实践

京东零售技术

Golang赋能金融科技后端架构的高效与安全构建

xuyinyin

Mozilla “Common Voice” 开源语音识别项目_Mozilla_CarolGuo_InfoQ精选文章