【锁定直播】字节、华为云、阿里云等技术专家讨论如何将大模型接入 AIOps 解决实际问题,戳>>> 了解详情
写点什么

Mozilla “Common Voice” 开源语音识别项目

  • 2017-07-31
  • 本文字数:654 字

    阅读完需:约 2 分钟

语音识别技术可能会彻底改变我们与机器的交互方式,但通常技术开发代价昂贵,而且有专利上的使用限制。大多数语音识别技术都被封锁在少数的大公司内。Mozilla 认为这样会阻碍创新,因此它发起了“Common Voice”这一开源语音识别项目。

在“Common Voice”项目中,你可以捐献语音到一个大型数据库里,这些语音会被用于构建开源的语音识别引擎,任何人都可以访问这些数据从而轻松又快速地训练基于语音的应用程序。通过“Common Voice”,程序员们可以开发很多有趣的应用程序,如实时语音翻译、基于语音的管理助手等等。用户也可以帮助验证语音,根据显示的文本判断听到的语音是否正确,该判断结果也会被用于改进语音识别模型。

Mozilla 计划从 2017 年六月份开始收集总时长约 10,000 个小时的语音(这是训练一个语音文本转换系统所需要的数据量),之后会开源语音数据库。目前的源文本来自人们的捐献,以及一些公开的电影剧本,如电影“风云人物”(It’s a Wonderful Life)。考虑到实际生活中人们的语音变化多样,Mozilla 希望能收集到多样化的语音,让语音识别引擎能够准确无误地处理不同场景下的语音,比如带有背景对话声、汽车噪音、风扇噪音的场景。在将来,Mozilla 有可能会将该语音识别引擎集成到 Firefox 中。

该项目在 Github 上的链接: https://github.com/mozilla/voice-web

查看英文原文: Project Common Voice


感谢蔡芳芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-07-31 19:008460
用户头像

发布了 21 篇内容, 共 88797 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

LeetCode题解:220. 存在重复元素 III,暴力法,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

Linux之scp命令

入门小站

Linux

【设计模式】备忘录模式

Andy阿辉

C# 编程 后端 设计模式 8月日更

可视化接口管理平台 YApi,让你轻松搞定 API 的管理问题

xcbeyond

工具 接口管理 YAPI 8月日更

你真的了解 fail-fast 和 fail-safe 吗

4ye

Java 后端 并发 map 8月日更

【Flutter 专题】68 图解基本约束 Box (三)

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 8月日更

QDS05 Prometheus

耳东@Erdong

Prometheus 8月日更

毕业总结

梦寻解语花

架构实战营

企业研发效能提升之道 —— 管中窥豹,窥一斑而知全豹

在天涯的海角

研发效能

架构实战营毕业设计

林子钧

架构实战营 毕业设计

select、poll、epoll之间的区别

一个大红包

8月日更

10篇校招/社招面经请你查收~

王知无

讲透学烂二叉树(六):二叉树的笔试题:翻转|宽度|深度

zhoulujun

二叉树 二叉树遍历 二叉树翻转

架构实战营 毕业设计项目

梦寻解语花

架构实战营

悄悄学习Doris,偷偷惊艳所有人 | Apache Doris四万字小总结

王知无

消息队列架构设计

thewangzl

没有银弹

escray

学习 极客时间 如何落地业务建模 8月日更

JVM空间分配担保机制

W🌥

Java JVM 8月日更

随机字符串,随机密码生成器

入门小站

工具

架构实战营毕业总结

林子钧

架构实战营 毕业总结

传统企业数字化转型的三大技术误区

码猿外

数字化转型 敏捷精益

从0开始的TypeScriptの九:接口Interfaces · 中

空城机

typescript 大前端 8月日更

讲透学烂二叉树(四):二叉树的存储结构—建堆-搜索-排序

zhoulujun

二叉树 堆排序 二叉堆 二叉堆排序 二叉树排序

架构实战营 - 模块五作业

思梦乐

二叉查找树的迭代遍历

泽睿

二叉树

模块五作业

秀聪

架构训练营

讲透学烂二叉树(三):二叉树的遍历图解算法步骤及JS代码

zhoulujun

二叉树 二叉树遍历 前序遍历 中序遍历 后续遍历

TypeScript那些最佳实践

思诚^_^

typescript

instanceof运算符的实质:Java继承链与JavaScript原型链

zhoulujun

JavaScript 继承 原型链 instanceof 继承链

《社会心理学》-怎样说服他人?

箭上有毒

8月日更

讲透学烂二叉树(五):分支平衡—AVL树与红黑树伸展树自平衡

zhoulujun

二叉树 平衡二叉树 红黑树

Mozilla “Common Voice” 开源语音识别项目_Mozilla_CarolGuo_InfoQ精选文章