写点什么

Mozilla “Common Voice” 开源语音识别项目

  • 2017-07-31
  • 本文字数:654 字

    阅读完需:约 2 分钟

语音识别技术可能会彻底改变我们与机器的交互方式,但通常技术开发代价昂贵,而且有专利上的使用限制。大多数语音识别技术都被封锁在少数的大公司内。Mozilla 认为这样会阻碍创新,因此它发起了“Common Voice”这一开源语音识别项目。

在“Common Voice”项目中,你可以捐献语音到一个大型数据库里,这些语音会被用于构建开源的语音识别引擎,任何人都可以访问这些数据从而轻松又快速地训练基于语音的应用程序。通过“Common Voice”,程序员们可以开发很多有趣的应用程序,如实时语音翻译、基于语音的管理助手等等。用户也可以帮助验证语音,根据显示的文本判断听到的语音是否正确,该判断结果也会被用于改进语音识别模型。

Mozilla 计划从 2017 年六月份开始收集总时长约 10,000 个小时的语音(这是训练一个语音文本转换系统所需要的数据量),之后会开源语音数据库。目前的源文本来自人们的捐献,以及一些公开的电影剧本,如电影“风云人物”(It’s a Wonderful Life)。考虑到实际生活中人们的语音变化多样,Mozilla 希望能收集到多样化的语音,让语音识别引擎能够准确无误地处理不同场景下的语音,比如带有背景对话声、汽车噪音、风扇噪音的场景。在将来,Mozilla 有可能会将该语音识别引擎集成到 Firefox 中。

该项目在 Github 上的链接: https://github.com/mozilla/voice-web

查看英文原文: Project Common Voice


感谢蔡芳芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-07-31 19:009748
用户头像

发布了 21 篇内容, 共 11.0 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

机器学习- 吴恩达Andrew Ng 编程作业技巧 -John 易筋 ARTS 打卡 Week 50

John(易筋)

ARTS 打卡计划

牛掰!阿里首席架构师用7部分讲明白了Java百亿级高并发系统(全彩版小册开源)

Java架构追梦

Java 学习 阿里巴巴 架构 百亿级并发架构设计

阿里分享:全网最详细的一篇SpringCloud总结

Java架构师迁哥

一文讲懂服务的优雅重启和更新

万俊峰Kevin

微服务 web开发 Go 语言 优雅停机

如何快速分类整理电脑文件

TroyLiu

文件管理 文件整理 电脑文件 文件分类 快速整理文件

信息流动过程中的聚类问题

Ryan Zheng

云钉一体应用创新:音视频如何带来灵活高效的协同体验

阿里云CloudImagine

阿里云 音视频

并发编程概览-从Lock和Synchronized说起

追风少年

Java 并发编程

Apache APISIX 开源 2 周年!

API7.ai 技术团队

开源 架构 后端 网关

怒肝最新保姆级前端学习路线,速成贴心全面!

程序员鱼皮

CSS JavaScript Vue 大前端 React

野生程序员高考试卷,试试你能打多少分?

北游学Java

程序员 高考

质量基础设施(NQI)“一站式”服务平台开发搭建

源中瑞-龙先生

NQI 质量基础设施“一站式”

Java 并发编程—— Semaphore

Antway

6月日更

搞定研发知识管理,你的企业就能跑快一步

华为云开发者联盟

知识管理 华为云 devcloud 研发团队 研发知识

来自Linux老学员的经验分享,新生必看!

学神来啦

Linux 运维 安全 虚拟机

10次面试9次被刷?吃透这500道大厂Java高频面试题后,怒斩offer

Java 程序员 架构 面试

限流篇,欣赏guava的RateLimiter

下雨喽

Java 架构 设计 限流 Guava

阿里P9分享:基于JDK 8 源码剖析

Java架构师迁哥

HarmonyOS IoT首著,走进万物互联的世界!

博文视点Broadview

计算机专业的应届生想进大厂做开发有多难?

Java架构师迁哥

Apache Calcite:异质数据源优化查询框架

余生

sql Apache Calcite

QQ春节红包活动如何应对10亿级流量?看看大佬的复盘总结

TakinTalks稳定性社区

活动 系统运维 高并发优化 高可用系统的架构 高可用架构

从原理到实践,手把手带你轻松get数仓双集群容灾

华为云开发者联盟

容灾 集群 数仓 集群容灾 双集群

☕️【Java 技术之旅】深入分析JDK动态代理的分析(源码深入)

码界西柚

Java JVM 动态代理 6月日更

一口气了解【2021 阿里云峰会】重磅发布

阿里云CloudImagine

阿里云

五层验证系统,带你预防区块链业务漏洞

华为云开发者联盟

区块链 智能合约 漏洞 可信 自免疫系统

流程即代码:低代码 & 云研发 IDE —— Uncode

Phodal

ide 云开发 云研发

拼搏26天刷完了阿里大佬的Java面试合集1000题,拿到了月薪30K的offer

Java 程序员 架构 面试

《漫画算法2》2021全新进阶版来袭!

博文视点Broadview

毕业设计So Easy:基于Java Web学生选课系统

不脱发的程序猿

Java web 毕业设计 学生选课系统

Mozilla “Common Voice” 开源语音识别项目_Mozilla_CarolGuo_InfoQ精选文章