燃爆上海 5·23-24,AICon 大模型实战风暴,50+ 干货一网打尽,即将开幕~ 了解详情
写点什么

Mozilla “Common Voice” 开源语音识别项目

  • 2017-07-31
  • 本文字数:654 字

    阅读完需:约 2 分钟

语音识别技术可能会彻底改变我们与机器的交互方式,但通常技术开发代价昂贵,而且有专利上的使用限制。大多数语音识别技术都被封锁在少数的大公司内。Mozilla 认为这样会阻碍创新,因此它发起了“Common Voice”这一开源语音识别项目。

在“Common Voice”项目中,你可以捐献语音到一个大型数据库里,这些语音会被用于构建开源的语音识别引擎,任何人都可以访问这些数据从而轻松又快速地训练基于语音的应用程序。通过“Common Voice”,程序员们可以开发很多有趣的应用程序,如实时语音翻译、基于语音的管理助手等等。用户也可以帮助验证语音,根据显示的文本判断听到的语音是否正确,该判断结果也会被用于改进语音识别模型。

Mozilla 计划从 2017 年六月份开始收集总时长约 10,000 个小时的语音(这是训练一个语音文本转换系统所需要的数据量),之后会开源语音数据库。目前的源文本来自人们的捐献,以及一些公开的电影剧本,如电影“风云人物”(It’s a Wonderful Life)。考虑到实际生活中人们的语音变化多样,Mozilla 希望能收集到多样化的语音,让语音识别引擎能够准确无误地处理不同场景下的语音,比如带有背景对话声、汽车噪音、风扇噪音的场景。在将来,Mozilla 有可能会将该语音识别引擎集成到 Firefox 中。

该项目在 Github 上的链接: https://github.com/mozilla/voice-web

查看英文原文: Project Common Voice


感谢蔡芳芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-07-31 19:009402
用户头像

发布了 21 篇内容, 共 10.3 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

简介一下LoRA模型

IT蜗壳-Tango

三周年连更

高级滤镜效果:Topaz Photo AI Mac电脑版

真大的脸盆

Mac Mac 软件 图像编辑处理 图像优化工具

瓴羊QUICKBI工具帮助企业处理数据,效率提升数倍!

对不起该用户已成仙‖

Stable Diffusion WebUI汉化

IT蜗壳-Tango

三周年连更

JS中数组随机排序实现(原地算法sort/shuffle算法)

不叫猫先生

JavaScrip 算法、 三周年连更

Matlab实现深度学习

袁袁袁袁满

三周年连更

致敬青年——开源的生力军

开放原子开源基金会

开放原子开源基金会

EasyRecovery2024免费版电脑数据恢复软件

茶色酒

EasyRecovery15

登顶Nature 正刊!百度生物计算用AI首次实现mRNA领域重大进展

脑极体

AI 生物

【分布式技术专题】「分布式技术架构」手把手教你如何开发一个属于自己的分布式锁的功能组件

码界西柚

redis 分布式锁 三周年连更 动手实现

Shell的基本使用方法

芯动大师

shell脚本编程 Shell命令 三周年连更

在 Go 中如何使用 Viper 来管理配置

江湖十年

golang 后端 日志

“前端”工匠系列(一):合格的工匠,究竟该搞什么 | 京东云技术团队

京东科技开发者

前端 编码格式 Vue 3 企业号 5 月 PK 榜

FLstudio2024最新版水果编曲软件

茶色酒

FLStudio21

FL Studio21最新数字音频工作站(DAW)软件

茶色酒

FL Studio21

cleanmymac x4.13.2中文版mac清理软件

茶色酒

CleanMyMac X

Go常用设计模式(上)

闫同学

三周年连更

Docker安全中的一些技术工具

穿过生命散发芬芳

Docker 三周年连更

Syslog-ng RHEL 的安装和配置

HoneyMoose

瓴羊Quick BI工具助力企业,数据处理效率翻番!

夏日星河

文心一言 VS chatgpt (14)-- 算法导论3.2 2~3题

福大大架构师每日一题

ChatGPT 文心一言 福大大架构师每日一题

2023-05-04:用go语言重写ffmpeg的scaling_video.c示例,用于实现视频缩放(Scaling)功能。

福大大架构师每日一题

golang 音视频 流媒体 福大大架构师每日一题

Web前端已死?别带节奏了,说白了就是“卷”

引迈信息

前端 大前端 低代码 java 并发 JNPF

我的职业规划 |社区征文

来碗老郭

三周年征文

最高可达4000万元!浙江台州|台州市“500精英计划”引才政策申报

科兴未来News

Django笔记二十一之使用原生SQL查询数据库

Hunter熊

Python sql django connection

Flink运行架构

阿泽🧸

flink 三周年连更

FL Studio 2023中文版水果音乐制作软件

茶色酒

FL Studio 21

分布式Mysql

乌龟哥哥

三周年连更

Guitar Pro2023专业的吉他制谱软件

茶色酒

Guitar Pro8

Paragon NTFS2023最新版ntfs磁盘读写工具

茶色酒

Paragon NTFS

Mozilla “Common Voice” 开源语音识别项目_Mozilla_CarolGuo_InfoQ精选文章