写点什么

Mozilla “Common Voice” 开源语音识别项目

  • 2017-07-31
  • 本文字数:654 字

    阅读完需:约 2 分钟

语音识别技术可能会彻底改变我们与机器的交互方式,但通常技术开发代价昂贵,而且有专利上的使用限制。大多数语音识别技术都被封锁在少数的大公司内。Mozilla 认为这样会阻碍创新,因此它发起了“Common Voice”这一开源语音识别项目。

在“Common Voice”项目中,你可以捐献语音到一个大型数据库里,这些语音会被用于构建开源的语音识别引擎,任何人都可以访问这些数据从而轻松又快速地训练基于语音的应用程序。通过“Common Voice”,程序员们可以开发很多有趣的应用程序,如实时语音翻译、基于语音的管理助手等等。用户也可以帮助验证语音,根据显示的文本判断听到的语音是否正确,该判断结果也会被用于改进语音识别模型。

Mozilla 计划从 2017 年六月份开始收集总时长约 10,000 个小时的语音(这是训练一个语音文本转换系统所需要的数据量),之后会开源语音数据库。目前的源文本来自人们的捐献,以及一些公开的电影剧本,如电影“风云人物”(It’s a Wonderful Life)。考虑到实际生活中人们的语音变化多样,Mozilla 希望能收集到多样化的语音,让语音识别引擎能够准确无误地处理不同场景下的语音,比如带有背景对话声、汽车噪音、风扇噪音的场景。在将来,Mozilla 有可能会将该语音识别引擎集成到 Firefox 中。

该项目在 Github 上的链接: https://github.com/mozilla/voice-web

查看英文原文: Project Common Voice


感谢蔡芳芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-07-31 19:009764
用户头像

发布了 21 篇内容, 共 11.0 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

融云即时通讯SDK集成 -- 定制UI(三) ——兼容Android Q

融云 RongCloud

即时通讯

京东数科面试真题:常见的 IO 模型有哪些?Java 中的 BIO、NIO、AIO 有啥区别?

Java 架构 面试

融云聊天室属性 kv

融云 RongCloud

IM

叫练手把手教你读JVM之GC信息

叫练

JVM JVM简介 JVM笔记

融云如何把图片消息的图片上传到自己的文件服务器

融云 RongCloud

sdk

融云 IM SDK 集成 --- 刷新会话界面和会话列表界面

融云 RongCloud

IM

关于融云聊天室KV 值的正确使用

融云 RongCloud

即时通讯

融云即时通讯SDK集成 -- 定制UI(一) ——会话界面小改动

融云 RongCloud

即时通讯

在融云 IMkit 会话界面基础上添加消息已读未读

融云 RongCloud

IM

配置融云SDK的自签证书

融云 RongCloud

sdk

项目延期了,怎么办?

石云升

项目管理 28天写作 职场经验 管理经验 3月日更

学习感悟

shun123456789

融云IMKit 动态删除或添加plugin 的实现

融云 RongCloud

IM

融云即时通讯SDK集成 -- 华为推送的点击跳转处理

融云 RongCloud

即时通讯

跳转到@消息的位置

融云 RongCloud

即时通讯

markdown如何插入图片、音频、视频?

xiezhr

markdown markdown语法 音频

一卷河图赋太虚:HMS Core CG kit与移动游戏新可能

脑极体

2万字系统总结,带你实现 Linux 命令自由?

比伯

Java 编程 架构 面试 程序人生

唠一唠融云 VIVO push 无法跳转的解决方案

融云 RongCloud

sdk

融云清空历史消息 Android 端

融云 RongCloud

sdk

弱网测试工具

Geek_6370d5

阿里大师口述:让你可以在简历上写精通SpringBoot

编程 架构 springboot

融云即时通讯SDK集成 -- 通知检查

融云 RongCloud

即时通讯

融云 IMkit 拦截或监听所有发送消息

融云 RongCloud

sdk

融云即时通讯SDK集成 -- 定制UI(二) ——添加自定义表情库

融云 RongCloud

融云如何更换用户信息

融云 RongCloud

即时通讯

唠一唠融云的消息扩展功能

融云 RongCloud

sdk

Android 端如何添加自定义表情

融云 RongCloud

IM

金三银四跳槽阿里必备:分布式/高并发/Redis,不看我真的怕你后悔

比伯

Java 编程 架构 面试 程序人生

融云 ConversationListFragment 会话列表添加头部布局

融云 RongCloud

sdk

技术实践 | 网易云信 QUIC 加速服务架构与实践

网易云信

架构 音视频

Mozilla “Common Voice” 开源语音识别项目_Mozilla_CarolGuo_InfoQ精选文章