写点什么

语音技术在小米的实践应用之路

  • 2019-09-19
  • 本文字数:789 字

    阅读完需:约 3 分钟

语音技术在小米的实践应用之路

AICon北京2018大会上,王育军讲师做了《语音技术在小米的实践应用之路》主题演讲,主要内容如下。


演讲简介


语音技术,包括语音识别与合成等,经历了几十年的发展,恰逢人工智能时代的来临,对其应用场景做了重新定义。但是我们面临的问题从来没有变过:数据失配和模型假设。在本次演讲中,我将分享在小米,我们如何解决失配的问题,如何自动标注数据,以及我们如何在小米特有用户场景下进行产品和算法创新。我们在语音合成中也做了创新的尝试,利用语音识别辅助,端对端的技术取代传统文本处理,节省了繁杂的标注工作。


演讲提纲:


  1. 小米语音是如何成长的?

  2. 电视->手机->音箱->儿童->车载->笔记本

  3. 语音技术中的自然语言应用

  4. 语音识别中采用了深度学习语言模型后,识别率绝对增长超过 1%。尺寸小可做嵌入式使用。在语音合成中的文本分析,我们基于端到端网络结构,业内首次提出将端到端网络应用于合成前端,通过一个编解码网络,完成传统复杂前端中的多个模块的功能。通过多目标联合地并行训练,取得了媲美传统前端的性能。

  5. 永远要突破算法的天花板

  6. 为什么语音算法可以在小米有所突破,发表顶级国际会议论文?不做空中楼阁。有实际产品需求,有用户场景,有强大的内测用户。

  7. 语音应用的挑战

  8. 小米过去 20 个月做语音的经验


听众收益:


  1. 语音技术在智能家居环境中如何发挥作用

  2. 了解如何快速将语音算法落地到产品


讲师介绍


王育军


小米 语音技术负责人


2000 年毕业于清华大学自动化系,随后赴英国伯明翰大学电子系学习人机交互。2002 至 2004 年就职于 NEC 电子,从事嵌入式语音识别与语音合成。随后加入中软国际从事声学模型训练技术。2007 年到 2012 年在比利时鲁汶大学电子系从事抗噪语音识别。回国后加入百度语音技术部。2015 年就职于乐视,负责语音识别与自然语言理解技术。2017 年加入小米,负责语音识别与语音合成技术。












完整演讲 PPT 下载链接


https://aicon.infoq.cn/2018/beijing/#schedule


2019-09-19 14:171829

评论

发布
暂无评论
发现更多内容

高级研发工程师都有哪些特点?【超级准】

liuzhen007

技术人生 工作体会 程序猿

限时白嫖!腾讯内部员工培训Java资料,网友:大厂就是不一样

牛哄哄的java大师

Java

Redis-技术专题-Redis分布式锁实现方案

码界西柚

redis 分布式锁 5月日更

通向未来的十二个趋势

CECBC

人工智能

顺序一致性(Sequential Consistency)

UNDEFINED

sequential consistency Java Concurrency distributed system

把复杂留给自己,简单留给用户

石云升

5月日更

清华学霸!用18行代码讲解Java接口,程序员:果然厉害,学到了

牛哄哄的java大师

Java 接口

未来5年或将出现颠覆型区块链应用,资产通证化将重构实体经济

CECBC

区块链

网络攻防学习笔记 Day2

穿过生命散发芬芳

5月日更 网络攻防

我与 InfoQ 写作平台的这些事

xcbeyond

个人成长 1 周年盛典 InfoQ 写作平台 1 周年 5月日更

微服务-技术专题-微服务进程间通信

码界西柚

微服务 分布式架构 5月日更

让 Go 代码跑上移动端

Rayjun

Go 语言 gomobile

【LeetCode】整数反转Java题解

Albert

算法 LeetCode 5月日更

数字化转型能力成为中国纺织服装业未来发展的核心动能

CECBC

纺织面料

3.5 Go语言从入门到精通:标准输入输出fmt包

xcbeyond

Go 语言 5月日更 fmt包

H5和WebRTC实时通讯方案的不同

liuzhen007

5月日更

自己在 InfoQ 平台的期冀——共同成长

liuzhen007

1 周年盛典

OAuth 2.0 了解了,OAuth 2.1 呢?

Zhang

OAuth 2.0 认证授权 OAuth 2.1

【LeetCode】砖墙Java题解

Albert

算法 LeetCode 5月日更

如何提升工作效率

wangwei1237

工作效率 文化 大历史理论

算法训练营 - 学习笔记 - 第四周

心在飞

【音视频】弱网下的音视频通讯

Bob

音视频 直播技术

【JS】作用域(入门篇)

德育处主任

JavaScript 大前端 Web js

模块三作业

c

架构实战营

网络攻防学习笔记 Day3

穿过生命散发芬芳

5月日更 网络攻防

别再傻傻分不清AVSx H.26x MPEG-x了

LoveYFan

音视频

第八大洲环游记(一):平流层上的非洲故事

脑极体

多家银行增设数字金融部 架构调整背后透露出哪些信号?

CECBC

银行

区块链如何推动人力资源和薪酬管理体系变革?

CECBC

人力资源

白嫖福利!阿里P7大神梳理的Java数组详细知识点,太实用了

飞飞JAva

Java

软件开发不同阶段的命名风格

顿晓

5月日更 命名 风格

语音技术在小米的实践应用之路_AICon_王育军_InfoQ精选文章