写点什么

语音技术在小米的实践应用之路

2019 年 9 月 19 日

语音技术在小米的实践应用之路

AICon北京2018大会上,王育军讲师做了《语音技术在小米的实践应用之路》主题演讲,主要内容如下。


演讲简介


语音技术,包括语音识别与合成等,经历了几十年的发展,恰逢人工智能时代的来临,对其应用场景做了重新定义。但是我们面临的问题从来没有变过:数据失配和模型假设。在本次演讲中,我将分享在小米,我们如何解决失配的问题,如何自动标注数据,以及我们如何在小米特有用户场景下进行产品和算法创新。我们在语音合成中也做了创新的尝试,利用语音识别辅助,端对端的技术取代传统文本处理,节省了繁杂的标注工作。


演讲提纲:


  1. 小米语音是如何成长的?

  2. 电视->手机->音箱->儿童->车载->笔记本

  3. 语音技术中的自然语言应用

  4. 语音识别中采用了深度学习语言模型后,识别率绝对增长超过 1%。尺寸小可做嵌入式使用。在语音合成中的文本分析,我们基于端到端网络结构,业内首次提出将端到端网络应用于合成前端,通过一个编解码网络,完成传统复杂前端中的多个模块的功能。通过多目标联合地并行训练,取得了媲美传统前端的性能。

  5. 永远要突破算法的天花板

  6. 为什么语音算法可以在小米有所突破,发表顶级国际会议论文?不做空中楼阁。有实际产品需求,有用户场景,有强大的内测用户。

  7. 语音应用的挑战

  8. 小米过去 20 个月做语音的经验


听众收益:


  1. 语音技术在智能家居环境中如何发挥作用

  2. 了解如何快速将语音算法落地到产品


讲师介绍


王育军


小米 语音技术负责人


2000 年毕业于清华大学自动化系,随后赴英国伯明翰大学电子系学习人机交互。2002 至 2004 年就职于 NEC 电子,从事嵌入式语音识别与语音合成。随后加入中软国际从事声学模型训练技术。2007 年到 2012 年在比利时鲁汶大学电子系从事抗噪语音识别。回国后加入百度语音技术部。2015 年就职于乐视,负责语音识别与自然语言理解技术。2017 年加入小米,负责语音识别与语音合成技术。












完整演讲 PPT 下载链接


https://aicon.infoq.cn/2018/beijing/#schedule


2019 年 9 月 19 日 14:17621

评论

发布
暂无评论
发现更多内容

人工智能应用实操:手把手教你用Python控制IoT智能硬件

智能物联实验室

物联网 IoT

架構師訓練營第 1 期 - 第 11 周總結

Panda

架構師訓練營第 1 期

架构师训练营第 1 期 - 第十一周总结

Todd-Lee

极客大学架构师训练营

第十一周课后练习

饭桶

字节总监首发1121道LeetCode算法刷题笔记(含答案)

Crud的程序员

程序员 面试 算法 字节 面试刷题

Meet new Sentinel Go committers!

阿里巴巴云原生

开源 开发者 云原生 sentinel 中间件

一不小心,就入选Gartner魔力象限了

数据君

数据库

架构师训练营第 1 期 -week12

习习

量化交易系统APP软件开发(现成)

开發I852946OIIO

系统开发

追忆

刘旭东

回忆 情绪

通用软件快速开发平台对企业信息化的影响

雯雯写代码

软件 快速开发 企业信息化

架构师训练营第 1 期 - 第十一周作业

Todd-Lee

极客大学架构师训练营

第11周学习总结

饭桶

程序员的真实故事

Learun

敏捷开发

Linux中父进程为何要苦苦地知道子进程的死亡原因?

linux大本营

c++ Linux 后台开发 进程

【硬件篇之电源纹波噪声测试】

良知犹存

硬件

如何在高速发展中等一等老人 银行数字化服务显温度

CECBC区块链专委会

银行 养老服务

大企软件系统问题多?归乡名企工程师:解决很简单,分分钟做个新系统

Philips

敏捷开发

解析—MyBatis在SpringBoot中动态多数据源配置

比伯

Java 编程 程序员 架构 计算机

架構師訓練營第 1 期 - 第 11 周作業

Panda

架構師訓練營第 1 期

Gemini双子新约软件系统开发|Gemini双子新约APP开发

开發I852946OIIO

系统开发

为什么说区块链完全去中心化做不到且没有意义

CECBC区块链专委会

区块链 去中心化

每周学点 TARS——服务鉴权功能

TARS基金会

DevOps 后端 鉴权 TARS

今天,我们和人民大学一起干了件大事!

数据君

数据库

Reactor线程模型浅析

赖猫

c++ Linux 编程 reactor 编程语言

开源软件联盟PostgreSQL分会投稿指南

PostgreSQLChina

数据库 postgresql 软件 投稿

我是因为这个才选择当程序员的,那么你呢?

Java架构师迁哥

云图说|AI开发难!难!难!端云协同多模态AI开发套件你需要了解一下

华为云开发者社区

AI 分布式协同 开发

如何利用小熊派获取MPU6050六轴原始数据

华为云开发者社区

物联网 IoT 小熊派

详解TCP IP网络协议栈底层原理到徒手实现

赖猫

c++ Linux 编程 程序 网络协议栈

腾讯云区块链总经理李力:产业区块链的四大发展趋势

CECBC区块链专委会

区块链 大数据

语音技术在小米的实践应用之路-InfoQ