写点什么

语音技术在小米的实践应用之路

  • 2019-09-19
  • 本文字数:789 字

    阅读完需:约 3 分钟

语音技术在小米的实践应用之路

AICon北京2018大会上,王育军讲师做了《语音技术在小米的实践应用之路》主题演讲,主要内容如下。


演讲简介


语音技术,包括语音识别与合成等,经历了几十年的发展,恰逢人工智能时代的来临,对其应用场景做了重新定义。但是我们面临的问题从来没有变过:数据失配和模型假设。在本次演讲中,我将分享在小米,我们如何解决失配的问题,如何自动标注数据,以及我们如何在小米特有用户场景下进行产品和算法创新。我们在语音合成中也做了创新的尝试,利用语音识别辅助,端对端的技术取代传统文本处理,节省了繁杂的标注工作。


演讲提纲:


  1. 小米语音是如何成长的?

  2. 电视->手机->音箱->儿童->车载->笔记本

  3. 语音技术中的自然语言应用

  4. 语音识别中采用了深度学习语言模型后,识别率绝对增长超过 1%。尺寸小可做嵌入式使用。在语音合成中的文本分析,我们基于端到端网络结构,业内首次提出将端到端网络应用于合成前端,通过一个编解码网络,完成传统复杂前端中的多个模块的功能。通过多目标联合地并行训练,取得了媲美传统前端的性能。

  5. 永远要突破算法的天花板

  6. 为什么语音算法可以在小米有所突破,发表顶级国际会议论文?不做空中楼阁。有实际产品需求,有用户场景,有强大的内测用户。

  7. 语音应用的挑战

  8. 小米过去 20 个月做语音的经验


听众收益:


  1. 语音技术在智能家居环境中如何发挥作用

  2. 了解如何快速将语音算法落地到产品


讲师介绍


王育军


小米 语音技术负责人


2000 年毕业于清华大学自动化系,随后赴英国伯明翰大学电子系学习人机交互。2002 至 2004 年就职于 NEC 电子,从事嵌入式语音识别与语音合成。随后加入中软国际从事声学模型训练技术。2007 年到 2012 年在比利时鲁汶大学电子系从事抗噪语音识别。回国后加入百度语音技术部。2015 年就职于乐视,负责语音识别与自然语言理解技术。2017 年加入小米,负责语音识别与语音合成技术。












完整演讲 PPT 下载链接


https://aicon.infoq.cn/2018/beijing/#schedule


2019-09-19 14:171407

评论

发布
暂无评论
发现更多内容

TiDB 在网易游戏的应用实践

TiDB 社区干货传送门

实践案例

冻结JS对象方法技术详解

猪痞恶霸

js 7月月更

继承

Jason199

js 继承 7月月更

PD 关于ID分配的源码分析

TiDB 社区干货传送门

TiDB 底层架构

价值几十万的 TiDB优化

TiDB 社区干货传送门

实践案例

排序算法总结

乌龟哥哥

7月月更

记一次TiDB优化

TiDB 社区干货传送门

性能调优

当大数据架构遇上 TiDB

TiDB 社区干货传送门

实践案例

TiDB升级5.0.2有惊喜

TiDB 社区干货传送门

版本测评

【SOP 系列】TiDB 使用 SOP 最全合集

TiDB 社区干货传送门

TiDB 底层架构

Electron入门【01】

坚果

7月月更

Python Asyncio 二探:使用和用途

宇宙之一粟

Python asyncio 7月月更

成年人的周末 2022.7.10

贾献华

7月月更

前端食堂技术周刊第 44 期:Bun、Vue.js 挑战、React 状态管理的新浪潮、Can I DevTools、函数式编程

童欧巴

Vue React Bun

Qt | 播放音频文件 QMediaplayer

YOLO.

音视频 qt 多媒体 播放 7月月更

一条 like 条件的慢 SQL 语句优化

TiDB 社区干货传送门

管理与运维

Spring&SpringBoot 源码笔记整理 |Bean 的加载流程一

自由

Spring5源码解析 7月月更

TiDB+FLINK 实时计算

TiDB 社区干货传送门

实践案例

TiDB 目录结构分析

TiDB 社区干货传送门

实践案例

TiDB 4.0 新特性也太爽了吧

TiDB 社区干货传送门

版本测评

架构实战营 模块六作业

挖了蘑菇哩斯

架构实战营

ArrayBlockingQueue源码分析-新增和获取数据

zarmnosaj

7月月更

聊聊乐观锁 & 悲观锁

Steven

小区搜索过程

柒号华仔

5G 7月月更

悲观事务加锁验证

TiDB 社区干货传送门

管理与运维

机器学习-回归分析

AIWeker

机器学习 回归分析 7月月更

TypeScript学习后续之受挫的经历

为自己带盐

7月月更

Spring IOC II

武师叔

7月月更

【TiDB 最佳实践系列】如何高效利用 Grafana 监控分析 TiDB 指标?

TiDB 社区干货传送门

监控

SpringBoot核心应用第一弹

Java学术趴

7月月更

语音技术在小米的实践应用之路_AICon_王育军_InfoQ精选文章