硬核干货——《中小企业 AI 实战指南》免费下载! 了解详情
写点什么

语音技术在小米的实践应用之路

  • 2019-09-19
  • 本文字数:789 字

    阅读完需:约 3 分钟

语音技术在小米的实践应用之路

AICon北京2018大会上,王育军讲师做了《语音技术在小米的实践应用之路》主题演讲,主要内容如下。


演讲简介


语音技术,包括语音识别与合成等,经历了几十年的发展,恰逢人工智能时代的来临,对其应用场景做了重新定义。但是我们面临的问题从来没有变过:数据失配和模型假设。在本次演讲中,我将分享在小米,我们如何解决失配的问题,如何自动标注数据,以及我们如何在小米特有用户场景下进行产品和算法创新。我们在语音合成中也做了创新的尝试,利用语音识别辅助,端对端的技术取代传统文本处理,节省了繁杂的标注工作。


演讲提纲:


  1. 小米语音是如何成长的?

  2. 电视->手机->音箱->儿童->车载->笔记本

  3. 语音技术中的自然语言应用

  4. 语音识别中采用了深度学习语言模型后,识别率绝对增长超过 1%。尺寸小可做嵌入式使用。在语音合成中的文本分析,我们基于端到端网络结构,业内首次提出将端到端网络应用于合成前端,通过一个编解码网络,完成传统复杂前端中的多个模块的功能。通过多目标联合地并行训练,取得了媲美传统前端的性能。

  5. 永远要突破算法的天花板

  6. 为什么语音算法可以在小米有所突破,发表顶级国际会议论文?不做空中楼阁。有实际产品需求,有用户场景,有强大的内测用户。

  7. 语音应用的挑战

  8. 小米过去 20 个月做语音的经验


听众收益:


  1. 语音技术在智能家居环境中如何发挥作用

  2. 了解如何快速将语音算法落地到产品


讲师介绍


王育军


小米 语音技术负责人


2000 年毕业于清华大学自动化系,随后赴英国伯明翰大学电子系学习人机交互。2002 至 2004 年就职于 NEC 电子,从事嵌入式语音识别与语音合成。随后加入中软国际从事声学模型训练技术。2007 年到 2012 年在比利时鲁汶大学电子系从事抗噪语音识别。回国后加入百度语音技术部。2015 年就职于乐视,负责语音识别与自然语言理解技术。2017 年加入小米,负责语音识别与语音合成技术。












完整演讲 PPT 下载链接


https://aicon.infoq.cn/2018/beijing/#schedule


2019-09-19 14:171641

评论

发布
暂无评论
发现更多内容

比AtomicLong更优秀的LongAdder确定不来了解一下吗?

一枝花算不算浪漫

并发编程 jdk源码

英语学习中听和说的区别

董一凡

学习

新mac笔记本需要做的事情

好好学习

Mac

用原理认知世界,用情绪驱动行为

史方远

职场 心理 成长

中小企业如何做运维自动化?

外滩运维专家

运维 spug 运维自动化 jenkins ansible

如何搞定Kafka重复消费?

奈学教育

kafka kafka配置

一文带你了解 HTTP 黑科技

苹果看辽宁体育

大前端 HTTP

回“疫”录(20):世界从来不会欺负听话的人

小天同学

疫情 回忆录 现实纪录 纪实

一想到有95%的问题还没解决,我就calm down了

赵新龙

科普 宇宙 后真相时代

Jenkins权限管理

kcnf

CentOS 6 升级 glibc

wong

centos glibc

MySQL事务解析

一个有志气的DB

MySQL 事务隔离级别 mysql事务

写作对我的意义

Neco.W

总结 思考 写作 感悟

2020第一篇技术博客

java劝退师首席大弟子

生活

JAVA内存模型与线程

颇风

Java 内存模型 JVM

写在开头

宋胖子

谈谈控制感(6):虚幻的控制感也好用

史方远

职场 心理 成长

《零基础学 Java》 FAQ 之 8-Java方法调用是传值还是传引用

臧萌

Java

如何用一套引擎搞定机器学习全流程?

Apache Flink

大数据 flink 流计算 实时计算

解决 Django 多进程下,logging 记录日志错乱问题

AlwaysBeta

Python django 编程 日志 log

华为“补洞”:去年重新设计超过6000万行代码

罗燕珊

华为 实体清单

Android | Tangram动态页面之路(三)使用

哈利迪

android

键入网址后,其间发生了什么?

小林coding

TCP 计算机网络 网络协议 IP HTTP

Design Sprint 教你五天完成产品迭代

Yanel 说敏捷产品

产品 敏捷 设计 产品设计 团队

如何发布一个npm包-创建,发布,更新,撤销及常见问题解决

Brave

npm

识别代码中的坏味道(二)

Page

Java 面向对象 复杂代码优化 重构 CleanCode

汉字不能编程?别闹了,只是看着有点豪横!容易被开除!

小傅哥

spring 小傅哥 aop 汉字编程

笔记:《如何系统思考》之如何应用系统思考

wiflish

思维方式

走进Golang之编译器原理

何磊

编译原理 Go 语言

Dart 进阶 | 深入理解 Function & Closure

LitaVadaski

flutter dart

PhotoShop切图,一篇文章就够用了

cwang

Web 工具 PhotoShop

语音技术在小米的实践应用之路_AICon_王育军_InfoQ精选文章