写点什么

语音技术在小米的实践应用之路

  • 2019-09-19
  • 本文字数:789 字

    阅读完需:约 3 分钟

语音技术在小米的实践应用之路

AICon北京2018大会上,王育军讲师做了《语音技术在小米的实践应用之路》主题演讲,主要内容如下。


演讲简介


语音技术,包括语音识别与合成等,经历了几十年的发展,恰逢人工智能时代的来临,对其应用场景做了重新定义。但是我们面临的问题从来没有变过:数据失配和模型假设。在本次演讲中,我将分享在小米,我们如何解决失配的问题,如何自动标注数据,以及我们如何在小米特有用户场景下进行产品和算法创新。我们在语音合成中也做了创新的尝试,利用语音识别辅助,端对端的技术取代传统文本处理,节省了繁杂的标注工作。


演讲提纲:


  1. 小米语音是如何成长的?

  2. 电视->手机->音箱->儿童->车载->笔记本

  3. 语音技术中的自然语言应用

  4. 语音识别中采用了深度学习语言模型后,识别率绝对增长超过 1%。尺寸小可做嵌入式使用。在语音合成中的文本分析,我们基于端到端网络结构,业内首次提出将端到端网络应用于合成前端,通过一个编解码网络,完成传统复杂前端中的多个模块的功能。通过多目标联合地并行训练,取得了媲美传统前端的性能。

  5. 永远要突破算法的天花板

  6. 为什么语音算法可以在小米有所突破,发表顶级国际会议论文?不做空中楼阁。有实际产品需求,有用户场景,有强大的内测用户。

  7. 语音应用的挑战

  8. 小米过去 20 个月做语音的经验


听众收益:


  1. 语音技术在智能家居环境中如何发挥作用

  2. 了解如何快速将语音算法落地到产品


讲师介绍


王育军


小米 语音技术负责人


2000 年毕业于清华大学自动化系,随后赴英国伯明翰大学电子系学习人机交互。2002 至 2004 年就职于 NEC 电子,从事嵌入式语音识别与语音合成。随后加入中软国际从事声学模型训练技术。2007 年到 2012 年在比利时鲁汶大学电子系从事抗噪语音识别。回国后加入百度语音技术部。2015 年就职于乐视,负责语音识别与自然语言理解技术。2017 年加入小米,负责语音识别与语音合成技术。












完整演讲 PPT 下载链接


https://aicon.infoq.cn/2018/beijing/#schedule


2019-09-19 14:171202

评论

发布
暂无评论
发现更多内容

Cornerstone mac激活版永久使用 SVN管理工具Cornerstone4 mac版下载

mac

SVN管理工具 cornerstone 4破解 苹果mac Windows软件

从一些常见的错误聊聊mysql服务端的关键配置 | 京东云技术团队

京东科技开发者

MySQL 数据库 dba 企业号 8 月 PK 榜 服务端配置

蓝易云:shell简单命令大全。

百度搜索:蓝易云

云计算 Linux 运维 Shell 云服务器

使用 FastGPT 构建高质量 AI 知识库

米开朗基杨

人工智能 云计算 AI ChatGPT FastGPT

数字化转型与架构-架构设计篇|建模之“动态”模型

数字随行

数字化转型

【IT运维知识】暴力破解和防暴力破解定义说明

行云管家

暴力猜解

直播源码的神奇之处,直播回放功能

山东布谷网络科技

直播源码

京东小程序数据中心架构设计与最佳实践 | 京东云技术团队

京东科技开发者

小程序 clickhosue 京东小程序 企业号 8 月 PK 榜

技术分享 | 编程界也内卷?浅析“斜杠青年”RCU

鼎道智联

电脑的配置对仿真软件的分析速度有影响吗?

思茂信息

硬件 仿真软件 电脑硬件 有限元分析 电脑配置

资损防控技术体系简介及实践

得物技术

稳定性 网络安全、攻防演练 资损 防资损 企业号 8 月 PK 榜

数字化转型与架构-架构设计篇|建模之“静态”模型

数字随行

数字化转型

26. NumPy

茶桁

Python Numpy

秒懂算法│博弈论

TiAmo

算法 斐波那契 博弈论

安全测试常态化落地方案及日常推进机制 | 京东物流技术团队

京东科技开发者

安全 测试 漏洞 安全测试 企业号 8 月 PK 榜

王文京:数据驱动、智能运营

用友BIP

2023全球商业创新大会

2023-08-22:请用go语言编写。给定一个长度为N的正数数组,还有一个正数K, 返回有多少子序列的最大公约数为K。 结果可能很大,对1000000007取模。 1 <= N <= 10^5, 1

福大大架构师每日一题

福大大架构师每日一题

蓝易云:JAVA使用HTTP代理教程。

百度搜索:蓝易云

Java 云计算 Linux 运维 HTTP

《操作系统实战 45 讲》笔记2——内存管理

袁世超

操作系统 Cosmos LMOS

一文让你了解大数据平台和云平台的区别

行云管家

大数据 云平台 大数据平台

分库分表之拆分键设计 | 京东物流技术团队

京东科技开发者

数据库 分库分表 企业号 8 月 PK 榜 拆分键设计

火山引擎云原生安全解决方案发布,构筑企业云战略基石

科技热闻

对线面试官 - Http经典面试题

派大星

HTTP Java 面试题

好焦虑,怎么才能写好Dockerfile?

java易二三

Java 程序员 计算机

CQ 社区版 2.3.0 发布 | 自动授权、分级授权、审计上卷下钻等

BinTools图尔兹

数据安全 数据库管理 权限管理 数据库操作 审计大屏

语音技术在小米的实践应用之路_AICon_王育军_InfoQ精选文章