10 月 23 - 25 日,QCon 上海站即将召开,9折优惠最后2天 了解详情
写点什么

语音技术在小米的实践应用之路

  • 2019-09-19
  • 本文字数:789 字

    阅读完需:约 3 分钟

语音技术在小米的实践应用之路

AICon北京2018大会上,王育军讲师做了《语音技术在小米的实践应用之路》主题演讲,主要内容如下。


演讲简介


语音技术,包括语音识别与合成等,经历了几十年的发展,恰逢人工智能时代的来临,对其应用场景做了重新定义。但是我们面临的问题从来没有变过:数据失配和模型假设。在本次演讲中,我将分享在小米,我们如何解决失配的问题,如何自动标注数据,以及我们如何在小米特有用户场景下进行产品和算法创新。我们在语音合成中也做了创新的尝试,利用语音识别辅助,端对端的技术取代传统文本处理,节省了繁杂的标注工作。


演讲提纲:


  1. 小米语音是如何成长的?

  2. 电视->手机->音箱->儿童->车载->笔记本

  3. 语音技术中的自然语言应用

  4. 语音识别中采用了深度学习语言模型后,识别率绝对增长超过 1%。尺寸小可做嵌入式使用。在语音合成中的文本分析,我们基于端到端网络结构,业内首次提出将端到端网络应用于合成前端,通过一个编解码网络,完成传统复杂前端中的多个模块的功能。通过多目标联合地并行训练,取得了媲美传统前端的性能。

  5. 永远要突破算法的天花板

  6. 为什么语音算法可以在小米有所突破,发表顶级国际会议论文?不做空中楼阁。有实际产品需求,有用户场景,有强大的内测用户。

  7. 语音应用的挑战

  8. 小米过去 20 个月做语音的经验


听众收益:


  1. 语音技术在智能家居环境中如何发挥作用

  2. 了解如何快速将语音算法落地到产品


讲师介绍


王育军


小米 语音技术负责人


2000 年毕业于清华大学自动化系,随后赴英国伯明翰大学电子系学习人机交互。2002 至 2004 年就职于 NEC 电子,从事嵌入式语音识别与语音合成。随后加入中软国际从事声学模型训练技术。2007 年到 2012 年在比利时鲁汶大学电子系从事抗噪语音识别。回国后加入百度语音技术部。2015 年就职于乐视,负责语音识别与自然语言理解技术。2017 年加入小米,负责语音识别与语音合成技术。












完整演讲 PPT 下载链接


https://aicon.infoq.cn/2018/beijing/#schedule


2019-09-19 14:171598

评论

发布
暂无评论
发现更多内容

鸿蒙NEXT开发-用户通知服务的封装和文件下载通知

东林知识库

鸿蒙NEXT开发-Tabs组件

东林知识库

唤醒新质生产力,破解企业供应链“新”课题

科技热闻

高效定位 Go 应用问题:Go 可观测性功能深度解析

阿里巴巴云原生

阿里云 云原生

数据要素市场化 驱动数字金融

郑州埃文科技

数据要素

互联网的“神经中枢”域名根服务器是如何演变的?

郑州埃文科技

根服务器

Shopify电商平台API接口对接及上线

北京木奇移动技术有限公司

跨境电商 软件外包公司 shopify开发

鸿蒙NEXT开发-Navigation组件导航

东林知识库

合合信息IntFinQ知识库体验:大模型加速器2.0,助力企业走向文档智能化

Damon小智

工作流 OCR AI‘’ DeepSeek coze

鸿蒙NEXT应用App测试-通用测试

东林知识库

2025南京软博会

AIOTE智博会

什么是IP地址子网划分,是如何应用的?

郑州埃文科技

IP地址

鸿蒙NEXT应用App测试-专项测试(DevEco Testing)

东林知识库

《币圈不设防》第五期:市场热点、交易所生态与合约争议深度探讨

TechubNews

WebGL开发框架及其特点

北京木奇移动技术有限公司

软件外包公司 webgl开发 3D软件开发

数据要素对企业营销会有什么影响?

郑州埃文科技

鸿蒙NEXT开发-用户通知服务

东林知识库

智能制造:MES系统架构设计

积木链小链

数字化转型 制造业 智能制造

有关IP地址运算

郑州埃文科技

IP地址

智能制造新引擎:铜丝生产行业MES系统核心功能

万界星空科技

制造业 mes 铜加工 铜拉丝生产 铜丝mes

太香了!快速集成DeepSeek能力的开源方案

王中阳Go

Go DeepSeek

鸿蒙NEXT开发-视频播放&绘图能力

东林知识库

文档智能扫描,提升无纸化办公效率

HarmonyOS SDK

电商评论数据自动化采集的六大核心策略(附避坑手册)

代码忍者

淘宝API接口

APP开发框架及其特点

北京木奇移动技术有限公司

APP开发 软件外包公司 APP外包公司

WebSocket调试神器对决:Apipost凭何碾压Apifox?

数据追梦人

鸿蒙NEXT开发-文件服务&上传下载

东林知识库

鸿蒙NEXT开发-位置服务

东林知识库

HarmonyOS:ComposeTitleBar 组件自学指南

李游Leo

鸿蒙

区块链项目的开发框架及特点

北京木奇移动技术有限公司

区块链技术 软件外包公司 web3开发

Gitea Enterprise 23.6.0 (Linux, macOS, Windows) - 本地部署的企业级 Git 服务

sysin

git

语音技术在小米的实践应用之路_AICon_王育军_InfoQ精选文章