AI实践哪家强?来 AICon, 解锁技术前沿,探寻产业新机! 了解详情
写点什么

语音技术在小米的实践应用之路

  • 2019-09-19
  • 本文字数:789 字

    阅读完需:约 3 分钟

语音技术在小米的实践应用之路

AICon北京2018大会上,王育军讲师做了《语音技术在小米的实践应用之路》主题演讲,主要内容如下。


演讲简介


语音技术,包括语音识别与合成等,经历了几十年的发展,恰逢人工智能时代的来临,对其应用场景做了重新定义。但是我们面临的问题从来没有变过:数据失配和模型假设。在本次演讲中,我将分享在小米,我们如何解决失配的问题,如何自动标注数据,以及我们如何在小米特有用户场景下进行产品和算法创新。我们在语音合成中也做了创新的尝试,利用语音识别辅助,端对端的技术取代传统文本处理,节省了繁杂的标注工作。


演讲提纲:


  1. 小米语音是如何成长的?

  2. 电视->手机->音箱->儿童->车载->笔记本

  3. 语音技术中的自然语言应用

  4. 语音识别中采用了深度学习语言模型后,识别率绝对增长超过 1%。尺寸小可做嵌入式使用。在语音合成中的文本分析,我们基于端到端网络结构,业内首次提出将端到端网络应用于合成前端,通过一个编解码网络,完成传统复杂前端中的多个模块的功能。通过多目标联合地并行训练,取得了媲美传统前端的性能。

  5. 永远要突破算法的天花板

  6. 为什么语音算法可以在小米有所突破,发表顶级国际会议论文?不做空中楼阁。有实际产品需求,有用户场景,有强大的内测用户。

  7. 语音应用的挑战

  8. 小米过去 20 个月做语音的经验


听众收益:


  1. 语音技术在智能家居环境中如何发挥作用

  2. 了解如何快速将语音算法落地到产品


讲师介绍


王育军


小米 语音技术负责人


2000 年毕业于清华大学自动化系,随后赴英国伯明翰大学电子系学习人机交互。2002 至 2004 年就职于 NEC 电子,从事嵌入式语音识别与语音合成。随后加入中软国际从事声学模型训练技术。2007 年到 2012 年在比利时鲁汶大学电子系从事抗噪语音识别。回国后加入百度语音技术部。2015 年就职于乐视,负责语音识别与自然语言理解技术。2017 年加入小米,负责语音识别与语音合成技术。












完整演讲 PPT 下载链接


https://aicon.infoq.cn/2018/beijing/#schedule


2019-09-19 14:171431

评论

发布
暂无评论
发现更多内容

笔记 20240524

Geek_d01095

camunda

淘宝1688跨境电商API接口接入指南:跨境卖家必备知识

代码忍者

pinduoduo API

50亿美元亏损背后:解析生成式 AI 的商业模式之争

Baihai IDP

程序员 AI 白海科技 LLMs GenAI

笔记 20240604

Geek_d01095

Spring Cloud Gateway

积分超市系统(源码 + 文档 + 部署 + 讲解)

深圳亥时科技

Mac桌面多窗口整理神器Moom,Moom使用教程

Rose

使用Creative Cloud Cleaner Tool mac轻松彻底卸载删除Adobe系列软件

Rose

Flink 实时湖仓,为汽车行业数字化加速!

阿里云大数据AI技术

大数据 flink 车联网 实时计算

JavaScript 与 Rust 和 WebAssembly 集成

京东科技开发者

Final Cut Pro X 插件不能使用出现叹号的解决办法

Rose

pr lut插件如何安装? lut预设导入Premiere Pro教程分享

Rose

笔记 20240530

Geek_d01095

RocketMQ

笔记 20240611

Geek_d01095

Elastic Search

PIRF 413:Recipe – What are we making?

Echo!!!

English

英特尔CEO帕特·基辛格:共筑x86核心架构,推动AI PC创新

E科讯

photoshop弹出Time to update 提示框,如何关闭

Rose

Lightroom Classic(Lrc)与Lightroom(Lr)有哪些区别?如何选择LRC和Lr?

Rose

笔记 20240615

Geek_d01095

RocketMQ

仓储管理系统-综合管理(源码+文档+部署+讲解)

深圳亥时科技

释放时序数据活力:Greptime 边云一体解决方案白皮书发布!

Greptime 格睿科技

数据库 开源 数据分析 物联网 边云一体

Apache Calcite SQL Parser 原理剖析

端小强

Calcite

亚马逊云科技宣布为 Amazon ElastiCache 提供预留节点灵活性

伊克罗德信息科技

Redis对象共享池,性能优化小细节

江南一点雨

如何检查Mac上是否启用了SIP系统完整性保护

Rose

让你的 Mac 用上最美的屏保,Aerial 使用教程

Rose

Mac怎么创建txt文件?如何设置新建txt的快捷键?

Rose

语音技术在小米的实践应用之路_AICon_王育军_InfoQ精选文章