阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

语音技术在小米的实践应用之路

  • 2019-09-19
  • 本文字数:789 字

    阅读完需:约 3 分钟

语音技术在小米的实践应用之路

AICon北京2018大会上,王育军讲师做了《语音技术在小米的实践应用之路》主题演讲,主要内容如下。


演讲简介


语音技术,包括语音识别与合成等,经历了几十年的发展,恰逢人工智能时代的来临,对其应用场景做了重新定义。但是我们面临的问题从来没有变过:数据失配和模型假设。在本次演讲中,我将分享在小米,我们如何解决失配的问题,如何自动标注数据,以及我们如何在小米特有用户场景下进行产品和算法创新。我们在语音合成中也做了创新的尝试,利用语音识别辅助,端对端的技术取代传统文本处理,节省了繁杂的标注工作。


演讲提纲:


  1. 小米语音是如何成长的?

  2. 电视->手机->音箱->儿童->车载->笔记本

  3. 语音技术中的自然语言应用

  4. 语音识别中采用了深度学习语言模型后,识别率绝对增长超过 1%。尺寸小可做嵌入式使用。在语音合成中的文本分析,我们基于端到端网络结构,业内首次提出将端到端网络应用于合成前端,通过一个编解码网络,完成传统复杂前端中的多个模块的功能。通过多目标联合地并行训练,取得了媲美传统前端的性能。

  5. 永远要突破算法的天花板

  6. 为什么语音算法可以在小米有所突破,发表顶级国际会议论文?不做空中楼阁。有实际产品需求,有用户场景,有强大的内测用户。

  7. 语音应用的挑战

  8. 小米过去 20 个月做语音的经验


听众收益:


  1. 语音技术在智能家居环境中如何发挥作用

  2. 了解如何快速将语音算法落地到产品


讲师介绍


王育军


小米 语音技术负责人


2000 年毕业于清华大学自动化系,随后赴英国伯明翰大学电子系学习人机交互。2002 至 2004 年就职于 NEC 电子,从事嵌入式语音识别与语音合成。随后加入中软国际从事声学模型训练技术。2007 年到 2012 年在比利时鲁汶大学电子系从事抗噪语音识别。回国后加入百度语音技术部。2015 年就职于乐视,负责语音识别与自然语言理解技术。2017 年加入小米,负责语音识别与语音合成技术。












完整演讲 PPT 下载链接


https://aicon.infoq.cn/2018/beijing/#schedule


2019-09-19 14:171033

评论

发布
暂无评论
发现更多内容

阿里P8大神分享的并发编程笔记,颠覆了我以往“正确“的认知

Java 程序员 面试 并发编程

智能合约业务场景探索(一)

石君

智能合约 28天写作

产品经理训练营笔记-认识产品经理(上)

.nil?

我做了回视频,告诉你需要用到哪些工具

和牛

工具

日语复习 Day03【~あまり(に)】

IT蜗壳-Tango

程序员 七日更 日语语法

Lambda 和 Stream API

小方

Java Lambda Stream<T>

android开发要学什么语言!掌握这些Android开发热门前沿知识,挥泪整理面经

欢喜学安卓

android 程序员 面试 移动开发

绩效管理,上下同心者胜(一)

一笑

管理 绩效 28天写作

「架构师训练营 4 期」 第三周 - 001

凯迪

RocketMQ解析

石刻掌纹

Android面试总结(一)

我就感觉到快

Redis布隆过滤器原理与实践

Java redis 面试

Windows文件夹还能更改颜色?

程序员的时光

程序员 七日更 28天写作

精选算法面试-哈希表

李孟聊AI

面试 算法 哈希 28天写作

读《一入阿里“误终生”》,我喜欢上了小马哥

李忠良

28天写作

写在开课前

5x

基因编辑食品,能否端上我们的餐桌?

脑极体

游戏夜读 | 游戏作品的生命力

game1night

使用DevSecOps保护CI / CD管道

啸天

DevSecOps 应用安全 开发安全

HDFS杂谈:ACL访问控制列表

罗小龙

hadoop hdfs acl 28天写作

自动驾驶感知功能一般都有啥?(28天写作 Day9/28)

mtfelix

自动驾驶 28天写作

如何实现CentOS服务器的扩容??

冰河

Linux centos 扩容 服务器

android进阶之光!双非渣本Android四年磨一剑,进阶学习资料!

欢喜学安卓

android 程序员 面试 移动开发

「架构师训练营 4 期」 第三周 - 002

凯迪

一篇让你彻底理解网关是什么的文章

Java架构师迁哥

架构师训练营第十三周作业

丁乐洪

一款dubbo服务可视化调试工具

程序员架构进阶

dubbo 工具 RPC 服务化 28天写作

OSPF的八大特点介绍

项目管理系列(4)-另类减肥法

Ian哥

28天写作

概率论DEMO

rainbow

28天瞎写的第二百二十天:独立设计维哈柯文云输入法的故事

树上

28天写作

语音技术在小米的实践应用之路_AICon_王育军_InfoQ精选文章