10 月 23 - 25 日,QCon 上海站即将召开,现在购票,享9折优惠 了解详情
写点什么

语音技术在小米的实践应用之路

  • 2019-09-19
  • 本文字数:789 字

    阅读完需:约 3 分钟

语音技术在小米的实践应用之路

AICon北京2018大会上,王育军讲师做了《语音技术在小米的实践应用之路》主题演讲,主要内容如下。


演讲简介


语音技术,包括语音识别与合成等,经历了几十年的发展,恰逢人工智能时代的来临,对其应用场景做了重新定义。但是我们面临的问题从来没有变过:数据失配和模型假设。在本次演讲中,我将分享在小米,我们如何解决失配的问题,如何自动标注数据,以及我们如何在小米特有用户场景下进行产品和算法创新。我们在语音合成中也做了创新的尝试,利用语音识别辅助,端对端的技术取代传统文本处理,节省了繁杂的标注工作。


演讲提纲:


  1. 小米语音是如何成长的?

  2. 电视->手机->音箱->儿童->车载->笔记本

  3. 语音技术中的自然语言应用

  4. 语音识别中采用了深度学习语言模型后,识别率绝对增长超过 1%。尺寸小可做嵌入式使用。在语音合成中的文本分析,我们基于端到端网络结构,业内首次提出将端到端网络应用于合成前端,通过一个编解码网络,完成传统复杂前端中的多个模块的功能。通过多目标联合地并行训练,取得了媲美传统前端的性能。

  5. 永远要突破算法的天花板

  6. 为什么语音算法可以在小米有所突破,发表顶级国际会议论文?不做空中楼阁。有实际产品需求,有用户场景,有强大的内测用户。

  7. 语音应用的挑战

  8. 小米过去 20 个月做语音的经验


听众收益:


  1. 语音技术在智能家居环境中如何发挥作用

  2. 了解如何快速将语音算法落地到产品


讲师介绍


王育军


小米 语音技术负责人


2000 年毕业于清华大学自动化系,随后赴英国伯明翰大学电子系学习人机交互。2002 至 2004 年就职于 NEC 电子,从事嵌入式语音识别与语音合成。随后加入中软国际从事声学模型训练技术。2007 年到 2012 年在比利时鲁汶大学电子系从事抗噪语音识别。回国后加入百度语音技术部。2015 年就职于乐视,负责语音识别与自然语言理解技术。2017 年加入小米,负责语音识别与语音合成技术。












完整演讲 PPT 下载链接


https://aicon.infoq.cn/2018/beijing/#schedule


2019-09-19 14:171528

评论

发布
暂无评论
发现更多内容

图数据库有哪些:知名图数据库产品和应用场景介绍

悦数图数据库

数据库 图数据库

如何使用Redis实现分布式锁?

王磊

Java Java面试题

一个炫酷的头像悬停效果 2

南城FE

CSS 前端 动画 SASS 交互

业内首份!电信和互联网数据安全标准汇编发布(附下载)

极盾科技

数据安全

面部表情识别技术在人机交互中的应用

数据堂

学习 ChatGPT 一切基础知识的绝佳资源

3D建模设计

人工智能 ChatGPT LLM

文心一言 VS 讯飞星火 VS chatgpt (79)-- 算法导论7.4 4题

福大大架构师每日一题

福大大架构师每日一题

助力人工智能教育普及 宾果智能机器人走进全国千所小学

硬科技星球

悦数图数据库与 keyarchOS 完成浪潮信息澎湃技术认证

悦数图数据库

数据库 图数据库 分布式图数据库

2023.10.14-价值最大化沙盘演练

ShineScrum

面部表情识别技术的最新研究进展

数据堂

面部表情识别的伦理问题与应对策略

数据堂

使用 ChatGPT 的代码解释器进行数据科学的 5 种方法

3D建模设计

Python 数据分析 ChatGPT

近期大型攻防演练观感及未来攻防趋势判断

墨菲安全

安全 软件供应链

企业级即时通讯协作和移动应用管理平台哪个品牌好?

BeeWorks

一云多芯能力再获认可!天翼云助推政企上云行稳致远!

天翼云开发者社区

云计算

GPT大语言模型引爆强化学习与语言生成模型的热潮、带你了解RLHF。

汀丶人工智能

强化学习 ChatGPT AI大语言模型

Prompt-“设计提示模板:用更少数据实现预训练模型的卓越表现,助力Few-Shot和Zero-Shot任务”

汀丶人工智能

人工智能 Prompt prompt 工程

第二周作业

大肚皮狒狒

使用three.js与WebGL相比有什么优势?

3D建模设计

WebGL three.js

LangChain + Streamlit + Llama:将对话式AI引入本地机器

3D建模设计

人工智能 LLM

如何使用LLM实现文本自动生成视频

3D建模设计

Python 人工智能

企业级私有化部署即时通讯,完美替代SaaS平台

BeeWorks

2023 ARTS打卡第一周

犇犇

ARTS 打卡计划

从来不懂K8s的人在10分钟内将应用跑在了K8s中

北京好雨科技有限公司

Kubernetes 开发者 云原生 应用部署

2023 ARTS 打卡第一周

Z.

ARTS 打卡计划

语音技术在小米的实践应用之路_AICon_王育军_InfoQ精选文章