小爱:语音识别和NLP在语音交互中的实践

2019 年 9 月 26 日

小爱:语音识别和NLP在语音交互中的实践

AICon 北京 2017 大会上,【王刚】讲师做了《小爱:语音识别和 NLP 在语音交互中的实践》主题演讲,主要内容如下。

演讲简介

本次讲演将讲述小爱从 0 到 1 的研发经历,介绍在小爱开发过程中所遇到的一些典型问题,以及在解决问题过程中的一些思考过程和相应的解决方法。使用语音的人机交互面临着一系列的技术挑战,而小爱只是走了万里长征的第一步,听众将从本次讲演中对语音交互系统的特点有一个全面的了解,对在语音交互中出现的新问题和新挑战有更深刻的认识,了解小爱在解决问题过程中的思路和方法。

内容概要

  1. 背景

1.1. 发布人工智能电视,有屏幕设备的用户特点 (17-03)

1.2. 发布水滴平台 (17-05)

1.3. 发布小爱音箱,无屏幕设备的用户特点 (17-07)

1.4. 发布手机上的新语音助手,触摸屏幕的用户特点 (17-11)

  1. 语音交互和搜索的重要区别

2.1. 只有一次机会的交互方式

2.2. 用户行为反馈

2.3. 多轮对话

2.4. 自然语言的表达:随意、模糊

  1. 语音识别

3.1. 不同引擎在不同场景表现的差异

3.2. 每一家都不同的优势:方言、响应速度

3.3. 多家融合策略

  1. 垂域建设

4.1. 电视垂域

4.1.1. 背景:query 的表达

4.1.2. Slot 种类介绍

4.1.3. Word Lattice 方法

4.1.4. 案例分析

4.2. 音乐垂域

4.2.1. 背景:query

4.2.2. 各种歌曲

4.2.3. 基于搜索的方法

4.2.4. 案例分析

4.3. 其他典型垂域

4.3.1. 计算器

4.3.2. 翻译

4.3.3. 控制类

4.3.4. 知识问答

4.3.5. 闲聊

  1. 中控策略架构及实战案例

  2. 多轮交互

6.1. 失败概率的累计

6.2. 实战案例:智能家居控制

  1. 用户行为反馈

7.1. 纯语音交互的隐反馈

7.2. 完听率

7.3. 重复 query

  1. 总结

讲师介绍

王刚

小米 小爱总监

王刚,博士毕业于香港科技大学计算机科学系,现任小米小爱语音交互系统的负责人,为小米各类智能设备提供语音交互的技术和产品。目前小爱已覆盖了小米 AI 音箱、小米人工智能电视、小米手机以及小米生态链中多种类型智能硬件。在加入小米之前,王刚博士在微软亚洲研究院和腾讯工作,长期从事机器学习和搜索引擎方向的研发工作。

完整演讲 PPT 下载链接

https://aicon.infoq.cn/2017/beijing/schedule

2019 年 9 月 26 日 13:52 566

评论

发布
暂无评论
发现更多内容
小爱:语音识别和NLP在语音交互中的实践-InfoQ