GMTC 全球大前端技术大会(北京站)门票 9 折特惠中,点击立减 ¥480 了解详情
写点什么

小爱:语音识别和 NLP 在语音交互中的实践

2019 年 9 月 26 日

小爱:语音识别和NLP在语音交互中的实践

AICon北京2017大会上,【王刚】讲师做了《小爱:语音识别和 NLP 在语音交互中的实践》主题演讲,主要内容如下。


演讲简介


本次讲演将讲述小爱从 0 到 1 的研发经历,介绍在小爱开发过程中所遇到的一些典型问题,以及在解决问题过程中的一些思考过程和相应的解决方法。使用语音的人机交互面临着一系列的技术挑战,而小爱只是走了万里长征的第一步,听众将从本次讲演中对语音交互系统的特点有一个全面的了解,对在语音交互中出现的新问题和新挑战有更深刻的认识,了解小爱在解决问题过程中的思路和方法。


内容概要

  1. 背景


1.1. 发布人工智能电视,有屏幕设备的用户特点(17-03)


1.2. 发布水滴平台(17-05)


1.3. 发布小爱音箱,无屏幕设备的用户特点(17-07)


1.4. 发布手机上的新语音助手,触摸屏幕的用户特点(17-11)


  1. 语音交互和搜索的重要区别


2.1. 只有一次机会的交互方式


2.2. 用户行为反馈


2.3. 多轮对话


2.4. 自然语言的表达:随意、模糊


  1. 语音识别


3.1. 不同引擎在不同场景表现的差异


3.2. 每一家都不同的优势:方言、响应速度


3.3. 多家融合策略


  1. 垂域建设


4.1. 电视垂域


4.1.1. 背景:query 的表达


4.1.2. Slot 种类介绍


4.1.3. Word Lattice 方法


4.1.4. 案例分析


4.2. 音乐垂域


4.2.1. 背景:query


4.2.2. 各种歌曲


4.2.3. 基于搜索的方法


4.2.4. 案例分析


4.3. 其他典型垂域


4.3.1. 计算器


4.3.2. 翻译


4.3.3. 控制类


4.3.4. 知识问答


4.3.5. 闲聊


  1. 中控策略架构及实战案例

  2. 多轮交互


6.1. 失败概率的累计


6.2. 实战案例:智能家居控制


  1. 用户行为反馈


7.1. 纯语音交互的隐反馈


7.2. 完听率


7.3. 重复 query


  1. 总结


讲师介绍


王刚


小米 小爱总监


王刚,博士毕业于香港科技大学计算机科学系,现任小米小爱语音交互系统的负责人,为小米各类智能设备提供语音交互的技术和产品。目前小爱已覆盖了小米 AI 音箱、小米人工智能电视、小米手机以及小米生态链中多种类型智能硬件。在加入小米之前,王刚博士在微软亚洲研究院和腾讯工作,长期从事机器学习和搜索引擎方向的研发工作。












完整演讲 PPT 下载链接


https://aicon.infoq.cn/2017/beijing/schedule


2019 年 9 月 26 日 13:521140

评论

发布
暂无评论
发现更多内容

什么是动态代理

Rayjun

Java 动态代理

谈谈贪官污吏

空山

可视化数据科学中的概率分布以帮你更好地理解各种分布

计算机与AI

学习 数据科学

新基建下区块链基础设施建设

CECBC区块链专委会

区块链

MySql从青铜到王者晋级之路,阿里大牛经验总结让牛少走弯路!

Java架构之路

Java 程序员 架构 面试 编程语言

英特尔老矣,尚能“转”否?

脑极体

大企程序员亲身经历告诉你,CRM系统,自己的才是最好的

Learun

敏捷开发

.NET可视化权限功能界面设计

力软.net/java开发平台

.net 可视化 权限

Vidyo的技术特点都有哪些?

dwqcmo

音视频 集成架构 解决方案 智能硬件

【JSRC小课堂】Web安全专题(一)认证缺失和认证缺陷漏洞

京东科技开发者

WEB安全

实用!8个 chrome插件玩转GitHub,单个文件下载小意思

程序员内点事

GitHub

即构SDK10月迭代:新增多款语音音效、外部采集码流控制及Android SDK 最低支持操作系统版本调整

ZEGO即构

android RTC

你有时间吗?

池建强

时间

32个问题,学习Java虚拟机的运行时数据区

AI乔治

Java 架构 JVM JVM虚拟机原理

如何生成 Flink 作业的交互式火焰图?

Apache Flink

flink

一文读懂GaussDB(openGauss) 的六大关键技术特性

华为云开发者社区

数据库 数据 存储

谷歌朝南,华为朝北

脑极体

LeetCode题解:47. 全排列 II,回溯,JavaScript,详细注释

Lee Chen

算法 LeetCode 前端进阶训练营

来自阿里面试官的Java面试连珠炮,让你自由发挥你能撑到哪一步?

Java架构之路

Java 程序员 架构 面试 编程语言

算法学习1-- 数组常见问题

菜鸟小sailor 🐕

算法和数据结构

10 张图打开 CPU 缓存一致性的大门

小林coding

缓存 cpu 操作系统 计算机

记一次Jvm参数调优实战

AI乔治

Java 架构 JVM 编程思维 jvm调优

求职时这样回答问题你就输了!来自IT类面试官视角的深度解读

华为云开发者社区

面试 软件开发

30 岁的码农人生 ——人生至暗时,你依然能窥见光明

cxuan

程序员 程序人生 感悟

AES加密模式

Mars

AES

如何在微信公众号图文中插入外链

Ceelog

微信公众号

今天你的idea崩了吗?分享6种“白嫖”正版idea的途径,真香定律

小Q

学习 架构 面试 开发 IntelliJ IDEA

它可能是分布式系统中最重要的枢纽

架构师修行之路

分布式 微服务 注册

阿里技术专家撰写程序员“不迷茫”职业路指南,切中痛点规划未来

周老师

Java 编程 程序员 架构 面试

分布式系统使用网关到底是好还是坏?

架构师修行之路

分布式 微服务 网关

阿里巴巴专属著作超赞,就是名字起得有点狂“成神之路”???

Java架构师迁哥

DIY 的 Kubernetes 集群的稳定性保障实践

DIY 的 Kubernetes 集群的稳定性保障实践

小爱:语音识别和NLP在语音交互中的实践-InfoQ