写点什么

亚马逊发布新的 Alexa 跨技能会话模型

作者:Anthony Alford

  • 2019-06-22
  • 本文字数:1211 字

    阅读完需:约 4 分钟

亚马逊发布新的Alexa跨技能会话模型

拉斯维加斯举行的亚马逊re:MARS AI大会上,Alexa 副总裁 Rohit Prasad 演示了Alexa智能助手的一种新对话模型。在这个新模型中,Alexa 可以无缝地在技能之间进行转换,并记住对话的上下文,从而消除歧义。


Alexa 用户对于技能的概念无疑很熟悉,这是 Alexa 功能的构建块。用户通过选择一个技能来让 Alexa“打开”或“启动”该技能。一旦某个技能激活,Alexa 的会话功能就会受到该技能需求的限制。与许多其他聊天机器人一样,Alexa 使用意图分类和槽填充模型。意图/槽模型的一个例子是电影票购买技能。在该技能中,意图 PurchaseTickets 拥有槽 theaterCity、theaterName、movieTitle*、*showTime 和 numberOfTickets。


分析用户说出的每个短语,以确定用户希望 Alexa 采取的操作(意图)以及具体的操作参数(槽)。一旦确定了意图,接下来与 Alexa 的大部分对话都是为了填充意图的任何空白槽。这个模型的一个缺点是 Alexa 不记得对话的任何细节。特别是,已经被标识为槽值的项不能供用户稍后可能选择的其他技能使用。例如,如果用户购买了电影票,然后想要使用 Alexa 来安排拼车去影院,目前还不能简单地说,“我需要一辆车去那里。”相反,用户必须显式地打开拼车技能,并填写该技能的槽 destinationAddress(目的地地址)和 arrivalTime(到达时间)。该技能无法把前一技能的槽 theaterName(剧院名称)和 showTime(放映时间)作为上下文推断出这些。


re:MARS主题演讲中,Prasad 播放了一个视频,演示一段与 Alexa 之间的对话。在这个视频中,用户与 Alexa 进行了长时间的对话,购买电影票,预订餐馆,安排拼车,所有这些全都使用了一个新的对话模型,在这个模型中,Alexa 可以保持上下文信息,在技能之间进行切换,并使用记住的上下文填充槽。Alexa 团队表示,“每一轮对话,系统都会生成一个向量……这代表了对话的上下文和语义内容。”


这个演示代表了许多研究论文的成果,其内部运作机制去年在一篇博文会议论文中提到过。系统创建槽嵌入,将语义相似的槽在嵌入空间里聚合在一起。这使得 Alexa 能够识别出什么时候可以用一个技能的槽来填充另一个技能的槽。还有一个LSTM神经网络,它决定是否将槽值“结转”到下一步的对话中。


虽然这项技术还没有正式向 Alexa 开发者社区发布,但已经有一个名为Alexa Conversations的开发者预览程序。开发人员可以申请“对即将到来的跨主题功能的早期访问”。一名Alexa冠军Mark Tucker 在推特上说:


Alexa Conversations 预览版承诺了更少的编码和更多的对话体验。每个开发人员都应该开始期待。亚马逊主要关注对话管理,而不是状态管理和意图上下文。这会是解决方案吗?


然而,并不是每个人都对新对话模型表现得很激动。Hacker News的一位评论者指出:


我希望它能走向一个更明确的“项列表->遗传->新的项列表”方法。当你试图与它进行正常对话时,Alexa 最容易暴露缺点。


查看英文原文Amazon Announces New Cross-Skill Conversational Model for Alexa


2019-06-22 08:005086
用户头像

发布了 806 篇内容, 共 552.7 次阅读, 收获喜欢 1585 次。

关注

评论

发布
暂无评论
发现更多内容

TLS协议分析 (九) 现代加密通信协议设计

OpenIM

打爆怪兽 一起来养猪 养蜂人 幸福饭店 山海经 弹球 旅行世界

游戏开发_软件开发

如何优雅地设计DWS层? | StartDT Tech Lab 17

奇点云

浅谈对象体系 | StartDT Tech Lab 07

奇点云

不吹不黑!阿里新产微服务架构进阶笔记我粉了!理论实战齐飞

Java 程序员 架构 面试 微服务

清华大牛带领20位大厂专家耗时三年整理出这份2000页Java进阶指南

Java~~~

Java 架构 面试 微服务 多线程

写了一年golang,来聊聊进程、线程与协程

捉虫大师

线程 进程 协程 Go 语言

浅谈单点登录SSO实现方案 | StartDT Tech Lab 06

奇点云

GitOps系列|云原生时代,你还不懂GitOps?

极狐GitLab

security CI/CD gitops

为什么在 Windows 下用 Ctrl+Z 退出 Python 而 Linux 下用 Ctrl+D 呢?

小拍Piper

Python Linux windows

Rust从0到1-完结

rust

吃透HTTP原理,教你建立安全的HTTPS网站

博文视点Broadview

性能优化之分页查询 | StartDT Tech Lab 12

奇点云

大数据安全验证之Kerberos | StartDT Tech Lab 11

奇点云

浅谈元数据采集 | StartDT Tech Lab 10

奇点云

从动物科学到乐队鼓手,腾讯技术小哥的开源人生

腾源会

腾讯云 开源

有人在恶意提权吗?

BUG侦探

Linux 主机安全 提权

分享 | RadonDB 的开源之路(4 千字长文)

RadonDB

MySQL 数据库 RadonDB

实用?HUAWEI高工总结出15W字的图解计算机操作系统指南手册

Java~~~

Java 架构 面试 TCP 网络协议

26岁!月薪38k,全靠这份GitHub百万下载的阿里P5-P9知识核心手册

Java~~~

Java 架构 面试 微服务 多线程

基于OLT(实体、关系、标签)建模方法论的最佳实践 | StartDT Tech Lab 08

奇点云

模型工厂,让AI算法触手可达 | StartDT Tech Lab 05

奇点云

成为优秀架构师需要具备哪些能力?

卢卡多多

架构师 服务 9月日更

分布式任务调度的应用分享 | StartDT Tech Lab 13

奇点云

开源贡献分享:从网关内服务健康检查说起 | StartDT Tech Lab 09

奇点云

一个不起眼却非常实用的功能介绍

ThingJS数字孪生引擎

大前端 物联网 可视化 数字孪生

数据仓库领域常见建模方法及实例演示 | StartDT Tech Lab 16

奇点云

DataMaleon组件化开发实践 | StartDT Tech Lab 14

奇点云

Alibaba内部的10w字Java高频面试手册遭人恶意在牛客网开源下载?

Java~~~

Java 架构 面试 JVM 多线程

操作系统的IO模型

Java 程序员 架构 操作系统 计算机

量化交易系统软件开发(源码)

Geek_23f0c3

量化交易机器人系统开发 量化策略 智能量化交易软件

亚马逊发布新的Alexa跨技能会话模型_AI&大模型_InfoQ精选文章