写点什么

亚马逊发布新的 Alexa 跨技能会话模型

作者:Anthony Alford

  • 2019-06-22
  • 本文字数:1211 字

    阅读完需:约 4 分钟

亚马逊发布新的Alexa跨技能会话模型

AI 大模型超全落地场景&金融应用实践,8 月 16 - 19 日 FCon x AICon 大会联诀来袭、干货翻倍!

拉斯维加斯举行的亚马逊re:MARS AI大会上,Alexa 副总裁 Rohit Prasad 演示了Alexa智能助手的一种新对话模型。在这个新模型中,Alexa 可以无缝地在技能之间进行转换,并记住对话的上下文,从而消除歧义。


Alexa 用户对于技能的概念无疑很熟悉,这是 Alexa 功能的构建块。用户通过选择一个技能来让 Alexa“打开”或“启动”该技能。一旦某个技能激活,Alexa 的会话功能就会受到该技能需求的限制。与许多其他聊天机器人一样,Alexa 使用意图分类和槽填充模型。意图/槽模型的一个例子是电影票购买技能。在该技能中,意图 PurchaseTickets 拥有槽 theaterCity、theaterName、movieTitle*、*showTime 和 numberOfTickets。


分析用户说出的每个短语,以确定用户希望 Alexa 采取的操作(意图)以及具体的操作参数(槽)。一旦确定了意图,接下来与 Alexa 的大部分对话都是为了填充意图的任何空白槽。这个模型的一个缺点是 Alexa 不记得对话的任何细节。特别是,已经被标识为槽值的项不能供用户稍后可能选择的其他技能使用。例如,如果用户购买了电影票,然后想要使用 Alexa 来安排拼车去影院,目前还不能简单地说,“我需要一辆车去那里。”相反,用户必须显式地打开拼车技能,并填写该技能的槽 destinationAddress(目的地地址)和 arrivalTime(到达时间)。该技能无法把前一技能的槽 theaterName(剧院名称)和 showTime(放映时间)作为上下文推断出这些。


re:MARS主题演讲中,Prasad 播放了一个视频,演示一段与 Alexa 之间的对话。在这个视频中,用户与 Alexa 进行了长时间的对话,购买电影票,预订餐馆,安排拼车,所有这些全都使用了一个新的对话模型,在这个模型中,Alexa 可以保持上下文信息,在技能之间进行切换,并使用记住的上下文填充槽。Alexa 团队表示,“每一轮对话,系统都会生成一个向量……这代表了对话的上下文和语义内容。”


这个演示代表了许多研究论文的成果,其内部运作机制去年在一篇博文会议论文中提到过。系统创建槽嵌入,将语义相似的槽在嵌入空间里聚合在一起。这使得 Alexa 能够识别出什么时候可以用一个技能的槽来填充另一个技能的槽。还有一个LSTM神经网络,它决定是否将槽值“结转”到下一步的对话中。


虽然这项技术还没有正式向 Alexa 开发者社区发布,但已经有一个名为Alexa Conversations的开发者预览程序。开发人员可以申请“对即将到来的跨主题功能的早期访问”。一名Alexa冠军Mark Tucker 在推特上说:


Alexa Conversations 预览版承诺了更少的编码和更多的对话体验。每个开发人员都应该开始期待。亚马逊主要关注对话管理,而不是状态管理和意图上下文。这会是解决方案吗?


然而,并不是每个人都对新对话模型表现得很激动。Hacker News的一位评论者指出:


我希望它能走向一个更明确的“项列表->遗传->新的项列表”方法。当你试图与它进行正常对话时,Alexa 最容易暴露缺点。


查看英文原文Amazon Announces New Cross-Skill Conversational Model for Alexa


公众号推荐:

AIGC 技术正以惊人的速度重塑着创新的边界,InfoQ 首期《大模型领航者AIGC实践案例集锦》电子书,深度对话 30 位国内顶尖大模型专家,洞悉大模型技术前沿与未来趋势,精选 10 余个行业一线实践案例,全面展示大模型在多个垂直行业的应用成果,同时,揭秘全球热门大模型效果,为创业者、开发者提供决策支持和选型参考。关注「AI前线」,回复「领航者」免费获取电子书。

2019-06-22 08:004822
用户头像

发布了 704 篇内容, 共 422.8 次阅读, 收获喜欢 1519 次。

关注

评论

发布
暂无评论
发现更多内容

隧道视野效应 - 认知局限

石云升

教育 认知 隧道视野效应

程序员在编程过程中,经常会在代码中使用到“where 1=1”,这是为什么呢?

小Q

Java 数据库 学习 架构 面试

Maven 进阶

少平

“双11”正成为区块链场景应用“练兵场”

CECBC

大数据

上海与鲲鹏的数字共鸣

脑极体

架构师训练营 -week08-作业

大刘

极客大学架构师训练营

《迅雷链精品课》第四课:区块链技术发展趋势

迅雷链

区块链

数字货币是数字经济发展基石

CECBC

数字货币

架构师训练营第四周作业

李日盛

架构

28天刷完这份内容多大349页的阿里Java面试通关手册,我成功闯进了字节跳动!

Java架构之路

Java 程序员 架构 面试 编程语言

太牛了,腾讯T4Java技术专家手撸的Redis技术笔记,一周内下载量已突破30W。

Java架构之路

Java 程序员 架构 面试 编程语言

“先加密后签名”是不是安全?看完这篇就秒懂!

华为云开发者联盟

安全 加密 签名

16张图带你彻底搞懂基数排序

Java架构师迁哥

杂谈

落曦

【薪火计划】01 - 好与坏

AR7

管理

手把手教你使用ModelArts的自动学习识别毒蘑菇分类

华为云开发者联盟

学习 AI 图像识别

架构师训练营 1 期 -- 第八周笔记

曾彪彪

极客大学架构师训练营

Maven 入门

少平

Java

这篇 MySQL 索引和 B+Tree 讲的太通俗易懂!

MySQL 面试 数据库事务 索引结构

如果说数据是推动自动驾驶的原动力,那么存储扮演什么角色?

焱融科技

自动驾驶 数据 存储 文件存储 自动驾驶训练

一周信创舆情观察(11.2~11.8)

统小信uos

Scala-语法特性(一):类型和变量定义

正向成长

scala

从 Android 到 Java:如何从不同视角解决问题?

Java架构师迁哥

linux下定位多线程内存越界问题实践总结

小Q

Java Linux 学习 面试 多线程

如何提升存储性能之IO模型和AIO大揭秘

焱融科技

数据 io 存储 焱融科技 分布式文件存储

架构师训练营第四周学习笔记

李日盛

笔记

iOS底层系统小结

shirley

ios

区块链技术发展需加强核心技术自主创新

CECBC

区块链技术

线上排障技巧 | 动态修改LOGGER级别

AI乔治

Java 编程 架构 JVM

【涂鸦物联网足迹】涂鸦云平台接口列表—智能门锁

IoT云工坊

人工智能 云计算 物联网 API 智能门锁

【得物技术】机器学习在图形验证码识别上的应用

得物技术

学习 算法 测试 图像识别 验证码

亚马逊发布新的Alexa跨技能会话模型_AI&大模型_InfoQ精选文章