10 月 23 - 25 日,QCon 上海站即将召开,现在购票,享9折优惠 了解详情
写点什么

亚马逊发布新的 Alexa 跨技能会话模型

作者:Anthony Alford

  • 2019-06-22
  • 本文字数:1211 字

    阅读完需:约 4 分钟

亚马逊发布新的Alexa跨技能会话模型

拉斯维加斯举行的亚马逊re:MARS AI大会上,Alexa 副总裁 Rohit Prasad 演示了Alexa智能助手的一种新对话模型。在这个新模型中,Alexa 可以无缝地在技能之间进行转换,并记住对话的上下文,从而消除歧义。


Alexa 用户对于技能的概念无疑很熟悉,这是 Alexa 功能的构建块。用户通过选择一个技能来让 Alexa“打开”或“启动”该技能。一旦某个技能激活,Alexa 的会话功能就会受到该技能需求的限制。与许多其他聊天机器人一样,Alexa 使用意图分类和槽填充模型。意图/槽模型的一个例子是电影票购买技能。在该技能中,意图 PurchaseTickets 拥有槽 theaterCity、theaterName、movieTitle*、*showTime 和 numberOfTickets。


分析用户说出的每个短语,以确定用户希望 Alexa 采取的操作(意图)以及具体的操作参数(槽)。一旦确定了意图,接下来与 Alexa 的大部分对话都是为了填充意图的任何空白槽。这个模型的一个缺点是 Alexa 不记得对话的任何细节。特别是,已经被标识为槽值的项不能供用户稍后可能选择的其他技能使用。例如,如果用户购买了电影票,然后想要使用 Alexa 来安排拼车去影院,目前还不能简单地说,“我需要一辆车去那里。”相反,用户必须显式地打开拼车技能,并填写该技能的槽 destinationAddress(目的地地址)和 arrivalTime(到达时间)。该技能无法把前一技能的槽 theaterName(剧院名称)和 showTime(放映时间)作为上下文推断出这些。


re:MARS主题演讲中,Prasad 播放了一个视频,演示一段与 Alexa 之间的对话。在这个视频中,用户与 Alexa 进行了长时间的对话,购买电影票,预订餐馆,安排拼车,所有这些全都使用了一个新的对话模型,在这个模型中,Alexa 可以保持上下文信息,在技能之间进行切换,并使用记住的上下文填充槽。Alexa 团队表示,“每一轮对话,系统都会生成一个向量……这代表了对话的上下文和语义内容。”


这个演示代表了许多研究论文的成果,其内部运作机制去年在一篇博文会议论文中提到过。系统创建槽嵌入,将语义相似的槽在嵌入空间里聚合在一起。这使得 Alexa 能够识别出什么时候可以用一个技能的槽来填充另一个技能的槽。还有一个LSTM神经网络,它决定是否将槽值“结转”到下一步的对话中。


虽然这项技术还没有正式向 Alexa 开发者社区发布,但已经有一个名为Alexa Conversations的开发者预览程序。开发人员可以申请“对即将到来的跨主题功能的早期访问”。一名Alexa冠军Mark Tucker 在推特上说:


Alexa Conversations 预览版承诺了更少的编码和更多的对话体验。每个开发人员都应该开始期待。亚马逊主要关注对话管理,而不是状态管理和意图上下文。这会是解决方案吗?


然而,并不是每个人都对新对话模型表现得很激动。Hacker News的一位评论者指出:


我希望它能走向一个更明确的“项列表->遗传->新的项列表”方法。当你试图与它进行正常对话时,Alexa 最容易暴露缺点。


查看英文原文Amazon Announces New Cross-Skill Conversational Model for Alexa


2019-06-22 08:005133
用户头像

发布了 850 篇内容, 共 592.7 次阅读, 收获喜欢 1605 次。

关注

评论

发布
暂无评论
发现更多内容

大数据-64 Kafka 深入理解 Kafka 分区与重分配机制:高并发与高可用的核心 实机测试

武子康

Java 大数据 kafka 分布式 消息队列

超融合:企业最关心的那些事

智驱前线

超融合

GPT-5技术解析:多版本模型与软件生成能力

qife122

人工智能 代码生成

什么是真正的Monorepo?深入解析单一代码仓库的利与弊

qife122

版本控制 软件开发

使用spaCy检测编程语言的NLP技术解析

qife122

自然语言处理 编程语言检测

黑龙江的二级等保和三级等保,在保护要求上有啥不一样?

等保测评

超融合架构:中小企业数字化转型的利器

智驱前线

超融合架构

基于 WebGL 的数字孪生项目

北京木奇移动技术有限公司

软件外包公司 数字孪生开发 webgl开发

区块链Web3项目的开发流程

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

2012年9月安全公告网络研讨会问答与幻灯片集锦

qife122

Visual Studio 安全公告

数据中心升级十字路口:超融合架构,是理想路径还是现实考量?

智驱前线

超融合架构

企业在黑龙江做二级等保测评,一般要准备哪些材料?

等保测评

语音情感分析技术解析

qife122

语音分析 实时推理

超融合架构:破解传统 IT 困局的关键引擎

智驱前线

IT 超融合架构

CANN与智谱GLM强强联合,国产AI加速迈向端云协同

极客天地

40岁程序员同事被撸下技术Leader后,我们去灵隐寺聊了聊出路及副业销售18万的操作

陆通

程序员 大龄程序员 就业 副业搞钱

可定制NLP工具包spaCy与LLM集成技术解析

qife122

自然语言处理 开发者工具

性能优化之母:为什么说“方法内联”是编译器优化中最关键的一步棋?

poemyang

编译原理 Java虚拟机 JIT编译器 #java

百度搜索PC端全量上线系列AI功能  AI搜索月活已超3.22亿

极客天地

意念统御,军团集结!网易伏羲以科技重铸《魔兽世界》统御之盔,用意念“控制”机器人

网易伏羲

网易伏羲 脑机接口 人形机器人 宇树科技 魔兽世界

【AI编程】让Codebuddy改写《浪浪山小妖怪》,结果写出了打工人血泪史

卷福同学

基于AI的课程内容生成系统技术解析

qife122

系统架构 生成式AI

京东商品列表API秘籍!轻松获取商品列表数据

tbapi

京东API 京东商品列表API 京东数据采集 京东数据分析

一分钟读懂超融合架构 | 轻松干货

智驱前线

超融合架构

Intigriti Bug Bytes

qife122

漏洞挖掘 漏洞赏金

网站卡顿被攻击?EdgeOne 十分钟接入指南:安全加速一体化落地实战

六月的雨在InfoQ

CodeBuddy首席试玩官 CodeBuddyIDE AIIDE 边缘安全加速平台 EO

黑龙江等保测评结果与企业的信用、资质有何关联?

等保测评

2025 WAIC探展合合信息展台:AI鉴伪技术洞察“看不见”的伪造痕迹

猫头虎

人工智能 OCR OCR识别 ai鉴伪

超融合架构:数字化转型的万能钥匙?这些场景适用!

智驱前线

超融合架构

超融合架构是什么?一文看懂计算、存储、网络的一体化

智驱前线

深度Ritz方法的全面误差分析

qife122

深度学习 偏微分方程

亚马逊发布新的Alexa跨技能会话模型_AI&大模型_InfoQ精选文章