写点什么

阿里小蜜中的情绪回复能力

  • 2019-06-02
  • 本文字数:3872 字

    阅读完需:约 13 分钟

阿里小蜜中的情绪回复能力

本次分享内容提纲:


  • 阿里小蜜介绍

  • 情绪回复能力介绍

  • 客户情绪安抚

  • 客服质量检测

  • 情绪生成式语聊

一、阿里小蜜介绍

传统的客服模式始于电话客服,会有专业的咨询顾问帮客户解答问题。之后有了在线客服和线上申请,在线客服类似于文字聊天,线上申请是非实时的通讯方式,可以理解为类似留言或者邮件的形式。



1. 智能服务模式

在阿里场景下我们对问题进行了区分,将其分成问题咨询和交易纠纷,分别有专门的顾问进行解答。在智能服务模式下,在问题咨询端建立了小蜜这样的产品,如果问题比较复杂,小蜜解决不了,还是会把问题转到人工顾问这一端,为用户提供更全面的服务。即便这样,在人工客服一端,也有对应的智能辅助产品,帮助提高人工客服的服务效率,比如检索是否有历史相似答案提供给人工客服,帮助他们快速完成解答。


2. 模式的升级与生态圈拓展

智能客服能力建立之前,人工服务的能力来自于自营客服、外包客服和云客服。模式升级之后,利用智能服务的能力,形成了平台能力、三方能力、智能人机交互这三种服务模式。服务的对象可以理解为三个层次,其中,阿里是包括指淘宝、天猫、咸鱼、淘票票等阿里巴巴内部产品平台的范围;商家是指依托于阿里巴巴淘宝和天猫等平台之上的外部商家;企业则是指纯粹外部的企业。



如图,最下面这层其实是为小二进行服务的,小二是阿里客服的简称。在上面机器人配置平台这一层是为机器人服务提供一些能力。再往上一层是按照产品进行划分,分成阿里小蜜、店小蜜和企业小蜜。阿里小蜜主要服务阿里内部的淘宝天猫这样平台,店小蜜服务阿里平台上的商家,企业小蜜服务于外部企业。


二、阿里小蜜情绪回复能力

我们今天介绍阿里的小蜜产品在情绪回复能力上的技术发展。情感机器人的两个主要发展方向:


  • 类人:就是情感越像人越好。

  • 多模态:就是情绪的表达其实可以有多少手段,对人而言,可以是语言、表情神态、肢体语言等。


从情感处理能力上来说,可以把机器人分成三类:


第一类是机器人没有情感处理能力,阿里小蜜最开始的版本确实是没有情感处理能力的,只是对高频场景中的问题进行解答,比如用户说我要退货、如何退货、赶紧给我退货,得到的答复都是阿里平台上如何退货的文字描述,但其实第三句是有强烈情绪表达的,但是初期的阿里小蜜没有这样的理解能力;


第二类机器人是有完整的情绪识别能力的,目前体现最多的是在一些闲聊场景下,比如小冰,比如在对骂场景下,如果客户骂机器人,机器人虽然没有直接的对骂,机器人也会有婉转的方式,比如 " 180 度反弹 " ,虽然没有直接对骂,但是也表达了对自己辱骂的情绪,这是一种情绪比较完整的机器人;


第三类机器人产品,客服机器人,客户可以骂人,但是人工客服和客服机器人是绝对不能有这种情绪的,辱骂、讽刺、挖苦是机器人绝对不能有的情绪。但是有一些,比如高兴、委屈是机器人可以有的,所以小蜜的定位是部分情绪能力缺失的客服机器人。


从多模态角度来说,阿里小蜜目前只考虑了文本,和少量语音。


情绪回复,今天会讲两个方面,一个是理解情绪,另外一个是表达情绪。

三、客户情绪安抚


从三个方面进行介绍:服务质量检测,客户情绪安抚和情绪回复生成。


先看客户情绪安抚,针对常见场景,我们不仅仅只是告诉客户一些流程,比如退货流程,还是有一些安抚在里面。然后看右面的情绪回复能力,这个情绪回复能力,和情绪安抚的主要区别是,情绪安抚是业务专家之前预设好的各种答复,但是情绪回复采用纯生成式的模型,用在闲聊场景,内容不是提前配置好的;最左边的服务质量监测,如果从小蜜转到人工客服,小蜜也是继续服务的,针对服务质量不好的时候,会对人工客服做一些警示,就是提示他,注意自己的服务态度。下面针对这三块进行更为详细的介绍。


针对客户情绪安抚,我们分成离线端和在线端。



离线端,从下往上是如下几个离线处理,首先是情绪分类模型,这是整个流程最基本的东西,我们要去识别客户交流过程中体现的情绪;然后是主题分类模型,也就是说我们不仅要识别出情绪,还要知道聊的是哪方面的内容;第三步是知识构建,这里的知识构建应该就是一个问答对,做这一步的原因是,因为情绪分类和主题分类都比较粗,针对一些高频的问题,希望给用户更具体的回复方式。


在线端,其实是一个相反的过程,首先识别用户所说的是不是和之前总结的知识点比较接近,如果有就拿出来进行回答,如果没有就看是否可以归结到某种主题这样的情况上,如果再没有的话,我们就监测,它是不是仅仅是属于一种情绪表达,然后给更出更宽泛的情绪安抚。


其中的情绪分类模型:


通过数据分析以及参与常用的情绪字典,我们将情绪划分为 38 类 ( 感激、惊奇、失望、抱歉、期待、疑惑、尴尬、高兴、着急、怨恨、喜欢、抑郁、委屈、轻视、害怕、孤独、愤怒、悲伤、满意、无聊、同情、平静、烦恼、激动、嫌弃、懊悔、羞愧、解恨、犹豫、思念、感动、敬佩、心慌、低落、骄傲、心虚、羡慕、辱骂 ) ,但是其实我们针对最常用的 7 类 ( 委屈、恐惧、着急、失望、愤怒、辱骂、感谢 ) 模型训练出单独的分类模型,这样对这 7 中情绪分类的更准确。



上面是模型图,最左边的两个 poolling 是在做句子级别的语义特征抽取,这个实际上用的是 swem 算法;中间是 n-gram 多元的特征抽取,用的是 cnn 的模型,我们提取了两元、三元、四元这样的信息形成特征;最右侧的一块是 emotion embedding,用到了 18 年发表一篇文章的思路。在我们的场景下,label 就是 emotion,所以这一块叫 emotion embedding,这里将 word embedding 和 emotion embedding 结合起来其实是算某个词在某个 emotion 下面的 attention score,attention 可以理解为权重。这样更直接的体现了词级别的语义特征,整个句子从左到右,就是将词级别的、n-gram 级别的和词语级别的语义信息结合起来,才能获得比较好的语义分类。因为在线端用户打的句子都比较短,用这种方式才能实现比较好的语义识别的结果。


第二部分就是主题分类,我们定义的时候称呼为 " 情绪主题类别 " 。比如阿里小蜜有查天气的功能,并且被高频使用,这部分有没有必要放到这个模块呢?其实是没有必要的,一般是通过点击按钮引导操作,只是想看看天气,几乎没有情绪表达的。而这里提到的模型是用于识别情绪主题类别,从情绪的角度,归结常见的主题,而其它不带情绪的主题是没有归到里面。下面是针对 7 类情绪,做了 35 种情绪主题分类,主题分类架构和刚才的情绪分类的架构一致。



最后,基于知识的安抚,就是看用户说的话是不是和某个知识点很相近,这时候我们就用到匹配回复这样的模型能力,在文本匹配这一块儿可以分成两个功能能力。首先是分成两部分,最左边两块是一部分,最右侧是一部分,最左边的两块是两句话,他们分别在提取特征,最后把特征合并到一起做分类,最右边的部分是把两个句子从一开始就进行交互,把交互的结果,一层层做特征抽取,这相当于一个交互时间点的不同,一个是最后交互,另一个是一开始交互,我们把两种交互抽取特征的结果结合到一起,做一个准确率更高的文本匹配模型,来实现在线匹配问答。

四、客服质量检测

我们只探讨两种服务问题,一种是消极,一种是态度差,消极是指爱搭不理的态度,态度差是指客服虽然给了客服充分的回复,但是态度不好,比如可能有反怼客户,讽刺客户的现象发生。这套服务提供给平台端和商家端,平台端就是比如淘宝,天猫这样阿里自家平台,商家端是商家自己的店铺的客服检测,这是两个不同的模型,因为两种场景在服务质量的要求上存在不同的衡量标准。


在机器人端典型的对话方式是一问一答,而在人工客服端往往出现多问多答的情况,比如客户连着说几句,客服是连着回答几句。这时候我们对客服服务质量进行评价就需要非常关注上下文,并且上下文每句话是谁说的,等等这些信息。


模型如下图,考虑了句子长度、说话人角色,以及内容的语义信息等等特征。


五、情绪生成式语聊

下图是比较通用的语义生成模型,这种传统的生成模型存在的一个问题就是 ’ safe response ’ 的产生,就是很泛泛的一个回复,很少有情感传达在里面,比如好,哦哦,可以这样的回复。



我们的目的是让机器人产生带情绪的回复,另外希望回复更具有针对性一些,而不是全部都是通用的 ’ safe response ',在下面的模型里,除了情绪,我们还可以添加 topic 相关的信息,分析出聊天的主题。下面的例子里,客户说今天心情很好,聊的是生活化的主题,表达的是高兴的情绪,这时候我们生成 ’ 好开心啊 ',回复用户。



针对上述的用户和机器人的情感对应关系,可以进行预设。比如客户在表达高兴的时候,我们也要表达出高兴,用户在辱骂我们的时候,我们要表达出委屈。

六、未来工作

未来,我们要做一个 session 满意度预估,这里的 session 就是一个完整的对话,目前是通过人工用研分析,是设计一个调查问卷的形式,随机抽取每天的用户,然后让用户打分,最后的分数就是满意用户的占比。


存在的问题就是:一个是耗费人工;二是每天的统计量是不足的,因此会产生每天统计结果比较大的自然震动。


联系我们:


欢迎对智能问答机器人、自然语言处理、机器学习等领域感兴趣的业内优秀同学、老师、专家关注我们的算法专家、高级算法专家、资深算法专家等岗位,感兴趣可以发送您的简历至:


shuangyong.ssy@alibaba-inc.com


进行内推,或者邮件咨询岗位细节,感谢您的关注!

嘉宾介绍:

宋双永,阿里巴巴小蜜情感语聊算法负责人,智能服务事业部算法专家。致力于智能对话中的情绪回复能力以及开放域语聊能力的算法研究和业务场景落地,在机器学习和自然语言处理领域积累了多年的实战经验,发表了多篇学术文章和专利。


本文来自 DataFun 社区


原文链接


https://mp.weixin.qq.com/s/q2fJefssYZ0BMxzIVy_SMw


公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2019-06-02 08:0011110

评论

发布
暂无评论
发现更多内容

“中国法研杯”司法人工智能挑战赛:基于UTC的多标签/层次分类小样本文本应用,Macro F1提升13%+

汀丶人工智能

人工智能 nlp 文本分类 小样本学习

顶会ICSE-2023发布LIBRO技术,缺陷自动重现率达33%

华为云开发者联盟

人工智能 华为云 大模型 华为云开发者联盟 企业号 5 月 PK 榜

更高效便捷的开发体验——Cloud Studio 编辑器命令行工具

CODING DevOps

软件工程 研发效能 Cloud Studio 在线编辑

2023我的前端面试小结

loveX001

JavaScript 前端

软件测试 | 开源Web性能测试

测吧(北京)科技有限公司

测试

PAG动效框架源码笔记 (三)播放流程

olinone

ios android 特效

性价比提升15%,阿里云发布第八代企业级计算实例g8a和性能增强型实例g8ae

云布道师

共享电动车生产批发厂家怎么找

共享电单车厂家

共享电动车厂家 共享电单车厂商 共享电动车生产

“数据进化论”2023数智科技大会官宣:从看、用到智能,与客户共进化

奇点云

发布会 奇点云 数据云 数智科技大会

上海丨阿里云 Serverless 技术实战营邀你来玩!

阿里巴巴云原生

阿里云 Serverless 云原生

软件测试 | 如何运行JMeter

测吧(北京)科技有限公司

测试

软件测试 | 配置JMeter

测吧(北京)科技有限公司

测试

airasia Superapp × HMS Core:便捷出行,悦享全程

HMS Core

HMS Core

技术同学如何快速熟悉业务

老张

系统架构 业务

结合实例,解读华为云数字工厂信息模型配置器

华为云开发者联盟

云计算 后端 华为云 华为云开发者联盟 企业号 5 月 PK 榜

4.0 功能抢先看 | 读懂一个项目的研发效能 之 项目质量表现

思码逸研发效能

研发效能 项目质量

软件测试 |JMeter服务器模式、重置JMeter命令

测吧(北京)科技有限公司

测试

mate云端元宇宙系统智能合约链游开发技术

Congge420

区块链

基于Jmeter 的接口自动化测试实践探讨

jackwang

元宇宙链游系统开发搭建技术

Congge420

区块链

智能合约DAPP挖矿系统开发应用

Congge420

区块链

NFT盲盒卡牌游戏系统开发搭建

Congge420

区块链

Midjourney|文心一格prompt教程[技巧篇]:生成多样性、增加艺术风格、图片二次修改、渐进优化、权重、灯光设置等17个技巧等你来学

汀丶人工智能

人工智能 AI绘画 MidJourney prompt learning

社招前端二面必会react面试题及答案

beifeng1996

前端 React

软件测试 | JMeter

测吧(北京)科技有限公司

测试

软件测试 | 认识性能测试

测吧(北京)科技有限公司

测试

TIDB General Log抓取分析神器

TiDB 社区干货传送门

管理与运维 故障排查/诊断

js事件循环与macro&micro任务队列-前端面试进阶

loveX001

JavaScript 前端

面试官让你说说react状态管理?

beifeng1996

前端 React

文档还能这么写?GreptimePlay 邀你免费玩!

Greptime 格睿科技

数据库 云原生 时序数据库 Playground

Cloud Studio 内核升级之持续优化

CODING DevOps

DevOps 软件工程 Cloud Studio 云端IDE

阿里小蜜中的情绪回复能力_软件工程_DataFunTalk_InfoQ精选文章