【AICon】探索八个行业创新案例,教你在教育、金融、医疗、法律等领域实践大模型技术! >>> 了解详情
写点什么

阿里小蜜中的情绪回复能力

  • 2019-06-02
  • 本文字数:3872 字

    阅读完需:约 13 分钟

阿里小蜜中的情绪回复能力

本次分享内容提纲:


  • 阿里小蜜介绍

  • 情绪回复能力介绍

  • 客户情绪安抚

  • 客服质量检测

  • 情绪生成式语聊

一、阿里小蜜介绍

传统的客服模式始于电话客服,会有专业的咨询顾问帮客户解答问题。之后有了在线客服和线上申请,在线客服类似于文字聊天,线上申请是非实时的通讯方式,可以理解为类似留言或者邮件的形式。



1. 智能服务模式

在阿里场景下我们对问题进行了区分,将其分成问题咨询和交易纠纷,分别有专门的顾问进行解答。在智能服务模式下,在问题咨询端建立了小蜜这样的产品,如果问题比较复杂,小蜜解决不了,还是会把问题转到人工顾问这一端,为用户提供更全面的服务。即便这样,在人工客服一端,也有对应的智能辅助产品,帮助提高人工客服的服务效率,比如检索是否有历史相似答案提供给人工客服,帮助他们快速完成解答。


2. 模式的升级与生态圈拓展

智能客服能力建立之前,人工服务的能力来自于自营客服、外包客服和云客服。模式升级之后,利用智能服务的能力,形成了平台能力、三方能力、智能人机交互这三种服务模式。服务的对象可以理解为三个层次,其中,阿里是包括指淘宝、天猫、咸鱼、淘票票等阿里巴巴内部产品平台的范围;商家是指依托于阿里巴巴淘宝和天猫等平台之上的外部商家;企业则是指纯粹外部的企业。



如图,最下面这层其实是为小二进行服务的,小二是阿里客服的简称。在上面机器人配置平台这一层是为机器人服务提供一些能力。再往上一层是按照产品进行划分,分成阿里小蜜、店小蜜和企业小蜜。阿里小蜜主要服务阿里内部的淘宝天猫这样平台,店小蜜服务阿里平台上的商家,企业小蜜服务于外部企业。


二、阿里小蜜情绪回复能力

我们今天介绍阿里的小蜜产品在情绪回复能力上的技术发展。情感机器人的两个主要发展方向:


  • 类人:就是情感越像人越好。

  • 多模态:就是情绪的表达其实可以有多少手段,对人而言,可以是语言、表情神态、肢体语言等。


从情感处理能力上来说,可以把机器人分成三类:


第一类是机器人没有情感处理能力,阿里小蜜最开始的版本确实是没有情感处理能力的,只是对高频场景中的问题进行解答,比如用户说我要退货、如何退货、赶紧给我退货,得到的答复都是阿里平台上如何退货的文字描述,但其实第三句是有强烈情绪表达的,但是初期的阿里小蜜没有这样的理解能力;


第二类机器人是有完整的情绪识别能力的,目前体现最多的是在一些闲聊场景下,比如小冰,比如在对骂场景下,如果客户骂机器人,机器人虽然没有直接的对骂,机器人也会有婉转的方式,比如 " 180 度反弹 " ,虽然没有直接对骂,但是也表达了对自己辱骂的情绪,这是一种情绪比较完整的机器人;


第三类机器人产品,客服机器人,客户可以骂人,但是人工客服和客服机器人是绝对不能有这种情绪的,辱骂、讽刺、挖苦是机器人绝对不能有的情绪。但是有一些,比如高兴、委屈是机器人可以有的,所以小蜜的定位是部分情绪能力缺失的客服机器人。


从多模态角度来说,阿里小蜜目前只考虑了文本,和少量语音。


情绪回复,今天会讲两个方面,一个是理解情绪,另外一个是表达情绪。

三、客户情绪安抚


从三个方面进行介绍:服务质量检测,客户情绪安抚和情绪回复生成。


先看客户情绪安抚,针对常见场景,我们不仅仅只是告诉客户一些流程,比如退货流程,还是有一些安抚在里面。然后看右面的情绪回复能力,这个情绪回复能力,和情绪安抚的主要区别是,情绪安抚是业务专家之前预设好的各种答复,但是情绪回复采用纯生成式的模型,用在闲聊场景,内容不是提前配置好的;最左边的服务质量监测,如果从小蜜转到人工客服,小蜜也是继续服务的,针对服务质量不好的时候,会对人工客服做一些警示,就是提示他,注意自己的服务态度。下面针对这三块进行更为详细的介绍。


针对客户情绪安抚,我们分成离线端和在线端。



离线端,从下往上是如下几个离线处理,首先是情绪分类模型,这是整个流程最基本的东西,我们要去识别客户交流过程中体现的情绪;然后是主题分类模型,也就是说我们不仅要识别出情绪,还要知道聊的是哪方面的内容;第三步是知识构建,这里的知识构建应该就是一个问答对,做这一步的原因是,因为情绪分类和主题分类都比较粗,针对一些高频的问题,希望给用户更具体的回复方式。


在线端,其实是一个相反的过程,首先识别用户所说的是不是和之前总结的知识点比较接近,如果有就拿出来进行回答,如果没有就看是否可以归结到某种主题这样的情况上,如果再没有的话,我们就监测,它是不是仅仅是属于一种情绪表达,然后给更出更宽泛的情绪安抚。


其中的情绪分类模型:


通过数据分析以及参与常用的情绪字典,我们将情绪划分为 38 类 ( 感激、惊奇、失望、抱歉、期待、疑惑、尴尬、高兴、着急、怨恨、喜欢、抑郁、委屈、轻视、害怕、孤独、愤怒、悲伤、满意、无聊、同情、平静、烦恼、激动、嫌弃、懊悔、羞愧、解恨、犹豫、思念、感动、敬佩、心慌、低落、骄傲、心虚、羡慕、辱骂 ) ,但是其实我们针对最常用的 7 类 ( 委屈、恐惧、着急、失望、愤怒、辱骂、感谢 ) 模型训练出单独的分类模型,这样对这 7 中情绪分类的更准确。



上面是模型图,最左边的两个 poolling 是在做句子级别的语义特征抽取,这个实际上用的是 swem 算法;中间是 n-gram 多元的特征抽取,用的是 cnn 的模型,我们提取了两元、三元、四元这样的信息形成特征;最右侧的一块是 emotion embedding,用到了 18 年发表一篇文章的思路。在我们的场景下,label 就是 emotion,所以这一块叫 emotion embedding,这里将 word embedding 和 emotion embedding 结合起来其实是算某个词在某个 emotion 下面的 attention score,attention 可以理解为权重。这样更直接的体现了词级别的语义特征,整个句子从左到右,就是将词级别的、n-gram 级别的和词语级别的语义信息结合起来,才能获得比较好的语义分类。因为在线端用户打的句子都比较短,用这种方式才能实现比较好的语义识别的结果。


第二部分就是主题分类,我们定义的时候称呼为 " 情绪主题类别 " 。比如阿里小蜜有查天气的功能,并且被高频使用,这部分有没有必要放到这个模块呢?其实是没有必要的,一般是通过点击按钮引导操作,只是想看看天气,几乎没有情绪表达的。而这里提到的模型是用于识别情绪主题类别,从情绪的角度,归结常见的主题,而其它不带情绪的主题是没有归到里面。下面是针对 7 类情绪,做了 35 种情绪主题分类,主题分类架构和刚才的情绪分类的架构一致。



最后,基于知识的安抚,就是看用户说的话是不是和某个知识点很相近,这时候我们就用到匹配回复这样的模型能力,在文本匹配这一块儿可以分成两个功能能力。首先是分成两部分,最左边两块是一部分,最右侧是一部分,最左边的两块是两句话,他们分别在提取特征,最后把特征合并到一起做分类,最右边的部分是把两个句子从一开始就进行交互,把交互的结果,一层层做特征抽取,这相当于一个交互时间点的不同,一个是最后交互,另一个是一开始交互,我们把两种交互抽取特征的结果结合到一起,做一个准确率更高的文本匹配模型,来实现在线匹配问答。

四、客服质量检测

我们只探讨两种服务问题,一种是消极,一种是态度差,消极是指爱搭不理的态度,态度差是指客服虽然给了客服充分的回复,但是态度不好,比如可能有反怼客户,讽刺客户的现象发生。这套服务提供给平台端和商家端,平台端就是比如淘宝,天猫这样阿里自家平台,商家端是商家自己的店铺的客服检测,这是两个不同的模型,因为两种场景在服务质量的要求上存在不同的衡量标准。


在机器人端典型的对话方式是一问一答,而在人工客服端往往出现多问多答的情况,比如客户连着说几句,客服是连着回答几句。这时候我们对客服服务质量进行评价就需要非常关注上下文,并且上下文每句话是谁说的,等等这些信息。


模型如下图,考虑了句子长度、说话人角色,以及内容的语义信息等等特征。


五、情绪生成式语聊

下图是比较通用的语义生成模型,这种传统的生成模型存在的一个问题就是 ’ safe response ’ 的产生,就是很泛泛的一个回复,很少有情感传达在里面,比如好,哦哦,可以这样的回复。



我们的目的是让机器人产生带情绪的回复,另外希望回复更具有针对性一些,而不是全部都是通用的 ’ safe response ',在下面的模型里,除了情绪,我们还可以添加 topic 相关的信息,分析出聊天的主题。下面的例子里,客户说今天心情很好,聊的是生活化的主题,表达的是高兴的情绪,这时候我们生成 ’ 好开心啊 ',回复用户。



针对上述的用户和机器人的情感对应关系,可以进行预设。比如客户在表达高兴的时候,我们也要表达出高兴,用户在辱骂我们的时候,我们要表达出委屈。

六、未来工作

未来,我们要做一个 session 满意度预估,这里的 session 就是一个完整的对话,目前是通过人工用研分析,是设计一个调查问卷的形式,随机抽取每天的用户,然后让用户打分,最后的分数就是满意用户的占比。


存在的问题就是:一个是耗费人工;二是每天的统计量是不足的,因此会产生每天统计结果比较大的自然震动。


联系我们:


欢迎对智能问答机器人、自然语言处理、机器学习等领域感兴趣的业内优秀同学、老师、专家关注我们的算法专家、高级算法专家、资深算法专家等岗位,感兴趣可以发送您的简历至:


shuangyong.ssy@alibaba-inc.com


进行内推,或者邮件咨询岗位细节,感谢您的关注!

嘉宾介绍:

宋双永,阿里巴巴小蜜情感语聊算法负责人,智能服务事业部算法专家。致力于智能对话中的情绪回复能力以及开放域语聊能力的算法研究和业务场景落地,在机器学习和自然语言处理领域积累了多年的实战经验,发表了多篇学术文章和专利。


本文来自 DataFun 社区


原文链接


https://mp.weixin.qq.com/s/q2fJefssYZ0BMxzIVy_SMw


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-06-02 08:0011114

评论

发布
暂无评论
发现更多内容

阿里云易立:以云原生之力,实现大模型时代基础设施能力跃升 | KubeCon 主论坛分享

阿里巴巴云原生

阿里云 容器 云原生 KubeCON

WIFI7-802.11be/EHT-IPQ9574-IPQ9554-QCN9274-QCN6274 support-320/240MHz and Multi-RU technology

wifi6-yiyi

WiFi7 ipq9554 802.11be

全面解读 SQL 优化 - 统计信息

KaiwuDB

sql 优化 KaiwuDB

Spring Boot 中常见且必备的注解解析

Liam

Java 程序员 Spring Boot 后端 注解

深圳华秋电子有限公司与共熵服务中心缔结战略合作伙伴关系

华秋电子

合作伙伴

EOS系统合约链账户介绍

BSN研习社

强强联合!天翼云与神州信息共助银行数字化转型升级!

天翼云开发者社区

数据库 云计算

华秋DFM新功能丨可焊性检查再次升级,抢先体验!

华秋电子

JAVA OOM异常最佳实践

Yestodorrow

Java 运维 监控 可观测性 系统性能

DxO FilmPack 6 for Mac(胶片模拟效果滤镜软件) 6.15.0完美激活版

mac

图像处理软件 苹果mac Windows软件 DxO FilmPack 6

苹果电脑pdf文档大小压缩推荐 PDF Squeezer激活中文最新版

胖墩儿不胖y

Mac软件 pdf编辑器 pdf处理工具

供应链透明度的代币开发

区块链软件开发推广运营

交易所开发 dapp开发 区块链开发 NFT开发

DApp区块链公链智能合约质押挖矿系统开发

l8l259l3365

支持信创系统的数据库审计系统有哪些?用哪家好?

行云管家

数据库 信创 数据安全 国产化 数据库审计

三个要点,掌握Spring Boot单元测试

互联网工科生

Spring Boot 分层架构 单元测试 JUnit Mockito

专业强大的字体管理软件:RightFont 直装激活最新版

mac大玩家j

字体设置 Mac软件 字体设计 字体管理工具

What's new in Pika v3.5.1

apache/dubbo-go

redis redis sentinel Pika

探索古彝文AI识别技术:助力中国传统文化的传承与发扬

颜淡慕潇

人工智能 算法 AI识别技术 前言技术

如何用装饰者模式代理final方法

程序员万金游

spring aop #java #程序员 #Spring #后端

Topaz Video AI for mac(视频增强和修复工具) 3.5.2完整激活版

mac

苹果mac Windows软件 Topaz Video AI 视频增强修复工具

ARTS-week7(23.9.25-23.9.30)

EchoZhou

牵引数字经济重要增长极,天翼云智能边缘云助力元宇宙加速发展!

天翼云开发者社区

云计算

得物API元数据中心探索与思考

得物技术

API管理 元数据中心 自动解析

什么是API商品数据接口?该怎么使用?

Noah

API 安全 API 文档 API 开发

“开放原子开源大赛”来袭, inBuilder低代码开发创新赛火热报名中!

inBuilder低代码平台

DxO PureRAW for Mac(RAW照片处理器)v3.6.0永久激活版

mac

苹果mac Windows软件 DxO PureRAW raw智能照片处理工具

[分组聚合]基于Lucene8进行多值字段分组聚合(多属性字段)

alexgaoyh

lucene Spring Boot 分组聚合 单字段 多属性

长沙企业采购云管平台选哪家厂商?联系电话多少?

行云管家

云计算 云服务 云管理平台 云管平台

前端首屏优化 | 提升首屏的 8 个很简单的手段

Yestodorrow

可观测性 网站性能

文心一言 VS 讯飞星火 VS chatgpt (102)-- 算法导论9.3 8题

福大大架构师每日一题

福大大架构师每日一题

4点策略调优!智能外呼助力汽车行业盘活客户价值

中关村科金

智能外呼系统

阿里小蜜中的情绪回复能力_软件工程_DataFunTalk_InfoQ精选文章