2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

多轮对话机器人打造(上篇):着手设计

  • 2019-11-05
  • 本文字数:2769 字

    阅读完需:约 9 分钟

多轮对话机器人打造(上篇):着手设计

多轮对话聊天机器人,作为人工智能的典型应用场景,也是一项极具挑战的任务,不仅涉及多方面异构知识的表示、抽取、推理和应用,还涉及包括自然语言理解在内的其他人工智能核心技术的综合利用。

简介与相关技术调研

目前,多轮对话聊天机器人已经产生了很多应用,有萌妹子小冰,有佛法大师贤二,也有应用在各行各业的智能客服。多轮对话聊天机器人,作为人工智能的典型应用场景,也是一项极具挑战的任务,不仅涉及多方面异构知识的表示、抽取、推理和应用(如语言知识、领域知识、常识知识等),还涉及包括自然语言理解在内的其他人工智能核心技术(如用户画像、对话管理等)的综合利用。



实现对话机器人常见的方法,可以从最简单的“关键字匹配”,到最前沿的深度学习“端到端生成”应答。分别应用到不同的场景:闲聊、任务(垂直领域)、问答(QA)。


设计一个聊天机器人

要想机器能与人产生对话,那么第一步,就必须先“理解”人说话的内容,对于机器来说,“理解”就是把自然语言转成具有结构化的表达。机器解析结构化表达的内容,根据知识库(可能是 QA 对、可能是 if-then 规则、可能是业务流程等)获取相应的回答。


如下图,一次对话,就是一个会话的接入,语义理解就是理解人说话的内容,应答引擎就是根据理解的内容做出的应答。


语义理解

1. 建立语言模型

因为人类语言的本质是为了传递人与人之间的信息(意思)。那么,我们可以定义出 N 种意思分类(意思的种类越多,机器人的理解能力越强)。所以,一个语言模型就是一个多标签的数学模型,把自然语言转成具有结构化的表达。有以下三个步骤:


1)文本预处理:切词、词向量、词义消解等(这里内容很大,不详细介绍)。


2)样本准备:抽取一些经典的发言,在我们的 myModel 平台进行标注。



3)序列模型:多标签模型,如下图就是一种 CNN 与 LSTM 组合的神经网络方法。



尽管已经在一个垂直的领域,而且看似简单的三步,但是要做一个好的语义理解模型,是非常难的,例如一个小改动导致预测结果差异,可分两种:


1)一种是句中的词语位置变了、辅助词变了,如:“这就是给我的回复?”与“你们就这么回复我?”。


2)一种是增加一些无关核心内容的词,如:“但是我后面没开挂都被制裁”与“但是我后面没开挂都被制裁我就想不通了”。


备注:增加更多有标注的样本量、基于大规模数据训练的模型(如 BERT 等)二次训练、神经网络增加 attention、结合知识库等,都是一些优化的手段。

2. 语言模型在系统中的应用

理解用户说话的意思,我们分为了三层:第一层,是理解当前聊天处于哪一个话题,有没有切换话题;第二层,是理解具体的内容,含有意图与实体;第三层,是理解当前发言的情感,跟踪用户的情绪变化。


1) 话题模型(Topic 模型)


在我们系统中,它是一个分类模型,与后面的应答引擎是有对应的关系,根据不同的话题,进入不同的业务流程,所以模型的标签的业务的分类。


2) 意图理解(Act-Slot 模型、Value 模型)


  • Act-Slot 模型


在我们系统中,它是一个多标签模型,相同一句话,不同的角度,有不同的理解。所以,模型的标签是意图与实体类型,如下图的“inform,QQ”。



例如,在具体的项目中,我们定义了:



  • Value 模型


在我们系统中,获取到用户发言的 Act-Slot 之后,根据 Act-Slot 的意图,得到其相对应的实体值。总共设计了三种方法以获取不同类型的 Value,方法如下:


  • 正则表达式:如抽取时间、等级等有一定格式的实体。

  • 词库对比:如安图恩等游戏专有词汇。

  • LSTM 模型:当句式中不明显表达实体时,将通过模型分到 6 类中:

  • ENV:涉及到电脑环境相关信息。

  • MAPID:涉及到地图相关信息。

  • ROLE:涉及到角色相关信息。

  • TEAM:涉及到组队相关信息。

  • LOGIN:涉及到登录相关信息。

  • EQUIP:涉及到装备相关信息。


备注:并非所有聊天机器人都这么设计,有些系统会把意图作为一个模型,实体与 value 作为一个模型。


3) 情感模型


在我们系统中,它是一个分类模型,把用户的发言分为了以下几种不同级别的情绪(标签):脏话、生气、平和、赞扬。

应答引擎

1. 定义业务描述语言

为了能快速接入各种服务,基于 XML 描述语言,定义了一套业务流程的描述语言。总共分为三层,最底层是基础流程控制单元,如分支 if、循环 while、顺序 sequence、并行 parallel;第二层,是每个话题都需要的通用组件,如询问 QQ 号、游戏名、情绪安抚等;最顶层是具体的业务应用服务,如装备找回流程、被盗处理流程等。



例子:获取 QQ 号与大区号流程。


2. 业务流程控制引擎

如下图所示,有 Task1 到 Task5,共 5 个业务流程(业务应用),这些业务流程可以使用上述描述语言刻画出来。而下图中涉及到的为上述语言的解析过程。


话题切换监听器:作为旁路分类模型,用于跟踪聊天话题的切换。以用户发言为输入,输出 1、2、3、4、5,分别代表 Task1,Task2 …. Task5。(用户每次输入,都会有一次判断,反映话题是否有变化与切换到哪一个 Task)


会话信息:表示在对话当抽取出来的上下文信息,局部信息表示在本 Task 可见,全局信息表示所有 Task 可见。


状态:表示 Task 运行状态。而流程中断的位置,并非所有位置都可以中断,如下图标记红点的是可被中断(当运行到有标记红的地方,就会请求“话题切换监听器”,当前是否有话题变化)。


  • 挂起:表示当前流程暂停(如下图,P2 表示 Task1 中的第二个点挂起)

  • 未激活:“-”表示该 Task 没有启动过。

  • 激活:Running 表示正处于该 Task 的流程中。

  • 结束:Close 表示该 Task 已结束。



备注:每一个红点的地方,都可能由于用户发言导致切换到另一个 Task 流程中。会话开始时,会根据“起始问题识别”,得到需要走哪一个 Task,作为起始 Task。在起始 Task 流程中,如果遇到红点的地方,并且话题切换监听到需要转到另外的 Task,刚切换到新的 Task 流程,新流程走完后再回到切换话题的断点处,继续原流程一直走完。

3. 一个业务流程例子

例子:假设有四个业务流程 Task,每个流程都根据流程控制单元画出相应的流程图。


  • Task1 为“处罚查询”流程。

  • Task2 为“处罚申诉”流程。

  • Task3 为“修改密码”流程。

  • Task4 为“实名验证”流程。


备注:每个 Task 都可以单独由“起始问题识别”触发,也可以如下例子嵌套对话。


TP 小天

对话是一种比网页或 APP 更自由的表达形式,用户有了主动表达诉求的空间,可以实现有别于网页或 APP 的一些特殊功能:用户安全教育、舆论监控、信息收集。


根据上述的机器人设计方法,我们设计了 TP 小天,用户可以通过游戏安全中心公众号,咨询游戏安全相关的信息。如下图所示,已经接入了处罚查询、申诉、举报、帐号冻结等游戏安全功能与话题。



在实战中,一个可运营的聊天机器人,还会涉及到很多其它的内容,如何提升语义理解的丰富性、大样本推荐标注、FAQ 应答、快速可配置修正、对话生成多样性、闲聊等等。


本文转载自公众号云加社区(ID:QcloudCommunity)。


原文链接:


https://mp.weixin.qq.com/s/36MbN7E1_8A7ODfMrZpPAA


2019-11-05 17:072736

评论

发布
暂无评论
发现更多内容

百度程序员开发避坑指南(前端篇)

百度Geek说

前端

一文简述:云原生架构的四个特征六个原则

穿过生命散发芬芳

4月月更

面向对象编程,你真正懂吗?

CRMEB

"三高"Mysql - Mysql备份概览

懒时小窝

MySQL 高可用 MySQL 数据库

后端开发【一大波干货知识】tcp/ip定时器与滑动窗口详解

Linux服务器开发

网络协议 TCP/IP 后端开发 Linux服务器开发 C++后台开发

图文并茂|彻底搞懂零拷贝(Zero-Copy)技术

深度Linux

内存管理 Linux内核 进程管理 嵌入式开发 设备驱动

恒源云(Gpushare)_如何加速从 GitHub 上克隆代码或下载文件?技巧大放送8!

恒源云

GitHub

如何为网站建立一个FAQ页面?

小炮

FAQ

硅谷区块链公司Espresso Systems因涉嫌知识产权盗窃被起诉

西柚子

基于 KubeVela 的机器学习实践

阿里巴巴云原生

fastposter v2.7.0 发布 电商海报编辑器

物有本末

海报 fastposter 海报生成器 海报编辑器 主图编辑器

pip:带你认识一个 Python 开发工作流程中的重要工具

华为云开发者联盟

Python 项目管理 pip 依赖关系 包管理器

王者荣耀商城异地多活架构设计

阿卷

架构实战营

资产设备信息管理系统的功能

低代码小观

资产管理 CRM 企业管理系统 CRM系统 企业设备管理

CentOS8安装erlang 和 RabbitMQ

阿Q说代码

4月月更 RabbitMQ安装 erlang安装

实践GoF的设计模式:单例模式

华为云开发者联盟

程序设计 设计模式 单例模式 GoF 共享实例

眼见为实,看看MySQL中的隐藏列!

码农参上

MVCC MySQL 数据库 4月月更

测试人员最佳测试管理工具

阿里云云效

阿里云 云原生 开发 测试管理 测试管理工具

厉害!我带的实习生仅用四步就整合好SpringSecurity+JWT实现登录认证!

沉默王二

Java

日志中台不重不丢实现浅谈

百度Geek说

后端

2022年IAA行业品类发展洞察系列报告:内容向APP及休闲游戏的突围

易观分析

IAA 休闲游戏

日志中台不重不丢实现浅谈

百度开发者中心

恒源云(Gpushare)_如何获取实例SSH端口号?技巧大放送7!

恒源云

服务器 终端登录

实例解析网络编程中的另类内存泄漏

华为云开发者联盟

TCP 网络编程 网络 压力测试 内存泄漏

多场景实现供应链可视化,小家电产业出海焕发新活力

数商云

产业数字化 供应链 供应链系统

局部变量是线程安全的,原因是什么?

华为云开发者联盟

线程 高并发 变量 线程安全 局部变量

如何满足一个前端对 Mock 的全部幻想

Liam

前端 Jmeter Postman Mock

一场由TiCDC异常引发的GC不干活导致的Tikv硬盘使用问题

TiDB 社区干货传送门

银行推进人工智能技术应用时需同步考量可信AI的评估与验证

易观分析

人工智能 AI

netty系列之:netty中的核心编码器bytes数组

程序那些事

Java Netty 程序那些事 4月月更

恒源云(Gpushare)_啥,还不知道咋关机?技巧大放送6!

恒源云

人工智能 GPU服务器

多轮对话机器人打造(上篇):着手设计_文化 & 方法_selinux_InfoQ精选文章