写点什么

京东 618:智能机器人 JIMI 的进击之路

  • 2017-06-17
  • 本文字数:2784 字

    阅读完需:约 9 分钟

ArchSummit 全球架构师峰会深圳站将于 2017 年 7 月 7 日~8 日在深圳·华侨城洲际酒店召开,大会设置了相关专题来深入解读电商大促背后的技术故事,大会还邀请了 eBay、WalmartLabs 等国外顶尖技术专家,分享 AI 促销、搜索引擎、异地多活、库存物流等核心架构实践。

目前,人工智能正在以前所未有的姿态汹涌而来,快速杀入人们的视野。京东一直致力于用技术驱动业务成长,全面提高用户体验,基于对未来客服人力成本可能的提升,以及人工智能技术的发展趋势,早在 2012 年,京东就决定研制智能机器人以应对业务不断拓展带来的客服成本和压力。

JIMI 的发展:智能进化,全面拓展

2012 年 JIMI 顺势诞生,初期以售后服务为主,14 年 5 月开放售前服务,逐渐拓展到移动端、微博、微信等多平台端口,为用户提供推荐商品、告知优惠、砍价、下单、直接支付的售前全流程闭环体验,让用户可以边咨询边购物,成为用户贴心的购物助手。同时,我们也将智能机器人拓展到各个业务层面,店铺 JIMI、京东金融 JIMI、京东到家 JIMI 相继诞生,此外,我们还将 JIMI 的服务能力平台化,推出了 JIMI 开放平台,接入长虹、华西等外部企业。

在这全面应用和不断推广的过程中,JIMI 也为京东商城节约了数千万的人力成本。日接待量高达百万次,覆盖京东 10 亿 + 的商品,应答准确率 90% 以上,用户满意度高达 80% 以上,减少客服压力的同时为用户提供更好的服务,也帮助外部企业也减少了至少 50% 的人力成本。

JIMI 产品技术体系揭秘

JIMI 整体产品架构如下图所示:

目前 JIMI 推出的覆盖全平台的用户端产品,商家和企业一旦启用,也就将 JIMI 的能力赋能给商家和企业,让商家和企业可以定制自己的智能机器人。JIMI 在多领域多终端以拟人化的交互体验为用户进行服务,多领域语义识别、情感分析和领域知识图谱等能力是 JIMI 的核心。基础平台支撑起 JIMI 服务能力,让 JIMI 可以快速高效进行数据标注、清洗、挖掘,以及模型训练等。

为了更灵活高效的支撑 JIMI 产品发展路线,在技术上 JIMI 采用了平台服务化架构技术体系,如下图:

从上到下,顶部展示的是目前 JIMI 支撑的所有业务场景,包括:京东自营业务的导购、售后和虚拟业务,京东 POP 店铺机器人,京东金融机器人等。其下,是统一接入层。界面按照终端接入组件化思路,所有界面交互统一把交互和展示逻辑封装,按照 Web(PC)、SDK、M 页面分三类。前后端数据交互通道,浏览器走 HTTPs 和 WebSocket 方式,移动 SDK 走 TCP 方式,若是服务端接口,走京东内部标准化 JSF RPC 方式。这样就整合了所有来自不同终端不同业务场景机器人请求,所有请求统一转发到“调度引擎”服务进行请求调度分发。

“调度引擎”相当于一个请求路由服务,根据终端机器人请求类型的不同,会调度分发给后端不同服务流程处理。后端的服务整体分为“算法”、“工程”、“数据”三类。对于聊天机器人来说,“算法”是大脑、“工程”是躯体、而“数据”是血液。下面,分别简单介绍下三类服务的作用与协作方式。

“工程”是系统的躯体,它负责了在线问答请求各服务的内部流转,如下图所示的服务交互流程:

“算法”是系统的大脑,它的核心是自然语言处理(NLP)。NLP 负责对用户的问题进行分析并产生答案,包括:用户的意图识别,关键词的识别、歧义分析等。对于问答机器人而言,语言理解的关键在于用户意图识别。当用户存在明确意图时,结合相应商品等信息就能给出准确的答案。在实际应用中,意图识别往往看作机器学习的多分类问题。

为了让 JIMI 更精准地理解用户的提问,从而给出针对性更强的回答,2015 年,京东成立 DNN 实验室(深度神经网络实验室),将 NLP 和 DNN 进行结合,这种新算法具有一定的上下文识别能力,相对于传统的分类算法,会更准确。

我们只要将京东客服能够回答的问题归纳成一个个的业务点:如退换货相关、运费相关、商品属性相关等。意图识别需要做的就是对用户问题进行分类,决定用户意图到底是在哪一个业务点上。即分类模型输入为用户问题,输出为当前咨询所属业务点。在引入深度神经网络模型后,JIMI 意图识别整体准确率由原先的 76% 提升至 84.1%。在命名实体识别(关键词识别)环境上,结合深度神经网络,JIMI 抽取用户问题关键信息的准确率比传统方法提高了 6.6%。这也是 JIMI 与其它同类产品的本质区别。

意图识别模块除了分类外,后续的维护工作也相当重要。一方面需要优化当前的分类效果,解决线上的 bad case;另一方面随着时间迁移,会出现新的业务点,用户提问方式也会发生改变。我们的分类模型也需要随之做出调整。为了减少人力,做到模型自学习,还需要引入线上数据收集模块,整个意图识别框架如
下:

这样线下和线上的工作联动运作,就能保证 JIMI 的意图识别不断优化,跟得上业务的不断升级。

“数据”是系统的血液,其架构体系如下:

数据经过采集(采集方式包括:SDK、HTTP 和事件采集)、预处理、数据格式校验,通过传输通道(JMQ、Kafka 消息队列异步传输、HTTP 同步传输)进入数据存储层。通过建立的元数据进行实时或者离线加工处理,并建立索引服务,供查询搜索使用。对于清洗后的数据,进行数据聚合,供机器学习语料训练;并提供数据自助查询,报表展现。能支撑 10 亿级数据实时上报,做到秒级延迟、秒级查询,提升了 JIMI 的应答效果。

用户画像也是 JIMI 重要的技术手段之一,目前我们主要致力于挖掘用户与用户、用户与商品之间的深层次联系,通过深度学习、大数据处理等核心技术,建立起复杂的用户、商品特征关联网络,用于精准的刻画用户特性。我们把每个用户的特征,都加入到模型的训练和预测中,比如根据画像数据,当前用户是有小孩的,且历史有过购买奶粉的记录,那我们预测时就会结合用户画像特征,推测用户可能会问奶粉购买相关的问题,并直接将问题展示出来供客户点选,用户点击感兴趣的问题进行咨询即可。

JIMI 的未来:全能的智能 AI 与开放的平台

前不久,AlphaGo 对战柯洁获全胜的新闻引起了大众的广泛讨论,对于 JIMI 是否会像 AlphaGo 一样在某些方面进行训练,以达到人类水平或超过人类这个问题,我们已经可以说,JIMI 在一些品类的客服满意度已超过人工客服。目前在日常情况下,JIMI 的接待量已与人工客服接待量持平,大促期间甚至会超越人工客服。

未来 JIMI 也会继续不断进化,除客服行业,也会积极拓展其它领域的深度学习,提升服务质量,推动人工智能技术成长。同时,我们也会通过我们的人工智能开放平台,给不同行业的商家或机构提供智能咨询服务解决方案,让智能 JIMI 的身影能够进入各个垂直领域,实现京东技术能力的开放与经验共享。

作者介绍:

刘丹,京东智能通讯部总监,京东深度神经网络实验室(DNN-Lab)核心成员之一,资深电商专家。在实时通讯、测试架构、稳定性框架、智能电商服务等领域均有涉猎,精通业务通用 性架构、用户行为、智能客服、稳定性提升等多项理论及实践,京东咚咚、智能聊天机器人和无人客服系统研发负责人。

2017-06-17 20:309687

评论

发布
暂无评论
发现更多内容

一文理解布隆过滤器和布谷鸟过滤器

京东科技开发者

Schema Free

DashVector

人工智能 大数据 AI 向量检索 大模型

白话文讲解大模型| Attention is all you need

阿里技术

架构 Transformer 大模型 LLM 白话文

人工智能 | 文生图大模型

测吧(北京)科技有限公司

测试

探讨拼多多商品 API 接口:运用及收益

科普小能手

API接口工具 API 接口 API 测试 pinduoduo API 拼多多API

小间距LED显示屏,我们还可以了解哪些

Dylan

LED显示屏 全彩LED显示屏 led显示屏厂家 户内led显示屏 市场

glibc 内存分配与释放机制详解

vivo互联网技术

开源 glibc 内存管理 内存泄漏

压力测试,探索服务器性能瓶颈

测试人

软件测试

如何用CST自带宏提取材料的DK,Df值

思茂信息

cst cst使用教程 cst电磁仿真 cst仿真软件

云计算与低代码:实现无缝集成与高效部署的最佳实践

天津汇柏科技有限公司

云计算 低代码

腾讯云AI代码助手

全栈若城

HyperWorks的实体几何创建与六面体网格剖分

智造软件

Hypermesh 仿真分析 有限元

在使用Alt+Tab切换程序时 Windows 11 24H2会出现黑屏

吴脑的键客

windows Windows 10 Windows11

融云「北极星」专业版:指标异常及时告警,趋势变化预先知悉

融云 RongCloud

融云:社交泛娱乐出海机会尚存,跨境电商异军突起

融云 RongCloud

GreptimeDB 首位独立 Committer Eugene Tolbakov 是怎样炼成的?

Greptime 格睿科技

开源 时序数据库

条件过滤检索

DashVector

向量检索 大模型 向量数据库

第73期 | GPTSecurity周报

云起无垠

全域身份管理是IAM的重要发展方向

芯盾时代

iam 身份和访问管理 统一身份管理平台

百度沧海·存储统一技术底座架构演进

百度Geek说

创元集团携手火山引擎,数据飞轮驱动美妆品牌数字化转型

字节跳动数据平台

大数据 数智化转型 数字化平台 企业 AI 应用

从微笑曲线底端崛起 ,中国县城工厂走向“新质供给”

Alter

数字化落地过程中的研发效能治理如何开展?

思码逸研发效能

DevOps 研发管理 绩效管理 研发度量 研发效能度量

阿里云 DataWorks 正式支持 SelectDB & Apache Doris 数据源,实现 MySQL 整库实时同步

SelectDB

数据库 大数据 数据分析 数据迁移 整库同步

Agent 智能体开发框架选型指南

Baihai IDP

程序员 AI 智能体 Agents

袋鼠云港口数智化解决方案发布,数智引领,加速“智变”

袋鼠云数栈

JinaCLIP×Milvus:手把手教你搭建多模态RAG系统

Zilliz

多模态 rag clip模型 jinaclip

Netty 如何自动探测内存泄露的发生

bin的技术小屋

内存泄露 Netty 内存泄露检测 netty内存管理 Java.

GreptimeDB v0.9 重磅发布|引入日志存储引擎,支持日志指标数据联合分析!

Greptime 格睿科技

云原生 时序数据库

【EMNLP2024】面向长文本的文视频表征学习与检索模型 VideoCLIP-XL

阿里云大数据AI技术

人工智能 自然语言处理 阿里云 论文 EMNLP

【JIT/极态云】技术文档--模型简介

武汉万云网络科技有限公司

低代码 开发工具

京东618:智能机器人JIMI的进击之路_语言 & 开发_刘丹_InfoQ精选文章