写点什么

天盾风控 3.0 系统剖析及 618 总结

  • 2020-03-22
  • 本文字数:2213 字

    阅读完需:约 7 分钟

天盾风控3.0系统剖析及618总结

天盾风控系统简介

天盾是保障京东商城及金融主要业务安全运行的风控系统,已接入业务场景达 200 多个,主要接入场景类型如下:


  • 授信安全

  • 支付业务

  • 营销系统

  • 账户安全

  • 支持各种验证方式


1、天盾风控系统架构


接入的业务系统调用天盾时,天盾实时获取指标,指标通过指标加工系统生成,系统根据指标实时计算风险结果,返回上游系统。



2、天盾内部系统


  • 设备指纹


针对京东 PC 及 H5 页面采集设备信息报送天盾。


  • 食蚁兽系统


食蚁兽系统是风控实时统计平台,适用于各种流式计算,可进行高密集,多维度,可伸缩,配置灵活的复杂计算的统一平台。


  • 天盾引擎


天盾风控实时计算引擎,实时收集计算指标,并根据指标执行规则和模型,生成实时风险结果返回上游系统 。

天盾系统历史版本

1、天盾 1.0 系统


前身为京东白条风控,2015 年初上线,主要覆盖 10+种业务场景。使用 Groovy 语言,原子规则,规则包,试用设备指纹。


  • 规则决策关系


原子规则:原子规则是最小粒度的规则单位,是基本指标计算。



规则包(决策):不同原子规则的组合,根据规则包(决策)的命中情况返回上游结果。



  • 内部结构


上游系统调用天盾引擎后,引擎获取该业务的规则包,并解析规则,并行运行原子规则,最终获取结果返回收银台。



2、天盾 2.0 系统


  • 2.0 系统特点:

  • 规则改用 java 语言,2015 年底试运行,2016 年初上线

  • 加入维度概念,所有规则都被放在固定的维度中,所有决策围绕维度进行配置

  • 接入京东金融多种支付方式;多种不同订单业务;近 200 个业务场景

  • 全场景使用设备指纹

  • 加入食蚁兽

  • 入模型,模型与规则并行

  • 密码支付,指纹支付,无密支付,短信支付

  • 规则决策关系


2.0 系统添加了维度的概念,规则脚本是原子规则的组合,通过维度与得分来表示一个规则脚本。




决策是维度得分的组合,其实就是脚本的组合,根据决策的命中结果返回上游系统。



  • 天盾 2.0 内部结构



3、天盾 2.0 系统存在问题


  • 维度问题:系统中的维度未起到实质性作用,无谓消耗了系统运行时间并增加了配置复杂度

  • 原子规则配置混乱:针对重复性原子规则,不同场景参数要重新配置,参数配置问题查找困难,原子规则重用配置性比较差

  • 随着规则的不断增多,系统运行时间不断增加,难以达到业务的需求,急需设计新系统,提高系统的性能,降低系统响应时间

  • 2.0 系统性能问题


随着规则的不断增加,主要交易场景性能已经无法满足业务需求



  • 往年大促前的准备工作


和业务方一起梳理规则,主要方法如下:



为应对大促的到来,保证系统的响应时间,需减少一半以上规则。带来问题主要是规则的覆盖度更粗,影响的范围更大,增高了加验率和拦截率,误命中或漏命中的概率更大。

天盾 3.0 系统

1、天盾 3.0 系统


  • 针对原有天盾 2.0 系统配置复杂,规则数量迅速增加导致的系统性能过慢的问题,制作天盾 3.0 系统,解决性能问题和易用性问题

  • 2017 年 1 月开始开发,3 月底试运行,4 月下旬正式上线


2、设计前思考及实现


思考: 如何构建快捷高效的系统?


  • 流程上是否可简化?

  • 系统内部组件关系设计是否合理?

  • 可否减少系统内部的无谓损耗?

  • 系统是否简单易用?


从以上几点考虑着手设计实现天盾 3.0 系统


  • 天盾 2.0 系统流程上是否可以简化?



针对原子规则的获取可以提前计算并预热保存,针对获取决策结果可在单个原子规则执行完毕后提前获取,下图为 3.0 系统简化流程后的新流程:



  • 系统内部组件关系设计是否合理?


2.0 系统内部组件关系



在天盾 2.0 系统中,维度和维度得分未起到实质作用,只是增加了配置和运行复杂度,在 3.0 系统中去除了维度,重新定义原子规则,规则脚本,与决策的配置关系,下图为天盾 3.0 决策配置关系



使用脚本 id 代替维度及维度得分,决策只支持”与”的逻辑关系,上图中根据优先级获得的原子规则为 4,5,1,2,3。


另外从执行完所有原子规则后生成决策结果,变为根据原子规则结果实时生成决策结果。若原子规则 1,2,3,4,5 的取值如下图,则生成决策结果如下



根据决策优先级,决策 2 命中返回结果。


  • 可否减少系统内部的无谓消耗?



在 2.0 系统中,上面几个原子规则会并行执行,并对 jsfA,hbaseA,redisA,jsfB 重复调用多次,产生了无谓消耗,在 3.0 系统中,保证对重复性的查询只查一次



另外在 3.0 系统中,根据规则查询数据的情况,对简单内存计算同步执行,减少多线程执行的消耗,上图中 ruleE 没有查询远程数据,因此只会同步执行


  • 系统是否简单易用?


系统实现对客户要具有良好的使用体验和较小的学习成本。


3、3.0 系统上线后的实际性能情况


同场景同策略条件下天盾 3.0 性能比 2.0 提升近 200ms,如下:


升级前天盾 2.0 主要场景性能



升级后天盾 3.0 主要场景性能


天盾 3.0 系统 618 大促

1、618 大促前准备工作


  • 迁移天盾最主要场景到天盾 3.0 系统


天盾 3.0 上线后系统性能有显著的提升,为保证天盾最主要业务的性能,在已接入的 200 多个业务场景中,选择最重要的业务场景策略迁移至天盾 3.0 系统。


  • 对迁移场景后的天盾 3.0 进行压测

  • 对单一业务压测:


对天盾系统中调用量最高,规则数量及复杂度最高的场景分别进行压测:



  • 对以上业务进行同时组合压测:



以上压测均按最大策略数量进行,系统性能良好,按压测情况 618 无需再像往年大促需要下线规则。


2、618 期间系统实际运行情况



  • 618 零点主要支付场景 1 性能


策略数量是去年双 11 的 2.5 倍以上,性能依然有所提升




  • 618 零点主要支付场景 2 性能


策略数量是去年双 11 的 3 倍以上,性能依然有所提升




从 1.0 到 2.0,再到 3.0,天盾的版本更新见证了京东的飞速发展,相信随着业务进一步高速发展,天盾系统也将不断的迭代优化以满足需求,我们将继续努力,做好京东的保护盾。


2020-03-22 21:061959

评论

发布
暂无评论
发现更多内容

网络模拟器:Cisco Packet Tracer 设备登陆实验

生产环境全链路压测建设历程 23:FAQ 3、4 适配改造,目标压力

数列科技杨德华

全链路压测 七日更

架构师训练营第一周作业

Mark

甲方日常 77

句子

工作 随笔杂谈 日常

腾讯T2手把手教你!字节跳动历年校招Android面试真题解析,含BATJM大厂

欢喜学安卓

android 程序员 面试 移动开发

阿里P8大牛亲自讲解!Android高级工程师面试实战,Android岗

欢喜学安卓

android 程序员 面试 移动开发

总结2020:5个月出版两本书,日更公众号是一种怎样的体验?

冰河

程序员 程序人生 年终总结

10次面试,2份offer —— 大龄程序员 2020 求职记录

escray

面试 架构师训练营第 1 期

我对2021的期待,从合上这份2020日历开始

脑极体

小说内容理解

DataFunTalk

AI 推荐系统

“让专业的人做专业的事”,畅捷通与阿里云的云原生故事

阿里巴巴中间件

云计算 云原生

Serverless 在 SaaS 领域的最佳实践

阿里巴巴中间件

阿里巴巴 中间件

全面 Severless 化只需要 7天!看南瓜电影的云上升级

阿里巴巴中间件

阿里巴巴 中间件

开设赌场的CTO | 法庭上的CTO(23)

赵新龙

CTO 法庭上的CTO

58同城风控平台演进

DataFunTalk

架构 中台

史上最全面‘java监听器’解读,读完就能用进项目

Java架构师迁哥

时空大数据与智能技术的时代共舞,百度地图给2020的答案

脑极体

鸟枪换炮,利用python3对球员做大数据降维(因子分析得分),为C罗找到合格僚机

刘悦的技术博客

Python 数据分析 特征选择 降维

工具词典:中立观点

lidaobing

维基百科 28天写作

阿里P8大牛亲自讲解!6年菜鸟开发面试字节跳动安卓研发岗,成功收获美团,小米安卓offer

欢喜学安卓

android 程序员 面试 移动开发

犯”集资诈骗罪“、二审判6年的CTO | 法庭上的CTO(21)

赵新龙

CTO 法庭上的CTO

天下武功,唯”拆“不破之架构篇二 | 技术人应知的创新思维模型 (9)

Alan

架构 技术 技术人应知的创新思维模型 七日更 28天写作

十大经典排序算法最强总结(含Java、Python码实现)

Java 面试 算法

被砍伤的技术VP | 法庭上的CTO(24)

赵新龙

CTO 法庭上的CTO

云原生架构-静态代码扫描SonarQube超时

云原生实验室

DevOps 云原生 jenkins SonarQube Pipeli

互联网大厂有哪些分库分表的思路和技巧?

冰河

分布式数据库 分库分表 分布式存储 数据一致性 数据同步

侵犯著作权、判刑两年半的 CTO |法庭上的CTO(22)

赵新龙

CTO 法庭上的CTO

2020盘点之手机失窃事件复盘分析

石君

信息安全 资金安全 手机失窃

百分点智能对话技术探索实践

DataFunTalk

AI

散布消极言论被开除的总监 | 法庭上的CTO(25)

赵新龙

CTO 法庭上的CTO

C语言编程:入门指南(一周内学懂)

计算机与AI

c

天盾风控3.0系统剖析及618总结_文化 & 方法_京东数字科技产业AI中心_InfoQ精选文章