基于“三明治”结构的深度学习框架的金融反欺诈模型研究与应用

2019 年 12 月 21 日

基于“三明治”结构的深度学习框架的金融反欺诈模型研究与应用

金融行业业务的高速扩张也意味着风险指数的急剧上升,尤其在金融欺诈风险上,一项来自尼尔森 * 全球银行卡报告的数据显示:2016 年全球银行卡欺诈损失率已高达万分之 7.15。居高不下的欺诈率背后是传统风控方法在精准度和时效性方面面临挑战,金融企业迫切需要建立更新的智能风险防控体系。


经过多年演进,人工智能正进入一个新阶段。越来越多的企业在选择这一给人类经济与社会生活带来颠覆性影响的技术,将开启数字化转型的新篇章。在金融行业,尤为如此。当我们把目光投向金融行业风向标的巨头们,不难发现在过去的十余年中,这些行业引领者正将更多资金投入大数据、机器人和云计算服务领域,这些举措也受到投资者的热捧。


那么,AI 何以成为金融行业新的宠儿?究其原因,是因为 AI 与金融行业在诸多特性上天然契合。首先,AI 与金融都构建在海量的数据之上,这为 AI 的模型训练与预测推理提供了丰沃的数据土壤;其次,AI 可以有效降低传统金融行业用于客户关系维护的大量服务成本;同时,AI 也能帮助金融企业展开更多的精准狙击,进一步提升业务质量;而更为重要的是,拥有众多创新基因的金融业务与 AI 结合,可为行业带来更大发展空间,创造更多新的可能。


以银行为例,通过与 AI 融合,依托庞大的业务数据,以智能的方式驱动数据分析与预测方法创新,进而获得新的洞察,拥抱更为灵敏、高效的商业模式,并规避诸如贷款逾期、 违规欺诈等风险,在未来竞争中占得先机。金融行业业务的高速扩张也意味着风险指数的急剧上升,尤其在金融欺诈风险上,一项来自尼尔森 * 全球银行卡报告的数据显示:2016 年全球银行卡欺诈损失率已高达万分之 7.15。居高不下的欺诈率背后是传统风控方法在精准度和时效性方面面临挑战,金融企业迫切需要建立更新的智能风险防控体系。


金融行业面临的挑战


伴随金融业务的高速扩张,其风险指数也在不断上升。尤其在银行卡、信用卡等领域,欺诈损失率正随着欺诈损失金额的增长而逐年上升。因此,反欺诈正成为金融行业实施风控的重要方向。


在风险形式上,传统风险与新型风险也正相互交织。除了层出不穷的传统金融欺诈手段,例如信用欺诈、盗刷欺诈、恶意套现以及保险业骗保等,伴随互联网时代出现的个人信息泄露、钓鱼网站、欺诈黑产化等问题,也带来更高频化、精准化的金融欺诈犯罪。


金融反欺诈也在面临新的挑战,互联网时代的到来,令金融欺诈行为变得更高频化和精准化,层出不穷的欺诈行为给社会生活带来巨大不安,传统的反欺诈方法和模型亟待改进,以应对新的挑战。


此外,金融行业存在深层次交易特征学习能力不足的问题,基于规则和机器学习的金融反欺诈模型在对相对复杂的序列化交易特征进行学习时,效果低于预期,同时单一的深度学习方法也存在单笔交易内特征学习能力有限的问题。


为应对这些问题,各类金融机构也制定了众多缜密的反欺诈手段来予以反制。随着信息化技术的进步,尤其是 AI 技术的不断突破, 越来越多的 AI 能力正与金融风控系统相结合,构成更有效的反欺诈模型。


创新的“三明治”多层反欺诈侦测模型


传统上,金融企业与机构往往采用基于规则的方式来构建其风控反欺诈模型,其特征就是不断建立、更新基于用户行为特征的规则库。当交易发生时,系统会通过规则引擎来监测该笔交易潜在的风险。


例如一个常常出国的商务人士,在交易规则库中,他出现大笔海外交易行为是正常的,对于一个很少离开居住地使用信用卡的老年人,他的正常交易行为可能是小额、本地和多笔的特性,当其出现大额交易情况时,这一异常交易特征就会被规则引擎所匹配,并引起警觉。而当该账户屡次出现异地不正常大额交易记录,这个账户可能就会被风控系统列入监控范围,并实施后续的核查工作。


基于规则的风控系统固然有效,但其作为一种反向系统,需要规则库不断通过已有业务案例进行总结。这意味着用户每隔一段时间就要耗费大量资源来总结业务,更新规则。而随着业务场景的增多,交易规则复杂度也不断提升,使风控系统的资源消耗和监控时延持续增加。为此,金融机构开始尝试利用 AI 能力,构建更为高效的金融反欺诈模型, 这一 AI 能力建设依托于机器学习、深度学习等多种方法。


与基于规则的方法相比,AI 反欺诈方案具有更高的客观性及准确性,引人注目的点就是能够实施“对规则的自我学习”。通俗来讲,基于规则的方法是预先告诉系统,A 方法、B 方法是错的,错了就告警。而机器学习、深度学习方法则是将大量历史数据作为学习样本,并通过大量的计算单元进行训练,从而得到一个评估模型。当新的交易进入这一模型时,系统能自我判别交易的合法性。但在实际应用中,特征工程可能较为复杂,例如深夜在便利店,一张很久不用的信用卡突然出现大额支付行为,或者一个病毒性感冒患者长期频繁就诊并开具巨额药品。这里出现了“深夜”,“很久不用”,“便利店”,“病毒性感冒”,“巨额”等多种复杂特征,对传统机器学习的方法提出了挑战。


针对这一挑战,电子商务、电子支付国家工程实验室、英特尔三方工程师创新地提出 GBDT→GRU→RF 三明治结构欺诈侦测模型架构,通过多层学习的方法,规避序列化交易特征学习能力不足以及单笔交易内特征学习能力有限等问题。英特尔不仅为新模型提供了性能卓越的英特尔® 至强® 处理器产品家族作为动力源泉,也对模型中的三层方法分别提供了针对性的技术和工具优化,提升模型的整体工作效率。


模型简介 “GBDT—>GRU—>RF”三层架构如下图所示,首先,这一框架将针对单一深度学习方法 (例如 RNN)在单笔交易内特征学习能力上的不足,通过英特尔提供的 Analytics Zoo 工具, 在框架的前端引入 GBDT 模型进行特征优化,并将优化后的特征与人工特征相结合,作为 GRU 网络的输入,以此来学习序列间的特征,并且将单笔交易内的特征时序化。这一过程可以对数据实施有效的过滤,从而为后续的 GRU 模型提供真正有用的数据。



“三明治”结构反欺诈模型


在中间层,框架并没有直接使用 GRU 网络的输出作为直接的欺诈侦测判别,而是将其作为序列间特征学习的一环,将学习得到的序列间特征与原先的交易内特征相结合,形成最终交易特征向量,最后在此基础之上,为进一步地将时序特征进行融合学习。在框架的最后,这一架构还叠加了一个顶层的 RF 模型,作为最终的欺诈判别分类器。


软件栈 “三明治”多层反欺诈侦测模型软件栈如下图所示,底层是由英特尔® 至强® 金牌处理器(6000 系列)为基础构建的硬件基础设施。其上,是 RedHat* Linux 操作 系统(Centos7.4 Kernel 3.10.0-957.12.1.el7.x86_64),并由虚拟化软件创建虚拟机。虚拟机上部署了英特尔® MKL-DNN 或英特尔® MKL,并安装有面向英特尔® MKL-DNN 的优化的 TensorFlow1.10 以及英特尔® Python 分发包,在顶层部署了欺诈检测应用。



“三明治”多层反欺诈侦测模型软件栈


针对数据非平衡性的处理办法 数据非平衡性是反欺诈应用中经常碰到的问题。在一些场景中,欺诈样本和正常样本的比例高达 10 万~100 万比 1。基于这一数据不平衡状况,在采样和训练时,可以基于以下的原则:


  • 由于正常样本的数据量非常大,正常的采样就可以满足训练对于正常样本的需要;

  • 在训练的时候,把欺诈样本数据的权重提高。

  • 不同于图像和语音等数据容易重新标注的情形,欺诈数据很难被生成出来并被标注。

  • 所以我们还是采用随机打乱次序并多次训练欺诈样本,但却仅需单次使用正常样本,以便进一步解决非平衡的问题。


提升算法准确性的方法 - 不同方法组合的次序和准确性有相关性:


特征内提取特性的算法与特征间提取特性的算法进行结合时,不同的次序会导致不同的准确性,测试表明,在 2 个特征内提取特性的方法之间,加入特征间提取特性的方法所获得的准确性是最高的。


  • 三明治的结构使用旁路加强特征重用:


和 Densenet* 算法一样,“三明治” 结构也构建了不同方法之间的连接关系,这种使用旁路的方法,使其可以通过加强特征重用,来提升整体的训练效果。


从软件到硬件的全方位技术支撑


除了算法设计上的独到创新,GBDT→GRU→RF 三明治结构欺诈侦测模型取得的成功也离不开底层硬件设施提供的强大性能支撑。英特尔为模型提供了高性能的英特尔® 至强® 处理器产品家族,其不仅在内核、高速缓存方面表现优异,还以大量的硬件增强技术助力提升框架性能。例如英特尔® 高级矢量扩展指令集 2(AVX2)、英特尔® 快速通道互联链路(QPI)等。


而更新一代的英特尔® 至强® 可扩展处理器更是可以为框架的性能提供更强助力,这一处理器不仅在处理性能上远超上一代产品,更集成了英特尔® 高级矢量扩展 512(AVX-512)技术,其出色的并行计算能力正符合人工智能的需求,可在框架的运行过程中发挥重要作用。


除了处理器产品外,英特尔也为模型中的 GBDT、GRU、RF 三种方法提供了深入而有效的全方位优化方法和工具。


从模型到应用——以中国银联为例


背景


作为一家提供专业银行与支付服务,发卡量和交易量市场份额世界第一的金融机构,中国银联(以下简称“银联”)正不遗余力地引入 AI 技术能力,开展高效金融反欺诈模型的构建。在本案例中,中国银联与英特尔一起,共同开展基于深度学习的反欺诈技术研究。


通过结合在基于规则、机器学习等反欺诈模型中汲取的经验,中国银联基于 “三明治“结构的多层模型,以及基于英特尔® 架构的多方位优化,构建高效的欺诈侦测方案。目前,该方案已在伪卡 / 套现欺诈侦测等场景中进行了实测,并获得良好效果。


解决方案 中国银联采用 GBDT—>GRU—>RF“三明治”结构,构建了高效的反欺诈模型。首先,银联基于 Analytics Zoo 以及 Spark* pipeline 对数据进行流程化建模。通常地,AI 训练模型需要针对用户的每条交易和行为进行分析,即通过算法学习到每个持卡人的消费行为模式,去分析是否异常,并在发现异常交易行为时启动拦截动作,但这需要系统引入海量的交易数据。同时,训练模型要学习到用户的历史交易行为,每个人至少需要数百笔非正常交易数据供模型学习所用。


为此,银联基于 Hadoop* 构建了海量数据存储平台,并引入 Analytics Zoo 等来对训练数据进行流程化建模。针对学习历史交易数据不足的问题,利用建模过程,平台可从少量的原始字段中衍生出了几百个特征因子,归纳成当笔 / 上笔交易、长短时统计以及可信特征变量等 6 大维度,并通过这些特征工程来帮助模型进行更好的学习。而后,银联基于“GBDT—>GRU—>RF”三层架构模型,在上百个节点组成的训练集群上开展其反欺诈侦测模型的构建,并取得了良好的效果。


通过多方位的测评,全新的多层反欺诈模型无论是在召回率,还是在准确率方面都达到预期效果,与传统机器学习方法,或单一的 RNN 方法相比,F1 值(F1 Score,一种准确率和召回率的加权平均值,用于衡量侦测模型的性能表现)有了质的提升,超过了业务部署的临界点。


如图下图所示,左图中,与其他机器学习、深度学习模型,或者多层模型相比,GBDT— >GRU—>RF “三明治”结构反欺诈模型有着最优的精度 - 召回(Precision – Recall,PR) 曲线(最上部曲线为 GBDT—>GRU—>RF “三 明治” 结构反欺诈模型测试值)。在右图中,可以看出,随着数据非平衡率(Imbalance ratio)的增加,GBDT—>GRU—>RF “三明治” 结构反欺诈模型的 F1 值下降最为缓慢。



GBDT—>GRU—>RF “三 明治” 结构反欺诈模型评估效果


在完成流程化建模和多层反欺诈侦测模型构建后,银联将其进行了封装和整合,并以 API 接口的方式提供端到端的智能分析解决方案,从而更好地为业务人员提供服务。如下图所示,用户通过 API 接口等方式提供入参,即可获得经过智能模型运算分析后的结果指标。以三明治结构的欺诈侦测模型为例,其可以为伪卡、套现等欺诈侦测场景提供底层模型支撑,而业务人员则不需要深入研究这些复杂的模型,只需要根据数据规范调用上层 API 即可。



中国银联电子支付研究院智能分析服务平台架构图


在银联的训练集群中,全部采用了基于英特尔®至强®处理器的平台。该平台不仅在内核、高速缓存等方面表现优异,而且能以多项硬件增强技术助力提升框架性能。除了基本的计算能力支撑,平台还为银联 AI 反欺诈模型的构建提供了以下能力:


  • 支持高度不规则的计算,如树构建、熵计算、树遍历、缩减等;

  • 支持常规计算,如 GRU、非线性激活、 批处理规范化等。


同时,英特尔®至强®处理器 / 英特尔®至强®可扩展处理器所集成的英特尔®高级矢量扩展 512(英特尔® AVX-512)技术,为银联“三明治”结构反欺诈模型提供了出色的并行计算能力。


英特尔的优势分析


针对基于机器学习的方法对序列化交易特征学习能力的不足,以及单一深度学习模型对单笔交易内特征学习能力的限制,银联联合英特尔提出多层机器学习 + 深度学习模型,以技术创新大幅提升反欺诈模型的性能。


在这一创新过程中,英特尔不仅为这一新型的反欺诈模型提供了高性能处理器产品作为算力引擎,还提供了多样化、可扩展、全方位的技术支撑,为三明治结构欺诈侦测模型中每一个层面所用的方法,都提供了有针对性的优化手段和工具,从而帮助整个反欺诈模型进一步提升了效率。


基于英特尔®至强® 处理器 / 英特尔®至强® 可扩展处理器的硬件平台为中国银联反欺诈模型成功构建、应用提供的强劲算力,以及英特尔提供的多项优化措施,用户在未来也可选择性能更强、在 AI 领域有着更多优化方法的第二代英特尔® 至强® 可扩展处理器等更新硬件产品,来构建其性能更优的解决方案。


以上内容均摘自英特尔中国金融行业 AI 实战手册,如果想了解更多更详细内容,请点击【阅读原文】,下载金融行业 AI 实战手册。


想了解更多 AI+ 金融行业的实战经验,欢迎扫描下方小助手二维码,备注:公司 + 职位 + 城市,加入金融科技实战交流群



2019 年 12 月 21 日 15:45490
用户头像

发布了 123 篇内容, 共 33.4 次阅读, 收获喜欢 139 次。

关注

评论 1 条评论

发布
用户头像
金融行业欺诈问题严重,如何解决?英特尔提供了一种思路。
2020 年 01 月 03 日 14:03
回复
没有更多评论了
发现更多内容

redis数据结构介绍三-第三部分 整数集合

Nick

redis 源码 数据结构 源码分析 算法

工作时间都去哪儿了?

伯薇

效率 时间管理 个人提升 团队

程序员陪娃漫画系列——排队问题

孙苏勇

程序员 生活 程序员人生 陪伴 漫画

web集群架构

桥哥技术之路

二、基于 Dockerfile 构建并运行镜像

悟尘

Docker Kubernetes 容器 k8s Compose

忆秦娥·记游(三)

轩辕御龙

开发机直连Docker中的redis容器小案例

麦叔

redis Docker

三、基于 Docker-registry/Nexus3 搭建本地仓库

悟尘

Docker Kubernetes 容器 k8s Compose

初入响应式编程(下)

CD826

spring 微服务 响应式编程 reactor

从翻译到本地化:我在Airbnb做本地化经理的经历

葛仲君

产品 翻译 Airbnb 本地化 全球化

redis数据结构介绍二-第二部分 跳表

Nick

redis 源码 数据结构 源码分析 算法

如何学习区块链技术

Kaichao

比特币 区块链 以太坊

西江月·记游(一)

轩辕御龙

音视频已强势崛起,我们该如何快速入门音视频技术?

音视频专家-李超

音视频 WebRTC ffmpeg 在线教育 音视频会议

回"疫"录(6):致敬最美逆行者

小天同学

疫情 回忆录 现实纪录 纪实 创新突破

Make Tmux Great Again

ccx

tmux

记游(四)

轩辕御龙

多人实时互动之各WebRTC流媒体服务器比较

音视频专家-李超

WebRTC 在线教育 音视频会议 mediasoup janus

B站、Quora、InfoQ,哪个的阅读/播放量会先到10W+?

赵新龙

写作平台 B站 Quora

我认为“写作平台”还缺少读者

小天同学

产品 反馈 写作平台 建议

一、Docker基础入门及架构介绍

悟尘

Docker Kubernetes 容器 k8s Compose

Istio 1.5:对开发人员有什么帮助?

麦叔

云原生 istio servicemesh

Java并发编程系列——Fork-Join

孙苏勇

Java Java并发 并发编程 线程

没有永恒的技术,只有适合的技术

码闻强

技术 个人成长 职业规划

最通俗易懂的H264基本原理

音视频专家-李超

音视频 WebRTC ffmpeg 音视频会议 H264

Flink Weekly | 每周社区动态更新

Apache Flink

大数据 flink 流计算 实时计算 大数据处理

Netty系列之源码解析(一)

猿灯塔

Netty

废掉一个人最好的办法是让他忙到没有时间思考

熊斌

程序员人生 职场 思考

广告与数据算法系列1.1.1: 什么是广告

黄崇远@数据虫巢

互联网 算法 广告

菩萨蛮·记游(二)

轩辕御龙

四、Docker 网络原理、分类及容器互联配置

悟尘

Docker Kubernetes 容器 k8s Compose

基于“三明治”结构的深度学习框架的金融反欺诈模型研究与应用-InfoQ