QCon全球软件开发大会8折优惠倒计时,购票立减¥1760!了解详情 >>> 了解详情
写点什么

业务安全解决之道:爬虫、扫号、羊毛党、垃圾注册...

2020 年 4 月 23 日

业务安全解决之道:爬虫、扫号、羊毛党、垃圾注册...

作为国内第一大 OTA 企业,业务安全一直是携程所面临的重要安全风险之一。

在面对各类从散兵作战到越来越专业化的黑产,以及技术从单一到持续自动化的工具化下的攻击时,我们也根据不同的业务安全风险,建立了相应的系统进行防护,并和黑产进行持续的技术和思维上的攻防。

其中经历了从业务驱动技术(被动式防御),到技术驱动业务(主动式防御)的过程,不断结合新技术的应用,新系统的开发以及注重用户体验和安全的平衡,并最终关注用户安全感知,不断完善业务安全的各方面,为用户提供一个安全、可信的环境,同时减少企业在安全上的损失。


一、携程业务面临的四大安全风险

携程的业务当前面临了大多数互联网企业都面临的相关业务安全风险:


1、垃圾注册,但发现有较多难点:手机号码;秒拨 ip;行为工具化;打码平台等;


2、扫号也是重大安全风险之一,威胁账号安全的关键点:资金盗用;信息泄漏;恶意欺诈。同样发现也有很多难点如:IP 使用量巨大,可以做到 1 号 1IP;使用外部社工库,密码正确率高;可以根据安全措施及时更换策略;设备指纹基本伪造,无明显特征;


3、薅羊毛(羊毛党)是当前电商,金融类公司重大的安全风险。对企业产生较大影响,包括影响活动实际收益和到达率;侵占有限的活动资源。发现难点:牟利方式多样化,各种形式组合;模拟真人或直接真人操作;黑色产业链发达,集团化模式;


4、爬虫,企业的价格策略被掌握;扰乱 PV/UV,无法做出正确营销判断;发现难点:频次低,特征不明;不会对业务方造成明显感知;


二、业务驱动技术

面对上述四大业务风险,携程设计了三大系统进行应对。


1、统一验证码


各应用验证码难度解耦;自动调节难度和类别;各参数独立可变配置;服务响应在 10ms 之内;


系统概况:


应对场景:扫号,薅羊毛,接口遍历;


效果:数字英文易识别成本低,中文输入成本高;


体验:用户每天需要一定时间输入,英文数字在 5s 左右,中文大于 10s;


成功率:成功率优化后保持在 90%;


架构图:



后端验证码配置界面:



问题:类别单一,易于破解(机器识别,人工打码);体验较差,输入验证码时间长;识别率存在上限;


2、风控系统


实时配置规则;异步响应;A/B testing


系统概况:


应对场景:扫号,薅羊毛;


效果:日均响应请求 1000w+次;


性能:平均响应耗时 5ms;


系统架构图:



风控系统配置界面:



问题:非实时响应;非多参数响应;无法支持多数据源;规则引擎服务写死


3、风险数据平台


基于离线规则运算;数据迭代,分钟级别计算结果;与外部黑产数据结合;


系统概况:


应对场景:垃圾注册,扫号,薅羊毛,爬虫;


对扫号进行实时拦截,目前成功账号/IP 已经达到了 0.7:1;


反爬主要提供对恶意爬虫的检测,经过 A/B 测试日均拦截爬虫行为 10w 次;


薅羊毛和异常注册识别月均识别超过 10w 次;


案例:



2016 年 7 月 27 日早晨 10 点 17 分,出现大量异常登录请求,风险数据平台在 10 点 25 分发现异常,迅速介入,10 点 45 将异常登录请求降低到十位数,在 11 点降低到个位数,对方此时发现无法绕过,直接放弃本次扫号。


本次事件持续 40 分钟,平台发现异常并介入使用了 8 分钟,随后 20 分钟进行了中文验证码干预,效果比较明显,且无需人工进行干预,实现了快速全自动化响应,让扫号无所遁形。


问题:Sql+DB;数据量瓶颈;运算效率


三、技术驱动业务

携程的业务安全实践,通过业务驱动技术,解决了相关问题的同时,也带来了一些系统上的瓶颈,并在业务的快速发展和攻击者的不断更新中,呈现了不少问题。为此,我们也正在寻求一条新的道路:技术驱动业务,来更好的支持业务,从被动到主动。


1、新的系统架构




数据层:


数据层负责对各种结构化以及非结构化数据进行统一的数据收集,清洗,预处理操作。目前来说,这种清洗注重点一般在区分正常用户和异常用户的注册,登录到账户各种重要操作,浏览 PV 数据,到最后购买旅游产品的一个行为区别,以及用户存在是否批量操作的相关数据抽取,这也被称为用户的社交网络区分。


规则引擎层:


规则引擎层负责将清洗及预处理完成的数据,使用实时流或者迭代作业按照定义好的规则或者模型进行数据计算,将计算完成的数据,存放在数据仓库内,以供分析层或者应用层调用。


分析模型层:


分析模型层负责将目前已有的清洗完成以及计算完成的结果数据再清洗和归类,进行后续的规则分析,补充,调整,模型的建立,以及离线+实时评分卡的数据权重比例调整等。


应用层:


应用层主要负责将综合得到的实时+离线的评分卡形式的得分结果通过 SOA 接口返回给业务方,告知业务方请求是否存在风险,并提供操作建议,同时会将相关请求数据全部记录,以供后续分析。


系统优势:


  • 支持各类不同源数据方式,DB,api 接口,kafka 消息等

  • 支持分钟级到年的离线海量数据计算,支持 storm 流式和 hive 离线方式

  • 实现比 drools 更优化的实时规则引擎计算逻辑,支持实时配置及四则运算,评分卡等

  • 高效的计算效率,千条规则毫秒级响应,整体接口内部平均响应 10ms 内

  • 分层架构设计,灵活应用 spark,impala,presto 等新技术的引入

  • 账户安全,反欺诈,反爬,接口防刷均可以使用规则引擎实现防护,能在各类场景应用


2、新的产品化验证码服务架构


主要涉及 bu 前端 js,验证码后端服务及 bu 后端,其中 bu 前端 js,验证码后端均是业务安全开发,作为一个产品化的产品推广到 bu 后端接入,bu 后端只需要监听 js 事件及验证码的校验,大大减少的 bu 的开发量工作,并简化了相关流程,风控和验证码在一个流程中实现。同时 js 也兼顾其他相关功能,大大提高了安全防护能力。



3、体验和安全性更好的滑块和选字验证码


在图片验证码体验的瓶颈及安全性防护的提升角度,安全开发了 2 类新的验证码:滑块和选字验证码,从兼顾体验和安全性出发,同时也使用了上面的架构,引入了风控进行防护。滑块在测试中,用户输入在 1~2 秒左右,大大提高了 4 位验证码的体验。选字验证码则兼顾了一些其他很好的作用(保密),同时所有字体位置随机,且后端只校验坐标位置,大大提高了破解难度,在体验上并不输于滑块,破解难度更高,成为我们后续的引入重点。



四、携程业务安全展望

携程未来在业务安全上还会继续应难而上,在技术和业务上共同发展,包括底层 spark,presto,impala 的引入,安全用户画像,惩罚中心,挑战服务的系统上线等等。


携程作为国内互联网旅游企业的标杆,体验和安全的平衡一直是业务安全所追求的,在有了技术支撑的前提下,这块也将进行持续的优化和改进。


同样,信息安全一直是全社会关注的话题之一,用户的安全感知,即如何提高用户自身的安全思维和对信息的敏感,保护自己账户,信息和个人资产的意识,也是我们需要进行不断改进所需要展示给用户的。


安全之路,任重而道远。


本文转载自技术琐话公众号。


原文链接:https://mp.weixin.qq.com/s/LwTXSzt931kn4d4XLweynQ


2020 年 4 月 23 日 17:39503

评论

发布
暂无评论
发现更多内容

使用K3S创建本地开发集群

东风微鸣

Kubernetes k3s Traefik

代码重构-设计模式总结

Mars

架构师训练营第七周课后作业

Gosling

极客大学架构师训练营

架构训练营第三周作业

李日盛

架构设计

如何将PyTorch Lightning模型部署到生产中

计算机与AI

学习 PyTorch

性能压测时,并发压力增加,系统响应时间和吞吐量如何变化

escray

极客大学 极客大学架构师训练营 课程作业

架构师训练营 -week07-总结

大刘

极客大学架构师训练营

架構師訓練營 week7 作業

ilake

Week3 - 练习

evildracula

架构

架构师训练营第 3 周学习总结

菜青虫

极客大学架构师训练营

第三周作业

tothegump

极客大学架构师训练营

架构师训练营第 3 周课后练习

菜青虫

极客大学架构师训练营

架构作业-第七周

Nick~毓

架构师入门学习感悟三

莫问

第三周架构师训练营作业

lithium

架构师训练营第三周作业

lakers

极客大学架构师训练营

架构师训练营第 1 期 - 第 7 周课后练习

Anyou Liu

极客大学架构师训练营

架构师训练营第三周作业1

韩儿

架构师训练营第三周作业2

韩儿

学习笔记:架构师训练营-第七周

四夕晖

极客时间架构师培训 1 期 - 第 7 周作业

Kaven

中国Java教父把十几年经验总结成:程序员自学的七条路(完整版)

Java架构师迁哥

极客大学 - 架构师训练营 第七周

9527

设计模式示例

Mars

单例模式 组合模式

架构师训练营第七周

我是谁

极客大学架构师训练营

CAP原理及作业

橘子皮嚼着不脆

架构训练营第三周作业

一期一会

设计模式

第七周作业

alpha

极客大学架构师训练营

第三周 单例

Geek_9527

性能优化-性能测试,系统优化,锁

garlic

极客大学架构师训练营

架構師訓練營 week7 總結

ilake

移动应用开发的下一站

移动应用开发的下一站

业务安全解决之道:爬虫、扫号、羊毛党、垃圾注册...-InfoQ