发布在即!企业 AIGC 应用程度测评,3 步定制专属评估报告。抢首批测评权益>>> 了解详情
写点什么

Airbnb:用机器学习打响金融诈骗战

  • 2018-04-03
  • 本文字数:1756 字

    阅读完需:约 6 分钟

看新闻很累?看技术新闻更累?试试下载 InfoQ 手机客户端,每天上下班路上听新闻,有趣还有料!

Airbnb ,一家旅行房屋租赁网站,正在使用机器学习技术来打击金融诈骗。他们用“定向摩擦”打击退款诈骗,与此同时,尽可能将该机制对于正常顾客使用在线预订系统的负面影响降到最低。

诈骗检测对 Airbnb 团队非常关键,因为每晚大约有二百万人在分布于 191 个国家的 Airbnb 房源入住。这意味着他们全球性社区的快速发展很大程度上依赖于信任。他们打击诈骗的方法包括主动措施和被动支持。主动措施通常应用在交易前,并且通常在后台进行:利用机器学习、试验和分析,防止欺诈者在网站上使用偷来的信用卡。

David Press 是 Airbnb 的信任数据科学家,他介绍了 Airbnb 是如何利用机器学习技术来鉴别和阻止诈骗者,同时将对正常顾客的影响降到最低。

退款是他们诈骗检测项目的主要关注点。与所有线上交易相同,Airbnb 也会遇到试图用盗取的信用卡进行交易的诈骗犯。当真正的持卡人发现他们的卡被盗了,并注意到账单上未经授权的消费,信用卡公司会向商家发起退款要求,然后商家(Airbnb)把钱返给消费者。与其他公司不同的是,Airbnb 承担这些退款的全部损失,而且不会让房主承担经济责任。所以为了更好地保护这个社区,并且减少退款损失,Airbnb 致力于对诈骗交易的源头进行打击:阻止盗用信用卡在网站的使用。

有时候交易会被直接拒绝,但在大多数情况下,Airbnb 会给用户机会,看他们是否满足附加验证条件,称为“摩擦”。 ”摩擦“是用来阻止未授权用户的一种方法,但对于正常用户来说是很容易满足的。为了防止信用卡盗用,会触发不同类型的“摩擦”机制来证明用户是信用卡的真正持卡人,包括微授权(在信用卡上放置两个小的授权码,持卡人必须通过登录网上银行进行确认), 3-D 安全(允许信用卡公司通过密码或短信直接验证持卡人),账单证明(需要持卡人上传一份相关信用卡帐单复印件)。

Press 介绍了他们如何使用机器学习模型来触发针对诈骗犯的“摩擦“。他还概述了如何通过最小化三个不同场景的损失函数来选择 ML 模型的阈值:假阳性、假阴性和真阳性。

他们使用机器学习模型来检测诈骗交易,用过去的已证实为良好消费和欺诈消费的例子进行训练,模型的目标是预测订单属于诈骗订单的概率。和其他机器学习模型一样,训练的模型并不是完美的,所以他们也需要处理不同的场景:假阳性、假阴性和真阳性。

  • 假阳性是指正常交易得分超过阈值,被模型分类成金融诈骗。
  • 假阴性是指诈骗情况得分低于模型阈值,被判断为正常交易。
  • 真阳性是指模型正确识别诈骗行为,其得分高于阈值。

Press 还介绍了每一种情况给 Airbnb 带来的损失。如果他们错误地对正常用户使用了“摩擦”(假阳性)机制,他们需要承担一定的损失,因为信用良好的用户可能会选择不配合完成”摩擦“,放弃交易,然后不再使用 Airbnb,造成客户流失。

对于假阴性,总损失是通过将假阴性的事件个数(FN)乘以每个诈骗交易的成本(C)计算出来的:FN*C。Airbnb 要承担与退款相关的所有损失,所以总成本是诈骗犯所诈骗的全部金额,再加上与处理相关的杂项费用,以及信用卡日益增加的拒绝率。

最后,对于真阳性交易(诈骗行为),Airbnb 应用“摩擦”来防止诈骗犯使用 Airbnb。如果“摩擦”机制成功地阻止了诈骗交易,就不会造成损失。

Airbnb 通过利用过去的阳性(诈骗)和阴性(非诈骗)订单来训练模型,优化机器学习模型的阈值。由于诈骗案例十分少见,这是一个不平衡的分类问题,缺乏正向标签。他们用真阳性率和假阳性率来描述模型在不同的阈值下识别诈骗和正常交易的能力,然后利用取决于这些比率的损失函数来评估与每个阈值相关的总成本。

Airbnb 使用他们的实验报告框架(Experiment Reporting Framenwork)运行 A / B 测试,来衡量由于“摩擦”机制使用不当(假阳性)对正常用户造成的影响。他们把得分较低的用户(基本排除诈骗可能)放在对诈骗者采用“摩擦“机制同一个实验阶段。

在博客中,Press 还演示了一个模拟示例,对比了直接拒绝交易和应用“摩擦“机制之间的不同。

查看英文原文 Fighting Financial Fraud with Machine Learning at Airbnb


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2018-04-03 19:001592
用户头像

发布了 52 篇内容, 共 28.0 次阅读, 收获喜欢 72 次。

关注

评论

发布
暂无评论
发现更多内容

如何在给定数组中执行二元搜索?

InfoQ IT百科

线程和进程有什么区别?

InfoQ IT百科

一个完整的计算机系统是由什么组成的?

InfoQ IT百科

1000道阿里巴巴初级~高级Java工程师面试题(含答案

爱好编程进阶

Java 面试 后端开发

在一个元素为 1 到 100 的整数数组中,如何搜索缺失元素?

InfoQ IT百科

ClassUtils常用方法总结

爱好编程进阶

Java 面试 后端开发

操作系统国产化的难点是什么?

InfoQ IT百科

如何实现冒泡排序算法(bubble sort algorithm)?

InfoQ IT百科

1000页神仙文档,连阿里P8面试官都说太详细了,面面俱到!搞懂这些直接P6+

爱好编程进阶

Java 面试 后端开发

如何在没有递归的情况下通过对给定二叉树执行中序遍历来打印所有节点?

InfoQ IT百科

5年crud“经验”

爱好编程进阶

Java 面试 后端开发

CDH+Kylin三部曲之二:部署和设置

爱好编程进阶

Java 面试 后端开发

3 个方法,教你提升程序员的自我价值

爱好编程进阶

Java 面试 后端开发

35K成功入职蚂蚁金服,现分享面试Java后端经历「内含面试题

爱好编程进阶

Java 面试 后端开发

java培训Redis的库存扣减操作

@零度

redis JAVA开发

未来十年,什么开发工程师最火爆?

TinTinLand

区块链

分享15款免费好用的中文字体

源字节1号

网站开发

如何使用堆栈算出两个链表的总和?

InfoQ IT百科

2021最新Java面试标准,26个技术点一千多道面试题全曝光,赶紧学

爱好编程进阶

Java 面试 后端开发

GPU微架构回顾

Finovy Cloud

GPU服务器 GPU算力

162基于springboot宠物管理系统

爱好编程进阶

Java 面试 后端开发

2021年阿里、腾讯、百度

爱好编程进阶

Java 面试 后端开发

2021最新一次Java面试,快手三面一轮游,如今已拿意向书

爱好编程进阶

Java 面试 后端开发

Bootstrap Table数据表格的使用指南

爱好编程进阶

Java 面试 后端开发

将博客搬至CSDN

爱好编程进阶

给定一个乱序数组,如何搜索最大和最小元素?

InfoQ IT百科

在没有递归的情况下如何反转单链表?

InfoQ IT百科

在不使用任何库的情况下,如何反转给定句子中的单词?

InfoQ IT百科

浅析Redis分布式集群倾斜问题

五分钟学大数据

redis 4月月更

Activiti 自定义表单流程(全流程演示)

爱好编程进阶

Java 面试 后端开发

axios发送post请求,springMVC接收不到数据问题

爱好编程进阶

Java 面试 后端开发

Airbnb:用机器学习打响金融诈骗战_语言 & 开发_Srini Penchikala_InfoQ精选文章