写点什么

Airbnb:用机器学习打响金融诈骗战

  • 2018-04-03
  • 本文字数:1756 字

    阅读完需:约 6 分钟

看新闻很累?看技术新闻更累?试试下载 InfoQ 手机客户端,每天上下班路上听新闻,有趣还有料!

Airbnb ,一家旅行房屋租赁网站,正在使用机器学习技术来打击金融诈骗。他们用“定向摩擦”打击退款诈骗,与此同时,尽可能将该机制对于正常顾客使用在线预订系统的负面影响降到最低。

诈骗检测对 Airbnb 团队非常关键,因为每晚大约有二百万人在分布于 191 个国家的 Airbnb 房源入住。这意味着他们全球性社区的快速发展很大程度上依赖于信任。他们打击诈骗的方法包括主动措施和被动支持。主动措施通常应用在交易前,并且通常在后台进行:利用机器学习、试验和分析,防止欺诈者在网站上使用偷来的信用卡。

David Press 是 Airbnb 的信任数据科学家,他介绍了 Airbnb 是如何利用机器学习技术来鉴别和阻止诈骗者,同时将对正常顾客的影响降到最低。

退款是他们诈骗检测项目的主要关注点。与所有线上交易相同,Airbnb 也会遇到试图用盗取的信用卡进行交易的诈骗犯。当真正的持卡人发现他们的卡被盗了,并注意到账单上未经授权的消费,信用卡公司会向商家发起退款要求,然后商家(Airbnb)把钱返给消费者。与其他公司不同的是,Airbnb 承担这些退款的全部损失,而且不会让房主承担经济责任。所以为了更好地保护这个社区,并且减少退款损失,Airbnb 致力于对诈骗交易的源头进行打击:阻止盗用信用卡在网站的使用。

有时候交易会被直接拒绝,但在大多数情况下,Airbnb 会给用户机会,看他们是否满足附加验证条件,称为“摩擦”。 ”摩擦“是用来阻止未授权用户的一种方法,但对于正常用户来说是很容易满足的。为了防止信用卡盗用,会触发不同类型的“摩擦”机制来证明用户是信用卡的真正持卡人,包括微授权(在信用卡上放置两个小的授权码,持卡人必须通过登录网上银行进行确认), 3-D 安全(允许信用卡公司通过密码或短信直接验证持卡人),账单证明(需要持卡人上传一份相关信用卡帐单复印件)。

Press 介绍了他们如何使用机器学习模型来触发针对诈骗犯的“摩擦“。他还概述了如何通过最小化三个不同场景的损失函数来选择 ML 模型的阈值:假阳性、假阴性和真阳性。

他们使用机器学习模型来检测诈骗交易,用过去的已证实为良好消费和欺诈消费的例子进行训练,模型的目标是预测订单属于诈骗订单的概率。和其他机器学习模型一样,训练的模型并不是完美的,所以他们也需要处理不同的场景:假阳性、假阴性和真阳性。

  • 假阳性是指正常交易得分超过阈值,被模型分类成金融诈骗。
  • 假阴性是指诈骗情况得分低于模型阈值,被判断为正常交易。
  • 真阳性是指模型正确识别诈骗行为,其得分高于阈值。

Press 还介绍了每一种情况给 Airbnb 带来的损失。如果他们错误地对正常用户使用了“摩擦”(假阳性)机制,他们需要承担一定的损失,因为信用良好的用户可能会选择不配合完成”摩擦“,放弃交易,然后不再使用 Airbnb,造成客户流失。

对于假阴性,总损失是通过将假阴性的事件个数(FN)乘以每个诈骗交易的成本(C)计算出来的:FN*C。Airbnb 要承担与退款相关的所有损失,所以总成本是诈骗犯所诈骗的全部金额,再加上与处理相关的杂项费用,以及信用卡日益增加的拒绝率。

最后,对于真阳性交易(诈骗行为),Airbnb 应用“摩擦”来防止诈骗犯使用 Airbnb。如果“摩擦”机制成功地阻止了诈骗交易,就不会造成损失。

Airbnb 通过利用过去的阳性(诈骗)和阴性(非诈骗)订单来训练模型,优化机器学习模型的阈值。由于诈骗案例十分少见,这是一个不平衡的分类问题,缺乏正向标签。他们用真阳性率和假阳性率来描述模型在不同的阈值下识别诈骗和正常交易的能力,然后利用取决于这些比率的损失函数来评估与每个阈值相关的总成本。

Airbnb 使用他们的实验报告框架(Experiment Reporting Framenwork)运行 A / B 测试,来衡量由于“摩擦”机制使用不当(假阳性)对正常用户造成的影响。他们把得分较低的用户(基本排除诈骗可能)放在对诈骗者采用“摩擦“机制同一个实验阶段。

在博客中,Press 还演示了一个模拟示例,对比了直接拒绝交易和应用“摩擦“机制之间的不同。

查看英文原文 Fighting Financial Fraud with Machine Learning at Airbnb


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2018-04-03 19:002140
用户头像

发布了 52 篇内容, 共 32.8 次阅读, 收获喜欢 73 次。

关注

评论

发布
暂无评论
发现更多内容

云原生与持续交付:加速软件交付与部署的革命

范艺笙冉

语音数据集:开启智能语音技术的新篇章

数据堂

写实风格3D模型材质贴图

3D建模设计

WebGL 3D渲染 three.js 材质纹理贴图 3D材质编辑

强大的磁盘分析:Disk Xray最新激活版

胖墩儿不胖y

Mac软件 磁盘分析软件 磁盘工具

赴一场AI星河之约:他们改变了什么?

脑极体

AI

有了向量数据库,我们还需要 SQL 数据库吗?

Zilliz

sql 向量数据库 zillizcloud rag

语音数据集:推动人工智能语音技术的关键要素

数据堂

爆红的PLM!

用友BIP

PLM

西部市场的无限潜力与成都的崛起“2024成都电子信息展会”

AIOTE智博会

电子展 电子信息展 成都电子展

重庆中烟:事项会计驱动业财深度融合

用友BIP

业财融合

来聊聊程序员的职业发展路线

伤感汤姆布利柏

观测云产品更新 | 智能监控、应用性能监测、场景图表等优化

观测云

APM 智能监控

3D 渲染如何帮助电商促进销售?

3D建模设计

WebGL 3D渲染 three.js 材质纹理贴图 3D材质编辑

LLM评估:通过7大指标监测并评估大语言模型的表现

Baihai IDP

程序员 AI ChatGPT LLM 白海科技

AI大模型时代下运维开发探索第二篇:基于大模型(LLM)的数据仓库

阿里云大数据AI技术

KaiwuDB 受邀亮相“ACDU 中国行”数据库技术沙龙(西安站)

KaiwuDB

KaiwuDB ACDB 中国行

江铃晶马 X 袋鼠云:搭建企业级数据资产中心,推进打造“智数晶马”

袋鼠云数栈

大数据 数据中台 数字化转型 案例 大数据平台

IM通讯协议专题学习(十):初识 Thrift 序列化协议

JackJiang

网络编程 即时通讯 IM

taobao.trade.memo.update( 修改交易备注 )丨淘宝店铺订单接口

tbapi

淘宝店铺订单接口 天猫店铺订单接口 淘宝店铺订单交易接口 淘宝店铺订单备注接口 天猫订单备注接口

语音数据集:智能语音技术的燃料与推动力

数据堂

中国中化、保利集团、中交集团、中国中车……2023年,更多央国企选择用友BIP

用友BIP

数智化转型

基于大数据、大模型的应用总结与技术心得

joe

GLTF编辑器实现逼真的石门模型

3D建模设计

WebGL 3D渲染 three.js 材质纹理贴图 3D材质编辑

GLTF 编辑器实现逼真3D动物毛发效果

3D建模设计

WebGL 3D渲染 three.js 材质纹理贴图 3D材质编辑

GLTF编辑器-位移贴图实现破碎的路面

3D建模设计

WebGL 3D渲染 three.js 材质纹理贴图 3D材质编辑

坚果的2023年终总结-激流勇进的一年

坚果

年终总结 坚果派

百度CTO王海峰:文心一言用户规模破1亿

飞桨PaddlePaddle

人工智能 深度学习 WAVE SUMMIT

避坑指南之财务共享服务中心的质量管理

用友BIP

财务共享

Linux操作系统中软件安装:用RPM包管理器安装软件步骤

小魏写代码

“边缘计算:从概念到实践的探索与思考“

future

Airbnb:用机器学习打响金融诈骗战_语言 & 开发_Srini Penchikala_InfoQ精选文章