如何 0 成本启动全员 AI 技能提升?戳> 了解详情
写点什么

蚂蚁数科提出隐私保护 AI 算法训练新框架 Gibbon,训练速度提升 4 倍

  • 2025-09-25
    北京
  • 本文字数:1113 字

    阅读完需:约 4 分钟

大小:579.07K时长:03:17
蚂蚁数科提出隐私保护AI算法训练新框架Gibbon,训练速度提升4倍

近日,全球安全顶级会议 ACM CCS 以及顶刊 IEEE TDSC 发布获选论文名单,蚂蚁数科的两项隐私计算创新技术成果入选,标志着蚂蚁数科在隐私保护人工智能(Privacy-Preserving AI)技术领域的持续领先。这两项研究聚焦当前跨机构联合建模中应用最广泛的梯度提升决策树(GBDT)模型,通过创新的隐私保护算法,解决了联合建模和联合推理中如何在保障数据隐私前提下实现高性能计算的技术难题。

 

这两研究成果分别是被 ACM CCS2025 收录的《Gibbon: Faster Secure Two-party Training of Gradient Boosting Decision Tree》(长臂猿:更快的 2 方安全 GBDT 训练框架)与被 IEEE TDSC 录用的《Privacy-preserving Decision Graph Inference from Homomorphic Lookup Table》(基于同态查找表的隐私保护决策图推理)

 

GBDT 类模型(包括 XGBoost、LightGBM 等)是一种基于梯度提升的决策树算法,可解释性强,预测速度快,广泛应用于营销、风控等场景,是跨机构联合建模中最流行最常用的算法。然而,在多方协作训练与推理过程中,如何在保障数据隐私的前提下实现高性能计算,长期面临“安全强则效率低,效率高则隐患多”的两难困境。

 

当前业界多采用联邦学习(FL)路线,虽性能较高,但存在潜在的信息泄露风险。例如,隐私计算联盟于 2024 年发布的《隐私计算产品通用安全分级白皮书》中就分析、披露了业内最流行的 FL 方案 SecureBoost 的信息泄露风险。

 

蚂蚁数科则另辟蹊径,选择安全等级更高但性能挑战更大的多方安全计算(MPC)技术路线,通过 GBDT 算法与先进密码学的深度协同设计,实现了安全与效率的双重突破:


  • 在训练方面:提出新型安全两方 GBDT 训练框架 Gibbon,相比当前最先进的 MPC 方案“Squirrel”(USENIX Security 2023),可将训练速度提升 2~4 倍,性能甚至优于联邦学习路线 SecureBoost 的开源实现。

  • 在推理方面:创新性地提出同态查找表技术,实现隐私保护决策图推理,支持 GBDT、决策树、评分卡等模型。其中,GBDT 和决策树的推理效率提升 2~3 个数量级。

 

目前,上述研究成果已应用于蚂蚁数科隐私计算系列产品中,全面支持跨机构间高安全、高性能、可落地的数据协作。

 

蚂蚁数科已构建覆盖多场景的隐私计算产品矩阵:包括面向数据基础设施的可信数据流通平台 FAIR;服务于金融与营销场景的隐私计算解决方案摩斯(Morse);以轻量化中间件形式为 AI、BI 及业务系统提供嵌入式隐私计算能力的密态中间件;以及为大语言模型应用提供全方位的数据和模型隐私保护的大模型隐私保护产品。

 

ACM CCS 是国际公认的信息安全领域旗舰会议,被中国计算机学会(CCF)列为 CCF-A 类会议。IEEE TDSC 是由 IEEE Computer Society 出版的权威学术期刊,聚焦可信计算、安全计算等研究领域,也是中国计算机学会 A 类期刊,代表该领域的最高学术水平。

2025-09-25 14:235568
用户头像
李冬梅 加V:busulishang4668

发布了 1182 篇内容, 共 804.1 次阅读, 收获喜欢 1301 次。

关注

评论

发布
暂无评论

华为云薛浩:媒体业务进入全面云化时代,云原生成为必然选择

华为云开发者联盟

云原生 媒体 音视频 华为云

Redisson 分布式锁源码 06:公平锁排队加锁

程序员小航

Java redis 分布式锁 redisson

我给我讲GIT,并成功把我得罪了

加百利

git 7月日更

打造中国数字军人 数军科技携黑科技亮相军博会

科技热闻

我删库跑路失败了

程序员鱼皮

Java c++ Python Linux 服务器

DataWorks赋能企业一站式数据开发治理能力

阿里云大数据AI技术

腾讯二面:Linux操作系统里一个进程最多可以创建多少个线程?

白亦杨

如何利用极狐GitLab CI提高生产力?

极狐GitLab

ci

Go 学习笔记之 数组

架构精进之路

Go 语言 7月日更

使用tar 命令进行文件的归档和压缩

学神来啦

云计算 Linux 运维 linux运维

多媒体技术(一)之图形图像

轻口味

android 音视频 计算机图形学 图形图像处理

RTC为何这么火?

anyRTC开发者

音视频 WebRTC RTC 实时通讯

我还是没有忍住,于是乎我开通了lua语言学习专栏!

李阿柯

lua 专栏

什么?C语言也能try...catch!

实力程序员

4轮技术面+1轮HR面,成功拿到腾讯40k*16的Offer ,详解面试流程和真题解析

Java 程序员 架构 面试

union 分页/group/join 复杂查询(.net core/framework)

Spook

sql ORM

百度交易中台之商品推广流程构建以及实现

百度Geek说

中台 软件架构 电商 交易

网安行业这几个熟悉又陌生的名词,啥帽子都清楚啦?

郑州埃文科技

DolphinDB插件开发深度解析

DolphinDB

数据库 大数据 时序数据库 插件开发 DolphinDB

Python 绑定:从 Python 调用 C 或 C++

华为云开发者联盟

c c++ Python 函数 Python 绑定

拖延背后的故事

卢卡多多

拖延症 7月日更

在数据库中如何查询表的创建时间?

华为云开发者联盟

数据库 日志 视图 GaussDB(DWS) 查找对象

底层技术支撑智慧出行,汽车智能化发展下区块链大放异彩

旺链科技

区块链产业

吹水、面试、进阶齐飞!Github霸榜的阿里分布式设计实录也太香了

Java架构师迁哥

研发管理和项目管理有哪些痛点?

万事ONES

研发管理 ONES 项目管理工具

替换 Spring Cloud,使用基于 Cloud Native 的服务治理

火山引擎开发者社区

云原生 后端 Service Mesh 服务网格

银行业智能运维的探索与实践

云智慧AIOps社区

银行数字化转型 智能运维

统一缓存帝国 - 实战 Spring Cache

悟空聊架构

缓存 passjava 悟空聊架构 7月日更 Spring Cache

小马哥的Java项目训练营-毕业总结

姑射仙人

互联网公司的「敏捷开发」流程是怎么样的?每个职位的角色和分工是什么?

万事ONES

并发王者课-铂金9:互通有无-Exchanger如何完成线程间的数据交换

MetaThoughts

Java 多线程 并发

蚂蚁数科提出隐私保护AI算法训练新框架Gibbon,训练速度提升4倍_生成式 AI_李冬梅_InfoQ精选文章