
近日,全球安全顶级会议 ACM CCS 以及顶刊 IEEE TDSC 发布获选论文名单,蚂蚁数科的两项隐私计算创新技术成果入选,标志着蚂蚁数科在隐私保护人工智能(Privacy-Preserving AI)技术领域的持续领先。这两项研究聚焦当前跨机构联合建模中应用最广泛的梯度提升决策树(GBDT)模型,通过创新的隐私保护算法,解决了联合建模和联合推理中如何在保障数据隐私前提下实现高性能计算的技术难题。
这两研究成果分别是被 ACM CCS2025 收录的《Gibbon: Faster Secure Two-party Training of Gradient Boosting Decision Tree》(长臂猿:更快的 2 方安全 GBDT 训练框架)与被 IEEE TDSC 录用的《Privacy-preserving Decision Graph Inference from Homomorphic Lookup Table》(基于同态查找表的隐私保护决策图推理)
GBDT 类模型(包括 XGBoost、LightGBM 等)是一种基于梯度提升的决策树算法,可解释性强,预测速度快,广泛应用于营销、风控等场景,是跨机构联合建模中最流行最常用的算法。然而,在多方协作训练与推理过程中,如何在保障数据隐私的前提下实现高性能计算,长期面临“安全强则效率低,效率高则隐患多”的两难困境。
当前业界多采用联邦学习(FL)路线,虽性能较高,但存在潜在的信息泄露风险。例如,隐私计算联盟于 2024 年发布的《隐私计算产品通用安全分级白皮书》中就分析、披露了业内最流行的 FL 方案 SecureBoost 的信息泄露风险。
蚂蚁数科则另辟蹊径,选择安全等级更高但性能挑战更大的多方安全计算(MPC)技术路线,通过 GBDT 算法与先进密码学的深度协同设计,实现了安全与效率的双重突破:
在训练方面:提出新型安全两方 GBDT 训练框架 Gibbon,相比当前最先进的 MPC 方案“Squirrel”(USENIX Security 2023),可将训练速度提升 2~4 倍,性能甚至优于联邦学习路线 SecureBoost 的开源实现。
在推理方面:创新性地提出同态查找表技术,实现隐私保护决策图推理,支持 GBDT、决策树、评分卡等模型。其中,GBDT 和决策树的推理效率提升 2~3 个数量级。
目前,上述研究成果已应用于蚂蚁数科隐私计算系列产品中,全面支持跨机构间高安全、高性能、可落地的数据协作。
蚂蚁数科已构建覆盖多场景的隐私计算产品矩阵:包括面向数据基础设施的可信数据流通平台 FAIR;服务于金融与营销场景的隐私计算解决方案摩斯(Morse);以轻量化中间件形式为 AI、BI 及业务系统提供嵌入式隐私计算能力的密态中间件;以及为大语言模型应用提供全方位的数据和模型隐私保护的大模型隐私保护产品。
ACM CCS 是国际公认的信息安全领域旗舰会议,被中国计算机学会(CCF)列为 CCF-A 类会议。IEEE TDSC 是由 IEEE Computer Society 出版的权威学术期刊,聚焦可信计算、安全计算等研究领域,也是中国计算机学会 A 类期刊,代表该领域的最高学术水平。
评论