InfoQ技术大会年底储值活动来袭,单张门票最高省3240元 了解详情
写点什么

FATE 发布 1.3 版本,首次增加联邦推荐算法

  • 2020-03-16
  • 本文字数:2024 字

    阅读完需:约 7 分钟

FATE发布1.3版本,首次增加联邦推荐算法

抗疫战场上的好消息不断传来,关于“数据免疫力”的话题也不断升温。企业和个人用户数据如何提高“免疫能力”,在越来越广泛的行业应用与合作中提升自身数据安全和防御能力?


近来,联邦学习进入行业视野。联邦学习在符合数据安全和政策法规的前提下,帮助各行各业实现多方协作训练 AI。FATE(Federated AI Technology Enabler)作为联邦学习首个工业级开源框架,实现了同态加密和多方计算(MPC)的安全计算协议,支持联邦学习架构,内置机器学习算法的联邦学习实现。


近日,FATE 发布了 2020 年的第一个版本更新 FATE v1.3。在这一版本中,FATE 首次增加联邦推荐算法模块 FederatedRec,该模块包含 6 大推荐场景中常用的算法,包括 5 种纵向联邦算法和 1 种横向联邦算法,可用于解决联邦学习场景下的推荐问题,比如评分预测,物品排序等。


此外,该团队与 VMware 中国研发开放创新中心云原生实验室的团队联合发布的 KubeFATE 也在这一版本中迎来更新,整体进行了重构,并引入了对最新版本的 FATE-Serving 支持,使得用户可以进行在线推理。最后,针对 FederatedML 等多个模块,新版本也进行了更新及优化。


项目 GitHub 地址:


https://ai.webankcdn.net/scvm/html/1579237806672.html


FederatedREC:提升算法预测效果,优化产品分发效率

在 FATE1.3 版本中,FATE 新增联邦推荐算法模块 FederatedRec,使得联邦推荐模块更加明确化,这一算法模块包含 6 大推荐场景的常用算法,主要有:


  • 纵向联邦算法 Hetero FM(Factorization Machine)

  • 横向联邦算法 Homo FM(Factorization Machine)

  • 纵向联邦算法 Hetero MF(Matrix Factorization)

  • 纵向联邦算法 Hetero SVD

  • 纵向联邦算法 Hetero SVD++

  • 纵向联邦算法 Hetero GMF(Generalized Matrix Factorization)


在这 6 类算法中,Hetero FM 和 Homo FM 分别是纵向联邦和横向联邦两种场景下的 FM(因式分解机)算法,该算法能够实现联合不同数据方的数据进行联合建模,对不同数据方直接进行显式的特征交叉和联合打分。


对于推荐场景下的算法,Hetero MF, Hetero SVD, Hetero SVD++和 Hetero GMF 提供了联邦建模下的协同过滤算法包。基于 FATE v1.3 提供的算法工具,能够实现不同数据方之间的 user-item,user-user 和 item-item 的矩阵分解。对开发者而言,通过联邦推荐这一模块,可以显著提升算法的预测效果及产品分发效率。


KubeFATE:支持 FATE-Serving 实现在线联邦推理,完全重构 Kubernetes

这一版本中,KubeFATE 也同步更新至 1.3,引入了对最新版本的 FATE-Serving 支持,使得用户可以进行在线推理,机器学习的常见功能进一步完善。对 KubeFATE 本身而言,这一版本也进行了彻底重构,主要有:


  • 支持完整的 FATE 集群生命周期管理,包括查询现在已部署的 FATE 集群列表,查看每个 FATE 集群的具体配置,对 FATE 集群配置进行更新,删除 FATE 集群等功能;

  • 实现 FATE 集群管理的任务框架,开发者可以细致追踪每个任务的子任务,方便定位基础设施层面的问题;

  • 分离 KubeFATE 的程序与 FATE 集群配置的关系,后续 FATE 更新版本后,开发者不需要每次都重新下载安装 KubeFATE 从而进行升级。理想网络状况下,KubeFATE 可以自动下载 FATE 集群的配置,开发者直接使用即可。如使用环境无网络支持,也可从 KubeFATE 的 Release 中下载 tgz 包,使用 KubeFATE 命令行直接上传到服务中,就可以实现部署发布新的集群支持。

  • 加强 FATE 模块化安装部署,这一版本中,KubeFATE 可以把 Exchange 或某几个模块单独部署为一个集群,通过 Kubernetes 联通起来。这一功能将有助于复杂 IT 环境的企业进行部署。


最后,在新版本中,KubeFATE 也会以服务的方式对外提供 RESTful API,对开发者而言,后续 KubeFATE 将以服务形式常驻对集群进行管理,命令行工具也可以在外网甚至 FATE 集群管理员的笔记本上运行。对外有 RESTful API 接口的功能如下图所示,都可以方便接入企业已有的云管系统。



FederatedML:训练稀疏数据效率提升,内存消耗再优化

除联邦推荐及 KubeFATE 的重点更新外,新版本针对 FederatedML 也做了进一步提升,在 1.3 中,纵向联邦广义线性模型(Hetero-LR、Hetero-LinR、Hetero-PoissonR)开始支持稀疏数据训练,开发者在训练稀疏数据时,能明显感到效率提升,内存消耗减少。解决分箱中 32M 限制,也使得特征分箱支持更高维度和更多样本的数据。纵向 SecureBoost 梯度直方图 32M 限制的解决,让 FATE 可以支持更高维度特征进行 secureboost 的训练。


总的来说,1.3 版本对 FATE 功能性及实践应用价值进行了强化,联邦推荐算法子模块 FederatedRec 的添加,对于用户而言,最明显的益处在于可以利用联邦推荐来提升自己算法的预测效果和产品的分发效率,使推荐服务的质量更上一个台阶。这对于第一方数据不够丰富,或者在业务的初始时期数据积累较少的用户方,是非常有帮助的。而 KubeFATE 也开启了 FATE 在生产环境,尤其是云原生环境上最优化管理使用的功能更新探索之路。后续,我们也将和 VMware 进一步合作,推出基于 FATE 的多方管理新项目。


2020-03-16 09:031361

评论

发布
暂无评论
发现更多内容

TCP拥塞控制详解 | 3. 设计空间

俞凡

算法 网络 TCP拥塞控制

SpingCloud集成zookeeper实现服务注册并访问

AI乔治

设计电商秒杀系统

Jadedev

「架构实战营」

NFT新的契机,多媒体NFT聚合平台OKALEIDO即将上线

小哈区块

Python 入门指南之开胃菜

海拥(haiyong.site)

7月月更

设计电商秒杀系统

大眼喵

「架构实战营」

项目协作的进度如何推进| 社区征文

卢卡多多

初夏征文

毕业总结

大眼喵

「架构实战营」

【LeetCode】在每个树行中找最大值Java题解

Albert

LeetCode 7月月更

毕业总结

天琪实刚亮

NFT新的契机,多媒体NFT聚合平台OKALEIDO即将上线

股市老人

牛客java选择题每日打卡Day5

京与旧铺

7月月更

x86汇编语言-从实模式到保护模式 笔记

贾献华

7月月更

深入理解 SQL 中的 Grouping Sets 语句

元闰子

sql spark spark SQL

一入“远程”终不悔,几人欢喜几人愁。| 社区征文

法医

初夏征文

架构实战营 - 第 6 期 毕业总结

乐邦

「架构实战营」

NFT新的契机,多媒体NFT聚合平台OKALEIDO即将上线

威廉META

远程办公工具分享|社区征文

如浴春风

初夏征文

远程办公之如何推进跨部门项目协作 | 社区征文

浩宇天尚

远程办公 7月日更 项目协调 初夏征文 工作协调

简述服务量化分析体系

阿泽🧸

7月月更 量化分析

【愚公系列】2022年7月 Go教学课程 002-Go语言环境安装

愚公搬代码

7月月更

疫情常态化大背景下,关于远程办公的思考|社区征文

如浴春风

初夏征文

远程办公之大家一同实现合作编辑资料和开发文档 | 社区征文

浩宇天尚

远程办公 协同办公 7月日更 初夏征文

自动渗透测试工具核心功能简述

穿过生命散发芬芳

渗透测试 7月月更

聊聊支付流程的设计与实现逻辑

知了一笑

Java 架构

模块九作业

天琪实刚亮

多媒体NFT聚合平台OKALEIDO即将上线,全新的NFT时代或将来临

EOSdreamer111

FATE发布1.3版本,首次增加联邦推荐算法_AI_Geek_684d95_InfoQ精选文章