NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

FATE 发布 1.3 版本,首次增加联邦推荐算法

  • 2020-03-16
  • 本文字数:2024 字

    阅读完需:约 7 分钟

FATE发布1.3版本,首次增加联邦推荐算法

抗疫战场上的好消息不断传来,关于“数据免疫力”的话题也不断升温。企业和个人用户数据如何提高“免疫能力”,在越来越广泛的行业应用与合作中提升自身数据安全和防御能力?


近来,联邦学习进入行业视野。联邦学习在符合数据安全和政策法规的前提下,帮助各行各业实现多方协作训练 AI。FATE(Federated AI Technology Enabler)作为联邦学习首个工业级开源框架,实现了同态加密和多方计算(MPC)的安全计算协议,支持联邦学习架构,内置机器学习算法的联邦学习实现。


近日,FATE 发布了 2020 年的第一个版本更新 FATE v1.3。在这一版本中,FATE 首次增加联邦推荐算法模块 FederatedRec,该模块包含 6 大推荐场景中常用的算法,包括 5 种纵向联邦算法和 1 种横向联邦算法,可用于解决联邦学习场景下的推荐问题,比如评分预测,物品排序等。


此外,该团队与 VMware 中国研发开放创新中心云原生实验室的团队联合发布的 KubeFATE 也在这一版本中迎来更新,整体进行了重构,并引入了对最新版本的 FATE-Serving 支持,使得用户可以进行在线推理。最后,针对 FederatedML 等多个模块,新版本也进行了更新及优化。


项目 GitHub 地址:


https://ai.webankcdn.net/scvm/html/1579237806672.html

FederatedREC:提升算法预测效果,优化产品分发效率

在 FATE1.3 版本中,FATE 新增联邦推荐算法模块 FederatedRec,使得联邦推荐模块更加明确化,这一算法模块包含 6 大推荐场景的常用算法,主要有:


  • 纵向联邦算法 Hetero FM(Factorization Machine)

  • 横向联邦算法 Homo FM(Factorization Machine)

  • 纵向联邦算法 Hetero MF(Matrix Factorization)

  • 纵向联邦算法 Hetero SVD

  • 纵向联邦算法 Hetero SVD++

  • 纵向联邦算法 Hetero GMF(Generalized Matrix Factorization)


在这 6 类算法中,Hetero FM 和 Homo FM 分别是纵向联邦和横向联邦两种场景下的 FM(因式分解机)算法,该算法能够实现联合不同数据方的数据进行联合建模,对不同数据方直接进行显式的特征交叉和联合打分。


对于推荐场景下的算法,Hetero MF, Hetero SVD, Hetero SVD++和 Hetero GMF 提供了联邦建模下的协同过滤算法包。基于 FATE v1.3 提供的算法工具,能够实现不同数据方之间的 user-item,user-user 和 item-item 的矩阵分解。对开发者而言,通过联邦推荐这一模块,可以显著提升算法的预测效果及产品分发效率。

KubeFATE:支持 FATE-Serving 实现在线联邦推理,完全重构 Kubernetes

这一版本中,KubeFATE 也同步更新至 1.3,引入了对最新版本的 FATE-Serving 支持,使得用户可以进行在线推理,机器学习的常见功能进一步完善。对 KubeFATE 本身而言,这一版本也进行了彻底重构,主要有:


  • 支持完整的 FATE 集群生命周期管理,包括查询现在已部署的 FATE 集群列表,查看每个 FATE 集群的具体配置,对 FATE 集群配置进行更新,删除 FATE 集群等功能;

  • 实现 FATE 集群管理的任务框架,开发者可以细致追踪每个任务的子任务,方便定位基础设施层面的问题;

  • 分离 KubeFATE 的程序与 FATE 集群配置的关系,后续 FATE 更新版本后,开发者不需要每次都重新下载安装 KubeFATE 从而进行升级。理想网络状况下,KubeFATE 可以自动下载 FATE 集群的配置,开发者直接使用即可。如使用环境无网络支持,也可从 KubeFATE 的 Release 中下载 tgz 包,使用 KubeFATE 命令行直接上传到服务中,就可以实现部署发布新的集群支持。

  • 加强 FATE 模块化安装部署,这一版本中,KubeFATE 可以把 Exchange 或某几个模块单独部署为一个集群,通过 Kubernetes 联通起来。这一功能将有助于复杂 IT 环境的企业进行部署。


最后,在新版本中,KubeFATE 也会以服务的方式对外提供 RESTful API,对开发者而言,后续 KubeFATE 将以服务形式常驻对集群进行管理,命令行工具也可以在外网甚至 FATE 集群管理员的笔记本上运行。对外有 RESTful API 接口的功能如下图所示,都可以方便接入企业已有的云管系统。


FederatedML:训练稀疏数据效率提升,内存消耗再优化

除联邦推荐及 KubeFATE 的重点更新外,新版本针对 FederatedML 也做了进一步提升,在 1.3 中,纵向联邦广义线性模型(Hetero-LR、Hetero-LinR、Hetero-PoissonR)开始支持稀疏数据训练,开发者在训练稀疏数据时,能明显感到效率提升,内存消耗减少。解决分箱中 32M 限制,也使得特征分箱支持更高维度和更多样本的数据。纵向 SecureBoost 梯度直方图 32M 限制的解决,让 FATE 可以支持更高维度特征进行 secureboost 的训练。


总的来说,1.3 版本对 FATE 功能性及实践应用价值进行了强化,联邦推荐算法子模块 FederatedRec 的添加,对于用户而言,最明显的益处在于可以利用联邦推荐来提升自己算法的预测效果和产品的分发效率,使推荐服务的质量更上一个台阶。这对于第一方数据不够丰富,或者在业务的初始时期数据积累较少的用户方,是非常有帮助的。而 KubeFATE 也开启了 FATE 在生产环境,尤其是云原生环境上最优化管理使用的功能更新探索之路。后续,我们也将和 VMware 进一步合作,推出基于 FATE 的多方管理新项目。


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2020-03-16 09:031560

评论

发布
暂无评论
发现更多内容

打造基于AI的一站式节能减碳方案,南洋万邦助力工业园区实现“双碳”目标

飞桨PaddlePaddle

人工智能 paddle 百度飞桨

高性能网络 SIG 月度动态:ANCK 首次支持 SMCv2.1,virtio 规范支持隧道报文内头部哈希

OpenAnolis小助手

高性能网络 龙蜥社区 anck 龙蜥sig smc

蓝易云:shell简单命令大全。

百度搜索:蓝易云

云计算 Linux 运维 Shell 云服务器

使用 FastGPT 构建高质量 AI 知识库

米开朗基杨

人工智能 云计算 AI ChatGPT FastGPT

数字化转型与架构-架构设计篇|建模之“静态”模型

数字随行

数字化转型

实时云渲染的关键技术是什么?

Finovy Cloud

云计算 3D 云渲染 实时云渲染

Databend 开源周报第 107 期

Databend

华为云classroom赋能--Toolkit系列插件DevSecOps助力开发者提速

华为云PaaS服务小智

DevOps 开发工具 华为云

蓝易云:JAVA使用HTTP代理教程。

百度搜索:蓝易云

Java 云计算 Linux 运维 HTTP

全链路数据湖开发治理解决方案2.0重磅升级,全面增强数据入湖、调度和治理能力

阿里云大数据AI技术

百度工程师浅析解码策略

百度Geek说

解码 企业号 8 月 PK 榜 生成模型

【代码实践】使用FastAPI+Supabase+LangChain开发AI应用

张文平

FastApi 应用开发 Supabase #人工智能 #LangChain

illustrator2023最新版 矢量图形编辑软件ai2023简体中文版下载

mac

Illustrator ai2023 苹果mac 矢量图形编辑软件 illustrator2023

iStat Menus for Mac中文下载附激活码

mac大玩家j

Mac软件 系统检测工具

Apache Paimon 实时数据湖 Streaming Lakehouse 的存储底座

Apache Flink

大数据 flink 实时计算

SRE 与开发的自动化协同 -- 生产环境出现 bug 自动生成异常追踪

观测云

异常追踪 智能巡检

Audition 2021 mac完整版 音频编辑软件audition新功能

mac

苹果mac 音频编辑软件 Windows软件 audition 2021 audition

小灯塔系列-中小企业数字化转型系列研究——CRM测评报告

向量智库

数据库国产化应用改造实践

鲸品堂

数据库 国产化 企业号 8 月 PK 榜

WIFI6E moudle-QCN9074+WiFi6 MT7915-support 2.4GHz and 5GHz-M.2-MINI PCIE how to choose?

wifi6-yiyi

wifi6 WIFI6E

查询速度最高提升50倍!火山引擎ByteHouse在广告投放领域实践分享

字节跳动数据平台

数据库 大数据 云原生 数仓 企业号 8 月 PK 榜

火山引擎DataWind产品可视化能力揭秘

白露为霜

数据可视化 商业智能 BI 分析工具 图表库 BI 报表

学习微服务必推荐的天花板级别微服务架构笔记

小小怪下士

Java 程序员 微服务 springboot

2023中国算力大会,和鲸科技携手生态伙伴共同推动算力创新发展与应用

ModelWhale

AI 算力 云算力 2023中国算力大会

How IPQ9574, IPQ9554, QCN9274, and QCN6274 Qualcomm Chipsets Harness the Full Potential of WiFi7 Features

wallyslilly

WiFi7 ipq9554 qcn9274 qcn6274 ipq9574

直播平台源码搭建协议讲解篇:传输控制协议TCP

山东布谷科技

TCP 软件开发 网络协议 直播平台源码 传输控制协议

最好用的Java开发工具:IDEA 2023激活中文+安装教程

胖墩儿不胖y

Mac 软件 Java 开发 java开发工具

峰会回顾第7期 | 视窗绘制技术演进和新趋势

OpenHarmony开发者

OpenHarmony

FATE发布1.3版本,首次增加联邦推荐算法_AI&大模型_Geek_684d95_InfoQ精选文章