最新发布《数智时代的AI人才粮仓模型解读白皮书(2024版)》,立即领取! 了解详情
写点什么

联邦学习全球首个工业级开源框架 FATE 完成重大更新:全球首次支持纵向联邦神经网络算法

  • 2020-01-19
  • 本文字数:1742 字

    阅读完需:约 6 分钟

联邦学习全球首个工业级开源框架FATE完成重大更新:全球首次支持纵向联邦神经网络算法

近两年来,联邦学习发展迅速,其作为分布式的机器学习范式,能够有效解决数据孤岛问题,让参与方在不共享数据的基础上联合建模,从技术上打破数据孤岛,实现 AI 协作。而 FATE 作为联邦学习全球首个工业级开源框架,支持联邦学习架构体系,为机器学习、深度学习、迁移学习提供了高性能联邦学习机制。此外,其自身还支持多种多方安全计算协议,如同态加密、秘密共享、哈希散列等,具有友好的跨域交互信息管理方案。


近日,全球首个联邦学习工业级开源框架 FATE 1.2 版本正式发布,在该版本中,FATE 推出了两大重量级的更新项,分别为对纵向联邦 DNN 的支持以及对多方安全计算 SPDZ 协议的支持。作为首个支持纵向联邦神经网络算法的版本,开发者在纵向联邦建模的分类、回归、排序等场景下都可以明显感受到其支持性。而 SPDZ 秘密共享安全计算协议的的支持,进一步拓展和丰富了 FATE 的应用场景。


在之前的 1.0 大版本中,FATE 上线了首个可视化联邦学习产品与联邦 pipeline 生产服务。而在 1.1 大版本中,FATE 联合 VMware 中国研发开放创新中心云原生实验室联合发布了 KubeFATE 项目,通过把 FATE 的所有组件用容器的形式封装,实现了使用 Docker Compose 或 Kubernetes(Helm Charts)来部署。前两个版本分别在可视化使用体验及部署体验上做了重点提升,而 FATE v1.2 版本则回归至算法本身,进一步拓展其支持性。除两大重量级更新项以外,还新增了如二阶优化方法-纵向 SQN、数据管理模块等功能,前者能够显著提升纵向逻辑回归和纵向线性回归收敛效率,对算法加速起到关键作用。后者则用于记录 upload 的数据表及 Job 运行中模型的输出结果,并提供查询以及清理 CLI,项目已开源在GitHub上。

FederatedML: 开启纵向联邦深度学习和多种多方安全计算协议支持之旅

在 FATE 1.2 版本中,首次对外发布了纵向联邦深度学习框架,开启了 FATE 对深度学习联邦化的支持,开发者可以自定义深度神经网络结构。目前版本已支持 Tensorflow, 后续会推出 PyTorch 版本,便于开发者低代价迁移 Tensorflow 和 Pytorch 的使用习惯和经验。


在这一版本中,FATE 实现了 SPDZ 秘密共享多方安全计算协议的支持,这意味在现有同态加密协议的基础上,FATE 能为开发者提供更多样化的多方安全计算协议支持。开发者们可根据自身算法的特点,自由选择适合自身算法的多方安全计算协议,联邦学习的可应用范围得到进一步拓展。值得说明的是,在纵向皮尔逊特征相关性计算算法实现中,首次使用了 SPDZ 协议。


此外,算法性能优化方面, 新版本也首次引入二阶优化算法,提出了纵向 SQN 算法,并成功应用在纵向广义线性模型中,对算法性能有显著提升。特征分箱和特征选择新增对多方 host 联邦建模的支持,开始全方位的支持多 host 场景。

FATE-Board:两大可视化支持,实用性再提升

自 1.0 版本推出 FATE-Board 以来,这一产品受到了开发者广泛好评。而在 1.2 版本中,FATE 也对 FATE-Board 再次进行了提升,新增了对联邦模式下特征相关性、以及 LocalBaseline 组件的可视化支持。前者能够直观地分析特征之间的相关性分布情况,从而帮助开发者快速进行判断与特征选择。而后者则可以让开发者将基于联邦训练的模型与基于 sklearn 训练的模型结果进行直接对比,并从可视化报告对比中得出相关结论。


此外,这一版本的 FATE-Board 在用户体验方面也有了重大的提升,如工作流、模型输出图表图形、评估曲线等,都高度优化了可视化效果及交互操作,并增强了实用性。在使用中相信能让开发者体验再上一层楼。

FATE-Flow:FATE 数据管理模块,开启数据治理之路

在 FATE 1.2 版本中,FATE 新增加了数据管理模块,这将成为开启数据治理的第一步。从这一版本开始,在整个 Job 生命周期产生的数据都有迹可循了。此外,数据管理模块提供了诸如查询、删除等常用管理命令,这也极大地增强了开发者对数据的掌控能力。


总的来说,FATE 在 1.2 这一版本中,开启了对新领域的进一步拓展。无论是对纵向联邦深度学习框架,还是多方安全计算 SPDZ 协议的支持,都是在打磨底层框架,为未来 FATE 能支持更多应用场景提供一种可能。从这一版本也可以看出,除新功能外,FATE 对已有建模组件也在持续不断的优化和改进,致力于在效率,多样性和实用性上,为开发者提供更加优质的服务体验。


详情可查阅 FATE官网项目贡献者指南。


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2020-01-19 09:442291

评论

发布
暂无评论
发现更多内容

舍弃Kong和Nginx,Apache APISIX 在趣链科技 BaaS 平台的落地实践

API7.ai 技术团队

nginx 开源 网关 kong APISIX

想聊天?自己搭建个聊天机器人吧!

百度开发者中心

人工智能 最佳实践 方法论 飞桨 语言 & 开发

程序员投入时间和精力实现财富增长之道,这可能会伴随你程序员整个生涯(请不要连续点赞)

孙叫兽

程序员 赚钱 教程 引航计划 签约计划第二季

TCP 三次握手

W🌥

计算机网络 TCP/IP 8月日更

图谱可视化|手把手教你采集明星人物关系并进行图谱展示

Python研究者

知识图谱 8月日更

读完这份JVM高级笔记,彻底玩转Java虚拟机,面试再也不用“虚”

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

高防服务器大数据时代下的最佳应用途径

九河云安全

贡献者,是衡量开源项目的金指标

API7.ai 技术团队

开源 网关 APISIX

知乎李大海对话阿里云贾扬清:透视AI应用难题与未来趋势

阿里云大数据AI技术

Redis扩展数据类型详解

码农参上

redis 8月日更

波场DAPP钱包开发|波场DAPP特点

Geek_23f0c3

钱包系统开发 DAPP智能合约交易系统开发 波场DAPP 波场钱包

7金5银,中国跳水梦之队背后的"黑科技"是什么?

百度大脑

人工智能 黑科技 跳水队

Go 效率工具集合

潇洒哥 - 老苗

Go 语言

大数据集群跨多版本升级、业务0中断,只因背后有TA

华为云开发者联盟

大数据 FusionInsight

企业在运营过程中需要解决的五项网络安全项目

九河云安全

使用FL studio中文版进行音乐合并和剪切

懒得勤快

数据库的简述与常用操作指南

行者AI

数据库

跟我读论文丨ACL2021 NER BERT化隐马尔可夫模型用于多源弱监督命名实体识别

华为云开发者联盟

BERT 弱监督 隐马尔可夫 CHMM HMM模型

高防云服务器服务器的价值会随着时间而扩展,从"成本效率"扩展到"新服务和技术"

九河云安全

Asop 之 消息处理机制

Qunar技术沙龙

android Linux 消息队列 安卓 epoll

连续霸榜丨EasyDL到底有多强?

百度大脑

人工智能 EasyDL

一文带你了解大厂亿级并发下高性能服务器是如何实现的!

Linux服务器开发

事件驱动 多进程 Linux服务器开发 IO多路复用 高性能服务器

FastApi-11-模板渲染

Python研究所

FastApi 8月日更

YYDS《剑指Offer》再续新篇,百万程序员人手一册

博文视点Broadview

绝了!阿里甩出“源码阅读指南”,原来源码才是最经典的学习范例

Java 编程 架构 面试 程序人生

耗时3年,从小厂逆袭,坐上美团L8技术专家(面经+心得)

Java 编程 程序员 架构 面试

5招教你实现多线程场景下的线程安全

华为云开发者联盟

Java 线程 多线程 线程安全

对象存储手把手教四 | Bucket 生命周期管理

QingStor分布式存储

对象存储 分布式存储 生命周期 数据管理

云服务器市场改变了行业市场的发展规模

九河云安全

企业数字化转型第一步,云服务器的部署以及搭建

九河云安全

Karmada: 云原生多云容器编排平台

华为云原生团队

开源 容器 k8s多集群管理 多云管理平台 多云

联邦学习全球首个工业级开源框架FATE完成重大更新:全球首次支持纵向联邦神经网络算法_AI&大模型_Geek_684d95_InfoQ精选文章