写点什么

联邦学习全球首个工业级开源框架 FATE 完成重大更新:全球首次支持纵向联邦神经网络算法

  • 2020-01-19
  • 本文字数:1742 字

    阅读完需:约 6 分钟

联邦学习全球首个工业级开源框架FATE完成重大更新:全球首次支持纵向联邦神经网络算法

近两年来,联邦学习发展迅速,其作为分布式的机器学习范式,能够有效解决数据孤岛问题,让参与方在不共享数据的基础上联合建模,从技术上打破数据孤岛,实现 AI 协作。而 FATE 作为联邦学习全球首个工业级开源框架,支持联邦学习架构体系,为机器学习、深度学习、迁移学习提供了高性能联邦学习机制。此外,其自身还支持多种多方安全计算协议,如同态加密、秘密共享、哈希散列等,具有友好的跨域交互信息管理方案。


近日,全球首个联邦学习工业级开源框架 FATE 1.2 版本正式发布,在该版本中,FATE 推出了两大重量级的更新项,分别为对纵向联邦 DNN 的支持以及对多方安全计算 SPDZ 协议的支持。作为首个支持纵向联邦神经网络算法的版本,开发者在纵向联邦建模的分类、回归、排序等场景下都可以明显感受到其支持性。而 SPDZ 秘密共享安全计算协议的的支持,进一步拓展和丰富了 FATE 的应用场景。


在之前的 1.0 大版本中,FATE 上线了首个可视化联邦学习产品与联邦 pipeline 生产服务。而在 1.1 大版本中,FATE 联合 VMware 中国研发开放创新中心云原生实验室联合发布了 KubeFATE 项目,通过把 FATE 的所有组件用容器的形式封装,实现了使用 Docker Compose 或 Kubernetes(Helm Charts)来部署。前两个版本分别在可视化使用体验及部署体验上做了重点提升,而 FATE v1.2 版本则回归至算法本身,进一步拓展其支持性。除两大重量级更新项以外,还新增了如二阶优化方法-纵向 SQN、数据管理模块等功能,前者能够显著提升纵向逻辑回归和纵向线性回归收敛效率,对算法加速起到关键作用。后者则用于记录 upload 的数据表及 Job 运行中模型的输出结果,并提供查询以及清理 CLI,项目已开源在GitHub上。

FederatedML: 开启纵向联邦深度学习和多种多方安全计算协议支持之旅

在 FATE 1.2 版本中,首次对外发布了纵向联邦深度学习框架,开启了 FATE 对深度学习联邦化的支持,开发者可以自定义深度神经网络结构。目前版本已支持 Tensorflow, 后续会推出 PyTorch 版本,便于开发者低代价迁移 Tensorflow 和 Pytorch 的使用习惯和经验。


在这一版本中,FATE 实现了 SPDZ 秘密共享多方安全计算协议的支持,这意味在现有同态加密协议的基础上,FATE 能为开发者提供更多样化的多方安全计算协议支持。开发者们可根据自身算法的特点,自由选择适合自身算法的多方安全计算协议,联邦学习的可应用范围得到进一步拓展。值得说明的是,在纵向皮尔逊特征相关性计算算法实现中,首次使用了 SPDZ 协议。


此外,算法性能优化方面, 新版本也首次引入二阶优化算法,提出了纵向 SQN 算法,并成功应用在纵向广义线性模型中,对算法性能有显著提升。特征分箱和特征选择新增对多方 host 联邦建模的支持,开始全方位的支持多 host 场景。

FATE-Board:两大可视化支持,实用性再提升

自 1.0 版本推出 FATE-Board 以来,这一产品受到了开发者广泛好评。而在 1.2 版本中,FATE 也对 FATE-Board 再次进行了提升,新增了对联邦模式下特征相关性、以及 LocalBaseline 组件的可视化支持。前者能够直观地分析特征之间的相关性分布情况,从而帮助开发者快速进行判断与特征选择。而后者则可以让开发者将基于联邦训练的模型与基于 sklearn 训练的模型结果进行直接对比,并从可视化报告对比中得出相关结论。


此外,这一版本的 FATE-Board 在用户体验方面也有了重大的提升,如工作流、模型输出图表图形、评估曲线等,都高度优化了可视化效果及交互操作,并增强了实用性。在使用中相信能让开发者体验再上一层楼。

FATE-Flow:FATE 数据管理模块,开启数据治理之路

在 FATE 1.2 版本中,FATE 新增加了数据管理模块,这将成为开启数据治理的第一步。从这一版本开始,在整个 Job 生命周期产生的数据都有迹可循了。此外,数据管理模块提供了诸如查询、删除等常用管理命令,这也极大地增强了开发者对数据的掌控能力。


总的来说,FATE 在 1.2 这一版本中,开启了对新领域的进一步拓展。无论是对纵向联邦深度学习框架,还是多方安全计算 SPDZ 协议的支持,都是在打磨底层框架,为未来 FATE 能支持更多应用场景提供一种可能。从这一版本也可以看出,除新功能外,FATE 对已有建模组件也在持续不断的优化和改进,致力于在效率,多样性和实用性上,为开发者提供更加优质的服务体验。


详情可查阅 FATE官网项目贡献者指南。


2020-01-19 09:442641

评论

发布
暂无评论
发现更多内容

悬赏任务源码开发设计构建时,要留意哪些事项

开源直播系统源码

源码 软件开发 直播系统 悬赏任务源码

只需八步将小程序一键打包生成App

Geek_99967b

小程序 小程序转app

运算符 (第二天)

Jason199

运算符 js 6月月更

Python时区转换的两种方式

红毛丹

Python 6月月更

漫谈测试覆盖率

老张

软件测试 质量保障 质量度量

知识图谱、图数据平台、图技术如何助力零售业飞速发展

GPU算力

图计算 图数据分析 图数据一体机

设计千万级学生管理系统的考试试卷存储方案

Fan

架构师实战营

互联网公司研发效能团队为啥必须独立?何时独立?

laofo

互联网 DevOps cicd 研发效能 工程效率

如何在使用 Flutter时切换应用时隐藏应用预览

坚果

6月月更

服务器运维环境安全体系(下篇)

融云 RongCloud

马志强:语音识别技术研究进展和应用落地分享丨RTC Dev Meetup

声网

音视频 语音识别

浅谈企业自媒体如何才能脱颖而出

石头IT视角

Django API 开发:视图设置和路由

宇宙之一粟

django 6月月更

SpringBoot应用使用自定义的ApplicationContext实现类

程序员欣宸

Java spring springboot Spring Framework 6月月更

企业无忧 | Apipost私有化部署活动即将火热开启

Xd

后端 apipost 接口测试工具

python小知识-python作用域和闭包

AIWeker

Python python小知识

Linux编程_网页视频监控项目

DS小龙哥

6月月更

SAAS服务能有哪些优势

Geek_99967b

小程序 SaaS SaaS系统架构

流程测试支持批量参数导入,测试效率直接拉满!

Xd

数据库 后端 接口测试 测试工具

Vue中created和mounted的区别

devpoint

Vue Vue3 InfoQ极客传媒15周年庆

『Three.js』起飞!

德育处主任

JavaScript canvas 前端可视化 three.js 6月月更

Google搜索为什么不能无限分页?

蝉沐风

elasticsearch 深度分页

Java异常处理机制

未见花闻

6月月更

在线文本字符串批量替换工具

入门小站

工具

hashmap的底层机制

卢卡多多

集合 6月月更

MySql事务

工程师日月

6月月更

InfoQ 极客传媒 15 周年庆征文|Socket请求和Http请求特点、区别及适用场景

No Silver Bullet

HTTP请求 6月月更 InfoQ极客传媒15周年庆 Socket请求

linux之Ansible快速入门

入门小站

Linux

在线JSON转CSV工具

入门小站

工具

Vue-4-模板语法-1

Python研究所

前端 6月月更

C#入门系列(十) -- 一维数组

陈言必行

C# 6月月更

联邦学习全球首个工业级开源框架FATE完成重大更新:全球首次支持纵向联邦神经网络算法_AI&大模型_Geek_684d95_InfoQ精选文章