2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

FATE 1.0 重磅发布:首个可视化联邦学习产品与联邦 pipeline 生产服务上线

  • 2019-08-22
  • 本文字数:1971 字

    阅读完需:约 6 分钟

FATE 1.0重磅发布:首个可视化联邦学习产品与联邦pipeline生产服务上线


作为全球首个联邦学习工业级技术框架,FATE 支持联邦学习架构体系与各种机器学习算法的安全计算,实现了基于同态加密和多方计算(MPC)的安全计算协议,能够帮助多个组织机构在符合数据安全和政府法规前提下,有效和协作地进行数据使用和联合建模。


8 月 18 日,FATE 1.0 版本正式发布,重点推出了联邦建模可视化工具 FATABoard,以及联邦学习建模 pipeline 调度和生命周期管理工具 FATEFlow,并对 FederatedML 进行了重大升级。


该项目已发布在 github:https://github.com/webankfintech/fate

FATEBoard:简单高效,联邦学习建模过程可视化

FATEBoard 是联邦学习建模的可视化工具,为终端用户可视化和度量模型训练的全过程,帮助用户更简单而高效地进行模型探索和模型理解。


FATEBoard 由任务仪表盘、任务可视化、任务管理与日志管理等模块组成,支持模型训练过程全流程的跟踪、统计和监控等,并为模型运行状态、模型输出、日志追踪等提供了丰富的可视化呈现。FATEBoard 可大大增强联邦建模的操作体验,让联邦建模更易于理解与实施,有利于建模人员持续对模型探索与优化。



图 1 FATEBoard 功能架构总览



图 2 FATEBoard 界面示意图

FATEFlow:高性能联邦学习 pipeline 生产服务

FATEFlow 是联邦学习建模 Pipeline 调度和生命周期管理工具,为用户构建端到端的联邦学习 pipeline 生产服务。FATEFlow 实现了 pipeline 的状态管理及运行的协同调度,同时自动追踪任务中产生的数据、模型、指标、日志等便于建模人员分析。另外,FATEFlow 还提供了联邦机制下的模型一致性管理以及生产发布功能。


在 FATE 0.3 版本以前,启动任务的模块是由 Workflow 完成。在 Workflow 中,各算法组件的顺序被完全固定,用户只能选择是否开启某个模块,无法按照需求调整组件顺序,甚至多次调用同一个组件。每多开发一个组件,都要修改整体的 Workflow,以适应新组件的添加。这种设计,使开发者在添加新组件时,修改部分过多,限制了整体系统的可扩展性。


而 FATE 1.0 新推出的 FATEFlow 良好解决了 workflow 中由于需要提前规定算法组建顺序而造成的流程排版复杂问题,在调用模块时不再存在大一统组件,每一次建模任务都能自定义算法流程。在 FATE v1.0 版本中,开发者自定义流程只要一个普通的 json 文件就可以实现,这使得开发者在添加新组件时,不用修改过多部分,极大程度地提升了整体系统的可扩展性。


FATEFlow 提供了极为丰富的功能,主要包括:


l DAG 定义联邦学习 Pipeline


多方非对称 Pipeline DAG、通用 json 格式 DAG DSL、DSL-Parser


l 联邦任务协同调度


多方任务队列管理、协同分发任务、任务一致性保证、多方状态同步等


l 联邦任务生命周期管理


多方启停、状态检测等


l 联邦模型管理


联邦模型存取、联邦模型一致性、版本管理、发布管理等


l 联邦任务输入输出实时追踪


数据、模型、自定义指标、日志等实时记录存储


此外,FateFlow 还提供了多种接口,方便用户完整把握整个建模任务。包括:


l 上传和下载数据功能,使得用户可以方便地切换数据源;


l 状态查询功能,获得每个组件的实时状态;


l 下载功能,获取每个组件的配置文件和中间结果,最大程度方便用户调试。



在 FATE 1.0 版本中,用户自定义流程得以进一步简化,过程非常简单,只需通过一个普通的 json 文件即可将算法全流程实现。



而配置运行 DSL,也只需要三步:


1. module: 模型组件,FATE 当前支持 11 个模型组件


2. Input:  


• data: 数据输入


• model: 模型输入


• isometric_model: 异构模型,当前只用于 Feature Selection


3. Output


• data: 数据输出


• model: 模型输出



通过以上配置,dsl-parser 能自动对用户设定的 json 文件,解析出完成的算法 DAG 图,并将其通过 FATEBoard 展示出来,使得用户可以清晰地看到整个算法流程的架构。



DAG 图示意

FederatedML:重大升级所有算法模块运行机制

FederatedML 支持 FATEFlow 以组件模块化的方式构建任意模型,支持 FATEBoard 回调中间统计结果以可视化展示。另外,还增加和升级了多项重要功能:


l 优化算法模块增加对 Nesterov Momentum SGD 优化算法的支持,极大提升了联邦学习算法的收敛速度;


l 多方安全协议增加对 Affine Transform 的加法同态加密算法的支持;


l 联邦特征分箱增加对稀疏输入格式的支持;


l 升级评估指标以覆盖大部分分类评估与回归评估;


l 重构和升级算法参数类,实现算法参数定义和校验一体化。

FATEServing:联邦推理功能升级

在线联邦推理中,FATE 1.0 新增了在线联邦建模 pipeline 的 DSL 解析器,允许用户生成联邦推理 pipeline 并进行联邦推理。


总之,FATE 1.0 版本为联邦学习建模带来更丰富更强大的功能,极大提升了联邦建模体验。微众银行 AI 团队欢迎对联邦学习有兴趣的同仁一起贡献代码,提交 Issues 或者 Pull Requests。


详情可查阅 FATE 项目贡献指南:


https://github.com/WeBankFinTech/FATE/blob/master/CONTRIBUTING.md


2019-08-22 15:224027

评论

发布
暂无评论
发现更多内容

告别分库分表,时序数据库 TDengine 解锁燃气监控新可能

TDengine

tdengine 时序数据库

智能感知的未来:传感器融合与数字样机技术

DevOps和数字孪生

KubeCon Europe 2025 | 一图速览华为云精彩议程

华为云原生团队

云计算 容器 云原生

天润融通助力扬子空调AI升级客服系统,独立解决率飙升至45%

天润融通

什么是区块链dapp开发?它能做什么?

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

【经验】几种数据库优化技巧

不在线第一只蜗牛

数据库

从 MySQL 到时序数据库 TDengine:Zendure 如何实现高效储能数据管理?

TDengine

tdengine 时序数据库 数据库·

三级等保测评的云

黑龙江陆陆信息测评部

网站做IPv6改造前需要哪些准备工作?

防火墙后吃泡面

【HarmonyOS Next】鸿蒙应用弹框和提示气泡详解(二)之浮层(OverlayManager),半模态页面(bindSheet),全模态页面(bindContentCover)详解

GeorgeGcs

模态 OverlayManager bindContentCover bindSheet 浮层

AI技术变革下的职场生存指南

老张

人工智能 职场成长

社会福利机构一定要买堡垒机吗?取决于什么因素?

行云管家

等保 堡垒机 社会福利

Go 语言常见错误——并发编程

FunTester

25年什么样的 Agent 会脱颖而出:简单胜于复杂

极客天地

Google 发布 Gemini 2.5 Pro 模型:思考+多模态;Vibe Coder :通过语音对话实现「氛围编程」丨日报

声网

万字详解主权跨链代币标准「ERC-7281」,如何让跨链代币具有可互换性?

TechubNews

交易所开发的实践与展望

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

签约快讯|天润融通签约石头科技

天润融通

因为懒得点鼠标,我给B站做了个语音助手

JYeontu

前端 JavaScrip 浏览器插件 浏览器脚本插件 #前端

Rust + TDengine:打造高性能时序数据处理利器

TDengine

tdengine 数据库·

医疗场景实战:百条数据 RFT 微调盘古大模型,精度大幅提升

华为云开发者联盟

人工智能 LLM 华为云盘古大模型

揭秘淘宝拍立淘API:开启智能商品搜索新时代

Noah

标星 62.9 万,8 个 yyds 的 GitHub 开源项目 !

JEECG低代码

GitHub 开源 开源项目

VMware Tools 12.5.1 下载 - 客户机操作系统无缝交互必备组件

sysin

vmware

直播分享|TinyPro:一行命令,搭建包含前后端的后台管理系统

OpenTiny社区

开源 前端 OpenTiny TinyPro 中后台系统

【大模型加速器2.0】合合信息文档图表解析全方位深度测评

申公豹

ORC技术

从 Timer 到 Timer-XL,再登时序大模型能力高峰

Apache IoTDB

用户标签与画像,精准运营更进一步 - ClkLog 埋点分析系统

ClkLog

开源 埋点 sdk 行为分析 画像

MacBook 跑通 : Deep Research

Lily

AI 网关需要具备的 10 大基本能力

阿里巴巴云原生

阿里云 云原生 AI网关

FATE 1.0重磅发布:首个可视化联邦学习产品与联邦pipeline生产服务上线_AICon_Sylvi_InfoQ精选文章