阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

阿里妈妈开源曲率空间学习框架、联邦学习解决方案,大幅提升数据的保护和使用效率

  • 2021-09-15
  • 本文字数:2117 字

    阅读完需:约 7 分钟

阿里妈妈开源曲率空间学习框架、联邦学习解决方案,大幅提升数据的保护和使用效率

9 月 15 日,阿里妈妈宣布同时开源两项 AI 技术:曲率空间学习框架和联邦学习解决方案。


这两项最新技术成果的开源,将助力业界提高数据隐私保护能力,预计可降低 80%的存储消耗量和提升 15%的用户请求匹配精准度,上述技术也可应用于互联网行业之外的各个科研计算领域。

 

据了解,曲率空间学习框架(Curvature Learning Framework,简称 CLF)是中国首个经过工业级场景验证的曲率空间深度学习框架;联邦学习解决方案(Elastic Federated Learning Solution,简称 EFLS),是百亿级工业场景跨企业合作的联邦学习解决方案。

 

用户即日起可在全球最大开源网站 GitHub 搜索“Curvature-Learning-Framework”,9 月 30 日以后搜索“Elastic-Federated-Learning-Solution”,查看两个项目的开源文件。

 

“AI 技术是新一代生产力。在基于庞大的工业级场景应用成熟后,我们选择向社会开放这些技术能力,以最大化共享 AI 技术红利,共同进步。”阿里妈妈 CTO 郑波表示。



曲率空间学习框架开源:AI 换轨,坐上曲率飞船

 

曲率是一个衡量空间弯曲程度的量,曲率越接近零,空间越平坦。在科幻小说《三体》中,人类正是利用空间曲率的变化建造出曲率飞船。

 

AI 所需的海量数据与计算往往基于曲率为零的欧氏空间,这潜在制约了表达能力。阿里妈妈技术团队发现,曲率空间能更精准的建模图数据结构,此次开源的曲率空间学习框架,包含流形、算子、模型及黎曼优化器整套深度学习流程,用户可便捷的将模型迁移到曲率空间中,从而给 AI 的发展打开一条新通路。

 

想象一下,使用曲率空间建模就像“吹起一个气球”。假设一个干瘪的气球表面上有十亿个节点,这会是非常致密的状态。随着气球逐渐充气变大,气球表面越来越“弯曲”,节点之间就分的越开,构成的形状也越立体,我们就能越好的观察这些节点并进行区分。

 

曲率空间正如一个膨胀的气球表面,相对于同样大小的欧氏空间,它能容纳的数据更多,而且对树、环等几何特性展现的更全面精准。基于图数据 Cora 的实验证明,替换欧氏空间为曲率空间,模型能提升约 8%的预测精度。

 

阿里妈妈技术人士表示,该技术已经在阿里妈妈业务中展现出很高的应用潜力。基于淘宝搜索广告场景,曲率空间能精准建模十亿级商家与用户的交互行为,利用空间曲率变化实现数据的“定向放大”与“精准分割”。系统全量上线后,存储消耗量降低 80%,用户侧请求匹配精准度相对提升 15%。

 

该技术有望广泛应用到其他行业,引领新一轮的 AI 落地浪潮。业内专家表示,曲率空间可以建模地球表面的云层运动轨迹,航空航海路线等,也能表征物流运输图、资源流动图等。从更及时的天气预报、更精准的地图导航,到更高效的物流运输、更公平的社会资源分配,此项新技术能切实改善人们的生活。

 

联邦学习解决方案开源:兼收并蓄,开放共建

 

联邦学习是 2016 年由谷歌提出,在保护终端隐私的前提下进行机器学习,帮助广告主实现跨公司多端投放的解决方案。通俗一点讲,联邦学习就像几位老师傅共同训练一个徒弟,老师傅们各有所长,却互相防备不能共享,而徒弟则兼收并蓄,融会贯通,集合各家所长,终学有所成。

 

据了解,阿里妈妈此次开源的联邦学习解决方案,更加关注隐私保护和加密计算,并在此基础上建立 APP 孤岛的信息链接,构建机器学习模型,在高并发、加密性、易用性和产品化等方面提供更好支持,方便多方在超大规模稀疏场景下进行联邦学习的合作与实践。

 

具体而言,联邦学习解决方案具备以下特点:


  • 大规模高可用:


云原生实现方案支持百亿规模数据求交;多种验证方式保证最终结果的完整性和正确性;精简的训练交互协议与高效的底层实现,保证分布式训练的高吞吐;精细的状态恢复与模型校验,确保分布式容灾的正确性。 


  • 加密保护隐私:


通过数据安全与计算安全两种手段以保障用户隐私,支持多种隐私保护方案以提供安全和性能的最佳平衡。


  • 更强大更便捷:


首次开源了基于水平聚合、层次聚合的两种模型,并通过可视化 web 界面方便任务流程的开发、配对、调度和管理,极大地提升迭代效率。

 

依托于联邦学习解决方案,阿里妈妈 Unidesk 产品已助力珀莱雅、卡姿兰、薇诺娜、花西子、修正等多个企业实现品牌和业务双丰收。据了解,花西子采用 Unidesk 产品以后,经营效果提升明显,短短 2 个月时间,品牌 ROI 提升 15%,且放量也在逐步提高。

 

未来,该技术可以扩展到金融、医疗共建等场景,普适性较高。

 

将开源进行到底

 

此次开源,延续了阿里妈妈“将开源进行到底”的一贯做法。从 2015 年开始,阿里妈妈技术团队将大规模深度学习、图学习、强化学习等多项 AI 技术深度应用到业务,引领了 AI 在互联网广告领域的探索和大规模应用,并沉淀出多个业内领先的 AI 工程系统。

 


2018 年 11 月,阿里妈妈对外开源了业界首个面向高维稀疏场景的大规模工业级训练引擎 XDL,并同时开源包含深度兴趣网络(DIN)、深度兴趣进化网络(DIEN)、深度树匹配(TDM)在内的多个工业级创新算法。在 GitHub 上,XDL 项目开源一个月内所获星赞数超过 1000 个,到现在已有 4000 多星赞,近 1000 次复制使用。

 

2019 年 1 月,阿里妈妈的大规模图深度学习框架 Euler 正式对外开源,在工业界引起巨大反响的同时,也引起学术界关注。2021 年 4 月,Euler2.0 发布,通用性和灵活性得到进一步提升。在 GitHub 网站上,Euler 项目现在已经有超过 2500 个星赞和 500 次复制使用。

 

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2021-09-15 16:412599
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 493.5 次阅读, 收获喜欢 1967 次。

关注

评论

发布
暂无评论
发现更多内容

软件测试|测试平台开发Flask操作数据库-ORM

霍格沃兹测试开发学社

js 高精度计算 - decimal.js 库

程序员海军

JavaScript 精度 高精度计算

NFT交易所交易平台开发功能以及创新设计

区块链软件开发推广运营

交易所 质押挖矿 数字藏品开发 区块链开发 NFT开发

喜讯!极限科技再次荣获一项国家发明专利授权

极限实验室

发明专利 数据分区 二维拆分算法

去中心化兑换交易所开发

西安链酷科技

DeFi流动性挖矿 去中心化钱包

数智化时代,企业如何深度推进业财融合?

用友BIP

业财融合 2023全球商业创新大会

酷克数据推出AI开发工具箱HashML 加速企业级AI应用落地投产

酷克数据HashData

交易所开发中心化交易所与去中心化交易所

区块链软件开发推广运营

数字藏品开发 dapp开发 区块链开发 交易所源码 NFT开发

软件测试|测试平台后端开发Flask框架-集成Swagger文档

霍格沃兹测试开发学社

去中心化流动性挖矿系统开发

西安链酷科技

软件开发 DeFi去中心化系统开发 DAPP系统开发 DeFi质押挖矿 DeFi流动性挖矿

智能合约DAPP系统开发

西安链酷科技

DAPP智能合约交易系统开发 DAPP系统开发 DeFi质押挖矿 NFT链游

软件测试|Vue常用指令-条件渲染(v-if)

霍格沃兹测试开发学社

企业大数据平台建设七大场景,看这本指南就够了

Geek_2d6073

如何加快跨国传输大文件的速度?

镭速

跨国传输大文件

如何解决基因行业海量数据传输难题?镭速传输给出答案

镭速

大数据传输

软件测试|测试平台后端开发Flask操作数据库-多对多

霍格沃兹测试开发学社

DAPP开发与经济模型设计

区块链软件开发推广运营

数字藏品开发 dapp开发 区块链开发 交易所源码 NFT开发

软件测试|Pycharm基础使用介绍

霍格沃兹测试开发学社

软件测试|Pycharm常用插件介绍

霍格沃兹测试开发学社

永续合约交易所软件开发的探讨

西安链酷科技

dapp开发 链游开发

DAPP质押挖矿系统开发

西安链酷科技

DAPP系统开发 流动性挖矿

软件测试|测试平台后端开发Flask操作数据库-数据CRUD(增删改查)

霍格沃兹测试开发学社

软件测试|缺陷的生命周期是怎么样的

霍格沃兹测试开发学社

苹果证书分类及作用详解,助力开发者高效管理应用程序

雪奈椰子

ios 开发 IOS云打包

软件测试|Flask操作数据库-一对多

霍格沃兹测试开发学社

永续合约交易平台搭建

西安链酷科技

数字货币交易所开发 交易所搭建 秒合约 质押挖矿系统开发 期权交易所

SpringBoot 如何优雅的进行全局异常处理?

这我可不懂

springboot

公链开发联盟链开发区块链浏览器开发钱包开发

区块链软件开发推广运营

数字藏品开发 dapp开发 区块链开发 链游开发 公链开发

Python从0到1丨详解图像锐化的Sobel、Laplacian算子

华为云开发者联盟

Python 人工智能 华为云 华为云开发者联盟 企业号9月PK榜

期权交易所搭建APP

西安链酷科技

合约交易所开发 交易所开发软件开发 秒合约

交割合约交易所开发APP

西安链酷科技

合约量化 合约交易所开发 量化合约

阿里妈妈开源曲率空间学习框架、联邦学习解决方案,大幅提升数据的保护和使用效率_AI&大模型_阿里妈妈技术团队_InfoQ精选文章