【AICon】AI 大模型超全落地场景&最佳实践 了解详情
写点什么

阿里妈妈开源曲率空间学习框架、联邦学习解决方案,大幅提升数据的保护和使用效率

  • 2021-09-15
  • 本文字数:2117 字

    阅读完需:约 7 分钟

阿里妈妈开源曲率空间学习框架、联邦学习解决方案,大幅提升数据的保护和使用效率

AI 大模型超全落地场景&金融应用实践,8 月 16 - 19 日 FCon x AICon 大会联诀来袭、干货翻倍!

9 月 15 日,阿里妈妈宣布同时开源两项 AI 技术:曲率空间学习框架和联邦学习解决方案。


这两项最新技术成果的开源,将助力业界提高数据隐私保护能力,预计可降低 80%的存储消耗量和提升 15%的用户请求匹配精准度,上述技术也可应用于互联网行业之外的各个科研计算领域。

 

据了解,曲率空间学习框架(Curvature Learning Framework,简称 CLF)是中国首个经过工业级场景验证的曲率空间深度学习框架;联邦学习解决方案(Elastic Federated Learning Solution,简称 EFLS),是百亿级工业场景跨企业合作的联邦学习解决方案。

 

用户即日起可在全球最大开源网站 GitHub 搜索“Curvature-Learning-Framework”,9 月 30 日以后搜索“Elastic-Federated-Learning-Solution”,查看两个项目的开源文件。

 

“AI 技术是新一代生产力。在基于庞大的工业级场景应用成熟后,我们选择向社会开放这些技术能力,以最大化共享 AI 技术红利,共同进步。”阿里妈妈 CTO 郑波表示。



曲率空间学习框架开源:AI 换轨,坐上曲率飞船

 

曲率是一个衡量空间弯曲程度的量,曲率越接近零,空间越平坦。在科幻小说《三体》中,人类正是利用空间曲率的变化建造出曲率飞船。

 

AI 所需的海量数据与计算往往基于曲率为零的欧氏空间,这潜在制约了表达能力。阿里妈妈技术团队发现,曲率空间能更精准的建模图数据结构,此次开源的曲率空间学习框架,包含流形、算子、模型及黎曼优化器整套深度学习流程,用户可便捷的将模型迁移到曲率空间中,从而给 AI 的发展打开一条新通路。

 

想象一下,使用曲率空间建模就像“吹起一个气球”。假设一个干瘪的气球表面上有十亿个节点,这会是非常致密的状态。随着气球逐渐充气变大,气球表面越来越“弯曲”,节点之间就分的越开,构成的形状也越立体,我们就能越好的观察这些节点并进行区分。

 

曲率空间正如一个膨胀的气球表面,相对于同样大小的欧氏空间,它能容纳的数据更多,而且对树、环等几何特性展现的更全面精准。基于图数据 Cora 的实验证明,替换欧氏空间为曲率空间,模型能提升约 8%的预测精度。

 

阿里妈妈技术人士表示,该技术已经在阿里妈妈业务中展现出很高的应用潜力。基于淘宝搜索广告场景,曲率空间能精准建模十亿级商家与用户的交互行为,利用空间曲率变化实现数据的“定向放大”与“精准分割”。系统全量上线后,存储消耗量降低 80%,用户侧请求匹配精准度相对提升 15%。

 

该技术有望广泛应用到其他行业,引领新一轮的 AI 落地浪潮。业内专家表示,曲率空间可以建模地球表面的云层运动轨迹,航空航海路线等,也能表征物流运输图、资源流动图等。从更及时的天气预报、更精准的地图导航,到更高效的物流运输、更公平的社会资源分配,此项新技术能切实改善人们的生活。

 

联邦学习解决方案开源:兼收并蓄,开放共建

 

联邦学习是 2016 年由谷歌提出,在保护终端隐私的前提下进行机器学习,帮助广告主实现跨公司多端投放的解决方案。通俗一点讲,联邦学习就像几位老师傅共同训练一个徒弟,老师傅们各有所长,却互相防备不能共享,而徒弟则兼收并蓄,融会贯通,集合各家所长,终学有所成。

 

据了解,阿里妈妈此次开源的联邦学习解决方案,更加关注隐私保护和加密计算,并在此基础上建立 APP 孤岛的信息链接,构建机器学习模型,在高并发、加密性、易用性和产品化等方面提供更好支持,方便多方在超大规模稀疏场景下进行联邦学习的合作与实践。

 

具体而言,联邦学习解决方案具备以下特点:


  • 大规模高可用:


云原生实现方案支持百亿规模数据求交;多种验证方式保证最终结果的完整性和正确性;精简的训练交互协议与高效的底层实现,保证分布式训练的高吞吐;精细的状态恢复与模型校验,确保分布式容灾的正确性。 


  • 加密保护隐私:


通过数据安全与计算安全两种手段以保障用户隐私,支持多种隐私保护方案以提供安全和性能的最佳平衡。


  • 更强大更便捷:


首次开源了基于水平聚合、层次聚合的两种模型,并通过可视化 web 界面方便任务流程的开发、配对、调度和管理,极大地提升迭代效率。

 

依托于联邦学习解决方案,阿里妈妈 Unidesk 产品已助力珀莱雅、卡姿兰、薇诺娜、花西子、修正等多个企业实现品牌和业务双丰收。据了解,花西子采用 Unidesk 产品以后,经营效果提升明显,短短 2 个月时间,品牌 ROI 提升 15%,且放量也在逐步提高。

 

未来,该技术可以扩展到金融、医疗共建等场景,普适性较高。

 

将开源进行到底

 

此次开源,延续了阿里妈妈“将开源进行到底”的一贯做法。从 2015 年开始,阿里妈妈技术团队将大规模深度学习、图学习、强化学习等多项 AI 技术深度应用到业务,引领了 AI 在互联网广告领域的探索和大规模应用,并沉淀出多个业内领先的 AI 工程系统。

 


2018 年 11 月,阿里妈妈对外开源了业界首个面向高维稀疏场景的大规模工业级训练引擎 XDL,并同时开源包含深度兴趣网络(DIN)、深度兴趣进化网络(DIEN)、深度树匹配(TDM)在内的多个工业级创新算法。在 GitHub 上,XDL 项目开源一个月内所获星赞数超过 1000 个,到现在已有 4000 多星赞,近 1000 次复制使用。

 

2019 年 1 月,阿里妈妈的大规模图深度学习框架 Euler 正式对外开源,在工业界引起巨大反响的同时,也引起学术界关注。2021 年 4 月,Euler2.0 发布,通用性和灵活性得到进一步提升。在 GitHub 网站上,Euler 项目现在已经有超过 2500 个星赞和 500 次复制使用。

 

公众号推荐:

AGI 概念引发热议。那么 AGI 究竟是什么?技术架构来看又包括哪些?AI Agent 如何助力人工智能走向 AGI 时代?现阶段营销、金融、教育、零售、企服等行业场景下,AGI应用程度如何?有哪些典型应用案例了吗?以上问题的回答尽在《中国AGI市场发展研究报告 2024》,欢迎大家扫码关注「AI前线」公众号,回复「AGI」领取。

2021-09-15 16:412640
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 504.2 次阅读, 收获喜欢 1970 次。

关注

评论

发布
暂无评论
发现更多内容

OpenHarmony 成功亮相国际学术会议 ASPLOS 2024

科技热闻

DockerCompose部署es和kibana

百度搜索:蓝易云

Docker Linux 运维 ES 云服务器

Spring与Docker:如何容器化你的Spring应用

百度搜索:蓝易云

Java Docker spring Linux 运维

详解GaussDB(DWS)中的行执行引擎

华为云开发者联盟

数据库 华为云 华为云开发者联盟 华为云GaussDB(DWS) 企业号2024年5月PK榜

介绍下InnoDB的锁机制?

派大星

MySQL innodb 互联网大厂面试

"Global Golden Course" - Certified ScrumMaster (Delivered in English at weekend)

ShineScrum捷行

Scrum Agile ScrumMaster Agile Coach

photoshop 2021安装教程 ps2021中文版 mac/win

Rose

智谱AI亮相2024 ICLR,分享面向AGI的三大技术趋势

Geek_2d6073

芯盾时代智能风控决策系统信贷版

芯盾时代

监管合规 风控系统 金融业 信贷

PS磨皮滤镜降噪插件套装 Imagenomic Professional Plugin Suite 支持ps2024

Rose

开源之夏2024学生报名启动!阿里云PolarDB社区项目期待你的参与!

阿里云数据库开源

数据库 阿里云 学生开发者

基于阿里云向量检索 Milvus 版与 PAI 搭建高效的检索增强生成(RAG)系统

阿里云大数据AI技术

人工智能 阿里云 Milvus

速度围观|使用分布式企业级任务调度平台,到底有多香?

智在碧得

数字化转型 XXL-JOB 任务调度平台 http任务 elastic job

在iPhone / iPad上轻松模拟GPS位置:AnyGo for Mac中文破解资源

Rose

腾讯互娱面经,希望别凉

王中阳Go

Go 面试 微服务 大厂面经 Go进阶

MacDroid pro:打破Android和Mac系统之间的传输障碍

Rose

Macs Fan Control for mac:提高设备的散热效果,减少过热造成的风险

Rose

浅析Jetty与tomcat区别

百度搜索:蓝易云

Java tomcat 运维 Web jetty

SVN 合并到 Git 时有文件大于 100 M 被限制 Push

HoneyMoose

2023年TCL实业营收突破1,200亿元,同比增长13%

Geek_2d6073

激发大数据场景价值,润和软件HopeOS闪耀鲲鹏昇腾开发者大会2024

科技热闻

谷歌访问助手,解决chrome扩展无法自动更新的问题

Rose

带你熟悉CCE集群增强型CPU管理策略enhanced-static

华为云开发者联盟

Kubernetes 华为云 华为云开发者联盟 华为云CCE 企业号2024年5月PK榜

Imagenomic Portraiture 4.5 ps智能磨皮滤镜插件

Rose

LED显示屏技术升级方向解析

Dylan

工具 LED显示屏 全彩LED显示屏 led显示屏厂家 舞台表演

碳课堂|一文读懂全球碳标准的前世今生

AMT企源

碳管理 碳核算 碳认证

Linux中的chsh命令及示例

百度搜索:蓝易云

云计算 Linux 运维 Shell 云服务器

Mybatis-Plus常见注解

百度搜索:蓝易云

sql 云计算 Linux 云服务器 Mybatis-Plus

第六届·2024 MindSpore 量子计算黑客松热身赛赛题解读

华为云开发者联盟

人工智能 华为云 华为云开发者联盟 企业号2024年5月PK榜

Downie 4 mac视频下载器:自动检测和下载指定网站上的最新视频

Rose

Mint Blockchain,要让全人类都拥有 NFT 资产!

NFT Research

web3 NFT\ L2

阿里妈妈开源曲率空间学习框架、联邦学习解决方案,大幅提升数据的保护和使用效率_AI&大模型_阿里妈妈技术团队_InfoQ精选文章