东亚银行、岚图汽车带你解锁 AIGC 时代的数字化人才培养各赛道新模式! 了解详情
写点什么

阿里开源深度学习框架 XDL,面向广告、推荐、搜索场景

  • 佚名

  • 2018-11-28
  • 本文字数:1428 字

    阅读完需:约 5 分钟

阿里开源深度学习框架XDL,面向广告、推荐、搜索场景

AI 前线导读: 11 月 28 日,阿里巴巴旗下大数据营销平台阿里妈妈宣布开源深度学习框架 XDL。这是阿里巴巴首次公开的深度学习框架,也是业界首个面向高维稀疏数据场景的深度学习开源框架,突破了现有深度学习开源框架大都面向图像、语音等低维稠密数据而设计的现状。


更多干货内容请关注微信公众号“AI 前线”(ID:ai-front)


双 11,阿里巴巴集中展示了其商业操作系统,半个月之后,阿里巴巴宣布将其中一大重要业务板块——阿里妈妈的重要技术框架——X-Deep Learning(XDL)进行开源。据称,这也是该商业操作系统中最具商业价值的业务板块之一。


作为阿里巴巴旗下的大数据营销平台,阿里妈妈基于自身广告业务,自主研发了深度学习框架 XDL,并已经大规模部署应用在核心生产场景。

面向高维稀疏业务场景,提升广告、推荐、搜索效率

随着深度学习的风靡,阿里妈妈发现,已有的开源框架很难满足其广告场景的规模性及生产迭代要求,自研面向工业应用的分布式深度学习框架随即被提上了日程。


于是,XDL 应运而生,旨在解决具有高维稀疏性的业务场景中面临的问题。XDL 针对阿里妈妈业务数据高维稀疏的场景特点进行了优化,自 2016 年下半年开始逐步部署到阿里妈妈的业务系统,至 2017 年初全面完成了生产化。以阿里妈妈定向广告为例,XDL 框架助力了业务场景所有核心算法的深度学习创新,当年,以 XDL 为基础的深度学习算法升级带来的广告收入提升超过百亿。


高维稀疏性既是阿里妈妈业务场景的重要特征,也是互联网的众多核心应用场景(如广告/推荐/搜索等)的特征,覆盖了大多数互联网企业的数据应用模式。对于难以与 BAT 研发能力比肩的众多互联网公司而言,工业级深度学习框架 XDL 及内置算法方案的开源,将助力各大公司的技术升级,大大提升广告/推荐/搜索场景的精准性,缩短技术迭代周期。


不仅是广告场景,互联网其它的核心场景如推荐、搜索等,也具有典型的高维稀疏数据特性,例如微博、抖音、今日头条等都属于该范畴内。因此,XDL 在这些场景中也具有非常高的通用性,这为开源提供了基础。不管是以广告、推荐、搜索为代表业务的企业级用户,还是对此感兴趣的个人用户,都可以加入到开源计划当中。


值得一提的是,在阿里巴巴 XDL 开源之前,业界的深度学习开源框架基本是面向图像、语音处理等场景数据而设计,这与整个人工智能领域的研究重点有关,图像和语音是率先取得理论突破的场景,但在工业级互联网场景中实现大突破还属首次。

开放与易用性

据阿里妈妈透露,XDL 框架从设计之初,就具备了足够的开放性和易用性,开源是水到渠成的一步。


XDL 创造性地采用了桥接的架构(Bridging)设计理念,重点打造面向工业级应用的分布式规模能力,单机能够处理的计算则引用现有开源框架。这种桥接的架构,使得 XDL 跟业界的开源社区是无缝对接的,例如用户可以非常方便地在 XDL 框架上应用基于 Tensorflow 或者 Pytorch 编写的最先进开源深度学习算法。


此外,对于已经在使用其它开源框架的企业或者个人用户,也可以在原有系统基础上轻松进行扩展,获得 XDL 带来的高维稀疏数据场景下的分布式能力。

系统化解决方案将分批发布

除了核心的 XDL 训练框架外,阿里妈妈透露将全面开源面向高维稀疏数据场景的系统化解决方案,计划分批次对外发布,包括面向在线实时服务的高性能深度学习预估引擎、面向全库实时检索的全新深度学习匹配引擎;同时还内置阿里妈妈自主研发的一系列创新算法,涉及 CTR 预估模型、CVR 预估模型、匹配召回模型、模型压缩训练算法等。



链接:http://t.cn/E28YBT9


公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2018-11-28 17:402044

评论 1 条评论

发布
暂无评论
发现更多内容

对话龙智专家,共探DevSecOps实践难点

龙智—DevSecOps解决方案

DevOps DevSecOps

【征集令】寻找2022年鸿蒙智联“出行新爆款产品”

HarmonyOS开发者

HarmonyOS

先进开发团队,先用 Apifox,做“API 文档先行”理念的先行者!

狐哥说技术

Apifox API swagger API文档

超细!细说Zookeeper选举的一个案例(下)

恒生LIGHT云社区

Go golang zookeeper Go 语言

Kubernetes 集群无损升级实践

vivo互联网技术

容器 云原生 服务器集群 Kubernetes 集群

COG云原生优化遥感影像,瓦片切分的最佳实践

华为云开发者联盟

云原生 遥感影像 瓦片切分 云上遥感影像文件 华为云地理遥感平台

前端开发之JS中filter()的使用

@零度

JavaScript 前端开发

即构科技 RTC 实践与深度解析 | 内容合集

ZEGO即构

音视频 RTC 内容合集 技术实践 技术专题合集

龙智第四次荣登“2021上海软件和信息技术服务业高成长百家”名单

龙智—DevSecOps解决方案

上海软件和信息技术服务业

Hive查询的18种方式

编程江湖

大数据 hive

建木持续集成平台v2.1.0发布

Jianmu

DevOps CI/CD 开源社区

GaussDB(DWS)中共享消息队列实现的三大功能

华为云开发者联盟

线程 数据同步 GaussDB(DWS) 共享消息队列 共享消息

【LeetCode】在 D 天内送达包裹的能力Java题解

Albert

算法 LeetCode 12月日更

容器技术正在颠覆传统,重构整个软件世界

巨子嘉

容器 云原生

比特币挖矿与源码解析

恒生LIGHT云社区

比特币 区块链 挖矿

跟着动画学Go数据结构之选择排序

宇宙之一粟

golang 数据结构 选择排序 12月日更

书单 | “实战派”系列,每一本都是学好用好一门技术的“航空母舰”

博文视点Broadview

netty系列之:netty对SOCKS协议的支持

程序那些事

Java Netty 程序那些事 SOCKS 12月日更

【1分钟调研赢好礼】HarmonyOS Connect 视频课堂用户反馈问卷

HarmonyOS开发者

HarmonyOS

被灵魂问倒:这个BUG为什么没测出来?

华为云开发者联盟

测试 bug 文档 测试用例 测试工程师

大数据开发hadoop之yarn基础架构详解

@零度

大数据 hadoop YARN

Sentinel-Go 源码系列(三)滑动时间窗口算法的工程实现

捉虫大师

Go sentinel-go

Java开发Excel数据导入mysql的实用小技巧

@零度

Java MySQL

读《思辨与立场》-07思维的标准

wood

28天写作 批判性思维 思辨与立场

Redisson:这么强大的实现分布式锁框架,你还没有?

华为云开发者联盟

redis 分布式 分布式锁 可重入锁 Redisson框架

从 WAN 到 SD-WAN 边缘设备的网络架构

devpoint

TLS ssl SD-WAN 12月日更

龙智宣布与ConnectALL成为合作伙伴 进一步提升DevOps解决方案水平

龙智—DevSecOps解决方案

DevOps ConnectALL 价值流 价值流管理

以 Vuex 为引,一窥状态管理全貌

杨成功

JavaScript Vue 大前端 vuex

Go语言逆向技术:常量字符串

华为云开发者联盟

字符串 go语言 字符 逆向技术 常量字符串

10个比较不错的 JavaScript 库

编程江湖

JavaScript 前端开发

你可能不信,52小时能做出7款超酷产品!

LigaAI

程序员 技术 技术人生 技术分享 hackathon

阿里开源深度学习框架XDL,面向广告、推荐、搜索场景_AI&大模型_InfoQ精选文章