阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

8 亿用户的网易云音乐是怎样建设数据中台的?

  • 2020-04-23
  • 本文字数:3841 字

    阅读完需:约 13 分钟

8亿用户的网易云音乐是怎样建设数据中台的?


这几年,“中台战略”概念像是一把火,“烧遍”国内互联网。而在业界,关于中台的实践并不多,尤其是数据中台。何为数据中台?数据中台建设面临着哪些挑战?它会带来哪些收获?…


带着这些疑惑,InfoQ 记者采访了 ArchSummit 全球架构师峰会讲师网易云音乐数据智能部数据开发专家朱一飞。作为国内知名音乐平台,网易云音乐有 8 亿用户。不过,它面临的挑战在于,一方面各个业务单元在 8 亿用户基数上积累海量的数据,另一方面,业务部门基于发展需要提出大量数据需求,并且在数据质量、数据共享、实时化方面的要求越来越高。为解决这些问题,网易云音乐搭建了自己的数据中台体系,且受益匪浅。


2012 年加入网易云音乐初创团队,朱一飞是一名“土生土长”的网易云音乐技术人。随着公司不断发展,他先后负责过搜索、音频识别后端架构。2016 年,朱一飞开始带领数据团队,经历了数据团队业务组建到平台建设,再到近一两年推进中台体系建设。

何为数据中台?

虽然当前关于中台的讨论已经很火热,但朱一飞认为数据中台是以数据驱动业务创新为目标,具备灵活机动快速反应特征的技术与组织能力体系建设。这里面有三个基本元素:


  1. 目标。中台的最终目的是解决业务问题;

  2. 灵活快速。能不能快速解决业务诉求是衡量数据中台的重要标准。说到底,建设中台是为了用;

  3. 体系化。n 支游击队凑在一起成不了集团军,因而缺乏强大的战斗力。关于技术体系、组织架构,需要有完整、严谨和深入的思考。

数据中台建设的背景和诉求

据悉,网易云音乐的数据团队最初是一支业务开发团队,其大部分工作都在解决业务需求。后来,团队慢慢发现平台工具层面存在诸多瓶颈。因此,团队发起为期 2 年左右的平台化建设,基本搭建起底层的技术基础设施。


在朱一飞看来,随着网易云音乐的创新发展,尤其是产品矩阵建立后,如何快速完整地满足业务对数据的诉求依然有很大的提升空间


“除底层工具建设外,我们发现还需要在平台与业务中间“铺设”一个中间层,确保团队能理解业务目标而不是躲在后台的技术领域自娱自乐。同时,我们还要快速跟上各产品发展方向的变化,并且努力将试错成本降到最低。因此,我们反过来又去思考平台体系还有哪些不完备的地方,组织架构还需要进行哪些调整。”他说。


而团队对于数据中台建设的诉求,主要分为两部分:


一是面向过去看要解决的问题,其中的核心是整个数据链路的标准化(包括方法论和工具两个层面,细化到链路的各个环节有不同的具体目标),以及如何去推动这套标准在所有相关业务团队的落地。


二是面向未来要为业务提供什么样的驱动力。团队要以什么样的形式提供数据服务,以及团队应该是什么样的组织模式,从而跟业务团队保持高效协同。

面临的挑战

据朱一飞介绍,团队面临的挑战是在业务需求响应与体系建设上如何取得更好的平衡。“解决单一问题总是相对简单的,相信很多兄弟团队都深有体会”。


他表示,“虽然目前网易云音乐的数据中台建设取得一定进展,但我们还是认为长期处在中台建设的’初级阶段‘。”


在整个数据中台建设中,他们需要不断做出权衡(trade off):


  1. 主干问题优先,考虑 ROI,比如数仓标准化、埋点规范化、指标口径统一等问题如果在产品初期不落地,则积重难返,而且大大消耗团队的精力。所以,这类问题,他们一般会在新产品场景优先去落地。

  2. 业务核心项目优先。核心的业务项目(比如云音乐中的增长项目)其实是中台服务的触点,如果错过了,以后合作接入就困难重重。因此,这类项目,他们一定会想办法先推动落地,再去考虑后续优化,体系化改造。

  3. 现阶段,他们并不追求一套大而全的体系。


据悉,网易云音乐的业务场景,从横向看,有音乐、直播、K 歌等产品线,从纵向看,包括增长、营收、平台等业务职能线。虽然网易云音乐的业务线和团队众多,“但我们的中台体系实际上是在同一套规范和标准下逐步接入业务的,而非反过来面向业务去设计多种架构”。这中间存在一些需要适配的地方。总的来说,其目标是尽可能抽取更多的共性。


朱一飞坦承,“想实现这一点并不简单,网易云音乐本身产品交互层面相对其他产品的复杂性,独特的账号体系都对我们提出了挑战。”


另一方面,在数据与业务结合的中间层,即中台赋能业务的部分,团队的灵活性会高一些,比如针对市场的新增目标,或会员的营收目标。“我们会单独组建团队专门搭建针对性的业务数据服务及产品,提供一站式解决方案,类似于一支快速反应部队能随时快速解决战斗。”他说。

网易云音乐的数据中台架构

据朱一飞介绍,网易云音乐数据中台架构包含几个层:


最底层——基础设施层

基础设施层包括资源环境和平台工具两部分:资源环境是依赖网易杭州研究院提供的大数据集群、容器化环境、底层储备组件等。平台工具主要是自研的提供离线、实时、算法三大方面开发能力的一站式开发环境。

第二层是数据层

数据层即网易云音乐的 OneData,包括元数据中心、标准化数仓、数据地图、统一指标体系、数据安全中心和保障这套体系的数据质量管理中心。

第三层是服务层

服务层即网易云音乐的 OneService。它提供不同层级和粒度的数据 API,包括从最底层的任务执行调度能力,到最面向应用的人群圈定的各类服务能力。而服务中的公共部分,包括权限 & 稽核模块、RPC 框架、服务发现等都是依托网易云音乐技术中心的统一框架。

最上层是产品层

如前文所述,他们组建了一支快速反应部队,针对一个个核心业务问题(增长、营收、版权)搭建了对应数据产品,实现从业务流程、信息采集、数据洞察到 ROI 评估再到业务流程的完整闭环。能够实现快速反应,主要是因为依赖上游的统一数据服务以及产品对应的统一系统框架。

网易云音乐数据中台的具体实践

数据中台的整个实践过程,大致可分为三个阶段:

阶段一:“史前时代”

这个时期属于数据团队大干快上的阶段,他们主要的工作模式是逢山开路,遇水搭桥,大量支持业务需求。同时,他们发布了数仓 1.0、用户画像和 DMP 系统、OLAP 分析平台,开发了大量报表。


在这期间,随着对业务的理解变得更深刻,同时网易云音乐快速发展积累的数据体量带来很多挑战,“我们做了相当多的基础设施改造,比如数据层面对埋点体系的梳理、平台层面搭建了底层计算能力(实时、算法)等”。

阶段二:数据中台 beta 阶段

2018 年底到 2019 年,为支持业务扩张,他们从目标、体系、组织结构对团队进行了梳理,确定了中台建设思路(这也契合同期网易云音乐整体技术、业务双中台战略)。


团队被重新划分为平台、数据、产品三条线,重点做了两件事:


  1. 整合升级。横向统一全域的数据,将之前的算法、广告、业务数据全部纳入进来。纵向,建立对整个 pipeline 的管理体系。

  2. 探索数据中台与业务的合作模式。“这个期间,我们也尝试多走一步,提供一站式的业务与数据结合的产品。核心是想获得中台在业务的落脚点,同时通过拿到一些业务结果让合作团队看到并认可数据中台的价值。”朱一飞说。

阶段三:数据中台 1.0

在这个阶段,主要有两个目标:


  1. 标准化。通过标准化,他们希望解决质量、效率和成本的问题。在标准化数仓重构、统一指标体系、统一 OLAP 分析平台、数据技术中台、数据资产管理等项目,大部分取得阶段性成果。

  2. 合作赋能。在前台业务赋能方面,他们一方面寻找更多中台接入的触点,另一方面也会尝试将部分成熟前台产品重新交到业务团队手里,防止战线过长,始终保持灵活机动的组织模式,更多通过赋能解决业务问题(扶上马,送一程)。

数据中台收益

朱一飞说:"从结果看,首先,我们从单一解决数据的问题转变为解决’人‘的问题。"从业务视角看,他们不光只是报表数据的提供者,而是真正参与到业务决策,解决业务问题。他们在多个团队实现从业务流程、信息采集、数据洞察到 ROI 评估再到业务流程的完整闭环,包括增长团队、版权团队、音乐人团队、会员营收团队等。


其次,从体系的角度衡量,团队在效率和质量上得到大幅提高,“支撑起我们难以想象的工作量”。比如,他们的标准化数仓 +OLAP 解决的临时取数每周在几千次左右,让其支撑的取数工作量减少 80% 以上


此外,他们搭建的离线、计算、算法平台支撑的开发者占到网易云音乐团队的近 50%,真正降低了数据处理和使用门槛,并且因为实现了大部分的标准化,质量仍然有保证。

个人收获与思考

对朱一飞而言,他最大的收获是以往看一个平台或中台架构的视角是平面的,更多看到的是一个最终结果,即中台是什么的问题。在经历网易云音乐从 0 到 1 搭建体系的过程后,他的视角扩宽到体系平面垂直的时间维度。“我会更多思考整个中台为什么应该是这样的,架构中哪些层面更重要、需要优先解决,设计者应该将每个部分如何在时间线上串联起来等问题。”他说。


一个团队需要什么样的数据中台,甚至是否需要数据中台应结合自己的实际情况,不变的是数据驱动业务创新这个目标,方法和思路可以因团队而异。实际上,数据中台并非 silver bullet(银弹)。


如果让他重新开始,朱一飞称“很多选择可能并不会有变化。但有一定经验,会让我们避免一些坑,速度会快一些,比如我们的规范化埋点和流程做在前头,数仓的设计会更规范完整一些。”


嘉宾介绍:


朱一飞,网易云音乐数据智能部数据开发专家。2012 年硕士毕业于浙江大学,同年加入网易云音乐,从 2016 年开始带领团队从 0 到 1 搭建了云音乐数据技术体系。近一年来结合业务创新发展的需要以及对中台建设的思考,实践了包括数据基础设施,标准化数仓,数据应用产品矩阵,团队组织模式在内的中台架构。


ArchSummit 全球架构师峰会(深圳站)现场,朱一飞老师将更加详细的介绍关于数据中台的一线实践与思考,希望给正在建设数据中台的一些公司提供可借鉴的经验。


2020-04-23 16:0510172
用户头像
万佳 前InfoQ编辑

发布了 677 篇内容, 共 335.5 次阅读, 收获喜欢 1795 次。

关注

评论

发布
暂无评论
发现更多内容

低代码平台探讨-MetaStore元数据缓存 | 京东云技术团队

京东科技开发者

缓存 低代码 元数据 企业号10月PK榜

最全数据安全评估标准汇编,你应该需要!(附下载)

极盾科技

数据安全

「爱嗨游」发布会剧透|应用出海十大难题,全景方案一次解决

融云 RongCloud

产品 社交 泛娱乐 GenAI 爱嗨游

九章云极DataCanvas多模态大模型平台实践与思考

九章云极DataCanvas

从理论到实践,实时湖仓功能架构设计与落地实战

袋鼠云数栈

数据中台 数据仓库 数据湖 湖仓一体 实时湖仓

架构师日记-聊聊开发必掌握的那些实践技能 | 京东云技术团队

京东科技开发者

软件开发 代码注释 开发技能 企业号10月PK榜

2023年知名国产数据库厂家汇总

行云管家

数据库 国产化 数据运维 数据安全运维 信创国产化

新晋技术管理者如何推动组织变革?

LigaAI

团队管理 研发管理 进阶 技术管理 企业号10月PK榜

黄金眼PAAS化数据服务DIFF测试工具的建设实践 | 京东云技术团队

京东科技开发者

测试 PaaS 回归测试 企业号10月PK榜

AIGC立法和相关版权案例分享-“心寄源”法律沙龙(2023第五期 | 总第十期)成功召开

开放原子开源基金会

活动回顾 | MatrixOne 在 SaaS 企服领域的应用解读

MatrixOrigin

数据库 分布式 HTAP MatrixOrigin MatrixOne

精彩回顾|【ACDU 中国行·成都站】数据库主题交流活动成功举办!

墨天轮

MySQL 数据库 oracle postgresql zabbix

华为云GaussDB亮相金融业数据库技术大会

华为云开发者联盟

数据库 后端 华为云 资讯 华为云开发者联盟

第1期 | GPTSecurity周报

云起无垠

Ask Milvus Anything!聊聊被社区反复@的那些事儿ⅠⅠ

Zilliz

Milvus Zilliz AIGC 向量数据库

Node.js 21 版本已发布!

南城FE

JavaScript 前端 nodejs

iPhone 15 拆机调查来了;小米澎湃 OS 彻底重写底层架构丨 RTE 开发者日报 Vol.69

声网

DR5白金版 for mac(PS一键磨皮插件Delicious Retouch)支持ps2022 v5.0汉化版

晴雯哥

SOA认知和方法论 | 京东物流技术团队

京东科技开发者

架构 软件架构 SOA 企业号10月PK榜

面试多起来了

王磊

Java

欢迎来到 GPTSecurity!共建知识库

云起无垠

GPTSecurity

腾讯大数据 x StarRocks|构建新一代实时湖仓

StarRocks

大数据 腾讯 StarRocks 湖仓

深入剖析 API 安全防护的最佳实践策略

Apifox

程序员 API 接口安全 接口工具 API 安全

Mac移植版 Nebula街机模拟器最新汉化包

胖墩儿不胖y

mac游戏 游戏推荐

技术同学如何设计职业规划

老张

职业规划 职场成长 职场发展

Camtasia 2023 for Mac(视频录制和剪辑软件) v2023.3.1中文激活版

mac

苹果mac Windows软件 Camtasia 2023 视频软件

8亿用户的网易云音乐是怎样建设数据中台的?_文化 & 方法_万佳_InfoQ精选文章