写点什么

如何从零开始建设数据中台?

  • 2020 年 5 月 12 日
  • 本文字数:1628 字

    阅读完需:约 5 分钟

如何从零开始建设数据中台?

数据中台对于许多传统企业而言,依旧是很陌生的概念。


如何从零开始建设数据中台?


我们把它简化为一个方程式,数据中台:正确的人+正确的工具+正确的事=降本增效,其中,三个要素缺一不可。



正确的人


数据中台在国内有完整实践的企业不多,相关的人才也相对较少。企业在选择数据中台时,需要有方法论、实践经验去指导,以避免从零摸索带来大量人力物力的浪费。这也是企业在选择服务商时需要留意的。


正确的工具


在这里主要指的是狭义上的数据中台产品。市面上的产品五花八门,数据中台产品各型各样,如何选择非常关键。


正确的事


数据中台不是摆设,并不是说搭建一个产品意义的数据中台,企业就完成数字化转型了。数据中台最终还是要为业务服务。我们要用数据中台做什么,解决什么业务痛点,需要考虑清楚。


这个方程式最终导向了我们建设数据中台的目的:为企业带来降本增效。“要么给老板省钱(降本),要么给老板挣钱(增效)”。


数据中台的选型与构建

首先需要强调的是,在这里我们分享的只是一般情况,不同企业、不同数据情况和不同需求,不可一概而论。不管黑猫白猫,能解决痛点的就是好猫。


数据中台的底层是大数据架构,大数据架构如何去选型?



在架构选型时,成本、场景支持是我们考虑最关键的 2 个要素。


综合实施周期、实施成本、是否支持实时计算、数据冗余与数据一致性情况等因素,我们认为 Lambda 架构成本相对适中,又能满足实时计算和离线计算两个场景。


当然,选择 Lambda 架构也会不可避免地面临数据冗余的问题,而目前大部分传统企业用到实时计算的场景偏少一些,相对来说产生的数据冗余也较少,可以通过数据治理等方式解决。


底层之上是引擎,包括离线计算引擎和实时计算引擎,又应当如何去选型?


离线计算:三种离线计算引擎各有特点,可以综合企业的数据情况和需求,选择合适的计算引擎。



实时计算:在批处理+流处理上,Flink 备受青睐,稳定性较好、吞吐量较大。一般来说推荐使用 Flink。



在架构上层,则涉及到了:数据模型应如何设计?


数据模型是为业务服务的。具体来说,就是把业务抽象化,提炼成数据模型,再通过数据解决业务问题。


建数据模型,会经历业务建模、概念建模、逻辑建模和物理建模四个阶段。



在模型选择上,我们仅列举两种模型,星型模型与雪花模型。通常情况下,为了能下游能更好地理解业务,快速提供数据服务,我们会采用空间换时间的方式,从而选择星型模型;而在维度信息变化非常频繁,或者数据存储成本非常高的情况下,我们可以采用雪花模型。归根到底,数据模型没有好坏之分,只有能否解决业务问题。


最后需要强调,对于技术和模型的选择,我们做了一些推荐和优劣势的介绍,但技术和模型本身没有对错之分,适合自己的才是最好的(能解决业务问题才是最好的)


数据中台的架构设计

我们把数据中台的架构分为三层,数据资产层、数据服务层、数据应用层。



这张图从下往上看,首先通过数据治理、数据开发、借助数据仓库,把数据转化为可用的数据,即资产「数据资产化」;然后建立数据能力,把数据用起来,例如标签工厂、模型分析等,即「资产服务化」;再通过智能化的场景给业务赋能,也就是「服务智能化」。


AI 驱动的数据中台

奇点云创立三年来,数据中台的实践在零售、时尚、百购等行业相继落地,在实践经验中,探索并检验出了数据中台的“王道”:AI 驱动的数据中台。


所谓“AI 驱动”,我们可以看到在架构中融入了独创的“云(智能)+端(感知)”的解决方案,从数据采集层的 AIoT 到数据服务层的算法服务、分析引擎再到顶部的数据智能应用,实现了“云赋能端,端丰富云”,既解决企业数据生产的问题,又解决企业数据使用的问题



在“AI 驱动的数据中台”实践中,奇点云自研了一站式大数据智能服务平台—DataSimba,其旨在为企业提供全链路的产品+技术+方法论服务。


DataSimba 核心模块包括全域数据采集、数据开发、数据治理、数据资产管理、数据 API、数据科学、数据质量、标签工厂,可以帮助企业快速搭建安全、易用的数据中台,最大化释放价值,驱动业务增长与创新。



2020 年 5 月 12 日 14:341927
用户头像
刘燕 InfoQ记者

发布了 821 篇内容, 共 276.3 次阅读, 收获喜欢 1560 次。

关注

评论 1 条评论

发布
用户头像
广告打得好
2020 年 05 月 19 日 15:22
回复
没有更多了
发现更多内容

Android程序员失去竞争力的3个陷阱!你中了几个?

小小Code

android 面试 移动开发

为了这一次字节跳动Android面试机会,我准备了158天,一个疏忽让我前功尽弃

小小Code

android 面试 移动开发

月薪9k小厂程序员工作三年,利用闲暇时间终于拿下自己向往已久的字节offer,薪水不能透露

小小Code

android 面试 移动开发

面试官宁愿要刚刚毕业工作1年的我小弟,也不要工作5年的我,年薪25w

小小Code

android 面试 移动开发

未来源码 | 吴恩达教授重磅演讲:Tips for using a data-centric AI approach

MobTech袤博科技

面试官系列 - https 真的安全吗,可以抓包吗,如何防止抓包吗

小小Code

android 面试 移动开发

【建议收藏】面试没亮点

小小Code

android 面试 移动开发

别再问Android开发前景了,现状分析给你看了,难道还要让我教你怎么做

小小Code

android 面试 移动开发

十月的Android面试之旅,惨败在字节三面,幸斩获小米Offer

小小Code

android 面试 移动开发

Android屏幕适配;知识点+攻略

小小Code

android 面试 移动开发

你所谓的安逸,正在慢慢毁掉你!

小小Code

android 面试 移动开发

毕业五年,如何从月薪5K涨到年薪50W+,需要掌握哪些核心技能?

Linux爱好者

内存管理 Linux内核 进程管理 驱动开发 嵌入式开发

Android开发:请你吃一顿史上最全的Android混淆大餐

小小Code

android 面试 移动开发

mysql经纬度 某半径长度 内查询数据

小小Code

android 面试 移动开发

做了5年Android,靠着这份190页的面试资料,成功入职腾讯

小小Code

android 面试 移动开发

Activity Result API 使用与源码分析

小小Code

android 面试 移动开发

阿里P8大牛沉寂5个月,整理出Android逆向系列学习进阶视频,八章-34节视频免费下载

小小Code

android 面试 移动开发

转载:程序员的发展方向

小小Code

android 面试 移动开发

Minio基本使用与原理

神秘码农

Linux操作系统I/O机制原理(流程图详解)

Linux爱好者

内存管理 Linux内核 进程管理 嵌入式开发 设备驱动

动态数据库工具——Database Inspector

小小Code

android 面试 移动开发

差点就痛失了字节跳动Android岗的Offer,原因竟是因为性能调优!

小小Code

android 面试 移动开发

东吴证券X袋鼠云:数据轻松可取、毫秒级反应能力,东吴证券做对了什么?

数栈DTinsight

大数据

显示实现接口和隐式实现接口的区别

小小Code

android 面试 移动开发

阿里面试官:简历上最好不要写Glide,不是问源码那么简单

小小Code

android 面试 移动开发

新闻速递 I MobTech通过中国信通院“安全专项评测”

MobTech袤博科技

模块四作业

HZ

架构实战营 #架构实战营

Android-气泡对话框(根据被点击View位置显示、可定制

小小Code

android 面试 移动开发

Android面试题之屏幕适配+AIDL篇

小小Code

android 面试 移动开发

如何从零开始建设数据中台?_AI_奇点云_InfoQ精选文章