写点什么

数据中台初探与应用实践

2020 年 5 月 18 日

数据中台初探与应用实践

本文是【技术琐话公益直播】4 月 28 日晚分享嘉宾徐桢虎在线直播中主题《数据中台初探与应用实践》内容整理,内容有删减调整,直播回放见之前的分享。



1 为什么需要数据中台


当企业发展到一定规模时,数据是否能够创造价值显得尤为重要。如果没有从业务的角度对数据进行规划,再多的数据也没有用。一个企业业务与数据双中台的战略地位是相辅相成的,需要打造数据与业务的闭环。


  • 数据增值 :对数据做统一规划、管理、深度挖掘,实现数据到资产的增值;

  • 数据流通 :高价值数据资源的整合、积累、流通,提升数据处理能力;

  • 业务创新 :打破技术隔阂,构建智能化技术引擎,提高业务效率和创新能力。


数据中台的核心价值为优化现有业务和实现新业务的转型,打造数据驱动的智能化企业。


业务价值


  • 以客户为中心进行精细化运营

  • 以数据为基础支撑商业模式创新

  • 打造持续增值的数据资产


技术价值


  • 应对不同数据处理的需求

  • 对数据资产进行标签化应用

  • 快速复用数据服务

  • 快速定位数据血缘链路


2 什么是数据中台


传统数据仓库,第一次明确了数据分析的应用场景应该用单独的解决方案去实现,不再依赖于业务的数据库。这个阶段主要是 IBM、oracle 的产品的黄金年代。但是进入互联网时代后业务发展太快,数据量剧增,传统数据仓库逐渐没落。为什么传统数据仓库效率这么低?自顶向下建模。


数据湖(Data Lake)是一个以原始格式存储数据的存储库或系统。以 google 发布的三篇论文为基础实现的 hadoop 开源项目的出现大数据平台是面向数据研发场景的,覆盖数据研发的完整链路的数据工作台。


大数据平台像一条设备流水线,经过大数据平台的加工,原始数据变成了指标,出现在各个报表或者数据产品中。


数据中台的核心,是在企业数字化战略的基础上,利用一套技术标准构建的共享、安全、标准、统一的数据服务。


恩门建模(自顶向下)因为是从数据源和主题域开始构建,构建成本比较高,适用于应用场景比较固定的业务,比如金融领域,冗余数据少是它的优势。金博尔建模(自底向上)由于是从分析场景出发,适用于变化速度比较快的业务,比如互联网业务。



嘉宾观点:数据中台是各个企业独有的一种战略选择和组织形式,不存在数据中台这样的一个能对外直接售卖的产品。



3 哪些企业需要数据中台


嘉宾认为:


企业有一定的信息化基础,但存在较多的业务数据的孤岛,需要数据整合分析


企业有数字化转型需求,需要通过精细化运营提升效率


企业是跨多个领域业务线的集团架构,有丰富的标签维度和大量的数据应用场景


四、什么时候要建数据中台


4 什么时候要建数据中台



5 建数据中台的成本

五、建设数据中台的成本



6 如何建数据中台

六、如何建数据中台



嘉宾观点:可见是数据资产化,可用是数据产品化和服务化,可运营是要打造数据价值转换的闭环


建议原则:


尽量兼容原各业务线系统,避免推倒重来(开源兼容)


先拿新的业务线作为试点,再大面积推广(快速试错)


先使用的业务线,提供更高的容错度和激励(鼓励创新)




7 建数据中台职责由那个团队承担?


8 封面传媒数据中台应用实践













嘉宾核心观点



人的因素往往最难推动,因为涉及到很多团队的利益,还涉及到能不能找到一些有经验的人来做这个事情。


嘉宾介绍


徐桢虎,西南交通大学计算机硕士,专业方向是数据仓库与数据挖掘


封面传媒 总经理助理兼数据研究部总监


技术委员会召集人、人工智能研究所执行所长


专注领域:数据中台建设、媒体 AI 应用落地


TGO 鲲鹏会 成都分会成员


2050 大会讲师


四川省青联委员


本文转载自公众号技术琐话(ID:TheoryPractice)。


原文链接


https://mp.weixin.qq.com/s?__biz=MzIxMzEzMjM5NQ==&mid=2651036706&idx=1&sn=467ce35475c82de0c88ba932455b541c&chksm=8c4c4926bb3bc030dafc939cc1701e4ef8e770c043da3dfd96831c6f85a78a2bb06e194d01fe&scene=27#wechat_redirect


2020 年 5 月 18 日 10:061641

评论 3 条评论

发布
用户头像
个人认为,中台在大多数公司性价比不高。失败的概率也非常大。
1、投入真的很大。如果小投入,几乎不要试。
2、高层会在中台建设一半,然后发现效果一般时,会马上提出质疑。压迫式KPI就会到来。
3、中台很容易是大数据团队自己幻想的。是否跟业务运营,数据分师接得上气,还未知。
2020 年 05 月 19 日 14:46
回复
用户头像
受益匪浅。在比较高的层次讲解了数据中台的意义,也给了数据中台建设的一般范式。看文章内容应该是截取了ppt,是否可以分享ppt
2020 年 05 月 18 日 15:52
回复
用户头像
中台适用场景小
2020 年 05 月 18 日 11:06
回复
没有更多了
发现更多内容

TcaplusDB X 光与夜之恋|春暖花开之际与你相遇

tcaplus

数据库

【母亲节】TcaplusDB祝天下母亲节日快乐!

tcaplus

数据库

Hive解析Json数组超全讲解

五分钟学大数据

hive 5月日更

Tars Java 客户端源码分析

vivo互联网技术

Java TARS RPC架构

看完阿里P7技术大牛的JVM知识点总结,竟帮我斩获了3份大厂Offer

飞飞JAva

Java JVM

现代电信企业:极低延迟与复杂决策如何兼得?

VoltDB

数据分析 5G 数据平台 低延迟

如何快速制作短视频?拥有这个神器,轻松搞定!

奈奈的杂社

短视频 视频剪辑 自媒体

你敢信?两面美团就收到了30k的offer!网友:Java面经交出来

java专业爱好者

Java 面试

【HDC.Cloud 2021】边云协同,打通AI最后一公里

华为云原生团队

人工智能 开源 云原生 边缘计算 华为云

ipfs是什么矿机靠谱吗?ipfs未来价值一万一枚是真的吗?

v:IPFS456

Filecoin IPFS怎么挖矿 IPFS挖矿最新消息 ipfs是什么矿机靠谱吗 ipfs未来价值一万一枚

如何快速排查发现redis的bigkey?4种方案一次性给到你!

驻云DataFlux

redis 云计算 云服务

如何在苹果M1上安装使用FL Studio

奈奈的杂社

编曲 教程分享 编曲软件

爬虫实战教程:采集微信公众号文章

前嗅大数据

大数据 爬虫 数据采集 爬虫教程

【Gartner精选报告摘要】中西方技术创新差异,5G魔力象限,未来5年数据分析领域预测

Geek_bacee5

Gartner IT信息技术研究 Gartner精选报告摘 数据分析领域预测 5G魔力象限

架构实战营 模块三作业

netspecial

架构实战营

架构实战模块三作业

Geek_649372

架构实战营

芜湖起飞!全网最全PHP文件包含大总结(不收藏血亏)

代码熬夜敲

php 网络安全 信息安全

打破思维定式(三)

Changing Lin

马丁格尔策略交易软件源码,量化策略系统开发

13823153121

挑战大厂:关于阿里的这些Java变态面试题目,你能回答上几个?

java专业爱好者

Java 面试 数组

为何“低代码”频频引发业界热议?

优秀

低代码

Offer收割机!阿里P7大神甩出JSP实战笔记,网友:信息量过大

飞飞JAva

Java

“红黑树”详解丨红黑树的应用场景

Linux服务器开发

后端开发 红黑树 Linux服务器开发 Linux内核 红黑树应用场景

“服务可达的数据链DNA” ,打通从代码到用户的“任督二脉”

博睿数据

数据链DNA

一周信创舆情观察(4.26~5.5)

统小信uos

全新 Jira 系列,适用于所有团队!

Atlassian

DevOps 敏捷 Atlassian Jira

关于安卓设备声音远程传输的解决方案

行者AI

云平台

Jmeter下载与mysql简单操作

InfoQ_Springup

工具软件

腾讯T6!万字长文体系化讲解Spring源码,码农:太透彻了,学会了

牛哄哄的java大师

Java

纯干货!看了10多篇Thread详解,只有阿里P7大佬的这份才是王者

牛哄哄的java大师

Java Thread

现货量化交易系统开发app,量化马丁策略交易平台搭建

WX13823153201

数据中台初探与应用实践-InfoQ