【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

数据中台初探与应用实践

  • 2020-05-18
  • 本文字数:1518 字

    阅读完需:约 5 分钟

数据中台初探与应用实践

本文是【技术琐话公益直播】4 月 28 日晚分享嘉宾徐桢虎在线直播中主题《数据中台初探与应用实践》内容整理,内容有删减调整,直播回放见之前的分享。


1 为什么需要数据中台


当企业发展到一定规模时,数据是否能够创造价值显得尤为重要。如果没有从业务的角度对数据进行规划,再多的数据也没有用。一个企业业务与数据双中台的战略地位是相辅相成的,需要打造数据与业务的闭环。


  • 数据增值 :对数据做统一规划、管理、深度挖掘,实现数据到资产的增值;

  • 数据流通 :高价值数据资源的整合、积累、流通,提升数据处理能力;

  • 业务创新 :打破技术隔阂,构建智能化技术引擎,提高业务效率和创新能力。


数据中台的核心价值为优化现有业务和实现新业务的转型,打造数据驱动的智能化企业。


业务价值


  • 以客户为中心进行精细化运营

  • 以数据为基础支撑商业模式创新

  • 打造持续增值的数据资产


技术价值


  • 应对不同数据处理的需求

  • 对数据资产进行标签化应用

  • 快速复用数据服务

  • 快速定位数据血缘链路

2 什么是数据中台


传统数据仓库,第一次明确了数据分析的应用场景应该用单独的解决方案去实现,不再依赖于业务的数据库。这个阶段主要是 IBM、oracle 的产品的黄金年代。但是进入互联网时代后业务发展太快,数据量剧增,传统数据仓库逐渐没落。为什么传统数据仓库效率这么低?自顶向下建模。


数据湖(Data Lake)是一个以原始格式存储数据的存储库或系统。以 google 发布的三篇论文为基础实现的 hadoop 开源项目的出现大数据平台是面向数据研发场景的,覆盖数据研发的完整链路的数据工作台。


大数据平台像一条设备流水线,经过大数据平台的加工,原始数据变成了指标,出现在各个报表或者数据产品中。


数据中台的核心,是在企业数字化战略的基础上,利用一套技术标准构建的共享、安全、标准、统一的数据服务。


恩门建模(自顶向下)因为是从数据源和主题域开始构建,构建成本比较高,适用于应用场景比较固定的业务,比如金融领域,冗余数据少是它的优势。金博尔建模(自底向上)由于是从分析场景出发,适用于变化速度比较快的业务,比如互联网业务。



嘉宾观点:数据中台是各个企业独有的一种战略选择和组织形式,不存在数据中台这样的一个能对外直接售卖的产品。


3 哪些企业需要数据中台


嘉宾认为:


企业有一定的信息化基础,但存在较多的业务数据的孤岛,需要数据整合分析


企业有数字化转型需求,需要通过精细化运营提升效率


企业是跨多个领域业务线的集团架构,有丰富的标签维度和大量的数据应用场景


四、什么时候要建数据中台

4 什么时候要建数据中台


5 建数据中台的成本

五、建设数据中台的成本


6 如何建数据中台

六、如何建数据中台



嘉宾观点:可见是数据资产化,可用是数据产品化和服务化,可运营是要打造数据价值转换的闭环


建议原则:


尽量兼容原各业务线系统,避免推倒重来(开源兼容)


先拿新的业务线作为试点,再大面积推广(快速试错)


先使用的业务线,提供更高的容错度和激励(鼓励创新)



7 建数据中台职责由那个团队承担?

8 封面传媒数据中台应用实践













嘉宾核心观点



人的因素往往最难推动,因为涉及到很多团队的利益,还涉及到能不能找到一些有经验的人来做这个事情。


嘉宾介绍


徐桢虎,西南交通大学计算机硕士,专业方向是数据仓库与数据挖掘


封面传媒 总经理助理兼数据研究部总监


技术委员会召集人、人工智能研究所执行所长


专注领域:数据中台建设、媒体 AI 应用落地


TGO 鲲鹏会 成都分会成员


2050 大会讲师


四川省青联委员


本文转载自公众号技术琐话(ID:TheoryPractice)。


原文链接


https://mp.weixin.qq.com/s?__biz=MzIxMzEzMjM5NQ==&mid=2651036706&idx=1&sn=467ce35475c82de0c88ba932455b541c&chksm=8c4c4926bb3bc030dafc939cc1701e4ef8e770c043da3dfd96831c6f85a78a2bb06e194d01fe&scene=27#wechat_redirect


2020-05-18 10:062278

评论 3 条评论

发布
用户头像
个人认为,中台在大多数公司性价比不高。失败的概率也非常大。
1、投入真的很大。如果小投入,几乎不要试。
2、高层会在中台建设一半,然后发现效果一般时,会马上提出质疑。压迫式KPI就会到来。
3、中台很容易是大数据团队自己幻想的。是否跟业务运营,数据分师接得上气,还未知。
2020-05-19 14:46
回复
用户头像
受益匪浅。在比较高的层次讲解了数据中台的意义,也给了数据中台建设的一般范式。看文章内容应该是截取了ppt,是否可以分享ppt
2020-05-18 15:52
回复
用户头像
中台适用场景小
2020-05-18 11:06
回复
没有更多了
发现更多内容

工作多年,Linux文件系统还不太了解?

架构精进之路

Linux 文件 6月日更

(技术型)产品经理打怪升级之路

菜根老谭

产品经理 职业转型

Pandas之:Pandas高级教程以铁达尼号真实数据为例

程序那些事

Python 大数据 数据分析 pandas

模块5 学习总结

TH

架构实战营

【LeetCode】目标和Java题解

Albert

算法 LeetCode 6月日更

react源码解析7.Fiber架构

全栈潇晨

react.js react源码

【Flutter 专题】110 页面间小跳转 (四)

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 6月日更

用C语言实现interface

实力程序员

NCRE考试感想 四级嵌入式(下)

万里无云万里天

嵌入式 6月日更 NCRE 考试经验

《漫画算法2》2021全新进阶版来袭!

博文视点Broadview

模块五-微博评论高性能高可用计算架构

华仔架构训练营

作业

CR

模块五:课后作业

黄先生

windows安装minikube的正确姿势

蛋先生DX

Docker k8s minikube 6月日更

模块五:课后作业

菲尼克斯

架构实战营

书单 | 阿里技术书单,满足你的“大厂情结”!

博文视点Broadview

模块5作业

大肚皮狒狒

JVM之内存管理

邱学喆

JVM 内存管理 垃圾回收算法 垃圾回收器

”微博评论“的高性能高可用计算架构

thewangzl

给你一台服务器,你能把你写的代码部署到线上吗?

小傅哥

小傅哥 ssl 云部署搭建 博客配置 安装宝塔

架构实战营5 作业

梦寻解语花

架构实战营

架构实战营 模块五作业

Dylan

架构实战营

如何画好架构图 (建议收藏)

悟空聊架构

流程图 架构图 6月日更 processon 原理图

Webpack 系列4:彻底理解 module.issuer 属性

范文杰

webpack 6月日更

如何从Java字节码角度解决问题

叫我阿柒啊

Java 字节码

前端vue在可视化大屏领域的工作实践

孙叫兽

Vue 可视化 eCharts 可视化地图 引航计划

架构实战营模块5

阿体

架构实战营 - 模块五作业

Sun

先立个Flag

追风少年

支持边云协同终身学习特性,KubeEdge子项目Sedna 0.3.0版本发布!

华为云开发者联盟

机器学习 学习 kubeedge Sedna 边云协同

关于MySQL库表名大小写问题

Simon

MySQL

数据中台初探与应用实践_开源_徐桢虎_InfoQ精选文章