2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

数据中台初探与应用实践

  • 2020-05-18
  • 本文字数:1518 字

    阅读完需:约 5 分钟

数据中台初探与应用实践

本文是【技术琐话公益直播】4 月 28 日晚分享嘉宾徐桢虎在线直播中主题《数据中台初探与应用实践》内容整理,内容有删减调整,直播回放见之前的分享。


1 为什么需要数据中台


当企业发展到一定规模时,数据是否能够创造价值显得尤为重要。如果没有从业务的角度对数据进行规划,再多的数据也没有用。一个企业业务与数据双中台的战略地位是相辅相成的,需要打造数据与业务的闭环。


  • 数据增值 :对数据做统一规划、管理、深度挖掘,实现数据到资产的增值;

  • 数据流通 :高价值数据资源的整合、积累、流通,提升数据处理能力;

  • 业务创新 :打破技术隔阂,构建智能化技术引擎,提高业务效率和创新能力。


数据中台的核心价值为优化现有业务和实现新业务的转型,打造数据驱动的智能化企业。


业务价值


  • 以客户为中心进行精细化运营

  • 以数据为基础支撑商业模式创新

  • 打造持续增值的数据资产


技术价值


  • 应对不同数据处理的需求

  • 对数据资产进行标签化应用

  • 快速复用数据服务

  • 快速定位数据血缘链路

2 什么是数据中台


传统数据仓库,第一次明确了数据分析的应用场景应该用单独的解决方案去实现,不再依赖于业务的数据库。这个阶段主要是 IBM、oracle 的产品的黄金年代。但是进入互联网时代后业务发展太快,数据量剧增,传统数据仓库逐渐没落。为什么传统数据仓库效率这么低?自顶向下建模。


数据湖(Data Lake)是一个以原始格式存储数据的存储库或系统。以 google 发布的三篇论文为基础实现的 hadoop 开源项目的出现大数据平台是面向数据研发场景的,覆盖数据研发的完整链路的数据工作台。


大数据平台像一条设备流水线,经过大数据平台的加工,原始数据变成了指标,出现在各个报表或者数据产品中。


数据中台的核心,是在企业数字化战略的基础上,利用一套技术标准构建的共享、安全、标准、统一的数据服务。


恩门建模(自顶向下)因为是从数据源和主题域开始构建,构建成本比较高,适用于应用场景比较固定的业务,比如金融领域,冗余数据少是它的优势。金博尔建模(自底向上)由于是从分析场景出发,适用于变化速度比较快的业务,比如互联网业务。



嘉宾观点:数据中台是各个企业独有的一种战略选择和组织形式,不存在数据中台这样的一个能对外直接售卖的产品。


3 哪些企业需要数据中台


嘉宾认为:


企业有一定的信息化基础,但存在较多的业务数据的孤岛,需要数据整合分析


企业有数字化转型需求,需要通过精细化运营提升效率


企业是跨多个领域业务线的集团架构,有丰富的标签维度和大量的数据应用场景


四、什么时候要建数据中台

4 什么时候要建数据中台


5 建数据中台的成本

五、建设数据中台的成本


6 如何建数据中台

六、如何建数据中台



嘉宾观点:可见是数据资产化,可用是数据产品化和服务化,可运营是要打造数据价值转换的闭环


建议原则:


尽量兼容原各业务线系统,避免推倒重来(开源兼容)


先拿新的业务线作为试点,再大面积推广(快速试错)


先使用的业务线,提供更高的容错度和激励(鼓励创新)



7 建数据中台职责由那个团队承担?

8 封面传媒数据中台应用实践













嘉宾核心观点



人的因素往往最难推动,因为涉及到很多团队的利益,还涉及到能不能找到一些有经验的人来做这个事情。


嘉宾介绍


徐桢虎,西南交通大学计算机硕士,专业方向是数据仓库与数据挖掘


封面传媒 总经理助理兼数据研究部总监


技术委员会召集人、人工智能研究所执行所长


专注领域:数据中台建设、媒体 AI 应用落地


TGO 鲲鹏会 成都分会成员


2050 大会讲师


四川省青联委员


本文转载自公众号技术琐话(ID:TheoryPractice)。


原文链接


https://mp.weixin.qq.com/s?__biz=MzIxMzEzMjM5NQ==&mid=2651036706&idx=1&sn=467ce35475c82de0c88ba932455b541c&chksm=8c4c4926bb3bc030dafc939cc1701e4ef8e770c043da3dfd96831c6f85a78a2bb06e194d01fe&scene=27#wechat_redirect


2020-05-18 10:062566

评论 3 条评论

发布
用户头像
个人认为,中台在大多数公司性价比不高。失败的概率也非常大。
1、投入真的很大。如果小投入,几乎不要试。
2、高层会在中台建设一半,然后发现效果一般时,会马上提出质疑。压迫式KPI就会到来。
3、中台很容易是大数据团队自己幻想的。是否跟业务运营,数据分师接得上气,还未知。
2020-05-19 14:46
回复
用户头像
受益匪浅。在比较高的层次讲解了数据中台的意义,也给了数据中台建设的一般范式。看文章内容应该是截取了ppt,是否可以分享ppt
2020-05-18 15:52
回复
用户头像
中台适用场景小
2020-05-18 11:06
回复
没有更多了
发现更多内容

算网资源调度关键技术

天翼云开发者社区

云计算 云服务

NFTScan | 08.26~09.02 NFT 市场热点汇总

NFT Research

NFT\ NFTScan

Web3 游戏周报(8.25- 8.31)

Footprint Analytics

8款国内外免费AI生成视频工具对比实测!我们真的可以做到“一人搞定一部影视作品“吗?

可信AI进展

AI测评

淘宝店铺所有商品数据接口怎么获取

tbapi

淘宝API接口 淘宝店铺所有商品数据接口

无需推翻既有的建设,这个可观测性产品思路清奇

巴辉特

监控 可观测性 Prometheus 故障定位

与客户建立联系,成为企业战略决策的引领者

智达方通

全面预算管理 财务管理 客户关系

万界星空科技MES系统如何帮助企业降低成本

万界星空科技

工业互联网 制造业 生产管理系统 mes 智能制造业

软件测试学习笔记丨Linux与SQL实战

测试人

Linux 软件测试 自动化测试 测试开发

蚂蚁知识图谱管理系统研究成果获国际顶会认可,KGFabric 论文入选 VLDB 2024

可信AI进展

人工智能 | MetaLlama大模型

测试人

人工智能 软件测试

NocoBase 与百事通:为法律行业带来全新变革

NocoBase

低代码 无代码 客户案例

新手使用住宅代理有哪些常见误区?

IPIDEA全球HTTP

HBlock应用实践与性能测试:解锁老旧服务器存储潜力,打造高效稳定的存储集群

Geek_2dc40b

HBlock 老旧服务器盘活

通义灵码使用安装教程,3分钟快速上手体验

阿里云云效

阿里云 云原生 通义灵码

云原生主键模型:高效、弹性,省钱又省心

StarRocks

数据库 大数据 存算分离 存算分离架构 湖仓一体

ps2224最新版,Photoshop 2024(Win&Mac) 软件下载

你的猪会飞吗

PS2024破解 mac破解软件下载 ps2024中文

通义灵码使用安装教程,3分钟快速上手体验

阿里巴巴云原生

阿里云 云原生 通义灵码

观测云核心技术揭秘:基于时间的半结构化数据模型

观测云

数据结构

GPU虚拟化技术简介:实现高性能图形处理的灵活部署

天翼云开发者社区

云计算 gpu 虚拟化技术

CRISP-DM的应用与理解

天翼云开发者社区

数据挖掘 CRISP-DM

私有云服务器虚拟化超分比及资源扩容管理

天翼云开发者社区

云计算 服务器 虚拟化

金九银十来了,你的简历写好了么?

不在线第一只蜗牛

程序员 前端

【论文速读】| 基于大语言模型智能体对文本到图像模型进行越狱

云起无垠

俄罗斯即将启动跨境加密支付试行计划:规避制裁与加密货币的未来

区块链软件开发推广运营

交易所开发 dapp开发 区块链开发 链游开发 NFT开发

AI真“卷出天际”!我国发布全球首个月球专业大模型;0代码可做游戏,谷歌发布世界首个AI游戏引擎|AI日报

可信AI进展

数据中台初探与应用实践_开源_徐桢虎_InfoQ精选文章