【AICon】探索八个行业创新案例,教你在教育、金融、医疗、法律等领域实践大模型技术! >>> 了解详情
写点什么

百分点技术大咖深度解读:数据中台的迷失与前行

  • 2020-03-08
  • 本文字数:3540 字

    阅读完需:约 12 分钟

百分点技术大咖深度解读:数据中台的迷失与前行

数据中台今年很火,火得有点突如其来,也让很多用户为之迷失。


这波由互联网巨头们带起来的中台热潮,看似偶然,其实必然。它让我们真正意识到数据形成资产化之后带来的巨大价值,以及企业与机构在未来的竞争中构建起数据资产体系和组织架构调整的重要性。


当数据中台成为大势所趋之际,对于各大传统行业而言,不禁要问:如何打造适合自身业务的数据中台?互联网公司的数据中台战略固然有其可取之处,但是邯郸学步则可能导致满盘皆输。事实上,数据中台终究只是一个代名词而已,形成适合自身业务的数据资产管理体系,通过数据资产化实现为前台业务提供“养料”和支撑,才是传统企业打造数据中台的核心本质。


正所谓,无论是互联网公司,还是传统企业,无论采用何种方式方法,在数据中台建设中,没有同途殊归,只有殊途同归。

01 为什么需要数据中台

以互联网公司为代表的数字原生企业,其天生就是数字化的,但绝大部分互联网企业也是发展到一定阶段之后,才开始着力于数据中台的建设。百分点大数据操作系统负责人贾喜顺直言,互联网企业典型的特征就是野蛮生长,当无序膨胀、快速发展到一定阶段之后,往往需要通过数据中台来更加高效驱动和管控业务。


而大部分传统行业用户,大多数都经历了多年的信息化建设,从过去的数据仓库、数据管理,到后来的大数据平台、数据治理,是企业数据资产化稳步演进的过程。而当前,传统行业正处于向数字企业转型的过程中,数据中台则是数据资产化演进的下一个阶段,它在数字化转型中可谓是至关重要。


正所谓是,先有业务数据化,才有数据业务化,传统企业需要数据中台这个中枢来让数据驱动业务,实现数字化的快速创新。在百分点看来,数据中台是集合数据采集、融合、治理、组织管理、智能分析为一体的整体平台,将数据以服务方式提供给业务前台使用,以提升业务运行效率、持续促进业务创新。


“如果将前台比作计算机的应用程序,后台比作计算机的存储,那么中台就是计算机的内存。数据中台的作用就是将前台的快速响应和后台变化周期慢的矛盾协同起来,将前台中的稳定通用业务能力‘内存化’到中台,将后台中频繁使用的能力抽取到中台中。现在,数据中台这个‘内存’的容量正在变得越来越大,”贾喜顺这样形容数据中台。



百分点是国内为数不多在多个行业拥有数据中台建设丰富经验的公司


以百分点某大型集团用户为例,其业务横跨数十个行业,拥有超过 2000 家的子公司,业务体量和复杂度巨大,几乎每一家公司都拥有多套业务系统和数据标准,在集团整体的数字化转型过程中,将数据汇总、拉通、流动、共享,通过数据来驱动业务应用和创新,成为该集团在数字化转型过程中遇到的最大挑战。


对此,贾喜顺表示:“像这样的用户在传统行业中非常具有代表性,拥有丰富的内部数据,却没有建成数据资产管理体系,无法实现数据资产化,也无法通过数据来支撑集团和各个子公司的业务创新。”


在贾喜顺看来,数据中台将会是企业在数据层面的一个标准化支撑,通过数据中台去支撑前端百花齐放的数据应用,并且应用产生的大量数据再次回流到数据中台之中,形成完整的数据闭环,驱动企业数据生态的形成。

02 好的数据中台是什么样

毫无疑问,当前关于数据中台的建设并没有一个标准化的定义,大家的理解都是五花八门。目前除了互联网企业之外,很多企业普遍处于数据中台建设的构思规划或者刚刚起步的阶段。贾喜顺用三点总结了当前企业在建设数据中台中面临的主要挑战


首先,大部分企业理念转变不到位,没有明白数据中台建设是一个长期过程,与传统的 IT 项目周期有着非常大的区别,业务部门必须从上到下去推动和配合数据中台的建设。“很多时候,数据中台建设并不是技术层面的问题,而是理念是否转变的问题。”


其次,企业需要在组织层面去保障数据中台的建设,需要单独成立部门或组织。“哪怕是阿里、腾讯、京东这样的互联网巨头,也已经将数据中台独立成部门,去统筹集团所有的数据。”


最后,是需要合格的团队、技术和产品,去完成实现数据中台的过程。“很多传统企业,其实在人才、技术储备上相对较差,这也是像百分点这样的厂商所能够去弥补的。”


那么,一个好的数据中台又会是什么样的?这恐怕是所有企业与机构接下来都将需要去深度思考的话题。


在百分点看来,数据中台必须要与自身业务实际情况去考虑。“同样是喝水,如果是一家人,自家挖一口井就可以满足喝水需求;如果是一个村子的人,则可以挖一口大井,用水泵抽水;而如果是一个城市,则需要建立自来水厂,来满足千家万户的喝水需求。”



百分点数据中台全景图


不过,数据中台的建设流程不管大小和复杂程度,数据中台的建设都需要围绕着数据的联络,包括数据的接入、清洗、加工、整合,并最终起到支撑应用层的服务。“数据中台不管大小,其链路完整性是非常有必要的,并且在数据标准和数据治理层面是必不可少,只有把数据标准统一了,才可以支撑起整个数据生态。”此外,考虑到企业与机构的成长性,百分点还强调了数据中台的扩展性和灵活性,“数据中台必须足够的健壮,可以支撑业务的弹性变化。”


从宏观层面来看,好的数据中台可以很好地盘活企业数据资产,并且建立起将装的数据资产管理体系,形成数据生态闭环,可以有效地支撑起基于数据的业务快速创新,并且有利于打破内部的固有利益和部门墙,推动企业在组织架构层面的变革,适应数字化转型。

03 数据中台服务商如何选

数据中台的热潮也带火了各种数据中台公司,从上层做大数据营销的公司,到底层做数据仓库、大数据平台的公司,还有用友、金蝶这些传统信息化软件公司,甚至阿里云这样的云厂商,每一家都从自身所擅长的领域去延伸到数据中台市场,希望在数据中台市场分的一杯羹。


不过,面对如此多的数据中台服务商,用户应该如何选择?笔者认为,从三个层面去考虑会更加合理。


首先,需要关注服务商在技术层面的积累,比如像数据仓库、大数据平台等,看是否具有相应的技术经验和强大的技术团队。


其次,需要关注数据中台服务商是否有健全的产品与工具,包括从数据接入、清洗、ETL 处理、可视化等整个体系的产品与工具,这些产品与工具是否经受过大量项目的沉淀与检验。



第三,需要关注数据中台服务商是否有丰富的行业经验和业务沉淀,像政府机构、金融、零售等行业非常符合和需要数据中台建设,虽然每一家企业或机构的数据中台需求迥异,但是供应商在同行业积累下的经验,有助于其在其他用户的数据中台建设。


最后需要关注交付能力,一个数据中台项目,其中数据治理部分就是非常不轻松,涉及到数据标准制定、数据拉通等等,基本上脏活累活占了大半。很可能出现,像一些云厂商不愿意干,小的创业公司又 hold 不住的局面。

04 数据中台未来趋势在哪

“如果当一个数据中台建设起来之后,你的数据科学家、数据分析师还需要在数据整理、加工上花费大量精力和时间的话,那么这样的数据中台肯定不代表着未来的发展趋势。”贾喜顺如是说。


在百分点看来,数据中台某种程度就是面向 AI 的,尤其是当前 AI 应用开始逐渐进入到各行各业之中,需要大量的基础数据集来训练和支撑,数据中台的建立,有利于 AI 模型的训练和 AI 应用的创新。“数据中台应该使用起来非常方便,不仅仅是专业人员才能使用,而是让更广泛的人群直接使用工具和数据,来支撑产品的创新。”


其次 AI 技术来优化和改造数据中台也将成为重要的趋势。“AI 可以让数据中台更加敏捷和高效。像百分点已经在数据中台的底层工具和产品层面开始融入一些 AI 技术,可以在数据标注、数据治理上快速便捷的处理数据;此外,通过 AI 还可以自动生成脚本等。”贾喜顺认为,AI 在数据中台的占比会越来越大,“除了底层之外,对于上层业务做一些 AI 层面的支持,比如 NLP、问答机器人、自动翻译等。”



第三,数据中台的定制化会更加容易。对于数据中台的一大疑惑就是,用户的需求造成的定制化程度严重,数据中台无法形成通用性的产品,造成数据中台项目的交付难度极大。贾喜顺表示:“数据中台的产品和工具将会更加灵活,朝着组件化的方向发展,可以通过积木式的产品搭建来满足用户需求,遇到个性化需求也可以快速通过组件进行定制化的开发。”


总体而言,数据中台将会朝着底层更智能、上层使用更加简单的方向发展。

写在最后

从长期来看,数据中台其实跟企业大小并没有直接关系,不同大小和类型的企业都需要数据中台。数据中台将逐渐成为一种基础能力,这种基础能力将会是企业在数字化时代中所必须具备的。


无论如何,数据中台的建设将会是一个长期、螺旋上升的过程,也将会对企业的组织架构产生深远影响。


就如大型机之父 Frederick Brooks 在《人月神话》中提到:这个世界上没有银弹。数据中台的建设没有一劳永逸的办法,企业与机构要想短期内就实现效果恐怕是不太现实,企业更需要从战略层面进行更多思考,再配合选择合适的数据中台服务商,方能在数据中台建设之路上走的稳当。


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2020-03-08 16:44946

评论

发布
暂无评论
发现更多内容

简述styled-components性能

devpoint

CSS React 样式组件 前端性能

2022年回顾:一个37岁中年程序员的一百场面试

无人之路

自动驾驶 面试 求职 大厂 跳槽

问题代码定位神器: Git Bisect

俞凡

git

FPGA:Verilog HDL程序的基本结构

timerring

FPGA

模块六作业

Ryan

架构

海外拥有最庞大社区人群的Verasity($VRA),后市值得期待

股市老人

空降负责人如何与团队建立信任?

石云升

极客时间 1月月更 技术领导力实战笔记

IDEA配置java的git路径

孙永潮

精华推荐 | 【深入浅出 RocketMQ原理及实战】「底层源码挖掘系列」透彻剖析贯穿RocketMQ的消费者端的运行核心的流程(上篇)

洛神灬殇

RocketMQ 消息队列 原理分析

如何判断候选人与岗位的匹配程度?

石云升

极客时间 1月月更 技术领导力实战笔记

你知道这个提高 Java 单元测试效率的 IDEA 插件吗

JAVA旭阳

Java

IntelliJ中高效重构的 10 个快捷方式

JAVA旭阳

Java

什么是AirServer?2024版本如何下载安装包

茶色酒

AirServer

FPGA:逻辑功能的仿真与验证

timerring

FPGA

如何妥善且优雅地做好解聘工作?

石云升

极客时间 1月月更 技术领导力实战笔记

模块5 微博高性能计算架构设计

KING

消息队列存储数据消息Mysql设计

闲人Eric

架构实战营

PHP转Go实践:xjson解析神器「开源工具集」

王中阳Go

php golang 高效工作 学习方法 Go web

企业架构治理指什么,如何做?

涛哥 数字产品和业务架构

架构治理 企业构架

复习前端:浏览器渲染机制

devpoint

DOM CSSOM 渲染树 重绘 重排

Verilog HDL仿真常用命令

timerring

FPGA

CrossOver2023软件Mac电脑版虚拟机安装包

茶色酒

CrossOver2023

会声会影2023功能强大的视频编辑软件

茶色酒

会声会影2023

影响产品开发决策的认知偏见

俞凡

认知

极客时间运维进阶训练营第12周作业

独钓寒江

国产 ETL工具 ETL产品 数据交换系统

weigeonlyyou

postgresql hadoop elasticsearch Prometheus 时序数据库

复习前端:CSS

devpoint

CSS Flex scss BFC

如何用Know Streaming来查询Kafka的消息

石臻臻的杂货铺

Kafk

设计微博系统中”微博评论“的高性能高可用计算架构

悟空

架构 高可用 高性能 微博评论

Verilog HDL基本语法规则

timerring

FPGA

KaiwuDB 荣获稀土掘金引力榜-年度最佳实践案例

KaiwuDB

多模数据库 数据库解决方案

百分点技术大咖深度解读:数据中台的迷失与前行_文化 & 方法_百分点科技技术团队_InfoQ精选文章