“AI 技术+人才”如何成为企业增长新引擎?戳此了解>>> 了解详情
写点什么

百分点技术大咖深度解读:数据中台的迷失与前行

  • 2020-03-08
  • 本文字数:3540 字

    阅读完需:约 12 分钟

百分点技术大咖深度解读:数据中台的迷失与前行

数据中台今年很火,火得有点突如其来,也让很多用户为之迷失。


这波由互联网巨头们带起来的中台热潮,看似偶然,其实必然。它让我们真正意识到数据形成资产化之后带来的巨大价值,以及企业与机构在未来的竞争中构建起数据资产体系和组织架构调整的重要性。


当数据中台成为大势所趋之际,对于各大传统行业而言,不禁要问:如何打造适合自身业务的数据中台?互联网公司的数据中台战略固然有其可取之处,但是邯郸学步则可能导致满盘皆输。事实上,数据中台终究只是一个代名词而已,形成适合自身业务的数据资产管理体系,通过数据资产化实现为前台业务提供“养料”和支撑,才是传统企业打造数据中台的核心本质。


正所谓,无论是互联网公司,还是传统企业,无论采用何种方式方法,在数据中台建设中,没有同途殊归,只有殊途同归。

01 为什么需要数据中台

以互联网公司为代表的数字原生企业,其天生就是数字化的,但绝大部分互联网企业也是发展到一定阶段之后,才开始着力于数据中台的建设。百分点大数据操作系统负责人贾喜顺直言,互联网企业典型的特征就是野蛮生长,当无序膨胀、快速发展到一定阶段之后,往往需要通过数据中台来更加高效驱动和管控业务。


而大部分传统行业用户,大多数都经历了多年的信息化建设,从过去的数据仓库、数据管理,到后来的大数据平台、数据治理,是企业数据资产化稳步演进的过程。而当前,传统行业正处于向数字企业转型的过程中,数据中台则是数据资产化演进的下一个阶段,它在数字化转型中可谓是至关重要。


正所谓是,先有业务数据化,才有数据业务化,传统企业需要数据中台这个中枢来让数据驱动业务,实现数字化的快速创新。在百分点看来,数据中台是集合数据采集、融合、治理、组织管理、智能分析为一体的整体平台,将数据以服务方式提供给业务前台使用,以提升业务运行效率、持续促进业务创新。


“如果将前台比作计算机的应用程序,后台比作计算机的存储,那么中台就是计算机的内存。数据中台的作用就是将前台的快速响应和后台变化周期慢的矛盾协同起来,将前台中的稳定通用业务能力‘内存化’到中台,将后台中频繁使用的能力抽取到中台中。现在,数据中台这个‘内存’的容量正在变得越来越大,”贾喜顺这样形容数据中台。



百分点是国内为数不多在多个行业拥有数据中台建设丰富经验的公司


以百分点某大型集团用户为例,其业务横跨数十个行业,拥有超过 2000 家的子公司,业务体量和复杂度巨大,几乎每一家公司都拥有多套业务系统和数据标准,在集团整体的数字化转型过程中,将数据汇总、拉通、流动、共享,通过数据来驱动业务应用和创新,成为该集团在数字化转型过程中遇到的最大挑战。


对此,贾喜顺表示:“像这样的用户在传统行业中非常具有代表性,拥有丰富的内部数据,却没有建成数据资产管理体系,无法实现数据资产化,也无法通过数据来支撑集团和各个子公司的业务创新。”


在贾喜顺看来,数据中台将会是企业在数据层面的一个标准化支撑,通过数据中台去支撑前端百花齐放的数据应用,并且应用产生的大量数据再次回流到数据中台之中,形成完整的数据闭环,驱动企业数据生态的形成。

02 好的数据中台是什么样

毫无疑问,当前关于数据中台的建设并没有一个标准化的定义,大家的理解都是五花八门。目前除了互联网企业之外,很多企业普遍处于数据中台建设的构思规划或者刚刚起步的阶段。贾喜顺用三点总结了当前企业在建设数据中台中面临的主要挑战


首先,大部分企业理念转变不到位,没有明白数据中台建设是一个长期过程,与传统的 IT 项目周期有着非常大的区别,业务部门必须从上到下去推动和配合数据中台的建设。“很多时候,数据中台建设并不是技术层面的问题,而是理念是否转变的问题。”


其次,企业需要在组织层面去保障数据中台的建设,需要单独成立部门或组织。“哪怕是阿里、腾讯、京东这样的互联网巨头,也已经将数据中台独立成部门,去统筹集团所有的数据。”


最后,是需要合格的团队、技术和产品,去完成实现数据中台的过程。“很多传统企业,其实在人才、技术储备上相对较差,这也是像百分点这样的厂商所能够去弥补的。”


那么,一个好的数据中台又会是什么样的?这恐怕是所有企业与机构接下来都将需要去深度思考的话题。


在百分点看来,数据中台必须要与自身业务实际情况去考虑。“同样是喝水,如果是一家人,自家挖一口井就可以满足喝水需求;如果是一个村子的人,则可以挖一口大井,用水泵抽水;而如果是一个城市,则需要建立自来水厂,来满足千家万户的喝水需求。”



百分点数据中台全景图


不过,数据中台的建设流程不管大小和复杂程度,数据中台的建设都需要围绕着数据的联络,包括数据的接入、清洗、加工、整合,并最终起到支撑应用层的服务。“数据中台不管大小,其链路完整性是非常有必要的,并且在数据标准和数据治理层面是必不可少,只有把数据标准统一了,才可以支撑起整个数据生态。”此外,考虑到企业与机构的成长性,百分点还强调了数据中台的扩展性和灵活性,“数据中台必须足够的健壮,可以支撑业务的弹性变化。”


从宏观层面来看,好的数据中台可以很好地盘活企业数据资产,并且建立起将装的数据资产管理体系,形成数据生态闭环,可以有效地支撑起基于数据的业务快速创新,并且有利于打破内部的固有利益和部门墙,推动企业在组织架构层面的变革,适应数字化转型。

03 数据中台服务商如何选

数据中台的热潮也带火了各种数据中台公司,从上层做大数据营销的公司,到底层做数据仓库、大数据平台的公司,还有用友、金蝶这些传统信息化软件公司,甚至阿里云这样的云厂商,每一家都从自身所擅长的领域去延伸到数据中台市场,希望在数据中台市场分的一杯羹。


不过,面对如此多的数据中台服务商,用户应该如何选择?笔者认为,从三个层面去考虑会更加合理。


首先,需要关注服务商在技术层面的积累,比如像数据仓库、大数据平台等,看是否具有相应的技术经验和强大的技术团队。


其次,需要关注数据中台服务商是否有健全的产品与工具,包括从数据接入、清洗、ETL 处理、可视化等整个体系的产品与工具,这些产品与工具是否经受过大量项目的沉淀与检验。



第三,需要关注数据中台服务商是否有丰富的行业经验和业务沉淀,像政府机构、金融、零售等行业非常符合和需要数据中台建设,虽然每一家企业或机构的数据中台需求迥异,但是供应商在同行业积累下的经验,有助于其在其他用户的数据中台建设。


最后需要关注交付能力,一个数据中台项目,其中数据治理部分就是非常不轻松,涉及到数据标准制定、数据拉通等等,基本上脏活累活占了大半。很可能出现,像一些云厂商不愿意干,小的创业公司又 hold 不住的局面。

04 数据中台未来趋势在哪

“如果当一个数据中台建设起来之后,你的数据科学家、数据分析师还需要在数据整理、加工上花费大量精力和时间的话,那么这样的数据中台肯定不代表着未来的发展趋势。”贾喜顺如是说。


在百分点看来,数据中台某种程度就是面向 AI 的,尤其是当前 AI 应用开始逐渐进入到各行各业之中,需要大量的基础数据集来训练和支撑,数据中台的建立,有利于 AI 模型的训练和 AI 应用的创新。“数据中台应该使用起来非常方便,不仅仅是专业人员才能使用,而是让更广泛的人群直接使用工具和数据,来支撑产品的创新。”


其次 AI 技术来优化和改造数据中台也将成为重要的趋势。“AI 可以让数据中台更加敏捷和高效。像百分点已经在数据中台的底层工具和产品层面开始融入一些 AI 技术,可以在数据标注、数据治理上快速便捷的处理数据;此外,通过 AI 还可以自动生成脚本等。”贾喜顺认为,AI 在数据中台的占比会越来越大,“除了底层之外,对于上层业务做一些 AI 层面的支持,比如 NLP、问答机器人、自动翻译等。”



第三,数据中台的定制化会更加容易。对于数据中台的一大疑惑就是,用户的需求造成的定制化程度严重,数据中台无法形成通用性的产品,造成数据中台项目的交付难度极大。贾喜顺表示:“数据中台的产品和工具将会更加灵活,朝着组件化的方向发展,可以通过积木式的产品搭建来满足用户需求,遇到个性化需求也可以快速通过组件进行定制化的开发。”


总体而言,数据中台将会朝着底层更智能、上层使用更加简单的方向发展。

写在最后

从长期来看,数据中台其实跟企业大小并没有直接关系,不同大小和类型的企业都需要数据中台。数据中台将逐渐成为一种基础能力,这种基础能力将会是企业在数字化时代中所必须具备的。


无论如何,数据中台的建设将会是一个长期、螺旋上升的过程,也将会对企业的组织架构产生深远影响。


就如大型机之父 Frederick Brooks 在《人月神话》中提到:这个世界上没有银弹。数据中台的建设没有一劳永逸的办法,企业与机构要想短期内就实现效果恐怕是不太现实,企业更需要从战略层面进行更多思考,再配合选择合适的数据中台服务商,方能在数据中台建设之路上走的稳当。


公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2020-03-08 16:44927

评论

发布
暂无评论
发现更多内容

大数据开发之Hive如何提高查询效率

@零度

大数据 hive

【签约计划第二季】百位签约创作者名单公布

InfoQ写作社区官方

签约计划第二季 热门活动

取代Maven?maven-mvnd持续霸榜 GitHub Trending,性能提升300%

沉默王二

maven

Dubbo为什么要用Go重写?

捉虫大师

Go dubbo

消息队列存储消息数据设计

张靖

#架构实战营

TDSQL PostgreSQL如何快速定位阻塞SQL

腾讯云数据库

tdsql 国产数据库

Linux之find exec

入门小站

这几个IDE是Node.js 开发人员需要知道的

@零度

node.js 前端开发

尚硅谷年终盘点|你好,2022;再见,2021

编程江湖

2022年新年祝福

forEach、map和for循环

编程江湖

大前端

尚硅谷年终盘点 | 你好,2022;再见,2021

@零度

从人工到智能!百度AI开发者大会分论坛,探寻国球乒乓背后的AI之路

百度大脑

人工智能

java开发之SSM开发框架的快速理解

@零度

ssm JAVA开发

腾讯云TDSQL数据库信创演进与实践

腾讯云数据库

tdsql 国产数据库

常用的echo和cat,这次让我折在了特殊字符丢失问题上

华为云开发者联盟

Linux cat echo 特殊字符 定向

☕【难点攻克技术系列】「海量数据计算系列」如何使用BitMap在海量数据中对相应的进行去重、查找和排序

洛神灬殇

BitMap bitmaps bitset 12月日更

链计算、新基建:区块链助力数字经济新生态

CECBC

一个cpp协程库的前世今生(二)协程切换的原理

SkyFire

c++ 协程 cocpp

强强联袂!腾讯云TDSQL与国双战略签约,锚定国产数据库巨大市场

腾讯云数据库

tdsql 国产数据库

性能工具之常见压力工具是否能模拟前端?

zuozewei

前端 浏览器 性能分析 测试工具 12月日更

在线JSON转Schema工具

入门小站

工具

MongoDB按需物化视图介绍

MongoDB中文社区

mongodb

Greenplum内核源码分析-分布式事务(一)

王凤刚(ginobiliwang)

源码分析 分布式事务 greenplum

洞见科技携手阿里云,以“隐私计算+云”推动场景应用大规模落地

阿里云弹性计算

阿里云 数据安全 隐私计算

尚硅谷喜获央广网2021年度公信力教育品牌

@零度

强强联袂!腾讯云TDSQL与国双战略签约,锚定国产数据库巨大市场

腾讯云数据库

tdsql 国产数据库

WireShark好学吗?我来手把手教你学WireShark抓包及常用协议分析

学神来啦

网络安全 Wireshark 渗透测试 kali kali Linux

Iog4j2漏洞相关技术分析

极光JIGUANG

新年将至,惊喜来袭

浪潮云

云计算运维

旺链科技团建图鉴 | 认真工作,肆意生活~

旺链科技

区块链 企业文化 团建

一文解析Apache Avro数据

华为云开发者联盟

序列化 flink sql Apache Avro 反序列 Avro

百分点技术大咖深度解读:数据中台的迷失与前行_文化 & 方法_百分点科技技术团队_InfoQ精选文章