阿里、蚂蚁、晟腾、中科加禾精彩分享 AI 基础设施洞见,现购票可享受 9 折优惠 |AICon 了解详情
写点什么

百分点技术大咖深度解读:数据中台的迷失与前行

  • 2020-03-08
  • 本文字数:3540 字

    阅读完需:约 12 分钟

百分点技术大咖深度解读:数据中台的迷失与前行

数据中台今年很火,火得有点突如其来,也让很多用户为之迷失。


这波由互联网巨头们带起来的中台热潮,看似偶然,其实必然。它让我们真正意识到数据形成资产化之后带来的巨大价值,以及企业与机构在未来的竞争中构建起数据资产体系和组织架构调整的重要性。


当数据中台成为大势所趋之际,对于各大传统行业而言,不禁要问:如何打造适合自身业务的数据中台?互联网公司的数据中台战略固然有其可取之处,但是邯郸学步则可能导致满盘皆输。事实上,数据中台终究只是一个代名词而已,形成适合自身业务的数据资产管理体系,通过数据资产化实现为前台业务提供“养料”和支撑,才是传统企业打造数据中台的核心本质。


正所谓,无论是互联网公司,还是传统企业,无论采用何种方式方法,在数据中台建设中,没有同途殊归,只有殊途同归。

01 为什么需要数据中台

以互联网公司为代表的数字原生企业,其天生就是数字化的,但绝大部分互联网企业也是发展到一定阶段之后,才开始着力于数据中台的建设。百分点大数据操作系统负责人贾喜顺直言,互联网企业典型的特征就是野蛮生长,当无序膨胀、快速发展到一定阶段之后,往往需要通过数据中台来更加高效驱动和管控业务。


而大部分传统行业用户,大多数都经历了多年的信息化建设,从过去的数据仓库、数据管理,到后来的大数据平台、数据治理,是企业数据资产化稳步演进的过程。而当前,传统行业正处于向数字企业转型的过程中,数据中台则是数据资产化演进的下一个阶段,它在数字化转型中可谓是至关重要。


正所谓是,先有业务数据化,才有数据业务化,传统企业需要数据中台这个中枢来让数据驱动业务,实现数字化的快速创新。在百分点看来,数据中台是集合数据采集、融合、治理、组织管理、智能分析为一体的整体平台,将数据以服务方式提供给业务前台使用,以提升业务运行效率、持续促进业务创新。


“如果将前台比作计算机的应用程序,后台比作计算机的存储,那么中台就是计算机的内存。数据中台的作用就是将前台的快速响应和后台变化周期慢的矛盾协同起来,将前台中的稳定通用业务能力‘内存化’到中台,将后台中频繁使用的能力抽取到中台中。现在,数据中台这个‘内存’的容量正在变得越来越大,”贾喜顺这样形容数据中台。



百分点是国内为数不多在多个行业拥有数据中台建设丰富经验的公司


以百分点某大型集团用户为例,其业务横跨数十个行业,拥有超过 2000 家的子公司,业务体量和复杂度巨大,几乎每一家公司都拥有多套业务系统和数据标准,在集团整体的数字化转型过程中,将数据汇总、拉通、流动、共享,通过数据来驱动业务应用和创新,成为该集团在数字化转型过程中遇到的最大挑战。


对此,贾喜顺表示:“像这样的用户在传统行业中非常具有代表性,拥有丰富的内部数据,却没有建成数据资产管理体系,无法实现数据资产化,也无法通过数据来支撑集团和各个子公司的业务创新。”


在贾喜顺看来,数据中台将会是企业在数据层面的一个标准化支撑,通过数据中台去支撑前端百花齐放的数据应用,并且应用产生的大量数据再次回流到数据中台之中,形成完整的数据闭环,驱动企业数据生态的形成。

02 好的数据中台是什么样

毫无疑问,当前关于数据中台的建设并没有一个标准化的定义,大家的理解都是五花八门。目前除了互联网企业之外,很多企业普遍处于数据中台建设的构思规划或者刚刚起步的阶段。贾喜顺用三点总结了当前企业在建设数据中台中面临的主要挑战


首先,大部分企业理念转变不到位,没有明白数据中台建设是一个长期过程,与传统的 IT 项目周期有着非常大的区别,业务部门必须从上到下去推动和配合数据中台的建设。“很多时候,数据中台建设并不是技术层面的问题,而是理念是否转变的问题。”


其次,企业需要在组织层面去保障数据中台的建设,需要单独成立部门或组织。“哪怕是阿里、腾讯、京东这样的互联网巨头,也已经将数据中台独立成部门,去统筹集团所有的数据。”


最后,是需要合格的团队、技术和产品,去完成实现数据中台的过程。“很多传统企业,其实在人才、技术储备上相对较差,这也是像百分点这样的厂商所能够去弥补的。”


那么,一个好的数据中台又会是什么样的?这恐怕是所有企业与机构接下来都将需要去深度思考的话题。


在百分点看来,数据中台必须要与自身业务实际情况去考虑。“同样是喝水,如果是一家人,自家挖一口井就可以满足喝水需求;如果是一个村子的人,则可以挖一口大井,用水泵抽水;而如果是一个城市,则需要建立自来水厂,来满足千家万户的喝水需求。”



百分点数据中台全景图


不过,数据中台的建设流程不管大小和复杂程度,数据中台的建设都需要围绕着数据的联络,包括数据的接入、清洗、加工、整合,并最终起到支撑应用层的服务。“数据中台不管大小,其链路完整性是非常有必要的,并且在数据标准和数据治理层面是必不可少,只有把数据标准统一了,才可以支撑起整个数据生态。”此外,考虑到企业与机构的成长性,百分点还强调了数据中台的扩展性和灵活性,“数据中台必须足够的健壮,可以支撑业务的弹性变化。”


从宏观层面来看,好的数据中台可以很好地盘活企业数据资产,并且建立起将装的数据资产管理体系,形成数据生态闭环,可以有效地支撑起基于数据的业务快速创新,并且有利于打破内部的固有利益和部门墙,推动企业在组织架构层面的变革,适应数字化转型。

03 数据中台服务商如何选

数据中台的热潮也带火了各种数据中台公司,从上层做大数据营销的公司,到底层做数据仓库、大数据平台的公司,还有用友、金蝶这些传统信息化软件公司,甚至阿里云这样的云厂商,每一家都从自身所擅长的领域去延伸到数据中台市场,希望在数据中台市场分的一杯羹。


不过,面对如此多的数据中台服务商,用户应该如何选择?笔者认为,从三个层面去考虑会更加合理。


首先,需要关注服务商在技术层面的积累,比如像数据仓库、大数据平台等,看是否具有相应的技术经验和强大的技术团队。


其次,需要关注数据中台服务商是否有健全的产品与工具,包括从数据接入、清洗、ETL 处理、可视化等整个体系的产品与工具,这些产品与工具是否经受过大量项目的沉淀与检验。



第三,需要关注数据中台服务商是否有丰富的行业经验和业务沉淀,像政府机构、金融、零售等行业非常符合和需要数据中台建设,虽然每一家企业或机构的数据中台需求迥异,但是供应商在同行业积累下的经验,有助于其在其他用户的数据中台建设。


最后需要关注交付能力,一个数据中台项目,其中数据治理部分就是非常不轻松,涉及到数据标准制定、数据拉通等等,基本上脏活累活占了大半。很可能出现,像一些云厂商不愿意干,小的创业公司又 hold 不住的局面。

04 数据中台未来趋势在哪

“如果当一个数据中台建设起来之后,你的数据科学家、数据分析师还需要在数据整理、加工上花费大量精力和时间的话,那么这样的数据中台肯定不代表着未来的发展趋势。”贾喜顺如是说。


在百分点看来,数据中台某种程度就是面向 AI 的,尤其是当前 AI 应用开始逐渐进入到各行各业之中,需要大量的基础数据集来训练和支撑,数据中台的建立,有利于 AI 模型的训练和 AI 应用的创新。“数据中台应该使用起来非常方便,不仅仅是专业人员才能使用,而是让更广泛的人群直接使用工具和数据,来支撑产品的创新。”


其次 AI 技术来优化和改造数据中台也将成为重要的趋势。“AI 可以让数据中台更加敏捷和高效。像百分点已经在数据中台的底层工具和产品层面开始融入一些 AI 技术,可以在数据标注、数据治理上快速便捷的处理数据;此外,通过 AI 还可以自动生成脚本等。”贾喜顺认为,AI 在数据中台的占比会越来越大,“除了底层之外,对于上层业务做一些 AI 层面的支持,比如 NLP、问答机器人、自动翻译等。”



第三,数据中台的定制化会更加容易。对于数据中台的一大疑惑就是,用户的需求造成的定制化程度严重,数据中台无法形成通用性的产品,造成数据中台项目的交付难度极大。贾喜顺表示:“数据中台的产品和工具将会更加灵活,朝着组件化的方向发展,可以通过积木式的产品搭建来满足用户需求,遇到个性化需求也可以快速通过组件进行定制化的开发。”


总体而言,数据中台将会朝着底层更智能、上层使用更加简单的方向发展。

写在最后

从长期来看,数据中台其实跟企业大小并没有直接关系,不同大小和类型的企业都需要数据中台。数据中台将逐渐成为一种基础能力,这种基础能力将会是企业在数字化时代中所必须具备的。


无论如何,数据中台的建设将会是一个长期、螺旋上升的过程,也将会对企业的组织架构产生深远影响。


就如大型机之父 Frederick Brooks 在《人月神话》中提到:这个世界上没有银弹。数据中台的建设没有一劳永逸的办法,企业与机构要想短期内就实现效果恐怕是不太现实,企业更需要从战略层面进行更多思考,再配合选择合适的数据中台服务商,方能在数据中台建设之路上走的稳当。


公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2020-03-08 16:44942

评论

发布
暂无评论
发现更多内容

深圳龙华携手腾讯云 加快推进区块链先行试验区建设

CECBC

「开源免费」基于Vue和Quasar的前端SPA项目crudapi后台管理系统实战之动态表单设计器(五)

crudapi

Vue crud 动态表单 quasar cruapi

区块链技术驱动商业银行开展供应链金融业务的创新路径

CECBC

一篇文章告诉你什么是EGG Network(阿凡提)以及什么是EFTalk

币圈那点事

Dubbo 学习笔记(一) Hello,Dubbo

U2647

dubbo 4月日更

DEX领域第一个运用整合思维的DeFi协议 SumSwwap潜力巨大

币圈资讯

如何引入TDD实践

顿晓

TDD 4月日更

spring的IOC使用以及原理

邱学喆

spring ioc 对象创建 属性注入

《几何代数计算入门(计算机视觉)》

计算机与AI

计算机视觉 计算机图形学

NA(Nirvana)Chain“以应用而生”如何强势突围

区块链第一资讯

redis Redis缓存穿透解决方案

Sakura

4月日更

你看起来很美味?独家揭露视频推荐系统AI秘方

白洞计划

浅论结构体与联合体

Integer

c

聊聊云厂商的指标监控组件

耳东@Erdong

Prometheus 4月日更 #Grafana

微服务网关:Spring Cloud Gateway —— Zuul

程序员架构进阶

微服务 网关 28天写作 4月日更

如何从Telegram下载一整套可爱的猫猫表情包?

彭宏豪95

GitHub 效率 社交 4月日更

使用FFmpeg开发的那些事

Bob

音视频 ffmpeg 开源文化

使用Composition API在Vue3中创建防抖搜索输入框

devpoint

vite Vue3 防抖

MapReduce优化

大数据技术指南

hadoop 4月日更

Linux mkdir 命令

一个大红包

4月日更

读《非暴力沟通》

箭上有毒

读书笔记 4月日更

那束漂亮的手捧花

小天同学

爱情 4月日更 幸福 传递

Go1.16 中模块的新变化

Rayjun

Go 语言

Boss直聘转发超120W次Java全栈面试题!已帮我拿下5个Offer!

Java架构追梦

Java 面试 架构师 阿里巴巴面经总结

Redis 最后一课

escray

redis 学习 极客时间 Redis 核心技术与实战 4月日更

和老大的相爱相杀中,让我终于搞懂了函数式接口

麦洛

Java 函数式接口 Lambda java8

用OpenCV制作庆祝武汉重启一周年短视频

老猿Python

Python OpenCV 音视频 图形图像处理 引航计划

OpenHarmony 1.1.0 LTS 版本正式发布

开放原子开源基金会

开源 开放原子开源基金会 OpenHarmony

【资深猎头分享】程序员面试如何避坑?

Java架构师迁哥

CI/CD之基于Jenkins的发布平台实践

小江

DevOps jenkins CI/CD 发布流程

线上PHP服务故障排查之路

风翱

PHP-FPM 线上事故 4月日更

百分点技术大咖深度解读:数据中台的迷失与前行_文化 & 方法_百分点科技技术团队_InfoQ精选文章