【ArchSummit】如何通过AIOps推动可量化的业务价值增长和效率提升?>>> 了解详情
写点什么

一切为了让数据价值升华,解密百分点数据中台的设计理念与实践

  • 2020-03-08
  • 本文字数:3718 字

    阅读完需:约 12 分钟

一切为了让数据价值升华,解密百分点数据中台的设计理念与实践

百分点数据中台的设计理念

在政府和企业数字化转型中,数据中台可以说是数据资产化演进至的新阶段,传统企业建设大数据平台的需求,也日益转换为对建设数据中台的需求。


原因在于,过去搭建数据资产平台的理念,未解决数据人员与业务人员之间存在的隔阂:数据人员不懂业务,导致数据过于技术化;业务人员不懂技术,无法使用数据。而随着数据中台概念的普及,以及传统企业中业务人员自身能力的提升,促使业务人员产生自主需求,希望借助平台获得分析数据的自主能力。并且,客户也有依托自身数据,发挥自身数据价值驱动业务发展的需求。



我们认为,要想让数据中台去支撑前台百花齐放的数据应用,首先数据层面要提供标准化的支撑,并且将前台应用所产生的大量数据回流到数据中台之中后,还可以形成完整的数据闭环,最终驱动企业和政府客户形成自身完整的数据生态。


为了做到这点,百分点将数据中台分为四个层次,从透明化的大数据技术平台到智能化的数据资产工具,再到行业化的数据资产,最终实现场景化的数据应用。



一是为数据筑巢,“用数据说话”。


万物互联所产生的数据爆发式增长,带来了实时数据分析需求的日益增长,尤其当数据量达到亿级、百亿级甚至万亿级规模,大多数企业和政府客户自身不具备技术团队,缺乏技术运维能力。


因此,如何标准化、透明化设计建立数据中台这个中枢神经,更快速地响应业务的变化成为最大挑战。


百分点在搭建万亿级大数据平台的建设实践中,将大数据技术组件能力透明,用户能够清晰了解各组件的技术能力,并判断是否与自身需求吻合,并且因为组件能力透明,后续也可在运维监管中做精细化管理。


现在,这个平台正承载着万亿级数据的存储、处理和应用,能够支持线上 2000+亿/天、峰值 500+万/秒的数据处理,且在实时性、稳定性、异构存储能力方面同样表现优异,在本地化部署万亿级大数据平台方面引领行业前沿。


此外,每个行业或者企业依托数据中台建设行业化数据资产时,需要建立一些规范与标准,百分点在大量实践基础上,将这些行业标签体系、数仓构建规范、数据标准与质量体系,形成丰富的行业性标准,并沉淀到工具中,落地实践时可以直接复用到更多行业,降低了实施中 60%的人力和时间成本


在安装部署上,百分点大数据操作系统 BD-OS 现在 只需要一个人、两个小时、三个步骤就能完成。未来,每一个普通人都能具备使用和操作大数据的能力,能够随时利用数据智能技术产品解决实际业务问题。

智能化的数据工具

二是将数据从“能用”转变为让更多人“易用”。


现阶段,各家数据工具大同小异,为了让数据中台在数字政府、媒体出版、零售快消等领域落地,百分点的独特性 在于,不仅结合 AI 让数据中台更加敏捷和高效,还能助力数据智能化,让数据平台更简单,更好用。


基于此,百分点 智能化数据工具实现了三个目标


第一,抛开技术的思维,降低使用门槛,让业务人员也能够轻松使用数据、用好数据;第二扩充平台的使用人群,数据中台的使用不再局限于技术人员,业务人员同样也能玩转数据中台;第三,降低管理实施的成本,智能化工具能够复用于不同项目中,节省 60%的人力和时间成本。


那么,这三个目标是如何实现的?


赵群表示,百分点通过数据仓库、机器学习平台和动态知识图谱平台等进行数据治理,从而形成了数据集、标签、知识图谱和智能分析等智能化数据工具。


如下图,百分点将智能化数据工具整体模块架构分为三层。



百分点智能化数据工具整体模块架构


以百分点智能分析工具为例


百分点智能分析工具将 BI 结合 AI,大量使用深度学习和自然语言处理技术,通过结合智能推荐、智能问答、智能挖掘等 增强分析能力,促使分析效率更高、门槛更低、数据分析能力更普惠。


当用户使用 智能推荐 时,可以直接通过语音问答的方式,询问“各订单来源的总支付订单量的占比为多少?”系统就会自动推荐所有适合该问题的图表,并将展示效果排序,不需要客户再进行任何的操作。


同理,对于数据治理工具,基于智能化的设计理念,实现了为前台业务自动化推荐数据标准、数据质量稽核的能力,大大提高了数据治理效率。


值得注意的是,百分点智能化的分析工具,不仅降低了技术门槛,基于 智能分析工具核心技术引擎,更能将实施成本缩减超过 50%。


百分点自主研发了异构任务执行引擎,集中负责与底层集群的交互,可支持知识多云、多集群甚至异构场景。智能工具通过 Rest API 提交,执行任务管理、协同和监管方案,再协调向各个数据集群制作 Shell、Python、Hive 等查询任务,最终实现智能分析工具的任务提交、执行、状态获取和结果查询,以及优先任务的判断。

同时研发了行业领先的基于统一数据模型、内存、Pipeline 的交互式数据融合引擎。结合生产流水线的设计,业务人员通过拖曳的方式,就能够轻松操作平台,解决业务问题,还能以 Pipeline 的方式,随时发送命令,实时查看结果。

行业化的数据资产

三是,彻底解决“数据用不起来”的问题。


在百分点服务众多客户后发现,“数据用不起来”往往是因为数据不规范,且业务部门未能深度参与。数据治理成功与否的关键,就在于是否能全局思考,结合各个业务部门规范数据,制定标准化体系。


那么,到底该如何将数据资产化,从而为前台应用提供更标准、更有营养的“养料”?


基于多年实践经验,百分点重点面向政府、公共安全、媒体出版、零售快消等行业打造了行业化数据资产体系,主要分为两个维度:数据资产标准实施路径和业务驱动数据流通的敏捷闭环

数据资产标准实施路径

百分点数据资产标准实施路径以标准为主导,兼顾组织和项目。只要建立了先进的标准,那么数据治理就都可以按项目方式进行。


百分点的数据资产标准实施路径为“五大体系、十一个步骤”。五大体系即数据接入、数据处理、数据治理、数据组织和数据服务,而十一个步骤则是五大体系的十一个完整运作过程。


五大体系中,第一步数据接入,做业务的盘点和数据接入;第二步是数据处理,做数据勘探和数据预处理;第三步治理数据,主要定义数据标准,将数据标准化;第四步数据组织,建设数据仓库,基于数据仓库,进行数据加工处理、资产化,形成数据资源目录;最后进行数据服务,做数据开放共享。

业务驱动数据流通的敏捷闭环

企业做大数据,本质需求是利用基于大数据的某个应用,盘活数据,挖掘数据价值。由此,百分点探索出一套真正有序的敏捷方式:由业务驱动数据流通为主导,强调价值和分享,真正做到数据“越用越好”。


那么这个敏捷方式该如何打造?


第一,业务驱动数据流通。


首先为业务人员提供敏捷的获取方式、自助接入的方案,实现自己接入数据,加工数据。其次,从业务的角度理解数据、加工数据和分析数据。最后,重点突破数据流通价值,沉淀并共享数据产品的价值模式。


第二,建立数据价值评估体系。


评估维度包括信息完成度、数据质量、使用情况、主观评价及响应速度。最终基于这五个维度,得到数据得分。


第三,完善数据运营管理体系。


划分责任,组织数据运营管理团队,制定运营体系;责任到人、激励到部门、资产到公司,考核组织对数据的共享方式,最终实现跨部门数据共享。


同时,敏捷闭环中存在四个角色:数据使用者、数据责任人、部门和公司。数据使用者对数据进行使用,并提交数据使用的反馈,并在这两个过程中,实现“数据越用越好”;评价反馈到数据责任人,责任人根据指标优化数据,满足使用者需求;部门则通过了解部门资产情况、促进数据共享;而公司则可以沉淀数据资产、组织激励考核方式,拥有了管理抓手。


那么在敏捷闭环形成后,它的驱动力和效果如何展现?依然从四个角色入手。


在敏捷闭环之外,四个角色均有各自的诉求:



对公司来说,


  1. 数据资源利用如何最大化?

  2. 如何打破“部门墙”?



对部门来说,


  1. 如何用数据帮助业务?

  2. 数据平台怎样提供数据分析的自主能力?

  3. 如何解决数据“只进不出”、不会使用数据的问题?



对数据负责人来说,


  1. 如何获得个人成就感?

  2. 如何获得认同?



对数据使用者来说,


  1. 有什么数据?

  2. 什么数据有用?

  3. 如何使用?

  4. 如何获得使用数据的成就感?


以上这些诉求及问题,都能在敏捷闭环中得到解决:


公司层面,拥有了数据管理的量化指标,能够看到部门间数据共享利用情况;

部门层面,有了数据资源共享的考核压力,同时通过数据平台的智能化工具及 SAAS 的能力,获得自主能力;

数据责任人层面,有了数据排名,能够通过他人反馈提升自身成就感;

而对于数据使用者来说,通过数据得分等各维度,能够发现高价值的数据,查看案例等。

最终,在敏捷闭环的驱动下,会沉淀出高价值的数据。


万物互联时代,数据已不是稀缺物品,“好数据”才是企业开展新型运营、创造价值的中枢系统,而数据中台承担着这一中枢系统的最核心作用。回看百分点数据中台透明化、智能化、行业化、场景化的设计理念与实践,百分点正在从让数据“能用”转变为更多人“易用”的道路上越走越远,越走越坚定。


百分点始终认为,传统企业运营数据中台,打造行业化数据资产,是要“将数据越用越好,而不是越管越好”。这就要求企业以高质量数据为基础,保证数据责任到人,充分盘活数据资产,让业务驱动数据流通,从而打造良性生态闭环,促进前台业务创新。


百分点数据中台始终基于业务场景,以为客户创造价值为原则。未来百分点仍将笃定让数据智能在企业和政府数字化转型中发挥力量,不断助力数字政府、智慧警务等领域的数据中台落地。


公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2020-03-08 16:44797

评论

发布
暂无评论
发现更多内容

系统安全问题与应对

superman

系统高可用问题

朱月俊

架构师0期11周作业

我在终点等你

架构师训练营—Week11 学习总结

Frank Zeng

甲方日常1

句子

工作 随笔杂谈 日常

奈学:红黑树(RedBlackTree)的概述

奈学教育

AVL

手写Spring框架之IOC

简爱W

架构师训练营第十一章作业

叮叮董董

架构师训练营-第十一周-命题作业

sljoai

极客大学架构师训练营 命题作业 第十一周

架构师训练营——第11周作业

jiangnanage

【架构师训练营 - week11 -1】作业

早睡早起

极客大学架构师训练营---习题

李朋

架构师培训第十一周练习

小蚂蚁

week 11作业

a晖

架构师训练营第 11 周——练习

李伟

极客大学架构师训练营

【Elasticsearch 技术分享】—— Elasticsearch 存储一条数据, put 过程是什么样子的?

程序员小航

Java elasticsearch 搜索 ES Lucene Elastic Search

图解 K8s 核心概念和术语

后端进阶

Docker Kubernetes 容器 云原生 k8s

你的业务是可变的吗

架构师修行之路

加解密

GalaxyCreater

加解密

系统高可用

陈皮

week11 总结

雪涛公子

第11周学习总结

Bruce Xiong

奈学:红黑树(RedBlackTree)的概述

古月木易

架构师培训 -11 安全、高可用

刘敏

架构师训练营第十一章总结

叮叮董董

架构师训练营十一周作业

方堃

第11周 安全和高可用

陆不得

week11 作业

雪涛公子

Cause: java.sql.SQLTimeoutException: ORA-01013: user requested cancel of current

Java个体户

Druid

架构师训练营——第11周学习总结

jiangnanage

关于高可用的思考

朱月俊

一切为了让数据价值升华,解密百分点数据中台的设计理念与实践_文化 & 方法_百分点科技技术团队_InfoQ精选文章