【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

大数据的下一站:数据中台

  • 2018-09-17
  • 本文字数:1962 字

    阅读完需:约 6 分钟

伴随着移动互联网和物联网的发展,大数据概念开始产生,但并不是所有的数据都能称为大数据,IT 调研与咨询服务公司 Gartner 对“大数据”的定义是:需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

大数据行业发展现状

根据中国信通院发布的中国大数据发展调查报告:2017 年中国大数据总体规模为 4700 亿元人民币,同比增长 30%,2017 年大数据核心产业规模为 236 亿元人民币,增速达到 40.5%,预计 2018-2020 年增速保持在 30% 以上。

在大数据应用上,接近 2/3 的企业已经成立相关数据分析部门,企业对数据分析的重视程度进一步提高,其中应用大数据实现了智能决策的企业占比最高,达到了 55.2%,其次,46.6% 的企业表示应用大数据后提升了运营效果,35.9% 的企业应用大数据后能够更好地管理风险。

大数据得到快速发展的一个重要原因是智能手机的普及,用户行为被有效记录下来,全球数据量开始呈现爆发性增长,目前,大数据的来源主要包括:

  • 移动设备的传感器收集了大量用户的行为数据;
  • 电子地图产生大量的用户轨迹数据,揭示了人们的流动规律和生活习惯;
  • 电商应用带来了网上交易数据,包括购买喜好、支付渠道、物流运输等。

在技术层面上来说,数据采集与传输、数据存储与管理、计算处理、查询与分析和可视化展现构成数据分析生态结构,近几年,相应技术层级的企业都如雨后春笋般涌现。而目前,数据体量、产业规模以及云计算高速发展所推动的基础设施成本都已不再是问题,大数据能否创造真实的商业价值和回报是大数据企业真正关心的核心问题。

开放数据是合作的基础

TalkingData 创始人兼首席执行官崔晓波认为,互联网公司之间的战役已经结束了。所有企业主战场不在线上而在线下,不管是互联网巨头还是产业巨头都在思考如何利用互联网、数据和相关技术的能力改变线下产业。而且,选择合作伙伴应该遵循一个原则:愿意真的开放数据,愿意给实体产业赋能

目前,中国已进入数据时代,企业核心竞争力是数据,不管是数据中台还是数据平台,提供的是一个核心能力,基于这一核心能力需要和别人互利共赢。简单说就是如何管理渠道、管理合作伙伴,这是中国企业首先要过的一关。第二才是如何把这个东西做大,其后才是生态环节。

大数据需要合法连接

数据的收集一直被人们担心是否侵犯了个人隐私,对此,崔晓波认为美国对信息隐私主要采取普通法保护的模式,由法院最终确定哪些行为构成侵犯隐私权。中国的个人信息保护制度才刚刚建立,只有几部法律分别界定了个人信息保护的内容,对如何保护个人信息还没有统一的说法,所以,需要结合我国的国情形成我们特有的个人信息保护理论和个人信息保护制度。

对企业而言,他们应该考虑数据如何做到安全合法连接,国家鼓励数据互联互通,政府部门之间数据也需要互联互通,但是由于规则不清楚,大多公司都不敢去做。所以企业需要摸清合规的界限在哪里,做到合法连接;数据连接、关联之后,再提供类似于安全沙箱的环境,将数据在里面做整合,来保证应用、建模时的数据安全。

大数据需要沉淀为产品

虽然,在基础科研方面,中国跟美国还有一些距离,但在大数据应用市场上,中国的应用和需求是比较强劲的,因为中国企业更关心应用和落地,解决应用才能给客户创造价值。

过去,所有大数据企业都在做项目,并没有更多资源把能力沉淀成产品和平台。比如很多可共用的数据服务没有服务化、产品化,很多产品总是做重复的动作。

今年,数据中台成为大数据行业的热门概念,它最先是从阿里引出的,是指通过数据技术,对海量数据进行采集、计算、存储、加工,同时统一标准和口径。数据中台把数据统一之后,会形成标准数据,再进行存储,形成大数据资产层,进而为客户提供高效服务。这些服务跟企业的业务有较强的关联性,是这个企业独有的且能复用的,它是企业业务和数据的沉淀,其不仅能降低重复建设、减少烟囱式协作的成本,也是差异化竞争优势所在。

在不久前举办的 TalkingData T11 数据智能峰会上,红杉中国专家合伙人车品觉先生指出,数据中台把数据与数据的技术,再与整个人才架构或公司架构结合以后,能孵化出更多的创新出来,形成创新的前端。

未来,基于数据时代,可能有很多公司平台出现。现在几大互联网巨头都在做自己的平台,不过更多是为企业自身服务。但创业公司由于体量比较小,既缺少客户,也缺乏聚合数据的能力,这就需要数据中台提供赋能。如何让服务头部企业探索出来的能力和方法,更好地去赋能整个产业链中的中小企业,是未来几年着力探索的工作。

崔晓波认为数据中台需要具备数据管理、数据工程和数据科学的能力。现在不同的数据中台有很多,有的企业把数据中台做成了软件中台,堆砌工具,这往往是 IT 部门主导的。但是所有数据中台的核心应该是数据,最核心的思想是数据如何共享,所以数据中台是否成功的唯一检验标准就是是否有足够的共享能力。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2018-09-17 01:533355
用户头像

发布了 83 篇内容, 共 46.9 次阅读, 收获喜欢 187 次。

关注

评论

发布
暂无评论
发现更多内容

Week7 作业

Shawn

第7周笔记:性能优化

Melo

第7周作业:web性能测压工具

Melo

浪潮信息推动AI在线教育实现全面应用

Geek_116789

程序员都应该知道的数据库避坑指南

Phoenix

MySQL 数据库 事务隔离级别

信创舆情一线--台积电宣布9月14日断供华为

统小信uos

华为 芯片 半导体

LeetCode题解:141. 环形链表,JavaScript,快慢指针,详细注释

Lee Chen

大前端 LeetCode

Java 基础知识整理

多选参数

Java

从IT建设模式变化看客户中心发展

环信

OOP面向对象编程(Object-Oriented Programming)概述

古月木易

面向对象 oop

我成功转行做了java程序猿!

诸葛小猿

Java 程序员 转行

WordPress插件设计

心平气和

php 插件设计 插件系统 WordPress

细数2020上半年PC端十大“黑恶势力”,一起康康是谁在“兴风作浪”

360安全卫士

高价值干货:这可能是你见过最全的网络爬虫总结

华为云开发者联盟

Python Web 爬虫 python 爬虫 内存数据库

【写作群星榜】7.11~7.17 写作平台优秀作者 & 文章排名

InfoQ写作社区官方

写作平台 排行榜 热门活动

Rust多线程之数据共享

编号94530

rust 多线程 数据共享 什么是多线程

ARTS Week7

丽子

ARTS 打卡计划

IDEA命令行缩短器助你解决此问题:Command line is too long. Shorten command line...

YourBatman

intellij-idea spring IDEA springboot

LeetCode题解:1051. 高度检查器,JavaScript,桶排序,详细注释

Lee Chen

大前端 LeetCode

Discuz插件设计

心平气和

php Diszuz 插件设计 插件系统

你以为你真的理解 Closure 吗

double U

大前端 闭包

腾讯员工每天在岗不足 8 小时被辞?背后原因可能不止你看到的这些!

程序员生活志

腾讯 辞退

OOP面向对象编程(Object-Oriented Programming)概述

奈学教育

面向对象编程

阿里巴巴取消周报?别高兴太早,也不见得是一件好事

非著名程序员

阿里巴巴 程序员 职场成长 职场误区

小白教程——基于阿里云快速搭建自己的网站

诸葛小猿

阿里云 视频 网站搭建 小白

上班摸鱼,可以玩一整天,哈哈哈!!!

诸葛小猿

上班 摸鱼

图解:最短路径之如何理解“松弛”or“放松”?

淡蓝色

Java 数据结构 算法

不变的是什么?

zhongzhq

依道而行 规律 变化

全球区块链专利排行榜中国52家企业上榜

CECBC

编程核心能力之复用

顿晓

编程 复用 编程日课 技术思维

raft协议中, 候选人角色能参与投票吗

程序员老王

raft

大数据的下一站:数据中台_大数据_覃云_InfoQ精选文章