燃爆上海 5·23-24,AICon 大模型实战风暴,50+ 干货一网打尽,即将开幕~ 了解详情
写点什么

首次揭晓!全国数据资源“大摸底”,数据生成总量激增

  • 2024-05-31
    北京
  • 本文字数:1872 字

    阅读完需:约 6 分钟

大小:1.01M时长:05:51
首次揭晓!全国数据资源“大摸底”,数据生成总量激增

近日,全国数据资源调查工作组发布了《全国数据资源调查报告(2023 年)》,验证了我国发展数字经济具备超大规模市场、海量数据资源和丰富应用场景的潜在优势。


根据国家数据局等多部门的最新调查结果,2023 年全国数据生产总量达到 32.85 泽字节(ZB),相当于 1000 多万个中国国家图书馆的数字资源总量。和 2022 年相比,我国数据年产量增长 22.44%。其中与智能网联汽车相关的出行数据,同比增长 49%;与工业机器人等智能生产设备相关的制造数据,同比增长 20%。预计今年我国数据生产量增长将超过 25%。


关注「InfoQ 数字化经纬」公众号,回复「数据资源」获取报告全文。

六大特征,揭示数据要素化的现状与挑战

报告指出了我国数据资源的六大特征,展现了我国数据资源的发展方向,也指出了存在的挑战。数据资源管理和利用整体处于起步阶段,数据价值潜力有待进一步挖掘。


数据生产:规模大、增长快


我国数据生产的规模优势基本形成,数据生产规模持续扩大,2023 年数据生产总量达到 32.85 泽字节(ZB),同比增长 22.44%。这一增长得益于 5G、AI 技术的快速发展及智能设备的规模应用,尤其是内容创作、影像视听等领域的非结构化数据爆发式增长。


数据存储:空间合理,产存转化待提升


2023 年我国累计数据存储总量为 1.73 泽字节(ZB),存储空间利用率为 59%。政府和行业重点企业存储空间利用率约为 70%,而数据服务商为 35.29%。行业重点企业数据终端存储占比超七成,超过了云存储占比。


尽管存储空间基本满足需求,但数据产存转化率较低,2023 年新增数据存储量仅为 0.95 泽字节(ZB)2.9%,表明数据价值潜力尚未被充分挖掘。


算力规模:增长迅速,区域布局需优化


至 2023 年底,我国 2200 各算力中心的算力规模约为 0.23 十万亿亿次浮点运算 / 秒(ZFLOPS),同比增长约 30%。虽然算力枢纽按需布局的趋势很明显,但区域算力布局仍需优化,东数西算战略仍需持续推进。


此外,我国智能算力占比约为 30%,能够支持行业垂直领域大模型落地的算力还不能满足各行各业对智能算力的需求,且大模型与国产软硬件的适配性问题尚需解决。


数据流通:多元交互,供需不匹配


数据流通方式多样,但交易供需存在不均衡。2023 年,四大运营商数据显示全国数据总流量较去年同期增长 7.6%,消费领域数据交互活跃度较高,移动互联网数据流通活跃度不断增加。中央企业和平台企业成为行业领域的数据枢纽,数据流通量远超其他企业。


尽管全国各地数据交易所已经快速铺开,19 个省市都建立了数据交易机构,但场内交易活跃度较低,数据产品成交率不高,数据交易机构供给水平难以满足旺盛的数据需求。



公共数据:开放共享初见成效,授权运营探索起步


截至 2023 年 12 月底,全国一体化政务数据枢纽接入 53 个国家部门、31 个省 / 自治区 / 直辖市和新疆生产建设兵团数据,挂接资源达 2.06 万个,实现累计调用 5361.35 亿次服务。


公共数据体系完善,数据汇聚能力不断提升;数据开放共享提升政务服务水平,国家行业主管部门、地方省级政府开放数据量比上年增长 16%、18.5%;北京、浙江、上海、重庆等 15 个地区的省级数据管理部门开始探索公共数据授权运营机制;公共数据与企业数据融合应用加深。



企业数字化转型:激活数据,提质增效成果不够理想


数字化转型促进了企业数据的沉淀与应用,96% 的行业重点企业已实现数据场景化应用。然而,数据管理和复用水平较低,多主体数据协同难度大,数据价值外溢效应尚不明显。


四大趋势,引导数字经济发展


数据生产向高增速和高质量同步发展


受政策、技术和应用推动,我国数据生产规模预计将保持快速增长,2024 年预计增幅超 25%。新技术如卫星通信、自动驾驶、生成式 AI 的应用将提升数据生产能力,有助于数据质量的进一步提升,同时数据存储能力也将随着硬件技术的进步而增强。


数据存储计算向一体化按需供给发展


AI 训练需求的增长将推动算力布局的优化和利用率的提升。数据存储结构将按需调整,边缘智能计算将增长,而数据高效计算和实时读取需求的增长将促进全国一体化算力体系的扩展,缓解东部实时算力压力的同时,释放西部算力优势。


数据流通向规范有序、多元协同发展


国家层面的数据交易规范将进一步完善,数据交易场所和服务商将走向规范有序发展。场内场外流通交易模式更加多元化,各类细分领域交易机构向专业化发展。平台企业和中央企业将发挥数据枢纽作用,带动数据汇聚和应用。


数据应用向需求牵引、智能驱动发展


应用场景需求将驱动数据开发利用,AI 技术成为数据开发利用的重要推动力,数据驱动业务发展将成为主要趋势。自然语言处理、语音识别等技术进步降低开发门槛,围绕数据增值的产品服务将逐渐成为数据供给的主要方式。

2024-05-31 18:308906

评论

发布
暂无评论
发现更多内容

那些打不垮你的,终究使你更强大

小天同学

读书 励志 个人感悟 4月日更

Flink的基石

五分钟学大数据

flink 4月日更

Linux free 命令

一个大红包

linux命令 4月日更

如何提高Linux水平

cdhqyj

如何在云中构建数字核心

云计算

华为云AI论文精读会2021第一期:高效语义分割模型Fast-SCNN分享

华为云开发者联盟

AI 华为云

架构实战营模块1作业指导

华仔

#架构实战营

最新分享:如何避免线程安全的坑?看这一篇就够了

学Java关注我

Java 编程 程序员 架构 计算机

浅谈JVM和垃圾回收

leonsh

Java JVM JVM虚拟机原理 垃圾回收算法

推进智慧城市建设 博睿数据亮相长三角城市数字化转型高峰论坛

博睿数据

数字化转型高峰论坛

翻译:《实用的Python编程》09_03_Distribution

codists

Python

Flink中的状态编程

大数据技术指南

flink 4月日更

不为人知的网络编程(十二):彻底搞懂TCP协议层的KeepAlive保活机制

JackJiang

TCP 即时通讯 IM

知乎万赞回答:程序员面试为什么被要求造航母,而工作拧螺丝?

Java架构师迁哥

开源 1 年半 star 破 1.2 万的 Dapr 是如何在阿里落地的?

阿里巴巴云原生

Java 微服务 云原生 中间件 API

欢迎参与 KubeVela 官方文档翻译活动

阿里巴巴云原生

容器 云原生 开发工具 OAM 资源调度

为什么我愿意持续做这样一件看似没有价值的事情

帅安技术

坚持 持续写作 长期价值

【全球年青人召集令】Hello World,Hello 2050

阿里巴巴云原生

容器 开发者 云原生 活动

GitHub面试题库+阿里巴巴2021年Java岗面试26大核心专题,成功助我砍下7家大厂Offer

Java架构追梦

Java 阿里巴巴 架构 面试

未来已来,HarmonyOS 开发者日全记录

清秋

华为 开发 物联网 新闻 HarmonyOS

架构实战营作业2

冷酷小绵羊

浅谈在探索数分之路上的“数据思维”论述

小飞象@木木自由

数据分析 数据分析体系 数据思维 数据分析方法论

计算机原理学习笔记 Day10

穿过生命散发芬芳

计算机原理 4月日更

趣题与算法(1)

阳龙生

简单了解InnoDB底层原理

leonsh

MySQL 数据库 innodb

百度大脑3月新品推荐:EasyDL视频目标追踪全新发布

百度大脑

百度大脑 EasyDL

使用Agora SDK开发React Native视频通话App

声网

RTC React Native 声网 RTE

这个GItHub上的Java项目开源了 2021最全的Java架构面试复习指南

比伯

Java 编程 架构 面试 程序人生

方寸之间,书写天地

石云升

4月日更 1 周年盛典 我和写作平台的故事 InfoQ 写作平台 1 周年

深入理解Java虚拟机-HotSpot

华章IT

Java JVM 虚拟机

融合趋势下基于 Flink Kylin Hudi 湖仓一体的大数据生态体系

Apache Flink

flink

首次揭晓!全国数据资源“大摸底”,数据生成总量激增_数字化转型_何逸灿_InfoQ精选文章