写点什么

数据分析师,即将从工业领域“消失”?

  • 2025-08-18
    北京
  • 本文字数:4208 字

    阅读完需:约 14 分钟

大小:2.10M时长:12:13
数据分析师,即将从工业领域“消失”?

2023 年底,一则 Google 裁撤数据科学家的新闻引起业内关注。有媒体猜测,Google 计划用 AI 自动化取代部分人力,导致数据科学家岗位减少。而在最近两年,随着 AI+BI 的产品形态逐渐普及,这种岗位裁撤风潮大有蔓延趋势,从新零售到金融,最终传递到工业领域。


尤其是在工业领域,行业壁垒较高,数据分析师本就是稀缺物种。如今,这一岗位的编制或面临进一步缩减。


AI 冲击数据分析师岗位的第一步,是将取数、做报表、给出分析结论等一系列工作,通过自然语言自助化完成,将任务交付时间压缩至分钟级。


到了 2025 年,AI 的职能边界进一步扩张。甚至不需要老板下命令,就能根据企业所在的领域、所积累的数据,将合适的数据以恰当的方式,主动推送给对应的负责人。


可以说,数据的消费范式,已经变了。


本质上,老板需要的不是数据,而是业务洞察,且洞察方向随着业务的开展,会不断出现变化。但岗位职能不同,接收到的上下文也不同,员工绞尽脑汁,耗时数天至数周给出的报表,通常也很难令老板满意。从前,企业被迫接受这一事实,苦恼的是业务一号位以及 HR;现在,AI 正在重新制定“游戏玩法”。


数据找人、无问智推?数据分析师会在多大程度上被 AI 取代?InfoQ 特别采访了涛思数据创始人 &CEO 陶建辉,聊了聊涛思数据最新的发布,以及 BI 类产品正在发生的变化。


人找数据,从未简单过


2025 年 7 月 29 日晚,TDengine 发布了一款全新产品 —— TDengine IDMP(Industrial Data Management Platform,工业数据管理平台),以“用 AI 改变数据消费范式”为主题,主打让数据自己说话,不用提问或拉取数据,而是将实时业务洞察所需要的可视化面板、实时分析任务主动推送给你。


在笔者眼中,陶建辉老师始终是一位情绪非常饱满的持续创业者。自 2008 年开启移动互联网领域 IP Push 与 IP 实时消息服务的创业之路起,到后来深耕时序数据库 TDengine,他一路走来始终保持着充沛激情。而当发布 TDengine IDMP 产品时,他的兴奋之情尤为强烈 —— 尤其是对其核心功能 “无问智推”,更是寄予厚望,坚定认为这是在 AI 时代下,足以带来 “范式革命” 的关键产品。


要回溯这种兴奋的源头,我们必须要明白 BI 类产品在数据的供给和消费问题上,长期以来所面临的问题。


我们可以将 BI 产品的发展,简单概括为三个阶段:

  • 报表式 BI

  • 自助式敏捷 BI

  • 指标化 BI


报表式 BI  最早于上个世纪就出现了,是最原始的形态:IT 人员先建模、后出表,通过邮件进行分发,业务人员仅负责提出需求和查看结果。这种 BI 本质上只是在解决“没有数据可看”的问题,是信息化的早期产物。


除了功能受限,报表式 BI 的另一大问题在于,技术人员完全不理解业务,建模速度也跟不上业务发展。于是自助式敏捷 BI 出现了,主打一个“还政于民”,建模的主体变成了业务人员,建模的方式是拖拉拽,同时通过实时连接数据仓库或大数据引擎,解决“数据时效性差”的问题。


不过,“还政于民”,初衷是好的,结果却不尽如人意。太多的人有权限进行数据建模,导致“数据沼泽”出现了,企业经营数据甚至做不到口径上的统一——同样叫做“毛利率”,但在销售部门和运营部门是完全不同的算法。


于是大约 2019 年之后,指标化 BI 产品开始出现。指标化 BI 是在数据仓库 / 数据湖与 BI 工具之间构建一个“统一指标语义层”,意思就是要对基础的指标和计算口径进行共识,比如:销售额 = 含税成交总额 - 退货额,这一公式只允许存储一次。数据维度、修改历史都做好限制和记录。


指标化 BI ,等于在一定的限制下,“还政于民”。那么,指标化 BI 解决得了产业的问题吗?Gartner 等研究机构并未针对指标化 BI 产品做单独的落地成功率统计,但 2021-2023 年对“整体 BI/ 数据分析项目”的统计区间显示,超过 60% 的 BI 项目未能达到预期效果。


抛开纷繁复杂的大数据技术名词,BI 类产品进化与拉扯,始终是在解决“人”的问题。


人无法做数据化决策,所以出现了报表式 BI ;技术人不懂业务,所以出现了自助式敏捷 BI ;业务人自说自话,所以出现了指标化 BI 。而在任何一家公司内,具备深度业务认知,且能紧跟业务发展,用数据建模的思维组织材料,敏捷生产洞察报告的人才,都是极少的。所以即便我们发明了“数据分析师”这个岗位,也依然不能将 BI 落地的成功率提高。


当这一问题出现在新零售领域时,其严峻程度或多或少是被冲淡了。毕竟,像库存周转率、订单满足率这类数据指标,即便不明确计算公式,多少也能理解其反映的业务情况。但在工业领域,许多数据指标是与工艺联系在一起的,理解成本骤然上升。


比如在烟草行业,需要关注的指标有:回潮温度、打叶效率、叶丝填充值、蒸汽单耗等,不但要理解其含义、计算方式,还要意识到,这些指标在数值上,是有参考标准和取值范围的。


每一年随着工艺和法律法规的变化,相关指标的参考标准都有可能发生变化。比如 AI 视觉检测技术成熟后,烟草行业的残次频率已经从 0.8% 降到了 0.12%。不要以为这一数据变化只有汇报价值,据烟草行业测算,一家中型烟厂每年可因此节省原料成本超过 222 万美元。


一个普通业务人员,很难做到对这些工艺指标、取值范围、每年变化了如指掌,甚至即时调整数据建模,产出对应的报告。


这是数智化转型的核心困局:人的能力即是瓶颈,软件只能辅助,不能根除。


直到 2022 年, AI 打破了这一逻辑,AI 的知识量与工作效率,对于人而言是“降维打击”。到了 2025 年,AI Agent 端到端任务平均通过率已经突破 70%,对 Level-1 级难度的任务通过率已经突破 85%。


从前在企业内缺位的数据专家,今天可以由 AI Agent 出任,这是 TDengine IDMP 所做的事情,也是陶建辉老师为何如此兴奋。


数据找人,涛思数据的解决思路


那么,所谓的由 AI Agent 出任数据专家,实现“数据找人”,是对 ChatBot 进行简单套壳吗?是单纯地集成一个 DeepSeek 吗?


当然不是,在发布日,涛思数据公布的 IDMP 架构如下:



大数据平台,尤其是工业领域的大数据平台,不光是解决数据分析问题,也是在解决数据的采集和治理问题。涛思数据的前置技术积累是充分的,在时序数据库上,有性能强大且具备开源口碑的 TSDB 做支撑。


TDengine TSDB 单个集群可以支撑起 10 亿级测点,配合高效的存储引擎,整体成本是通用平台的十分之一。它具备良好的系统开放性,支持 JDBC、ODBC、REST API 等接口,能够与 MES、ERP、AI 等企业系统无缝集成;支持数据订阅,数据不仅能流进来,还能实时流出去,不被厂商绑定;部署方式也更灵活,兼容 Windows、Linux、虚拟机、容器等多种环境,适配各种工业现场需求。


TDengine TSDB 是一个基础,保证 TDengine IDMP 可以高效获得业务数据。接下来, TDengine IDMP  基于采集到的实时数据,创建数据目录,做好数据标准化、数据情景化。


数据目录其实是数据孪生会涉及的概念,解决“数据在哪、属于谁、长什么样”的问题,AI/BI 工具可直接按目录路径调用数据,无需再写复杂 SQL。


数据标准化的目标是为了让跨系统数据可比、可用、可信,价值接近我们前面提到的“统一指标语义层”。


数据情景化,是为了让任何一条时序数据都能回答“它代表什么、在什么场景下、跟谁有关”,解决前面提到的“取值范围”问题。


接下来,TDengine IDMP 会通过内置的 Agentic AI,配合业务知识库,感知具体应用场景,自动生成指标、报表和分析任务,并主动推送业务洞察。其他核心能力还包括:


  • 智能可视化:“无问智推”能够驱动 AI 根据当前业务场景自动生成可视化看板,告别手动配置

  • 实时分析:支持多模态触发的流式计算,毫秒级反馈分析结果

  • 事件管理:将分析结果转化为可执行事件,提供全链路根因分析能力


此外,IDMP 也率先将 Git 思维引入到数据建模与治理中,支持多人协同建模、版本追溯,使工业数据管理像管理代码一样高效、可控。


实际上,TDengine IDMP 的野心很大,它并非想单纯给工业大数据平台加一个 ChatBI,而是希望提升从数据采集到业务决策的整个链路的效率。涛思团队技术人员,在官方博客上,也对这种针对性设计做了解读:


“在不同的工业场景里,有八个痛点彼此关联、相互放大:


  1. 数据在采集环节就因为厂商和协议不同而被割裂;

  2. 进入系统后,又因缺少语义和上下文而“失去身份”;

  3. 质量问题无法在入口阶段解决,导致后续分析精度下降;

  4. 出于安全考虑,数据流动受限,价值被锁住;

  5. 海量数据积压在库里,缺乏实时处理能力;

  6. 新算法、新模型难以及时落地;

  7. 业务人员缺乏直接获取洞察的途径,实时决策受阻;

  8. 行业知识门槛高,新人难以快速胜任。”


“IDMP 的目标,是让数据从进入平台的第一刻起就‘有名有姓’,并沿着同一条语义化管道,稳定流向实时分析、事件管理和业务决策。”


陶建辉老师本人对 TDengine IDMP 的期待甚至还要更宏大:数据的消费范式正因此出现变革。


另有接近涛思数据的人士透露,目前团队围绕 TDengine IDMP 和智能制造领域企业的合作,如烟草、光伏、电力,已经在洽谈和推进中,来自客户侧的反馈和需求可能会进一步加快 TDengine IDMP 的迭代速度。


数据消费范式转变:工业领域或将开始下一次进化


从 TDengine IDMP 发布,到“数据找人”逐步成为业界的新风潮,智能制造正在逐步迈入新阶段。过去,人们对制造业存在某种“偏见”,认为其:薄利、固化、封闭、缺少标准,因而转型困难。


但随着如 TDengine IDMP 般的产品进入,制造业携移动互联网时代积累的通信、大数据技术,跑步进入智能化时代。整个产业因此变得更加灵动,变得更具生命力。产业进化的信号,即是发生在 2025 年的数据消费范式转移:从“人定义问题→找数据→等洞察”到“AI 定义场景→推数据→给行动”,传统数据分析师的职能被三个不可逆的结构性变化彻底消解:


  • 技术替代:像 IDMP 般的工业大数据平台,将“业务认知 + 数据建模 + 实时推送”封装成基础设施,使 90% 的常规分析需求无需人工干预。

  • 成本重构:当 AI 能以工程师 1% 的成本完成设备预测性维护分析(国家电网案例),“招一个分析师”从投资变成冗余。

  • 权力转移:数据消费权从集中化的分析团队下沉至一线操作员——AI 用自然语言告诉工人“第 3 号锅炉需降负荷”,而非等待分析师的周报。


最终形态或许是,工业领域将出现真正的“数据零接触”组织——数据分析师的岗位描述从“提取洞察”变为“训练 AI 的业务规则”,而其编制规模随自动化率提升呈指数级萎缩。


至少,未来业务人员使用大数据平台,既不需要集中培训,也不需要排队等待 IT 人员定制 SQL。


AI Agent,会自己找上门来,融入工业体系的每一个流程。


※点击【传送门】,可立即体验 TDengine lDMP 无问智推!


2025-08-18 16:335288

评论

发布
暂无评论

承上启下继往开来,Python3上下文管理器(ContextManagers)与With关键字的迷思

刘悦的技术博客

Python 数据库 Python3 上下文 上下文管理器

DeFi 2.0的LaaS协议,重振DeFi赛道发展的关键

BlockChain先知

openharmony萌新贡献指南

坚果

开源 HarmonyOS OpenHarmony 7月月更

IMPALA2.12环境安装

怀瑾握瑜的嘉与嘉

7月月更

如何搭建清晰易懂的数据看板?

字节跳动数据平台

字节跳动 BI BI 分析工具 sentinel dashboard 可视化看板

Linux并不是一个操作系统

冯亮

Linux GNU

手把手带你体验Python实现人脸识别

迷彩

人脸识别 7月月更

王者荣耀商城异地多活架构设计

joak

典型的数据湖应用案例

五分钟学大数据

数据湖 7月月更

Envoy监听管理

阿泽🧸

envoy 7月月更

一篇文章带你快速学会Flex布局

bo

CSS 前端 Flex 7月月更

Seata 多语言体系建设

SOFAStack

开源项目 seata 开源软件 多编程语言 项目共建

【刷题记录】15.三数之和

WangNing

7月月更

React Native 跨端框架与小程序混编的方法

Geek_99967b

小程序

几种2022年流行的跨端技术方案的比较

Geek_99967b

小程序

👈🏻👈🏻👈🏻你来追我呀!Flutter 实现追逐动画

岛上码农

flutter ios 移动端开发 安卓开发 7月月更

nacos注册中心之服务地址的查询

急需上岸的小谢

7月月更

架构实战营第7模块作业

Geek_53787a

连接无限·协同无界|融云首届全球企业通信云大会 WECC 来了

融云 RongCloud

通信云

RISC-V Linux 内核剖析 会议记录

贾献华

7月月更

Docker 搭建 MySQL 主从复制

宁在春

MySQL Docker 主从复制 7月月更

如何将 NFT 元数据从 IPFS 转移到智能合约中

devpoint

智能合约 NFT Metaverse 7月月更

MySQL的锁(一)

技术小生

MySQL 7月月更

Kubernetes网络插件详解- Flannel篇

巨子嘉

云计算 容器 云原生

Baklib:分享一些关于建设企业知识管理(KM)的方法

Baklib

学生思维VS职场思维

KEY.L

【MySql 实战】高度聚合的数据项拆分为多行多列

安逸的咸鱼

MySQL 实战 7月月更

王者荣耀商城异地多活架构

Pengfei

你的技术leader不懂这个?没有它就是没有设计的完成思考过程

田晓亮

方法论 架构设计

深度遍历:统计最高分的节点数目 🐟

空城机

算法题 7月月更

数据分析师,即将从工业领域“消失”?_工业_王一鹏_InfoQ精选文章