AICon 深圳站聚焦 Agent 技术、应用与生态,大咖分享实战干货 了解详情
写点什么

数据分析师,即将从工业领域“消失”?

  • 2025-08-18
    北京
  • 本文字数:4208 字

    阅读完需:约 14 分钟

大小:2.10M时长:12:13
数据分析师,即将从工业领域“消失”?

2023 年底,一则 Google 裁撤数据科学家的新闻引起业内关注。有媒体猜测,Google 计划用 AI 自动化取代部分人力,导致数据科学家岗位减少。而在最近两年,随着 AI+BI 的产品形态逐渐普及,这种岗位裁撤风潮大有蔓延趋势,从新零售到金融,最终传递到工业领域。


尤其是在工业领域,行业壁垒较高,数据分析师本就是稀缺物种。如今,这一岗位的编制或面临进一步缩减。


AI 冲击数据分析师岗位的第一步,是将取数、做报表、给出分析结论等一系列工作,通过自然语言自助化完成,将任务交付时间压缩至分钟级。


到了 2025 年,AI 的职能边界进一步扩张。甚至不需要老板下命令,就能根据企业所在的领域、所积累的数据,将合适的数据以恰当的方式,主动推送给对应的负责人。


可以说,数据的消费范式,已经变了。


本质上,老板需要的不是数据,而是业务洞察,且洞察方向随着业务的开展,会不断出现变化。但岗位职能不同,接收到的上下文也不同,员工绞尽脑汁,耗时数天至数周给出的报表,通常也很难令老板满意。从前,企业被迫接受这一事实,苦恼的是业务一号位以及 HR;现在,AI 正在重新制定“游戏玩法”。


数据找人、无问智推?数据分析师会在多大程度上被 AI 取代?InfoQ 特别采访了涛思数据创始人 &CEO 陶建辉,聊了聊涛思数据最新的发布,以及 BI 类产品正在发生的变化。


人找数据,从未简单过


2025 年 7 月 29 日晚,TDengine 发布了一款全新产品 —— TDengine IDMP(Industrial Data Management Platform,工业数据管理平台),以“用 AI 改变数据消费范式”为主题,主打让数据自己说话,不用提问或拉取数据,而是将实时业务洞察所需要的可视化面板、实时分析任务主动推送给你。


在笔者眼中,陶建辉老师始终是一位情绪非常饱满的持续创业者。自 2008 年开启移动互联网领域 IP Push 与 IP 实时消息服务的创业之路起,到后来深耕时序数据库 TDengine,他一路走来始终保持着充沛激情。而当发布 TDengine IDMP 产品时,他的兴奋之情尤为强烈 —— 尤其是对其核心功能 “无问智推”,更是寄予厚望,坚定认为这是在 AI 时代下,足以带来 “范式革命” 的关键产品。


要回溯这种兴奋的源头,我们必须要明白 BI 类产品在数据的供给和消费问题上,长期以来所面临的问题。


我们可以将 BI 产品的发展,简单概括为三个阶段:

  • 报表式 BI

  • 自助式敏捷 BI

  • 指标化 BI


报表式 BI  最早于上个世纪就出现了,是最原始的形态:IT 人员先建模、后出表,通过邮件进行分发,业务人员仅负责提出需求和查看结果。这种 BI 本质上只是在解决“没有数据可看”的问题,是信息化的早期产物。


除了功能受限,报表式 BI 的另一大问题在于,技术人员完全不理解业务,建模速度也跟不上业务发展。于是自助式敏捷 BI 出现了,主打一个“还政于民”,建模的主体变成了业务人员,建模的方式是拖拉拽,同时通过实时连接数据仓库或大数据引擎,解决“数据时效性差”的问题。


不过,“还政于民”,初衷是好的,结果却不尽如人意。太多的人有权限进行数据建模,导致“数据沼泽”出现了,企业经营数据甚至做不到口径上的统一——同样叫做“毛利率”,但在销售部门和运营部门是完全不同的算法。


于是大约 2019 年之后,指标化 BI 产品开始出现。指标化 BI 是在数据仓库 / 数据湖与 BI 工具之间构建一个“统一指标语义层”,意思就是要对基础的指标和计算口径进行共识,比如:销售额 = 含税成交总额 - 退货额,这一公式只允许存储一次。数据维度、修改历史都做好限制和记录。


指标化 BI ,等于在一定的限制下,“还政于民”。那么,指标化 BI 解决得了产业的问题吗?Gartner 等研究机构并未针对指标化 BI 产品做单独的落地成功率统计,但 2021-2023 年对“整体 BI/ 数据分析项目”的统计区间显示,超过 60% 的 BI 项目未能达到预期效果。


抛开纷繁复杂的大数据技术名词,BI 类产品进化与拉扯,始终是在解决“人”的问题。


人无法做数据化决策,所以出现了报表式 BI ;技术人不懂业务,所以出现了自助式敏捷 BI ;业务人自说自话,所以出现了指标化 BI 。而在任何一家公司内,具备深度业务认知,且能紧跟业务发展,用数据建模的思维组织材料,敏捷生产洞察报告的人才,都是极少的。所以即便我们发明了“数据分析师”这个岗位,也依然不能将 BI 落地的成功率提高。


当这一问题出现在新零售领域时,其严峻程度或多或少是被冲淡了。毕竟,像库存周转率、订单满足率这类数据指标,即便不明确计算公式,多少也能理解其反映的业务情况。但在工业领域,许多数据指标是与工艺联系在一起的,理解成本骤然上升。


比如在烟草行业,需要关注的指标有:回潮温度、打叶效率、叶丝填充值、蒸汽单耗等,不但要理解其含义、计算方式,还要意识到,这些指标在数值上,是有参考标准和取值范围的。


每一年随着工艺和法律法规的变化,相关指标的参考标准都有可能发生变化。比如 AI 视觉检测技术成熟后,烟草行业的残次频率已经从 0.8% 降到了 0.12%。不要以为这一数据变化只有汇报价值,据烟草行业测算,一家中型烟厂每年可因此节省原料成本超过 222 万美元。


一个普通业务人员,很难做到对这些工艺指标、取值范围、每年变化了如指掌,甚至即时调整数据建模,产出对应的报告。


这是数智化转型的核心困局:人的能力即是瓶颈,软件只能辅助,不能根除。


直到 2022 年, AI 打破了这一逻辑,AI 的知识量与工作效率,对于人而言是“降维打击”。到了 2025 年,AI Agent 端到端任务平均通过率已经突破 70%,对 Level-1 级难度的任务通过率已经突破 85%。


从前在企业内缺位的数据专家,今天可以由 AI Agent 出任,这是 TDengine IDMP 所做的事情,也是陶建辉老师为何如此兴奋。


数据找人,涛思数据的解决思路


那么,所谓的由 AI Agent 出任数据专家,实现“数据找人”,是对 ChatBot 进行简单套壳吗?是单纯地集成一个 DeepSeek 吗?


当然不是,在发布日,涛思数据公布的 IDMP 架构如下:



大数据平台,尤其是工业领域的大数据平台,不光是解决数据分析问题,也是在解决数据的采集和治理问题。涛思数据的前置技术积累是充分的,在时序数据库上,有性能强大且具备开源口碑的 TSDB 做支撑。


TDengine TSDB 单个集群可以支撑起 10 亿级测点,配合高效的存储引擎,整体成本是通用平台的十分之一。它具备良好的系统开放性,支持 JDBC、ODBC、REST API 等接口,能够与 MES、ERP、AI 等企业系统无缝集成;支持数据订阅,数据不仅能流进来,还能实时流出去,不被厂商绑定;部署方式也更灵活,兼容 Windows、Linux、虚拟机、容器等多种环境,适配各种工业现场需求。


TDengine TSDB 是一个基础,保证 TDengine IDMP 可以高效获得业务数据。接下来, TDengine IDMP  基于采集到的实时数据,创建数据目录,做好数据标准化、数据情景化。


数据目录其实是数据孪生会涉及的概念,解决“数据在哪、属于谁、长什么样”的问题,AI/BI 工具可直接按目录路径调用数据,无需再写复杂 SQL。


数据标准化的目标是为了让跨系统数据可比、可用、可信,价值接近我们前面提到的“统一指标语义层”。


数据情景化,是为了让任何一条时序数据都能回答“它代表什么、在什么场景下、跟谁有关”,解决前面提到的“取值范围”问题。


接下来,TDengine IDMP 会通过内置的 Agentic AI,配合业务知识库,感知具体应用场景,自动生成指标、报表和分析任务,并主动推送业务洞察。其他核心能力还包括:


  • 智能可视化:“无问智推”能够驱动 AI 根据当前业务场景自动生成可视化看板,告别手动配置

  • 实时分析:支持多模态触发的流式计算,毫秒级反馈分析结果

  • 事件管理:将分析结果转化为可执行事件,提供全链路根因分析能力


此外,IDMP 也率先将 Git 思维引入到数据建模与治理中,支持多人协同建模、版本追溯,使工业数据管理像管理代码一样高效、可控。


实际上,TDengine IDMP 的野心很大,它并非想单纯给工业大数据平台加一个 ChatBI,而是希望提升从数据采集到业务决策的整个链路的效率。涛思团队技术人员,在官方博客上,也对这种针对性设计做了解读:


“在不同的工业场景里,有八个痛点彼此关联、相互放大:


  1. 数据在采集环节就因为厂商和协议不同而被割裂;

  2. 进入系统后,又因缺少语义和上下文而“失去身份”;

  3. 质量问题无法在入口阶段解决,导致后续分析精度下降;

  4. 出于安全考虑,数据流动受限,价值被锁住;

  5. 海量数据积压在库里,缺乏实时处理能力;

  6. 新算法、新模型难以及时落地;

  7. 业务人员缺乏直接获取洞察的途径,实时决策受阻;

  8. 行业知识门槛高,新人难以快速胜任。”


“IDMP 的目标,是让数据从进入平台的第一刻起就‘有名有姓’,并沿着同一条语义化管道,稳定流向实时分析、事件管理和业务决策。”


陶建辉老师本人对 TDengine IDMP 的期待甚至还要更宏大:数据的消费范式正因此出现变革。


另有接近涛思数据的人士透露,目前团队围绕 TDengine IDMP 和智能制造领域企业的合作,如烟草、光伏、电力,已经在洽谈和推进中,来自客户侧的反馈和需求可能会进一步加快 TDengine IDMP 的迭代速度。


数据消费范式转变:工业领域或将开始下一次进化


从 TDengine IDMP 发布,到“数据找人”逐步成为业界的新风潮,智能制造正在逐步迈入新阶段。过去,人们对制造业存在某种“偏见”,认为其:薄利、固化、封闭、缺少标准,因而转型困难。


但随着如 TDengine IDMP 般的产品进入,制造业携移动互联网时代积累的通信、大数据技术,跑步进入智能化时代。整个产业因此变得更加灵动,变得更具生命力。产业进化的信号,即是发生在 2025 年的数据消费范式转移:从“人定义问题→找数据→等洞察”到“AI 定义场景→推数据→给行动”,传统数据分析师的职能被三个不可逆的结构性变化彻底消解:


  • 技术替代:像 IDMP 般的工业大数据平台,将“业务认知 + 数据建模 + 实时推送”封装成基础设施,使 90% 的常规分析需求无需人工干预。

  • 成本重构:当 AI 能以工程师 1% 的成本完成设备预测性维护分析(国家电网案例),“招一个分析师”从投资变成冗余。

  • 权力转移:数据消费权从集中化的分析团队下沉至一线操作员——AI 用自然语言告诉工人“第 3 号锅炉需降负荷”,而非等待分析师的周报。


最终形态或许是,工业领域将出现真正的“数据零接触”组织——数据分析师的岗位描述从“提取洞察”变为“训练 AI 的业务规则”,而其编制规模随自动化率提升呈指数级萎缩。


至少,未来业务人员使用大数据平台,既不需要集中培训,也不需要排队等待 IT 人员定制 SQL。


AI Agent,会自己找上门来,融入工业体系的每一个流程。


※点击【传送门】,可立即体验 TDengine lDMP 无问智推!


2025-08-18 16:336

评论

发布
暂无评论
发现更多内容

简单好上手!1分钟带你体验Apipost

叶小柒

工赋开发者社区 | 达摩院开源半监督学习框架Dash,刷新多项SOTA

工赋开发者社区

新泰山众筹SUN4.0系统开发模式详情

开发微hkkf5566

AR Engine毫秒级平面检测,带来更准确的呈现效果

HarmonyOS SDK

HMS Core

开源工具系列3:Prowler

HummerCloud

云安全

共赴元宇宙新纪元,华为云VR开发应用大赛总决赛倒计时7天!

华为云开发者联盟

人工智能 华为云 VR开发应用 企业号 2 月 PK 榜 华为云开发者联盟

DiffusionDet 用扩散模型解决目标检测

Zilliz

“堆外内存”这玩意是真不错,我要写进简历了。

why技术

Java 程序员 面试

C++数据结构

老浩

版本控制 | 如何利用虚幻引擎进行虚拟制作,为电影制作带来更多可能

龙智—DevSecOps解决方案

游戏引擎 虚幻引擎 虚幻引擎5 虚拟制作

堡垒机真的安全吗可靠吗?大家喜欢哪款?

行云管家

等保 堡垒机 等级保护 堡垒机品牌

2023计算机领域顶会(A类)以及ACL 2023自然语言处理(NLP)研究子方向领域汇总

汀丶人工智能

人工智能 自然语言处理 2月日更 计算语言学协

大数据编程培训课程怎么选择

小谷哥

ITSM | Atlassian被Gartner评为IT服务管理平台魔力象限的领导者

龙智—DevSecOps解决方案

Atlassian ITSM Gartner

助力芯片产业蓬勃发展,诚翔滤器推出光刻机过滤器

电子信息发烧客

技术交错革新,移动开发平台机会和挑战并存

FinFish

移动开发 移动开发平台 移动应用开发

SAP的良好业绩,能否敲响国内厂商的警钟?

ToB行业头条

云原生微服务技术趋势解读

阿里巴巴中间件

阿里云 开源 微服务 云原生

从焊接角度聊一聊,设计PCB的5个建议

华秋PCB

工具 PCB PCB设计 焊接

Dubbo 3 之 Triple 流控反压原理解析

阿里巴巴中间件

阿里云 微服务 云原生

简单了解下linux与windows两者的区别-行云管家

行云管家

Linux

JVM参数:带你认识-X和-XX参数

华为云开发者联盟

开发 华为云 企业号 2 月 PK 榜 华为云开发者联盟

落地DevOps的路线图

老张

DevOps 软件工程

参加大数据开发培训机构怎么样

小谷哥

架构作为6

梁山伯

用Apipost进行Websocket调试教程

不想敲代码

微服务 websocket 接口调试

婚庆LED显示屏打造梦幻婚礼

Dylan

LED显示屏 led显示屏厂家 户内led显示屏

一文梳理 Code Review 方法论与实践总结

阿里巴巴中间件

阿里云 云原生 Code Review

drools规则动态化实践

京东科技开发者

Java 规则引擎 业务逻辑 企业号 2 月 PK 榜 drl

对比开源丨Prometheus 服务多场景存储压测全解析

阿里巴巴中间件

阿里云 云原生 Prometheus

数据分析师,即将从工业领域“消失”?_工业_王一鹏_InfoQ精选文章