从算力规模到系统级竞争:智算竞争核心已变,金山云战略升级曝行业“隐形拐点”  

  • 2026-01-27
    北京
  • 本文字数:2395 字

    阅读完需:约 8 分钟

从训练到推理:智算需求正在经历一场结构性转向

过去一年,如果仅从“算力需求增长”来理解中国智算产业的变化,显然是不够的。

 

在 2026 年 1 月 21 日举办的金山云年度 Tech Talk 上,金山云对其过去一年智算业务的演进进行了系统性回顾。从公开财报数据到客户侧真实使用情况,这些信息拼凑出了一幅更清晰的图景:智算需求并非简单放量,而是在训练、推理、应用形态和工程方式等多个层面同时发生结构性变化

 

这场变化的核心,不再只是“谁拥有更大规模算力”,而是围绕模型如何被使用、Token 如何被消耗、算力如何被组织展开。

 

变化首先体现在财务数据上。

 

根据金山云披露的公开财报,其智算云业务在过去一年实现了高速增长。以 2025 年第三季度为例,智算云账单收入达到 7.8 亿元人民币,同比增长接近 120%。这一数据并非孤立,而是延续了此前多个季度的增长趋势,显示智算已成为金山云收入结构中的重要组成部分。

 

金山云高级副总裁刘涛在分享中提到了金山云对这一趋势的判断:智算需求的增长重心,正在从训练侧逐步向推理侧转移。

 

从训练视角看,过去几年国内智算需求的主要推动力,来自少数对算力高度敏感的行业。

 

自动驾驶与具身智能,是其中最典型的代表。这些行业往往需要长期训练模型,并处理视频、点云、传感器等海量多模态数据。在早期阶段,它们对算力的需求更多集中在训练规模本身。

 

但与通用大模型不同,这类行业模型并不一味追求参数规模最大化。刘涛在分享中指出,自动驾驶和具身智能模型在训练阶段,对算力密度的要求并不极端,但对显存容量和数据处理能力要求更高。

 

这意味着,它们对算力平台的诉求,正在从“算力数量”转向“系统能力”——包括数据接入、预处理、多模态调度以及训练全流程的工程化效率。

 

推理侧的变化更加显著。

 

如果说训练侧的变化仍然是渐进的,那么推理侧的变化则更为直接和激烈。

 

一个被反复引用的数据,来自火山引擎在其公开发布会上的披露:平台每日 Token 调用量已达到 50 万亿级别。这是当前国内少数被明确对外公布的 Token 规模数据之一,也成为行业理解推理负载的重要参考。

 

与此同时,多个面向大众或企业的模型产品正在持续扩大推理需求。例如豆包、通义千问以及近期加大投入的腾讯元宝,都在不同程度上推动 Token 消耗快速增长。

 

这些产品并不完全运行在同一云平台上,但它们共同指向一个事实:推理阶段正在成为智算需求增长的主要来源,且这种增长具备明显的外溢性。

 

在所有推理场景中,编程类应用被反复强调。

 

刘涛指出,2025 年一个尤为显著的变化在于:编程相关请求正在成为 Token 消耗的主力场景之一。这一判断并非孤立,而是与海外模型使用结构的统计结果高度一致。

 

“Vibe Coding”成为一个关键词。一个广为流传的事实是,Claude Code 的大量代码本身,正是由 Claude Code 参与生成的。这意味着模型不再只是辅助工具,而是深度介入软件生产过程。

 

从全球 Token 调用结构来看,编程类请求在多家模型服务商中长期占据最高比例。金山云也观察到了同样的趋势:代码生成、重构和理解能力的提升,正在显著改变程序员的工作方式,并直接放大推理侧算力需求。

 

在具体应用层面,互联网客户仍然是智算需求的重要来源,但其需求形态已经发生变化。刘涛提到,当前互联网场景呈现出三个明显特征:

 

其一,多模态需求显著增长。视频生成、视频理解以及复杂推理任务,带动了训练与推理负载的持续上升;

其二,模型参数规模不再单向膨胀,而是围绕具体任务进行结构性调整;

其三,Vibe Coding 在头部互联网公司中已较为普及,使用更强的商用模型进行代码开发,正在成为常态。

 

这些变化意味着,互联网客户对智算平台的期待,已经从“算力服务”升级为对模型生命周期管理和工程体系的整体依赖。

 

为了满足更多元化的需求,刘涛表示,2025 年,智算平台金山云星流已完成从资源管理平台向一站式 AI 训推全流程平台的战略升级。从训推平台、机器人平台到模型 API 服务,升级后的金山云星流平台构建了从异构资源调度、训练任务故障自愈到机器人行业应用支撑、模型 API 服务商业化落地的全链路闭环。

实现三维进阶,智算云 AI 势能全释放

 

尽管各行各业大规模应用 AI 还处于早期探索阶段,但定位行业助力者的金山云,多年来持续打磨全栈 AI 能力。从 2023 年的智算网基础设施,到 2024 年智算云的平台化和 Serverless 化,再到 2025 年的一站式 AI 训推全流程平台,通过提升平台效率、突破行业边界、加速推理布局,金山云为迎接 AI 应用爆发做好了充分准备。

 

在平台效率方面,金山云星流训推平台提供从模型开发、训练到推理的完整生命周期管理,具备开发、训练、推理和数据处理四大模块能力,通过降低多模块协同复杂度,能实现“开箱即用”的 AI 开发体验。自研的 GPU 故障自愈技术结合任务可观测性设计,可实时监控硬件健康状态与任务进程,自动触发故障迁移与任务重调度,降低算力中断风险,保障长周期训练任务稳定运行。

 

作为面向机器人开发与落地的全链路云原生平台,金山云星流机器人平台深度融合数据采集、存储、标注、模型开发、训练、部署与仿真等核心环节,打造具身场景专属的数据、模型、仿真一体化引擎。平台率先实现具身智能数据工程领域采集、标注、管理的全链路闭环,可高效服务具身智能行业模型训练、仿真应用场景分析等核心需求,助力客户快速完成从算法研发到真实场景部署的全流程落地,最终推动机器人产业的智能化升级。

 

面向大模型应用开发者和企业用户,金山云星流平台模型 API 服务提供高可用、易集成的模型调用与管理能力,覆盖模型调用的全生命周期。该服务支持高并发推理与多模型管理,能够帮助用户高效接入多种模型资源,助力大模型应用落地。目前,金山云星流平台模型 API 服务已积累诸多行业客户。

 

同时,金山云星流平台的模型生态也在持续丰富。目前,平台已支持近 40 种不同模型,包括 DeepSeek、Xiaomi MiMo、Qwen3、Kimi 等。客户通过一站式访问,即可高效接入多种模型,在畅享稳定高效云服务的同时,更加聚焦 AI 业务创新和价值创造。