写点什么

不卷 Token 总量,华为云改卷 token 生产力:Agentic Infra 背后,AI 云竞争进入下半场

  • 2026-06-08
    北京
  • 本文字数:3550 字

    阅读完需:约 12 分钟

6 月 5 日,在华为云 INSPIRE 创想者大会上,华为云提出 Agentic Infra 基础设施范式,并发布通智一体化基础设施、新一代模型训推平台、企业级智能体平台等一系列 Agentic AI 产品。同时,华为云发布“行业 AI 梦工厂”智慧医疗、具身智能、智能制造、科学计算四大专区,试图将 AI 能力进一步引入具体行业场景。

 

可以看出,华为云正在将 Agentic AI 的竞争重点从单一模型能力,延伸到算力集群、存储、调度、训推平台、安全机制、智能体工程平台和行业场景。对于企业客户而言,Agentic AI 是否能够真正落地,关键不只在于模型本身,也取决于底层基础设施能否支撑长程任务、稳定运行、成本控制和安全可控。

搭建 Agentic Infra:从算力供给走向智能体运行底座

 

华为公司董事、华为云 CEO 周跃峰在会上表示,Agentic AI 正在推动计算范式变化。过去,AI 基础设施主要围绕大模型训练和推理展开;但进入智能体时代后,企业需要的不再只是“把模型跑起来”,而是让智能体能够长期执行任务、持续调用工具、管理上下文记忆,并在复杂业务环境中安全运行。

 

因此,Agentic AI 对基础设施提出了四类新要求:一是更高效的 Token 生成能力,支撑大规模智能体并发调用;二是更长程的记忆能力,让智能体能够处理跨小时、跨天级任务;三是更灵活的算力调度能力,在训练、推理和智能体运行之间动态分配资源;四是更强的安全自治能力,保障智能体在企业环境中的可控运行。

 

基于这一判断,华为云将 Agentic Infra 定义为“高效 Token 工厂、持续学习、通智一体化调度、安全自治”四个方向,并围绕这四个方向发布了对应的基础设施产品。

 

首先,在算力层面,华为云发布 AICS 灵衢智算集群。该集群基于灵衢网络,支持 10 万卡级集群规模,总算力最高可达 200 EFLOPS。华为云称,AICS 可将 Token 生成时延降低到 10 毫秒以内,千卡每秒吞吐达到 500 万 Tokens,在线服务可用性达到 99.95%。这对应的是 Agentic Infra 中的“高效 Token 工厂”能力。

 

其次,在记忆与上下文管理层面,华为云发布 AMS Agentic 记忆存储解决方案。该方案面向智能体长程任务中的记忆瓶颈,通过 NPU 直通 CMS(上下文记忆存储)硬件,提供 PB 级记忆空间,并支持 KV Cache 分层池化。其目标是在降低推理成本的同时,支撑天级长程任务,让智能体具备更强的持续学习和上下文保持能力。

 

第三,在资源调度层面,CCE Volcano Next 通智一体化调度引擎主要解决训练、推理和智能体负载之间的资源协同问题。该引擎通过“训推共池”和“碎片整合”,支持通用计算与智能计算混合负载调度。华为云称,该方案可将资源利用率提升 30%以上。

 

第四,在智能体运行环境层面,AgentSphere 面向智能体规模化运行,提供弹性扩展、主动防护和沙箱隔离能力。其羽量级沙箱技术可实现 100 毫秒级启动,并支持每分钟十万级批量创建,用于支撑智能体在云上的安全、高效运行。

 

在底层基础设施之外,华为云还发布了新一代 ModelArts Next 模型训推平台,面向模型开发、部署和企业场景适配。该平台重点建设四类能力:RL 强化学习服务、机密推理、模型路由和模型矩阵。

 

其中,MaaS 模型路由支持成本优先、效果优先和均衡模式三种策略,可根据请求特征动态选择模型。华为云披露,目前该平台已提供 15 余款 SOTA 模型服务,模型调度精准率超过 95%,调用成本平均降低 20%。企业级 RLaaS 服务则面向行业场景中的模型持续优化,支持一分钟创建任务、训练过程可视化观测,以及训推一致性保障,降低企业使用强化学习优化模型的门槛。

 

华为云还联合智谱、DeepSeek、Minimax、Kimi、阶跃星辰、百度、美团 LongCat、讯飞星火、爱诗科技、生数科技等 20 余家 TOP 模型厂商,发布“百模千态,云聚共赢”生态合作计划,共建系统化商业生态,打造多方共赢的产业发展新模式。

 

在智能体平台层面,华为云宣布智果 AgentArts 企业级智能体平台进入公测。该平台面向生产级长程任务、企业级安全、行业知识深度和全链路可观测等需求,主打智能体的工程化落地。与此同时,华为云上线了智果开源版 openJiuwen。华为云称,openJiuwen 内核与 AgentArts 企业版同源度超过了 90%。

 

此外,华为云还发布了新的 Agentic 云入口“智果园”。该入口聚合华为云全栈 Agentic 云服务、智能体和大模型能力,并将云服务能力 Skill 化、CLI 化,覆盖意图理解、功能开发、资源发放和应用部署等流程。华为云希望将云服务本身进一步智能体化,让用户通过自然语言或智能体工作流调用云上资源和能力。

 

安全方面,华为云发布了一套覆盖 AI 全链路的安全方案,主要面向 Agent 安全、模型安全和 Agentic Infra 安全。在数据安全层面,华为云发布数据安全专区,涉及硬件专属加密与 HYOK 技术、数据胶囊技术,以及 Agentic 基础设施多维度隔离等能力,目标是帮助企业在上云过程中保持数据控制权。

 

同时,华为云还发布 AI 机密计算方案,包含机密虚机、云端远程证明服务、机密计算密钥管理、机密推理网关、NPU 设备 PCIPC 直通等能力,支持机密推理、机密预训练和机密联邦学习等场景。

 

华为云方面还披露,截至目前,华为云已连续稳定运行零重大事故 1037 天。

 

华为云 CEO:不拼 Token 总量,而是要看背后的生产力提升

 

本次,周跃峰阐述了公司的 AI 云战略:相较于单纯追逐 Token 规模、MaaS 收入或互联网流量,华为云更强调 AI 对国计民生行业的生产力提升,并将通过国产化算力、全栈 AI 平台、混合云架构和行业 AI 梦工厂,构建面向企业与行业的智能体生态。

周跃峰表示,当前 AI 产业已经进入“Tokens 经济”时代,但华为云并不把 Token 总量或收入规模作为最核心指标。华为云更关注的是,每一个 Token 背后能否真正带来生产力提升:在医疗行业,Token 应当对应一条条鲜活生命的守护;在能源和制造行业,Token 应当对应一度电一度电的节约;在金融行业,Token 应当对应更多风险防范和业务效率提升。

这也构成了华为云与其他云厂商的核心差异。华为云认为,AI 不能只停留在个人问答、情绪价值或消费级应用上,而应当深入政府、医疗、金融、制造、科研、具身智能等行业场景,帮助国计民生行业提升生产力,实现“善政、惠民、兴业”。

周跃峰还表示,华为云并不愿意简单用收入总量、Token 总量或算力规模与其他厂商比较。

其原因在于,华为云采用的是国产化算力路线。华为云方面表示,在当前国产化算力正在成长的情况下,没有必要拿国产化算力规模与“万国牌”算力规模直接比较。华为云更看重的是发展“第二个算力平面”,让全球 IT 工作者和 AI 开发者拥有更多技术路线和生态选择。

在华为云看来,随着中国半导体产业发展,以及华为提出“韬定律”等方向,中国的“硅基黑土地”会越来越厚、越来越肥沃。华为云也将继续围绕鲲鹏通算、昇腾智算、欧拉操作系统、CANN 系统、容器火山平台、ModelArts 工具链等能力,构建国产化 AI 基础设施。

落地过程中,随着 AI 模型和算力技术迭代速度加快。如果企业或机构完全自建算力、自行部署模型,很可能出现“部署完就落后”的尴尬局面。对此,周跃峰表示,AI 时代不可能让每个机构、每家公司都建设万卡集群,面向超大规模通用模型,公共云和共享基础设施将是更高效的选择。

在热门的 AI 编程工具领域,华为云码道 CodeArts 代码智能体用户数突破 10 万,并已于 5 月 30 日正式开启商用,标志着 AI 驱动的软件研发正在迈入规模化应用新阶段。

“码道表面上是一个 AI 编程工具,但其战略意义并不止于写代码。”周跃峰说道,码道更像是“碳基生命和硅基系统之间的翻译器”。人类要调用硅基资源,需要把自然语言意图转化为硅基世界能够理解的指令和代码。因此,码道是智能体时代非常核心的基础能力。只有这类能力足够强,智能体才能更准确理解人的意图,并生成更精准的措施和动作。

周跃峰表示,华为云将对码道投入“范弗里特弹药量”级别的资源,不会简单用多少人使用、产生多少 Token、带来多少收入来衡量其价值。华为云还将与中国几十所高校共建 AI 编程教学活动和中心,投入专家、资源和免费算力,帮助高校开发者和科研人员提升 AI 编程能力。

周跃峰判断,AI 技术与云产业未来将更加密不可分。原因在于,模型训练和推理都离不开规模,而一旦涉及规模,云就会发挥核心作用。

他提到,无论在美国还是中国,今天 80%甚至 90%的 AI 创新都发生在云上。对于大量企业,尤其是中小企业和个人开发者而言,如果没有云平台提供共享算力、模型和工具链,AI 创新很难普及。因此,华为云未来将继续围绕三条主线布局:

第一,继续做厚国产化“硅基黑土地”,推动鲲鹏、昇腾等国产算力生态发展。

第二,在硬件基础上叠加软件和算法价值,提升模型服务和 Token 效率。

第三,面向智能体重构云服务体验,通过 Agentic Infra、模型服务、智能体开发平台和行业 AI 梦工厂,让 AI 更深入地进入产业场景。

周跃峰表示,AI 产业不能只集中在少数大企业中,而必须让更多中小企业、行业机构、基层医院、制造企业和科研团队都能用得起、用得好。对华为云来说,AI 云竞争的关键并不是谁产生了更多 Token,而是谁能让 Token 真正转化为行业生产力。