华为云加码AI云服务，从算力到Agent的全景布局

9 月 19 日，华为常务董事、华为云 CEO 张平安以“全面智能化，成就行业 AI 先锋”为主题，在 2025 华为全联接大会上系统介绍了华为云在 AI 云服务、大模型、具身智能与 Agent 平台方面的最新进展。华为高级副总裁、华为云全球 Marketing 与销售服务总裁杨友桂则聚焦全球数智化实践，分享了华为云在支持企业业务落地中的经验。

在算力方面，华为云宣布 CloudMatrix384 昇腾 AI 云服务已全面上线，未来将扩展至 8192 卡超节点，支持 50 至 100 万卡的集群规模，以满足快速增长的 AI 训练与推理需求。为应对大模型应用的复杂性，华为云推出 EMS（弹性内存存储）服务，通过内存扩展显存，显著降低多轮对话时延。在架构层面，CloudMatrix384 实现了算力、内存和显存的全面池化，将串行任务拆解为分布式并行任务，使平均单卡推理性能达到 H20 的 3 至 4 倍。张平安在现场宣布，CloudMatrix384 AI Token 推理服务全面上线。

在基础设施层面，华为云同时推动 AI 数据中心向高功率密度与全液冷演进。张平安提到，单机柜功率从传统的 10 千瓦提升至 70 甚至 200 千瓦，液冷已成为必要方案。华为云在贵州、内蒙古和安徽部署的全液冷 AI 数据中心，单柜散热能力达 80 千瓦，PUE 低至 1.1，并支持 AI 智能运维。企业无需自建或改造数据中心，即可通过光纤接入获取算力。

在大模型方向，华为继续推动盘古体系的行业化落地。openPangu 为开发者提供开源工具，降低昇腾硬件的使用门槛；而闭源的盘古大模型仍在持续加大投入，定位于面向行业难题的长期探索。华为云在 ModelArts 平台中沉淀行业 Know-how，结合 DataArts 数据治理生产线，帮助企业构建统一知识湖、优化增训数据质量，并快速生成带思维链的调优数据。实际案例包括：南航利用盘古跨模态预测实现 18 个月客流与票价预测，准确率达 90%；中国农科院构建农业科学发现大模型，将研发周期缩短超过 50%。目前，盘古已在 30 多个行业、500 多个场景落地应用。

具身智能成为本次发布的另一亮点。华为云推出 CloudRobo 平台，将复杂算法与逻辑迁移至云端，降低机器人本体复杂度，同时借助合成数据生成平台自动生成大规模训练样本，显著提升泛化能力。在上海国地中心的应用中，分拣机器人任务成功率超过 90%。此外，华为云发布了 R2C（Robot to Cloud）协议，目前已完成数据采集、生成和通讯接口三项国家标准立项，并宣布首批 20 家合作伙伴加入，合作方向涵盖制造、物流、巡检与康养。

在通用计算方面，鲲鹏云服务 CPU 核数已扩展至 1500 万，适配应用超过 2.5 万个，覆盖转码、数据库、云手机等场景。基于超节点架构的 GaussDB 数据库实现了任意节点多写多读，单集群每分钟可处理 540 万笔事务，性能较传统架构提升 2.9 倍。

AI Agent 的企业级应用也被重点介绍。华为云推出了 Versatile 平台，用户只需输入业务描述文档和流程图即可快速生成 Agent。在运行中，平台通过高性能沙箱与全内存缓存机制，使端到端响应时延降低 40%以上，从而保证复杂业务 Agent 的稳定运行。

在全球实践中，华为云客户规模显著增长，使用 AI 云服务的企业已从去年的 321 家增至 1805 家。应用案例包括：土耳其零售商 Defacto 在大促期间通过容器服务实现 30 秒扩容 4000 个 Pods，应对流量浪涌；巴西 Neogrid 借助数据仓库服务提升数据集成与分析效率；万华化学依托盘古大模型实现预测性维护，模型预测准确率从 70%提升至 90%；长安汽车通过“一云一网一平台”实现柔性制造，订单交付周期从 21 天缩短至 15 天。

杨友桂表示，华为云正在以“全球一张网，数智双引擎”为支撑体系，结合全球存算网、数据使能服务、一站式 AI 开发平台与最佳实践沉淀，帮助客户在数智化转型中降低门槛、提升效率。他强调，企业的数智化转型不是“孤军奋战”，而是需要全周期的技术与服务支持。

面对持续增长的算力需求与复杂的产业应用场景，华为云希望通过软硬协同和架构创新，构建更高效的 AI 基础设施，并在大模型、具身智能与 Agent 领域探索行业化的落地路径。

创作场景

华为云加码 AI 云服务，从算力到 Agent 的全景布局