
9 月 19 日,华为常务董事、华为云 CEO 张平安以“全面智能化,成就行业 AI 先锋”为主题,在 2025 华为全联接大会上系统介绍了华为云在 AI 云服务、大模型、具身智能与 Agent 平台方面的最新进展。华为高级副总裁、华为云全球 Marketing 与销售服务总裁杨友桂则聚焦全球数智化实践,分享了华为云在支持企业业务落地中的经验。
在算力方面,华为云宣布 CloudMatrix384 昇腾 AI 云服务已全面上线,未来将扩展至 8192 卡超节点,支持 50 至 100 万卡的集群规模,以满足快速增长的 AI 训练与推理需求。为应对大模型应用的复杂性,华为云推出 EMS(弹性内存存储)服务,通过内存扩展显存,显著降低多轮对话时延。在架构层面,CloudMatrix384 实现了算力、内存和显存的全面池化,将串行任务拆解为分布式并行任务,使平均单卡推理性能达到 H20 的 3 至 4 倍。张平安在现场宣布,CloudMatrix384 AI Token 推理服务全面上线。
在基础设施层面,华为云同时推动 AI 数据中心向高功率密度与全液冷演进。张平安提到,单机柜功率从传统的 10 千瓦提升至 70 甚至 200 千瓦,液冷已成为必要方案。华为云在贵州、内蒙古和安徽部署的全液冷 AI 数据中心,单柜散热能力达 80 千瓦,PUE 低至 1.1,并支持 AI 智能运维。企业无需自建或改造数据中心,即可通过光纤接入获取算力。
在大模型方向,华为继续推动盘古体系的行业化落地。openPangu 为开发者提供开源工具,降低昇腾硬件的使用门槛;而闭源的盘古大模型仍在持续加大投入,定位于面向行业难题的长期探索。华为云在 ModelArts 平台中沉淀行业 Know-how,结合 DataArts 数据治理生产线,帮助企业构建统一知识湖、优化增训数据质量,并快速生成带思维链的调优数据。实际案例包括:南航利用盘古跨模态预测实现 18 个月客流与票价预测,准确率达 90%;中国农科院构建农业科学发现大模型,将研发周期缩短超过 50%。目前,盘古已在 30 多个行业、500 多个场景落地应用。
具身智能成为本次发布的另一亮点。华为云推出 CloudRobo 平台,将复杂算法与逻辑迁移至云端,降低机器人本体复杂度,同时借助合成数据生成平台自动生成大规模训练样本,显著提升泛化能力。在上海国地中心的应用中,分拣机器人任务成功率超过 90%。此外,华为云发布了 R2C(Robot to Cloud)协议,目前已完成数据采集、生成和通讯接口三项国家标准立项,并宣布首批 20 家合作伙伴加入,合作方向涵盖制造、物流、巡检与康养。
在通用计算方面,鲲鹏云服务 CPU 核数已扩展至 1500 万,适配应用超过 2.5 万个,覆盖转码、数据库、云手机等场景。基于超节点架构的 GaussDB 数据库实现了任意节点多写多读,单集群每分钟可处理 540 万笔事务,性能较传统架构提升 2.9 倍。
AI Agent 的企业级应用也被重点介绍。华为云推出了 Versatile 平台,用户只需输入业务描述文档和流程图即可快速生成 Agent。在运行中,平台通过高性能沙箱与全内存缓存机制,使端到端响应时延降低 40%以上,从而保证复杂业务 Agent 的稳定运行。
在全球实践中,华为云客户规模显著增长,使用 AI 云服务的企业已从去年的 321 家增至 1805 家。应用案例包括:土耳其零售商 Defacto 在大促期间通过容器服务实现 30 秒扩容 4000 个 Pods,应对流量浪涌;巴西 Neogrid 借助数据仓库服务提升数据集成与分析效率;万华化学依托盘古大模型实现预测性维护,模型预测准确率从 70%提升至 90%;长安汽车通过“一云一网一平台”实现柔性制造,订单交付周期从 21 天缩短至 15 天。
杨友桂表示,华为云正在以“全球一张网,数智双引擎”为支撑体系,结合全球存算网、数据使能服务、一站式 AI 开发平台与最佳实践沉淀,帮助客户在数智化转型中降低门槛、提升效率。他强调,企业的数智化转型不是“孤军奋战”,而是需要全周期的技术与服务支持。
面对持续增长的算力需求与复杂的产业应用场景,华为云希望通过软硬协同和架构创新,构建更高效的 AI 基础设施,并在大模型、具身智能与 Agent 领域探索行业化的落地路径。
评论