10 月 23 - 25 日,QCon 上海站即将召开,9折优惠最后2天 了解详情
写点什么

在阿里云,我们看见了面向 Agent 的全栈能力体系

  • 2025-09-24
    北京
  • 本文字数:5079 字

    阅读完需:约 17 分钟

大小:2.69M时长:15:41
在阿里云,我们看见了面向Agent的全栈能力体系

9 月 24 日的 2025 云栖大会现场,阿里云智能首席技术官周靖人发布了多项重磅技术更新。最为外界所关注的是这次的大模型七连发:性能超过 GPT5、Claud Opus4 的 Qwen3-Max,下一代基础模型架构 Qwen3-Next 及系列模型,编程模型 Qwen3-Coder 重磅升级,视觉理解模型 Qwen3-VL 重磅开源,音视频能力狂揽 32 项开源最佳性能 SOTA 的全模态模型 Qwen3-Omni,视觉基础模型通义万相推出 Wan2.5-preview 系列模型,全新成员的语音大模型通义百聆。


然而,在 InfoQ 看来,最重要的让我们相对清晰得看见了面向 Agent 的全栈技术体系应该如何构建:一站式模型服务和 Agent 开发平台阿里云百炼在框架、模型、组件等层面均进行了更新,底层基础设施面对 Agent 也进行了针对性调整,比如新一代磐久 128 超节点 AI 服务器,分布式存储层面的表格存储 Tablestore 为 Agent 提供高性能记忆库和知识库等。这一系统化的技术布局,标志着阿里云正在走向以 Agent 为中心的全栈智能服务新范式。

大模型七连发,Qwen3-Max 性能跻身全球前三,超过 GPT5

围绕大模型和 AI 云,2025 云栖大会现场,阿里云智能首席技术官周靖人发布了多项重磅技术更新。通义大模型 7 连发,在模型智能水平、Agent 工具调用和 Coding 能力、深度推理、多模态等方面实现多项突破。

在大语言模型中,阿里通义旗舰模型 Qwen3-Max 全新亮相,性能超过 GPT5、Claude Opus 4 等,跻身全球前三。Qwen3-Max 包括指令(Instruct)和推理(Thinking)两大版本,其预览版已在 Chatbot Arena 排行榜上位列第三,正式版性能可望再度实现突破。

Qwen3-Max 是通义千问家族中最大、最强的基础模型,预训练数据量达 36T tokens,总参数超过万亿,拥有极强的 Coding 编程能力和 Agent 工具调用能力。在大模型用 Coding 解决真实世界问题的 SWE-Bench Verified 测试中,Instruct 版本斩获 69.6 分,位列全球第一梯队;在聚焦 Agent 工具调用能力的 Tau2-Bench 测试中,Qwen3-Max 取得突破性的 74.8 分,超过 Claude Opus4 和 DeepSeek-V3.1。Qwen3-Max 推理模型也展现出非凡性能,结合工具调用和并行推理技术,其推理能力创下新高,尤其在聚焦数学推理的 AIME 25 和 HMMT 测试中,均达到突破性的满分 100 分,为国内首次。


下一代基础模型架构 Qwen3-Next 及系列模型正式发布,模型总参数 80B 仅激活 3B ,性能即可媲美千问 3 旗舰版 235B 模型,实现模型计算效率的重大突破。Qwen3-Next 针对大模型在上下文长度和总参数两方面不断扩展(Scaling)的未来趋势而设计,创新改进采用了混合注意力机制、高稀疏度 MoE 结构、多 token 预测(MTP)机制等核心技术,模型训练成本较密集模型 Qwen3-32B 大降超 90%,长文本推理吞吐量提升 10 倍以上,为未来大模型的训练和推理的效率设立了全新标准。


在专项模型方面,千问编程模型 Qwen3-Coder 重磅升级。新的 Qwen3-Coder 与 Qwen Code、Claude Code 系统联合训练,应用效果显著提升,推理速度更快,代码安全性也显著提升。Qwen3-Coder 此前就广受开发者和企业好评,代码生成和补全能力极强,可一键完成完整项目的部署和问题修复,开源后调用量曾在知名 API 调用平台 OpenRouter 上激增 1474%,位列全球第二。


在多模态模型中,千问备受期待的视觉理解模型 Qwen3-VL 重磅开源,在视觉感知和多模态推理方面实现重大突破,在 32 项核心能力测评中超过 Gemini-2.5-Pro 和 GPT-5。Qwen3-VL 拥有极强的视觉智能体和视觉 Coding 能力,不仅能看懂图片,还能像人一样操作手机和电脑,自动完成许多日常任务。输入一张图片,Qwen3-VL 可自行调用 agent 工具放大图片细节,通过更仔细的观察分析,推理出更好的答案;看到一张设计图,Qwen3-VL 就能生成 Draw.io/HTML/CSS/JS 代码,“所见即所得”地完成视觉编程。此外,Qwen3-VL 还升级了 3D  Grounding(3D 检测)能力,为具身智能夯实基础;扩展支持百万 tokens 上下文,视频理解时长扩展到 2 小时以上。


全模态模型 Qwen3-Omni 惊喜亮相,音视频能力狂揽 32 项开源最佳性能 SOTA,可像人类一样听说写,应用场景广泛,未来可部署于车载、智能眼镜和手机等。用户还可设定个性化角色、调整对话风格,打造专属的个人 IP。类似于人类婴儿一出生就全方位感知世界,Qwen3-Omni 一开始就加入了“听”、“说”、“写”多模态混合训练。在预训练过程中,Qwen3-Omni 采用了混合单模态和跨模态数据。此前,模型在混合训练后,各个功能会相互掣肘甚至降智,比如音频理解能力提升,文字理解能力反而降低了。但 Qwen3-Omni 在实现强劲音频与音视频能力的同时,单模态文本与图像性能均保持稳定,这是业内首次实现这一训练效果。

通义大模型家族中的视觉基础模型通义万相,推出 Wan2.5-preview 系列模型,涵盖文生视频、图生视频、文生图和图像编辑四大模型。通义万相 2.5 视频生成模型能生成和画面匹配的人声、音效和音乐 BGM,首次实现音画同步的视频生成能力,进一步降低电影级视频创作的门槛。通义万相 2.5 视频生成时长从 5 秒提升至 10 秒,支持 24 帧每秒的 1080P 高清视频生成,并进一步提升模型指令遵循能力。此次,通义万相 2.5 还全面升级了图像生成能力,可生成中英文文字和图表,支持图像编辑功能,输入一句话即可完成 P 图。

2025 杭州云栖大会上,通义大模型家族还迎来了全新的成员——语音大模型通义百聆,包括语音识别大模型 Fun-ASR、语音合成大模型 Fun-CosyVoice。Fun-ASR 基于数千万小时真实语音数据训练而成,具备强大的上下文理解能力与行业适应性;Fun-CosyVoice 可提供上百种预制音色,可以用于客服、销售、直播电商、消费电子、有声书、儿童娱乐等场景。


截至目前,阿里通义开源 300 余个模型,覆盖不同大小的“全尺寸”及 LLM、编程、图像、语音、视频等“全模态”,全球下载量突破 6 亿次,全球衍生模型 17 万个,稳居全球第一。超 100 万家客户接入通义大模型,权威调研机构沙利文 2025 上半年报告显示,在中国企业级大模型调用市场中,阿里通义占比第一。

模型日均调用量增长 15 倍,阿里云百炼发布全新 Agent 开发框架

作为一站式模型服务和 Agent 开发平台,阿里云百炼也来了重磅升级。大会现场,阿里云发布全新 Agent 开发框架 ModelStudio-ADK,该框架突破以预定义编排方式开发 Agent 的局限,可帮助企业高效开发具备自主决策、多轮反思和循环执行能力的 Agent。使用 ModelStudio-ADK,1 个小时就能轻松开发一个能生成深度报告的 Deep Research 项目。随着模型能力的不断提升以及 Agent 应用的爆发,过去一年,阿里云百炼平台的模型日均调用量增长了 15 倍。



在框架层面,阿里云 ModelStudio-ADK 基于通义开源的 AgentScope 打造,可开发深度研究、硬件代理智能体、复杂检索智能体等应用。该框架还全面支持云端部署和云端组件调用,提供企业级、服务稳定、灵活部署和运行的高代码开发模式,帮助企业和开发者快速实现复杂场景 Agent 的开发和落地。


在模型层面,阿里云百炼持续上线全新通义千问家族旗舰模型,基于 Qwen3 系列模型强大的推理能力,可驱动 Agent 实现更高效的自主规划与决策,推理性能提高 50%,决策成功率达到 90%。目前,用户可一键调用 Qwen、Wan、DeepSeek 等 200 多款业界领先的模型。


在组件层面,面向 Agent 开发和部署所需的各类组件,阿里云百炼集成了工具连接 MCP Server、多模数据融合 RAG Server、沙箱工具 Sandbox  Server、智能记忆存取 Memory Server 以及支付订阅服务 Pay Server 等 7 大企业级能力。以 Pay Server 为例,该服务由阿里云百炼和支付宝联合首发推出,是业界首个为企业级 Agent 提供专业商业化支付通道的服务。目前,阿里云百炼首批上线了基于 ModelStudio-ADK 开发的 DeepResearch、Agentic-RAG、Computer-Use Agent 等 Agent 应用,用户可免费在线体验或下载代码进行二次开发。


大会现场,阿里云百炼还升级了低代码 Agent 开发平台 ModelStudio-ADP,该平台已广泛应用于金融、教育和电商等领域企业,目前,阿里云百炼平台已有超 20 万开发者开发了 80 多万个 Agent。据介绍,网商银行基于 ModelStudio-ADP 开发了贷款审核应用,支持合同、发票、营业执照等 26 种凭证,以及店面门头、餐饮厨房、就餐区、货架商品等超过 400 种细粒度物体的精准识别,准确率超 95%,其任务处理时间从原来的 3 小时优化至 5 分钟内。


同时,阿里云 Agent Infra 重要组件的无影 AgentBay 迎来重大升级。无影 AgentBay 是阿里云为 Agent 量身打造的“超级大脑” ,可动态调用云上算力、存储及工具链资源,大大突破了 Agent 在本地设备上的算力限制。本次云栖大会,无影 AgentBay 还全新推出了自进化引擎、自定义镜像、安全围栏、内存状态管理等新能力,并首次展示全新的个人计算产品——无影 Agentic Computer,拥有全新的人机交互方式,革命性的“记忆”能力和近乎无穷的云上算力。

AI 算力一年增长超 5 倍,阿里云 AI 基础设施全面升级

阿里云围绕 AI 进行了软硬全栈的协同优化和系统创新,已初步形成以通义为核心的操作系统和以 AI 云为核心的下一代计算机。过去一年,阿里云 AI 算力增长超 5 倍,AI 存力增长 4 倍多。


2025 年云栖大会现场,全面升级的阿里云 AI 基础设施重磅亮相,全面展示了阿里云从底层芯片、超节点服务器、高性能网络、分布式存储、智算集群到人工智能平台、模型训练推理服务的全栈 AI 技术能力。


在服务器层面,阿里云发布全新一代磐久 128 超节点 AI 服务器。新一代磐久超节点服务器由阿里云自主研发设计,具备高密度、高性能和高可用的核心优势,可高效支持多种 AI 芯片,单柜支持 128 个 AI 计算芯片,密度刷新业界纪录。磐久超节点集成阿里自研 CIPU 2.0 芯片和 EIC/MOC 高性能网卡,采用开放架构,扩展能力极强,可实现高达 Pb/s 级别 Scale-Up 带宽和百 ns 极低延迟,相对于传统架构,同等 AI 算力下推理性能还可提升 50%。


在网络层面,阿里云新一代高性能网络 HPN 8.0 全新亮相。为应对大模型时代对海量数据传输的需求,HPN8.0 采用训推一体化架构,存储网络带宽拉升至 800Gbps,GPU 互联网络带宽达到 6.4Tbps,可支持单集群 10 万卡 GPU 高效互联,为万卡大集群提供高性能、确定性的云上基础网络,助力 AI 训推提效。


在存储层面,阿里云分布式存储面向 AI 需求全面升级。高性能并行文件存储 CPFS 单客户端吞吐提升至 40GB/s, 可满足 AI 训练对快速读取数据的极致需求;表格存储 Tablestore 为 Agent 提供高性能记忆库和知识库;对象存储 OSS 推出 Vector Bucket,为向量数据提供高性价比的海量存储,相比自建开源向量数据库,成本骤降 95%,结合 OSS MetaQuery 语义检索和内容感知能力,可快速构建 RAG 等 AI 应用。


在 AI 智算集群层面,智能计算灵骏集群通过多级亲和性与拓扑感知调度设计,基于 HPN 网络支持 10 万卡稳定互联,多级可扩展的架构让每张卡间互联路径更短、带宽更优。灵骏集群面向任务的稳定性设计、故障分钟级恢复能力,有效提高了模型训练任务的集群稳定性。


AI 需求爆发也带动了通用算力需求上升,阿里云通用计算全面升级。依托自研的“飞天+CIPU”架构体系,阿里云第九代企业级实例采用英特尔、AMD 的最新芯片,在大幅提升算力水平的同时,可为 Agent 提供稳定、安全、高性能的通用 CPU 算力。其中,九代 AMD 实例 g9ae 提供物理核的规格,性能最高提升 67%,尤其适合企业离线数据分析处理、视频转码等高并发场景。


为 AI 负载提供弹性、调度优化和规模化运行的容器计算,也迎来重磅升级。容器服务 ACK 新增灵骏节点池,引入模型感知智能路由、多角色推理负载管理、故障自愈等核心功能,自动处理恢复时长缩短了 85% ,模型推理冷启动提速 10 倍。容器计算服务 ACS 强化网络拓扑感知调度,任务通信性能整体提升 30%,并针对 AI Agent 场景深度优化,Serverless GPU 算⼒开箱即用,支持每分钟 15000 沙箱的大规模并发弹性,结合安全沙箱、智能休眠与唤醒,实现 Agent 随需启用、高效响应。


阿里云人工智能平台 PAI 与通义大模型联合优化,印证了全栈 AI 的“1+1>2”的效果。在训练层,针对 MoE 模型,采用统一调度机制、自适应计算通信掩盖、EP 计算负载均衡和计算显存分离式并行等优化手段,使得通义千问模型训练端到端加速比提升 3 倍以上;升级 DiT 模型训练引擎,通义万相单样本训练耗时降低 28.1%;在推理层,通过大规模 EP、PD/AF 分离、权重优化、LLM 智能路由在内的全链路优化,实现推理效率显著提升:推理吞吐 TPS 增加 71%,时延 TPOT 降低 70.6%,扩容时长降低 97.6%。


“阿里云正在全力打造一台全新的 AI 超级计算机,它同时拥有最领先的 AI 基础设施和最领先的模型,两者可以在产品设计和运行架构上高度协同,从而确保在阿里云上调用和训练通义千问模型时,能达到最高效率。”吴泳铭表示。


截至目前,阿里云运营着中国第一、全球领先的 AI 基础设施和云计算网络,在全球 29 个地域设有 90 个可用区。三方机构 Omdia2025 年上半年数据显示,中国 AI 云市场阿里云占比 35.8%,超过 2 到 4 名总和;在已采用生成式 AI 的财富中国 500 强中,超 53%企业选择阿里云,渗透率位列第一。未来 3 年,阿里巴巴将投入 3800 亿用于建设云和 AI 基础设施,总额超过过去十年的总和。

2025-09-24 12:5968
用户头像
赵钰莹 极客邦科技 总编辑

发布了 903 篇内容, 共 696.1 次阅读, 收获喜欢 2703 次。

关注

评论

发布
暂无评论

企业架构设计方法TOGAF介绍

joinM

企业架构 技术架构 业务架构 TOGAF 技术与业务

用户故事是垂直的切片(译)

Bruce Talk

敏捷 译文 Agile User Story

《采访阿里“守护神”吴翰清:安全攻防-采访提纲》

Geek_6370d5

【采访融云CTO杨攀:2021如何让融云迈向更高舞台】(采访)

码界西柚

融云 杨攀

⼤规模短⽂本聚类的设计和实践

百度Geek说

聚类 query 内聚

我是如何开始写作的

happlyfox

个人成长 4月日更 1 周年盛典

toB SaaS会成为苏州下⼀个“⼀号产业”么?

龙归科技

数字化 tob

不忘初心,砥砺前行|暨InfoQ写作平台一周年

程序员架构进阶

28天写作 4月日更 1 周年盛典 我和写作平台的故事 InfoQ 写作平台 1 周年

双非渣硕!四面阿里收到offer后,才发现学长给的面试笔记有多强大

Java 编程 程序员 面试 计算机

重读《重构2》- 以对象取代基本类型

顿晓

重构 4月日更

全网最强的权限系统设计攻略:京东北极星商业系统权限管控实践

学Java关注我

Java 编程 程序员 架构 技术宅

灰度发布系统架构设计

xcbeyond

微服务 灰度发布 4月日更

如何做好前馈管理?

石云升

28天写作 职场经验 管理经验 4月日更

今年我读了四个开源项目的源码,来分享下心得

yes

源码

Spring Boot 2.0 实现优雅停机

U2647

Spring Boot 4月日更

Properties类使用需要注意的坑

风翱

properties 4月日更

Spring Boot 两行代码轻松实现国际化

Java架构师迁哥

pdf.js使用小结

空城机

大前端 4月日更 pdf.js

联盟链技术

360技术

DBA 行业是否将会消亡?

BinTools图尔兹

运维 dba 数据库管理工具

如何从零开始学Python:(4)如何处理列表数据?

广之巅

Python 4月日更

翻译:《实用的Python编程》TheEnd

codists

Python

用户故事拆分招数全景图(译)

Bruce Talk

敏捷 译文 Agile User Story

第一课作业纠正

杰语

Android Crash监控方式

Darren

监控 异常检测 Android开发 NativeCrash

混合云安全简史

龙归科技

混合云

python内置数据结构list、set、dict、tuple(一)

若尘

List 数据结构 set 字典 Python编程

禁止算法识别性别,能消解歧视吗?

脑极体

MySQL 表列数和行大小有哪些限制?

李尚智

MySQL 运维

阿里资深技术专家崮德:如何成就更好的自己

阿里巴巴中间件

HBase HA 分布式部署

Fong

大数据 运维 HBase hadoop3

在阿里云,我们看见了面向Agent的全栈能力体系_生成式 AI_赵钰莹_InfoQ精选文章