写点什么

十问阿里云 CTO 周靖人:关于为何如此高频率更新、Agent 与模型的关系、实现 ASI 的关键点、MaaS 架构差异点等

  • 2025-09-24
    北京
  • 本文字数:4641 字

    阅读完需:约 15 分钟

大小:2.39M时长:13:56
十问阿里云CTO周靖人:关于为何如此高频率更新、Agent与模型的关系、实现ASI的关键点、MaaS架构差异点等

9 月 24 日的 2025 云栖大会现场,阿里云 CTO 周靖人接连发布了七款大模型技术产品。七款技术产品覆盖语言、语音、视觉、多模态、代码等模型领域,在模型智能水平、Agent 工具调用以及 Coding 能力、深度推理、多模态等方面均实现突破。主会场结束后(主会场发布可点击:《在阿里云,我们看见了面向 Agent 的全栈能力体系》),周靖人在媒体群访环节就发布频率、技术路线、市场趋势、超级人工智能 ASI、Agent 未来演进、开发者社区及年轻人才培养等问题一一作出回应。

AI 战略布局与行业趋势

本部分围绕阿里云在 AI 领域的整体战略、市场策略及行业发展趋势展开,涵盖模型发布节奏、全栈能力优势及对未来的判断。


Q1:近年来,阿里陆续发布了多款大模型,包括通义千问和通义万相等,均展现出优秀性能。为何今年会出现如此高频率的发布节奏?是否与当前技术发展阶段的特点有关?未来是否可能出现大一统模型,从而改变目前多样化模型并存的格局?


周靖人:首先,不仅是我们,全球范围内 AI 模型的整体进展均在加速。通义模型家族始终与国际领先者保持竞争与追赶的态势。行业现状显示,诸如 OpenAI、谷歌等企业也在加快其模型研发进程。人工智能已进入一个明显的加速发展期。当前,竞争焦点不再局限于单一模型的能力或某项突破性思考,而更体现在迭代速度、创新效率与实施能力上。无形之中,整个行业都在提升模型迭代的效率。


其次,从单模态模型向多模态模型的演进是必然趋势。不论是从语言模型进一步扩展至多模态,还是从视觉或听觉等单一模态逐步融合为多模态能力,均与人类智能的发展规律相契合。人类智能并非由不同模块独立处理不同模态的信息,而是将各类模态的知识体系融合、互相促进与增强。这是一个重要的技术发展趋势。


Q2:据悉,阿里云已在 AI 云市场取得占有率第一的成绩。请问,在 AI 云领域,阿里云采取了哪些独特的策略?其核心竞争力体现在哪些方面?


周靖人:我在演讲中提到了一个重要的客观事实:阿里云是全球少数能够在大模型与云计算两方面均实现全栈自研,并实现联合创新的云计算企业,这是我们独特的优势。我在主会场演讲的第一部分聚焦 AI 模型,第二部分讨论智能体开发,第三部分涉及 AI 基础设施。所有这些创新环节相互关联、相辅相成。


模型的竞争本质上是系统能力的竞争,而云的竞争也同样是模型的竞争,二者密不可分。经过多年努力,阿里云已具备全栈自研的能力,能够为企业客户与开发者提供全方位支持。这一能力在 AI 时代具有重要战略意义,也是我们在 AI 云领域持续领先的关键原因。目前,不论是在基础设施还是模型能力方面,我们在业界均享有良好声誉。


Q3:阿里云强调全栈能力与中国唯一性,并取得显著成绩。在全栈 AI 方面,多家企业亦提及类似概念,我们的核心优势是什么?除开源与多线并进策略外,是否有其他补充?


周靖人:此前我们提到三者融合。早在行业尚未广泛开展模型服务时,我们已提出 MaaS 概念。自那时起,我们的云发展方向便与 AI 模型紧密结合。全栈自研体系并非近期才启动,甚至在 ChatGPT 爆发前,我们已强调 AI 与云的重要性。令人欣慰的是,这一战略已取得显著成效。当前无论在模型还是基础设施方面,我们均处于较为领先的位置,全球范围内也表现出色,这得益于我们多年的坚持。


Q4:GPT-5 发布后,公众对模型创新的进展略显失望,认为模型演进路径遇阻。但阿里提出了迈向超级人工智能 ASI 的激进路线。若阿里欲保持模型领先,您认为最关键的因素是什么?是底层算法创新、数据,还是其他要素?


周靖人:我认为二者不在同一维度。我们不对 OpenAI 的发布进行评价。公众可能对其期望过高,但这并不代表行业整体现状。事实上,行业各家的模型能力提升速度未减,无论是在工具使用还是复杂推理等方面,均取得长足进步。


通义千问也展现出强劲进展。创新速度并未减缓,全球范围内的投资仍在加速,表明 AI 模型的上限尚未触及,我们仍处于加速创新阶段。至于实现吴泳铭先生所述的超级人工智能 ASI,其中存在诸多难题待解。目前,模型在处理复杂度、深度思考等方面已有一定进展,如数学、代码等场景。但要实现工具的快速接入、模型训练与结构创新,仍需一系列变革。最终,模型需具备自主学习能力,通过反馈与外界交互实现进化。从当前模型发展路线看,需逐步构建持续学习与自我完善的机制。这其中涉及架构、系统及算法等多方面的挑战。

技术实现与系统挑战

本部分聚焦技术层面的具体实现路径,包括 Agent 能力、记忆机制及工程化挑战。


Q5:刚才您提到阿里在各个领域推进模型的快速迭代。在研发资源有限的情况下,此类策略是否会影响我们在底层算法或范式层面的创新?在快速迭代与底层创新之间,我们如何平衡优先级?又如何协调应用场景的落地?


周靖人:模型的创新并非分散进行。我们所发布的各类模型均属于整体技术体系的一部分,共同推动单模态、多模态以及具体任务场景中模型能力的突破。某些情况下,需在特定模态或任务中达到最优性能,才能提升整体模型水平。因此,模型发展并非孤立项目,而是通义大模型演进中联合优化的重要组成。


在这方面,各项工作实为融合推进。所有项目的规划与优先级均经过周密协调。此外,我们不仅积极推动模型的创新与迭代,自年初以来已实现显著进展,甚至完成数代模型的更迭。每一代模型的能力均有大幅提升,同时我们也在积极研发下一代模型。例如,通义千问 Next 版本在架构层面实现了重要创新。该模型推出后,整个技术社区均围绕新架构开展适配与尝试。通义千问 Next 的发布也积极推动了模型社区的创新与迭代。因此,这些方面实为相辅相成。模型发展应遵循循序渐进的原则,而非追求“憋大招”的模式。海外厂商亦在逐步发展,当前关键仍在于加快模型迭代与创新的速度。


今天上午发布的通义千问 3-MAX,此前已推出 Preview 版本。该版本在全球所有模型(包括闭源模型)的榜单中位列第三。今日发布的正式版本其跑分预计将于近日公布,性能将较前一版本更为强劲。敬请关注相关榜单。目前,通义千问拥有超过 300 个模型,近日连续发布七款,昨日亦有三款新品问世,表明我们的模型发布节奏极为迅速。这与底层团队在各方面的持续布局密切相关。在开源领域,通义千问已位居第一;在开源与闭源模型总榜单中,我们事实位列中国第一、全球前三。


由此可见,这一成就与阿里云底层基础设施的联合训练密切相关。正如吴咏铭所言,我们既拥有最优模型,也具备最强云平台。在 AI 云层面,阿里云跻身全球前四,且为中国唯一入选企业。目前,我们也是中国唯一具备国际影响力与强大国际竞争力的云厂商。


此外,我们高度重视与开发者的连接。一方面,我们推行模型开源;另一方面,我们将最新模型进展及时分享给开发者,这也正是开发者对我们的模型给予高度支持与推崇的原因。通过将诸多新技术开放给开发者,使其能够结合实际应用场景加以使用,从而推动整个 AI 产业的发展。


Q6:您认为模型与 Agent 能力之间未来将呈现何种关系?阿里在该领域的战略选择是什么?


周靖人:实际上,二者之间并无明确界限。我们的模型服务本身已具备 Agent 能力,包括核心工具的使用。简言之,自模型发展之初,其具备的搜索功能本质上已属于 Agent 范畴。因此,许多模型服务本身亦可视为 Agent。并不存在非黑即白的逻辑。


我们所讨论的智能体开发,主要面向行业应用。由于需深度理解各行各业的 Know-how 与知识体系,此类开发仍需依托行业专用的智能体。百炼平台将提供核心 Agent 能力,这些能力将逐步集成至通义千问、万相等模型中。这意味着底层模型将愈发强大,并融合更多工具。然而,面向业务层的工具使用与调优,仍需通过业务层智能体实现与解决。


Q7:关于您在主会场提到的 Agent 多模态记忆,想请问您记忆的边界何在?其主要难点是什么?


周靖人:“记忆”为泛义词。我们期望模型能理解上下文,即对先前处理的信息有所认知。模型层能力已有提升,如超长上下文支持,使模型能处理更复杂的前因后果,但这仍不足够。人类记忆不仅涉及近期事件,还可能涵盖多年以前的信息,需管理超大规模信息。我们提出支持多模态记忆,不仅限于文本,还包括视频、音频等。


此外,记忆需分层,如同人类记忆从具体记录抽象为经验、习惯乃至个性组成部分。这涉及短期与多重记忆的管理,是一个智能化过程,非纯规则所能解决。此领域仍待深入研究。我们认为,智能体与企业应用智能体均需记忆能力,百炼的 Agent 层将提供基础支持。


Q8:自阿里提出 MaaS 架构之后,多家企业相继跟进。从已公布的架构图看,大体相似,各家之间是否存在差异点?


周靖人:从概念层面讲,模型服务已成为行业共识,我们对此深感欣慰。阿里云提出 Model as a Service 时未引发广泛关注,如今成为行业共识,可谓我们对行业的一项贡献。然而,“模型服务”并非简单概念。实现极致弹性、性能与高吞吐的模型服务极为困难,甚至可称之为 AI 时代的弹性计算。它需具备高弹性、高吞吐等全方位能力。


在讨论性能前,需先关注精度。同一模型在不同平台可能表现迥异,这背后涉及精度对齐与模型上架流程的严格控制。我们已建立严格流程,确保通义模型服务原生支持最佳精度。在阿里云上,通义模型服务及其他模型服务均可获得高质量效果。


此外,企业对模型服务的吞吐、延迟、成本等方面需求多样:有的追求极致效率,有的注重性价比,甚至对服务时间有灵活要求。模型服务面向各行各业,满足千变万化的需求,这本身即是一个超大规模分布式系统难题。全球仅少数企业能应对,百炼正致力完善此方面。在规模指数增长的同时,我们保障服务质量、SOA 及安全等,这是模型推理服务的重要特点。

开发者生态与人才建设

本部分涉及开发者生态支持、模型评估体系优化及人才队伍建设。


Q9:请问阿里内部对通义大模型的评估维度优先级如何?会采用哪些指标评估?


周靖人:我们所有技术工作的核心评价标准是能力,包括模型能力。通义千问、万相等模型在各自领域均有完整评估体系。在通往 ASI 的道路上,技术路径与指标至关重要。每一代模型迭代均需经过严格技术评价,该体系是模型发展的基础,也是我们技术演进的关键目标。


社区的关注与喜爱是模型效果的真实反映。我们通过提升模型能力与开源策略,获得开发者自主评价与反馈。这是一种自发行为,而非运营结果,体现了社区对模型实际效果的认可。我们将继续与社区保持联动。最重要的是实现技术突破与能力提升,真正沿着 ASI 的方向取得进展。


Q10:阿里今年进行了大规模校招,在致力于 ASI 的情况下对年轻人的培养思路是什么?如何管理这些人才?


周靖人:通义实验室倡导开放氛围,鼓励团队成员开展创新。当前,行业技术发展路径已不像几年前那样由海外企业显著主导。整个行业在技术演进与突破方向上逐渐形成共识。然而,共识并不等同于实现。我们需更有效地按优先级规划工作,通过系统与算法的联合优化推动进展。换言之,我们采取齐头并进的策略。最终目标是在各项能力上追求极致,无论是编程还是视觉理解等。若单项能力未达极致,模型整体能力的提升将遭遇瓶颈。各家的技术方向大致相同,但我们的开放程度更具优势。


我们高度重视开发者视角,因此提供丰富模型与参数选择。开发者需求多样,我们期望通过持续的大模型创新助其选择最优模型并集成至自身系统。我们真诚期望与开发者及企业共同进步,推动 AI 产业发展。


对年轻人才,阿里提供最优环境。这个时代的创新既需人才,也需创新土壤与环境。这些因素的融合是人才发展与取得成就的基础。我们具备全栈与云计算联合的优势,无论在系统、模型还是应用层面,均拥有良好土壤,吸引人才加入。AI 时代需多面手人才,不仅懂算法,还需对工程与应用有敏锐洞察。幸运的是,我们提供全栈环境,为人才发展奠定基础,期待更多优秀人才加入,共同突破 ASI 创新。

2025-09-24 17:254770
用户头像
赵钰莹 极客邦科技 总编辑

发布了 909 篇内容, 共 702.8 次阅读, 收获喜欢 2706 次。

关注

评论

发布
暂无评论

一文读懂GPU参数选择

青椒云云电脑

云桌面 GPU算力

为什么GPU引领加速计算时代

青椒云云电脑

GPU算力

【PPT下载】杭州 Atlassian 社区四周年活动

跟YY哥学Jira

Jira ACE #研发效能 Atlassiam Jira Service Management

NFTScan | 09.18~09.24 NFT 市场热点汇总

NFT Research

NFT\

一文带你实现云上部署轻量化定制表单Docker

华为云开发者联盟

开源 云原生 华为云 华为云开发者联盟 企业号9月PK榜

【有奖体验】轻点鼠标,让古籍数字化“重生"

Serverless Devs

Serverless 云原生 托管 AIGC

支持国产基础硬件的云管平台哪家好?为什么?有哪些功能?

行云管家

云计算 云安全 云管平台 行云 云成本

文心一言 VS 讯飞星火 VS chatgpt (100)-- 算法导论9.3 6题

福大大架构师每日一题

福大大架构师每日一题

低代码引擎 TinyEngine 正式发布!

Kagol

开源 前端 低代码

GPT 被曝重大缺陷;腾讯侦破国内首个 AI 游戏外挂;特斯拉人形机器人再进化丨 RTE 开发者日报 Vol.56

声网

艺术与区块链的融合—NFT开发的创意之旅

区块链软件开发推广运营

交易所开发 dapp开发 区块链开发 链游开发 NFT开发

高级编程计算工具MATLAB R2023a激活中文版附密钥

胖墩儿不胖y

Mac软件 数学计算工具

开源项目专访 | XuperCore——让信任的链接更加便捷

开放原子开源基金会

噢耶!字节后端Offer,拿到了!

王中阳Go

Go 面试题 面经 校招 大厂面经

F5为OpenTelemetry项目提供降本增效的技术支持

科技热闻

国产化运维安全审计系统哪家好?支持信创吗?有哪些功能?

行云管家

国产化 安全运维 运维审计 国产化平台

LED透明屏为什么能透明?

Dylan

AR vr 虚拟 LED显示屏 led显示屏厂家

华为云HBase冷热分离最佳实践

华为云开发者联盟

大数据 后端 华为云 华为云开发者联盟 企业号9月PK榜

软件测试/测试开发丨利用人工智能ChatGPT自动生成PPT

测试人

人工智能 软件测试 PPT ChatGPT

十问阿里云CTO周靖人:关于为何如此高频率更新、Agent与模型的关系、实现ASI的关键点、MaaS架构差异点等_阿里巴巴_赵钰莹_InfoQ精选文章