2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

Mobvista 蔡超:多智能体不是“可选项”,而是软件未来的“必答题”

  • 2025-10-17
    北京
  • 本文字数:3976 字

    阅读完需:约 13 分钟

大小:1.94M时长:11:16
Mobvista蔡超:多智能体不是“可选项”,而是软件未来的“必答题”

在过去两年,大模型的进步让“智能体”(Agent)的概念逐渐走出实验室,成为产业界热议的方向。但单个智能体在执行复杂任务时,常常受限于推理链条过长、能力边界模糊以及执行效率不足。


于是,见证了一种全新的技术范式悄然崛起:多智能体协作。它不再是单一大模型“单打独斗”的时代,而是让多个具备专业能力的智能体像一支训练有素的专家团队般协同工作。这种转变不仅关乎技术演进,更可能彻底改变人机交互的方式。


那么,多智能体协作究竟如何定义?它与我们熟悉的单一大模型代理有何本质区别?企业在拥抱这一技术时会面临哪些挑战?它究竟是 AI 的未来形态,还是特定领域的增强工具?


在此背景下,我们希望通过与 Mobvista 集团副总裁兼首席架构师蔡超的对话,帮助读者了解多智能体协作的前沿技术难点、应用前景与产业趋势。


蔡超在近期的访谈中,用生动的比喻揭示了这一转变的本质:“单一大模型代理更像一个‘全能助理’,适合完成领域单一、简单明确的任务;而多智能体协作则像一个‘专家团队’,能够通过任务分解、交叉验证和角色分工,有效应对复杂任务挑战。”


这一区分直指当前大模型的核心局限性——上下文限制、推理错误传递和幻觉问题。当单一模型面对复杂任务时,往往力不从心。而多智能体系统通过精妙的组织设计,将复杂问题拆解为多个独立的子任务,分配给具有不同专长的智能体,不仅控制了任务复杂度,还通过智能体间的交叉验证提升了系统的准确性和可靠性。


为何多智能体协作在近期获得如此高度关注?蔡超认为,这主要源于“人们对于智能体应用领域需求的日益扩张及当前 LLM 的局限性”。随着企业期望 AI 能够处理更加复杂、多元的业务场景,单一模型的能力边界日益凸显。多智能体协作本质上是一种更高级的“context engineering”,通过任务分解和角色分工,巧妙地绕过了当前大模型的技术瓶颈。


值得注意的是,这种关注并非空穴来风。在即将举办的 2025 QCon 技术大会上海站上,多智能体协作已成为核心议题,反映出业界对这一方向的普遍认可。蔡超也将在本次大会上进行主题为《从 Copilot 到 Autopilot:Multi-Agent 系统的思考与实践》的演讲分享,敬请期待。


以下为访谈实录,经编辑:

多智能体能够弥补单一大模型的多种局限性


InfoQ:您如何定义“多智能体协作”?在当下的大模型发展语境下,它和“单一大模型代理”有何根本区别?


蔡超:多智能体协作是指多个具有不同角色和背景知识的智能体,按照一定的组织形式(如串行、层级或网络)进行交互与协作,共同完成一项任务。


与此相比,单一大模型代理更像一个“全能助理”,通常适合完成领域单一、简单明确的任务;而多智能体协作更像一个“专家团队”,但对于“复杂任务”,单一代理由于受到当前大模型的实际局限性,很难准确完成。而多智能体协作,可以把一个复杂任务分解为多个独立的子任务,有效控制任务的复杂度和工作上下文的长度,并利用不同智能体间的交叉验证来进一步提高准确性和可靠性。


InfoQ:目前业内对智能体协作的关注度快速上升,您觉得原因是什么?是技术成熟度、需求驱动,还是资本市场推动?


蔡超:我个人认为实际是人们对于智能体应用领域需求的日益扩张及当前 LLM 的局限性,加速了多智能体协作应用的关注度和实际应用。当前,LLM 存在的局限性包括:上下文限制,推理过程的错误传递,幻觉等,而多智能体通过任务分解、交叉验证、角色分工,在一定程度上能缓解这些局限。近期火热的“context engineering”就能比较好地解决当前 LLM 的一些局限性,而多智能体同样可以看作一种“context engineering”的方式。context engineering 相关内容也是我今年在 QCon 的议题中会和大家重点讨论的方向。


InfoQ:企业在尝试多智能体协作时,最常见的挑战是什么?(技术、成本、组织文化、数据安全)从 ROI 角度看,多智能体协作带来的价值是否已经可量化?


蔡超:传统软件系统有成熟的开发范式和可预期的行为,而多智能体系统虽然带来了更强的智能性和启发性,却同时引入了更高的不确定性。这种不确定性让企业在技术实现、成本管控、组织采纳和数据安全等方面都面临新的挑战:


技术上,难以像传统软件那样保证确定性和可复现性;成本上,更多试错和迭代增加投入;组织上,需要重新适应这种‘自主协作’的工作方式;安全上,智能体行为的不可预测性,例如:代码生成及执行,智能体交互都会带来新的安全挑战。


因此,多智能体协作并非适合所有场景,企业要结合自身业务特点,慎重选择切入点。 杜绝一味追求新技术

技术挑战是什么?


InfoQ:目前多智能体协作最核心的技术难点在哪里?是通信协议、角色分工、还是推理与计划能力?


蔡超:最核心的难点在于如何根据具体业务场景,抽象出合理的角色分工与组织结构,并进行有效的任务拆分。


相比通信协议这种工程问题,或单个智能体的推理规划能力,多智能体的协作本质上是一个“组织设计”问题:如何让不同 Agent 的能力互补、避免冲突与冗余。


此外,由于协作流程具有高度动态性,如何在运行中进行调优与协调,也是落地应用的一大挑战。


InfoQ:业界常用的智能体协作框架(如 AutoGen、CrewAI、LangGraph)在实践中各自的优势与局限是什么?


蔡超:在智能体协作框架的选择上,我尚无 AutoGen 的直接使用经验。我比较一下我们有过实践的:CrewAI 和 LangGraph。


CrewAI 的核心优势在于其高度契合人类对团队协作的直觉认知,强调 Role based 高度结构化的团队和任务设计,更容易匹配和适配企业业务场景的抽象。 我个人觉得 CrewAI 更为标准化,同时,在工程方面,其对可观测性等核心工程实践的支持也更为完善。


LangGraph 与 CrewAI 的关键抽象不同,Langgraph 采用节点,边 / 连接,状态这样抽象,用状态图来建模整个工作流程,没有这么符合人类直觉,学习曲线较高。但是更加适用于要想涉及复杂的,严格可控的工作流程的应用。


对于常规企业应用场景可以考虑先使用 CrewAI,对于要求严格控制复杂流程的场景可以考虑使用 LangGraph。


InfoQ:在多个智能体同时运行时,如何避免冲突、冗余计算甚至“失控”行为?在实际落地过程中,安全性与合规性如何保障?多智能体的“分工对话”是否会带来新的安全漏洞?


蔡超:在多智能体同时运行时,避免冲突与冗余计算的核心是协同机制的设计。常见做法是采用层级结构,由一个管理者 / 协调者 Agent 负责任务规划与分配,动态协调子任务的顺序与执行范围。同时,不同 Agent 之间可以通过交叉验证来提升结果的正确性,降低“失控”或错误累积的风险。


在安全与合规方面,多智能体应用本质上仍然是一个软件系统,因此需要遵循常规的网络安全、数据安全与合规性要求。但生成式智能体的引入带来了额外挑战:例如代码生成与执行可能导致潜在安全漏洞,跨系统或跨组织边界的 Agent 交互也可能引入认证、传输安全以及恶意攻击等问题。


在实践中,智能体应用首先是一个应用,一个软件系统,所以常规系统的安全保障(网络安全,数据安全)及合规性要求都是要同样关注的,同时,由于生成式模型引入的 Agent 内容生成及执行流程的不确定性,我们要将智能体运行在可控范围内,例如通过沙箱环境、严格的权限管理(包括:工具的权限)、人工审核等手段来降低风险。尤其是在多智能体“分工对话”场景下,需要额外关注潜在的信息泄露或权限绕过问题,确保协作不会成为新的攻击面。


InfoQ:当多个智能体一起工作时,怎样判断它的效率或者是否可靠?目前是否有通用的 benchmark 来衡量多智能体系统的协作效率与可靠性?


蔡超:在效率方面,我们通常衡量任务的完成时间以及 Token 的消耗情况。在可靠性方面,多智能体系统重点关注两个指标:


  • 准确率:系统产出的结果是否正确;

  • 一致性:针对同一问题,多次交互能否获得稳定一致的回答。


目前业界确实有不少用于评估单智能体或多智能体的 benchmark,但大多数都聚焦在特定场景(例如游戏、仿真环境)。而在企业实践中,更有价值的是结合实际业务需求来设计自有 benchmark,用以衡量在真实应用场景下的表现。

生态和未来


InfoQ:现在也有很多闭源模型搭配开放智能体的组合,您如何看待这种“闭源大模型 + 开放式多智能体生态”的结合?是否会成为新的产业趋势?


蔡超:在我看来 Agent,尤其是 Multi-Agent 系统,不同 Agent 可以根据自身角色和任务的特点选择不同的模型,无论是开源还是闭源。我们目前的 multi-agent 应用中,通常也是不同的大模型混合,做到知人善任。


同时,大量 Agent 框架本身就是开源的,这让企业和开发者能够在闭源模型的基础上构建一个开放、可扩展的智能体生态,实现‘能力由闭源模型提供,创新由开放生态驱动’的格局。


我认为这并不只是潜在趋势,而是已经随着 Multi-Agent 应用的兴起逐渐成为常态。


InfoQ:您认为多智能体协作会是未来 AI 系统的主流形态吗?还是会成为某些特定领域的“增强工具”?  对企业 CTO 或技术团队而言,现在是不是进入多智能体协作赛道的最佳时机?


蔡超:短期来看,Agent/Multi-Agent 更可能作为企业现有系统的“增强工具”。这是因为大多数企业仍在运行大量非 Agent 思维设计的遗留系统,全面重构需要时间与投入。因此,多智能体更现实的应用场景是辅助决策、自动化协作和人机混合工作流的优化。


长期来看,随着大模型能力、智能体基础设施和协作框架的成熟,Agent/Multi-Agent 将逐步演变为构建软件系统的新范式。未来企业应用的用户任务不再依赖人工编写固定逻辑,而是通过智能体的自主计划与协作来完成。这意味着软件系统将从“预设流程”转向“动态自治”,彻底改变架构与交付方式。


对于 CTO 和技术团队而言,现在正处于这一范式转变的早期阶段,但相关的基础设施、框架和开发工具已具备一定成熟度,可在多个垂直场景中落地。此时入局,不仅能在应用层快速积累实践经验,也能在组织层面提前培养“智能体化”的系统思维,占据未来竞争优势。需要注意的是,生态仍在快速演化,标准化不足与成本控制是短期挑战,但早期探索的价值远大于观望。


2025-10-17 14:305523
用户头像
李冬梅 加V:busulishang4668

发布了 1194 篇内容, 共 818.5 次阅读, 收获喜欢 1305 次。

关注

评论

发布
暂无评论

中国信通院正式启动视联网产业与技术研究工作

信通院IOMM数字化转型团队

中国信通院 视频行业 视联网

测试开发高薪私教线下班手把手带你提升职业技能

霍格沃兹测试开发学社

运用ETLCloud快速实现数据清洗、转换

谷云科技RestCloud

ETL 数据清洗 数据集成工具

幻兽帕鲁 Palworld 私有服务器一键部署教程

硅基新手村

游戏 steam Sealos Palworld 幻兽帕鲁

OpenKruise :Kubernetes背后的托底

不在线第一只蜗牛

Kubernetes 容器 云原生

短程无线自组网协议之:发展现状与趋势?

Geek_ab1536

SDWAN为什么性价比更高,价格更低廉?

Geek一起出海

SD-WAN

测试开发高薪私教线下班手把手带你提升职业技能

测试人

软件测试

【第七在线】智能商品计划:重塑服装行业的供应链管理

第七在线

链路传播(Propagate)机制及使用场景

观测云

APM 链路

媒体声音|PolarDB再升级:欢迎来到云数据库 x AI新时代

阿里云瑶池数据库

人工智能 数据库 云计算 阿里云 云原生

一起畅玩!幻兽帕鲁服务器华为云搭建教程(Windows平台)

YG科技

软件测试/测试开发|给你剖析闭包与装饰器的魔力

霍格沃兹测试开发学社

一站式解决对接问题,让企业管理更轻松!

聚道云软件连接器

案例分享

追求成长还是追求“高薪”?

老张

个人成长 能力提升

Go语言对象池实践

FunTester

山寨币发展的崛起:随着比特币 ETF 重新定义市场动态,山寨币激增

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

低代码开发视角下的大模型时代:探索“新思维”技术管理

不在线第一只蜗牛

人工智能 低代码 大模型 AI模型

Python多任务协程:编写高性能应用的秘密武器

霍格沃兹测试开发学社

毫巅之微---不同写法的性能差异 番外篇

fliter

用Python实现高效数据记录!Web自动化技术助你告别重复劳动!

霍格沃兹测试开发学社

云手机与实体手机的对比

Ogcloud

云手机 海外云手机 跨境电商云手机 tiktok云手机 云手机海外版

如何快速上手Visio?从入门到精通 | Visio替代软件,建议收藏!

彭宏豪95

效率工具 在线白板 架构图 绘图软件 Visio

中国信通院筹备启动“边缘算力网络推进计划”,招募首批成员单位

信通院IOMM数字化转型团队

边缘计算 边缘算力网络

Mobvista蔡超:多智能体不是“可选项”,而是软件未来的“必答题”_生成式 AI_李冬梅_InfoQ精选文章