
作者 | 华卫
编辑 | 蔡芳芳
“打开方式不对,还是功能被夸大了?”从 3 月份“现象级”Agent 产品 Manus 刷屏,到如今各类 AI Agent 产品扎堆涌现,Agent 在过去这半年多一直头顶“光环”。如今热潮尚未退去,但 Agent 开始频频被吐槽。
在各大论坛,关于 Agent 实际应用能力的讨论越来越多。不少长期关注该赛道的从业者及尝鲜用户反馈,厂商们和评测方把功能描述得非常强大,并放出了各种效果惊艳的演示案例。但普通用户上手时却如同“开盲盒”,尝试多次都很难成功且很多效果无法复现,能实现的多为基础操作,逻辑稍复杂就会跑崩。
一种声音是:“太简单了就失去使用 Agent 的价值了,还不如用工具实现。”
与此同时,Agent 类产品企业的市场表现似乎正在印证这些争议。曾引爆行业的 Manus 不仅国内业务大规模裁员,用户访问量也呈逐月回落态势,同类产品 Genspark 的用户市场亦面临相似处境。有行业观察者甚至直言,通用 Agent 能完成的场景,价值都很低,没人愿意付费。
11 月 5 日,麦肯锡旗下的 QuantumBlack 团队发布了《2025 年 AI 应用现状》报告,基于对 来自 105 个国家的 1993 名企业从业者的调查,揭开了 Agent 在全球范围内的微妙现状。报告指出,62% 的公司至少在尝试使用 Agent。然而,在任何一个特定业务职能中,声称其组织在规模化应用 Agent 的受访者比例都不超过 10%。有 23% 的受访者表示其公司在某些场景部署了 Agent,但这种应用通常仅限于一两个职能部门。
问题到底出在哪里?
“核心在于场景选择与 Agent 能力的错配,而非技术本身的性能瓶颈。”北京枫清科技有限公司技术合伙人王传阳向我们表示,Agent 在标准化通用场景中具备较强的复杂逻辑处理能力,如跨平台会议统筹、多维度信息整合等场景,其自主规划与工具调用能力可充分发挥,效率优于传统工具,但多数产品陷入场景选择误区。
一是强行让通用 Agent 承接垂域简单场景,这类场景虽步骤简洁却隐含专业壁垒,例如化工原料配比涉及行业专属安全规范,Agent 易因知识缺失导致逻辑断裂;二是聚焦通用低价值场景,如单纯信息检索、日程提醒等,此类场景传统工具即可满足,Agent 的核心价值无从体现,自然无法形成付费闭环。
还存在一类情况是,部分用户本就是来尝鲜、看热闹的,并没有实际需求。在实在智能董事长、创始人、CEO 孙林君看来,“哪怕是之前 GPT 发展时,也经历过‘用户量先暴涨、再逐步回落’的过程。真正的用户需求和有价值的场景,会在这个过程中沉淀下来。”
作为今年 AI 行业内最受关注似乎也是落地最多的一个应用领域,“场景错配,还是能力不实?”的相关疑问持续发酵。而通用与垂直的路线抉择,更是贯穿整个 AI Agent 赛道迭代、绕不开的核心命题。
为此,我们邀请了多家热门 Agent 产品企业的创始人以及技术负责人,探讨了通用与垂直两个赛道的生存现状、发展瓶颈,以及国内外 Agent 行业乱象背后的技术短板与市场逻辑。
通用 VS 垂直,谁更“难”?
在多重困境中,通用 Agent 似乎遭受到更多质疑。更值得注意的是,近期业内还普遍反映其存在成本高、落地难等现实痛点。
对此,王传阳的看法仍是,根本原因在于行业对通用 Agent 的能力认知错位与场景定位偏差,导致投入与产出严重失衡。
他举例称,部分企业盲目信奉 “通用 Agent 万能论”,将其直接应用于垂域核心业务。例如,让通用 Agent 主导信贷审批,但这需投入巨额算力进行模型微调,同时安排人工实时修正误判,成本远超预期。并且,通用 Agent 为覆盖多场景采用的冗余架构,又推高了单用户服务成本。
孙林君也观察到一种现象是,有些人会用开源框架或某类工具,去尝试完成一些极其复杂、大幅超越现有基模能力的任务,导致效果不佳。在他看来,“这要么是高估了自身能力,要么是高估了 AI 的潜力。”
“价值定位模糊进一步加剧了落地困境。”王传阳指出,当前多数通用 Agent 聚焦低价值通用场景,此类场景要么存在成熟替代工具,要么用户不愿为轻微效率提升付费;而高价值通用场景的挖掘与适配不足,导致产品陷入 “能落地的不盈利,盈利的难落地” 的僵局。
孙林君则站在企业侧的角度提出,Agent 必须满足三个关键特点才能真正落地使用。首先是可控性,企业内部工作流程严谨,Agent 需要遵循既定工作流,多次运行仍能输出一致结果,不仅成功率要高,在不同电脑环境下也得保持稳定运行;其次是高效性,它应尽量减少对接口的依赖,可以借助 RPA 能力便捷地搭建出来;再加上稳定性,这三点是企业选择 Agent 的核心考量。
另外,他表示,整个行业需要时间来达到高成熟度,这是现实情况。任何工具都有利有弊,对于 Agent,更应多关注积极的一面,充分发挥它在现实场景中的实用价值,而不是一味盯着当前的不足。如今 Agent 已经在很多实际场景中落地,并且在不少岗位创造了价值。比如,在不熟悉的领域,不少人会选择付费开通会员,借助 Agent 完成自己想做的事,这也构成了它的一种商业模式。
“不管是通用 Agent 还是垂直 Agent,受限于基础大模型的发展水平、技术成熟度,以及解决方案与实际需求的匹配度等因素,现阶段确实存在一些明显缺点,也很容易被大家感知到,但这并不会成为阻碍行业发展的根本原因。”
王传阳进一步指出,事实上,当前 Agent 的核心挑战在于对垂直领域深层业务逻辑的精准把控能力不足。垂直领域普遍存在知识壁垒高、业务逻辑动态闭环且容错成本极低的特性,如工业设备运维需精准匹配设备参数与运行场景、金融风控需联动多维度动态数据,这些隐性规则与复杂关联难以通过通用语料覆盖。
“从技术迭代规律来看,该挑战今年内无望解决。”一方面,垂域高质量数据多呈现孤岛化与隐私化特征,难以形成规模化训练数据集;另一方面,通用模型与垂域知识的适配需技术团队与行业专家长期协同调优,仅知识图谱构建与规则映射就需数月至数年周期,短期无法实现突破。
孙林君同样提及了数据层面,称“往未来看,数据将逐渐成为新的行业瓶颈”。原因在于,现有公开数据大概率已被各类大模型获取并用于训练了,而完全由人类原创的新数据会越来越少。在众多垂直领域中那些行业外无法获取的专属数据,会变得愈发稀缺。也正因此,垂直大模型相较于通用基模在针对性微调方面能取得更优的效果。
“现阶段,无论是企业还是具备专业职能的个人,应用这类基于垂直大模型的 Agent,往往能看到更理想的使用效果。接下来,基于通用基模开发垂直大模型的应用也会逐步凸显出来。”
同时,孙林君指出,Agent 的成本会逐步降低。“芯片性能在持续升级,模型优化技术也在不断进步。现在部分 7B 级别的模型,已经能实现原来 ChatGPT 那样的效果。按照这个发展规律,未来随着算力的升级和模型训练方法的革新,我们完全可以用更小体量的模型,打造出效果更优的 Agent 或大模型产品。甚至这些小模型在终端设备上的表现已经非常出色,达到了实用化水平,这都是可预见的趋势。”
对此,王传阳则持不同观点,他认为,短期内(3-5 年)通用 Agent 的成本与性能难以实现突发性突破。性能方面,LLM 受限于高质量数据稀缺与算力投入性价比下降,OpenAI、Anthropic 等企业的新一代模型改进幅度已趋于平缓。成本方面,通用 Agent 的全场景适配架构存在天然冗余,即便优化算力分配,单用户服务成本也难以低于聚焦单一领域的垂直 Agent。
角逐大半年,谁更“强大”?
在近期的一场 AI 创造者嘉年华上,RockFlow 创始人赖蕴琦给出了不一样的视角:“通用 Agent 和垂直 Agent 不太有真正的区别。核心是‘为用户解决什么问题’,只要能解决问题,就是很有价值的产品。”
那么,这两类产品谁更强呢?当前有一个现象是:在跨行业场景中,通用 Agent 的任务完成度和完成深度面临越来越多的实践争议与拷问。
孙林君认为,现阶段通用 Agent 能完成的场景,在任务深度上其实取决于基模能力。就像之前基础大模型做高考数学题的表现并不理想,但仅仅过了半年,现在的基础大模型做高考数学题达到 140 分以上的成绩已没什么问题,能秒杀 99% 的考生。从这一点足以看出,只要有可迭代的框架,通用 Agent 每隔几个月就会快速升级,而它所需要的足量数据与行业经验,本质上都源于人的实践积累,不是解决不了的问题。“在可见的短时间内,我们必然会看到更多有深度、能力超过普通人水平的 Agent 出现,事实上现在已经有不少了。”
“而且,垂直 Agent 就一定比通用 Agent 的能力更强大吗?这倒也不一定。”
他举例道,不是说把某一件事干好,公司就会变好。实际上,只有多个岗位之间实现无缝协同、高效配合,才能让整个公司运转得更好。从属性上来说,Agent 平台的核心是为用户提供搭建 Agent 的能力。只要这个平台的搭建能力足够强大、足够灵活,再加上沉淀了丰富的行业模板或现成的 Agent 资源,就能形成一个完整的生态,而这个生态必然不会局限于某个垂直行业。
另外,孙林君指出,如果将解决某个特定领域问题的 Agent 定义为垂直 Agent,比如专注于营销、客服、运营或数据处理的 Agent,通用 Agent 对企业来说其实更具价值。他以一个现实问题举例解释道,“一家企业想要搭建各类 Agent 且希望这些 Agent 能够协同工作,有必要去购买十套不同的垂直 Agent 平台吗?从这个角度来看,对任何企业而言,都没必要耗费成本去搭建十套各自独立的垂直 Agent 平台。”
因此,他认为,面向企业或个人的通用 Agent,会是未来的核心发展趋势。至于垂直 Agent,它确实有其阶段性的优势,目前能看到的表层情况是,它在特定领域可能显得更深入一些。但随着每一轮技术迭代,Agent 的底层能力会持续增强,通用 Agent 的通用性也会不断提升,届时垂直 Agent 的发展空间将会被一步步压缩。
王传阳则从技术层面谈到,通用 Agent 并非必然牺牲深度,通过模块化架构设计可实现跨行业适配与领域深度的平衡。核心思路是构建 “通用基础层 + 领域知识层 + 场景适配层” 的三级架构:通用基础层基于大参数模型保障跨行业的自然语言理解、工具调用等基础能力;领域知识层通过检索增强生成(RAG)技术嵌入垂域知识插件,如金融领域加载风控规则图谱,能源领域接入设备运维知识库。场景适配层则通过强化学习对具体行业场景的反馈数据进行微调,优化决策精度。
例如,企业跨行业合同生成场景,通用基础层保障合同框架的规范性,接入不同行业插件后可匹配金融、制造等领域的专属条款,再通过场景微调适配企业个性化需求,无需重构模型即可实现 “广度覆盖 + 深度适配”。
“博弈”在升级,终局不会是二选一
自两条路线分化以来,关于赛道终局的选择争议便从未停歇。这几个月,行业内流传着这样一种观点:“通用 Agent 是未来,垂直 Agent 只是过渡产品”。
而在孙林君看来,最终行业不会走向非此即彼的极端,反而会形成一种动态平衡。具体来说,如果需要深度解决某个特定领域的问题,垂直 Agent 无疑更具优势;但如果是应对 80% 的常规通用需求,通用 Agent 就完全足够覆盖。其实两者存在一定程度的互补性,想让其中一方完全取代另一方,并不是一件容易的事。
王传阳的观点也类似。他认为,未来行业演进的主流逻辑是 “协同发展”:通用 Agent 承担跨场景协同、通用任务处理等基础工作,垂直 Agent 深耕领域深度决策,两者形成互补而非替代关系。
大模型发展增速放缓,通用 Agent 短期内无法突破垂域知识壁垒,而垂直 Agent 的场景适配性具备长期不可替代性。当前 LLM 的性能提升已显现边际效益递减,数据稀缺与算力成本飙升成为主要瓶颈,Epoch AI 预测 2028 年前可用文本数据将耗尽,未来 5 年内通用模型难以覆盖垂域的隐性知识与刚性规则。从场景需求来看,垂直领域对 “高精度、高合规性” 的要求决定了垂直 Agent 的长期价值。例如,医疗诊断 Agent 需匹配临床指南与患者病史,工业控制 Agent 需严格遵循工艺参数,这些需求无法通过通用 Agent 的 “概率性输出” 满足。
“即便未来实现技术突破,通用 Agent 也无法颠覆垂直 Agent 市场。”王传阳表示,垂直 Agent 的核心竞争力不仅在于技术能力,更在于深度绑定的行业资源与场景壁垒。
然而,孙林君也直言称,“从领域来看,我们更看好那些垂直属性强、发展空间广阔且行业纵深深的赛道。那些领域覆盖较浅、没有自身独特行业数据支撑的 Agent,会慢慢被通用 Agent 蚕食掉。”
关于数据对 Agent 能力的重要性,知名市场研究机构 CB Insights 在最新发布的报告中亦重点提到,Agent 只有数据好,它才能真正发挥作用。在报告前言里,CB Insights 首席执行官 Manlio Carrelli 还反复强调,真正的竞争优势不在 AI 本身,而在于能不能把准确、全面的数据用起来,以及搭建让 Agent 真正有用的编排层。
值得关注的是,另一场 Agent 领域的关键争夺战也开始燃起:科技巨头们正在抢 Agent 通信标准的主导权。
Anthropic 的模型上下文协议(MCP)、谷歌的 A2A 协议、IBM 的 Agent 通信协议,都在一年内推出。今年 9 月,Stripe 发布用于智能体支付的 API,并与 OpenAI 共同推出了智能体商务协议(Agentic Commerce Protocol),将通过提供 Agent 与买家、企业之间的标准化通信框架,使其能够完成自主购买任务。
基模崛起,淘汰赛悄然打响
Agent 赛道的“内争”还在继续,日渐强大的基础模型所带来的冲击却又似“外患”般接踵而至。
去年,“模型即应用”的口号就喊了出来。前几天,月之暗面推出并开源旗舰级开源思维模型 Kimi K2 Thinking,以思维 Agent 为核心架构,主打“模型即 Agent”的理念。
模型越来越强,Agent 会不会被吃掉?这一担忧,与 Macaron 创始人陈锴杰在 AI 创造者嘉年华上提出的观点不谋而合。
“大家在讨论通用与垂直时,都在逃避竞争。”陈锴杰谈到,讲垂直是为了表明各自领域不“打架”,都能实现融资和发展。他进一步指出,在海外做通用 Agent,是明牌正刚 ChatGPT。在他看来,假设很多场景里面要解决的问题跟 ChatGPT 差不多,不同的解决方案或者更好的解决方法可能才是问题的本质。
孙林君则向我们举出了 AIGC 生成领域的现实案例:之前很多专注于某一细分领域像图片处理的小型创业公司,现在不少已经不复存在了。他表示,核心原因就是通用大模型的能力每迭代.一次,都会让这些公司掌握的技术被冲击掉。
但如果某个垂直领域的能力是建立在通用大模型缺乏足够数据深度的基础上,通用大模型想替代它就比较难。比如,医疗领域对技术精度和数据专业性的要求极高,且很多医疗相关的行业数据具有独特性,外部无法获取。在这类领域中,垂直应用或垂直 Agent 的使用效果要优于基于通用基模开发的 Agent,自然能拥有稳定的生存空间。反过来,若某个垂直 Agent 只是单纯依托通用基模的原生能力,那它的未来就不好说了。
再比如,实在智能团队做面向企业的通用 Agent 时,接触过很多客户内部独有的软件,不管是 GPT-4、GPT-4.5 还是 GPT-5 都没有接触过这类专属系统。这些通用大模型在对这类软件进行操作、识别和控制时,往往会出现“幻觉”,进而导致操作的不确定性和高失败率。“而像 TARS 大模型是基于特定行业的专属数据训练出垂直大模型,再面向企业级 Agent 时就能对企业内部信息化系统实现更完备、精准的操作,相较于通用基模就能体现出差异化能力。”
“不过,哪怕是通用 Agent,如果完全依靠基模能力,即便结合工具把产品设计得还不错,但底层能力要是没法超过基础大模型本身,那它的发展其实是高风险的,很难保持稳定。”
对此,Flowith 联合创始人拐子结合 Flowith 的新 Agent 产品分享了另一种看法。他认为,未来模型有可能变成用户眼中的 Agent。但对用户而言,这并不重要。用户真正关心的,只是能否帮自己解决问题。现在大家之所以关注 Agent,核心是它比传统大语言模型更进了一步,不再只提供单纯的输出,而是能交付到手即可用的结果。
从市场端角度考虑,Agent 的市场规模非常庞大。全世界范围内,无论是知识工作者、媒体从业者,还是日常使用手机、电脑的普通用户,都是 Agent 的潜在用户,他们需要通过这类工具变现、创造价值。因此,在模型面前,通用 Agent 有可能受到威胁,但绝非伪命题。即便模型未来去做类似事情,大概率也会采用类似 Agent 的运作方式。
“Agent 所需的调用能力、记忆功能,在当前的模型训练架构下是做不到的。”
泡沫之下,能赚钱的真不少
正如麦肯锡高级合伙人 Michael Chui 所言,“Agent 确实很火,但真正做好很难。”
CB Insights 在最近发布的《AI Agent Bible》中,梳理了当前 AI Agent 生态的增长脉络。2024 年,Agent 初创公司一共拿到了 38 亿美元融资,几乎是 2023 年的三倍。2025 年,在 CB Insights 追踪的 1500 多个科技细分市场里,交易最活跃的前十个市场中有五个直接和 Agent 相关。
在 2025 年收入最高的 20 家 Agent 初创公司里,有一半 3 年前都不存在,几乎“从零起步”却迅速闯进营收榜前列,包括 2022 年成立、年经常性收入 5 亿美元的 Cursor,以及 2023 年成立、收入均达 1 亿美元的 Lovable 和 Mercor 等。收入排名前 10 的企业中,有 6 家专注编程类 Agent,且员工人均收入达 140 万美元。
但与此同时,倒下的 Agent 项目也不少,其中还不乏明星企业。前不久,做法律 AI Agent 产品的英国 AI 初创公司 Robin AI 因新一轮融资失败,被挂上了破产网站。就在一月份,Robin AI 还入选了《星期日泰晤士报》推出的英国科技公司 Top 10 榜单。今年上半年,国内企业级 AI Agent 公司澜码科技被证实陷入经营危机,员工大规模离职,仅剩 20 余人维持客户支持。
Chui 一针见血地指出,“很多人看到的是炒作,我们看到的是大量还在探索阶段的公司。”
根据麦肯锡发布的《2025 年 AI 应用现状》报告,目前,Agent 最常出现的领域是 IT(如自动服务台)、知识管理(如深度研究、资料汇总)、软件工程、服务运营等。而发展较为前沿的行业是科技、媒体电信、医疗保健,这些行业 Agent 落地的比例明显更高。
把视线拉长到未来 3 年,王传阳给出这样的预测:“金融、电信、能源三大领域的 Agent 有望实现爆发式增长,核心源于这些领域具备数据基础扎实、场景需求明确、商业价值显性的独特优势。”
短短两年间,Agent 已从前沿技术概念跃升为企业 AI 布局中的优先事项。甚至去年,业内人人都在说,2025 年是 Agent 的落地元年。现在年关将近,Agent 看似无处不在。但从落地实况来看,还远远不足以支持千行百业的需求。
在 10 月的一档播客中,OpenAI 创始成员之一、前特斯拉 AI 主管 Andrej Karpath 就此给出了更为审慎的视角。他直言不讳地指出,行业内存在一些过于乐观的预测。在他看来,更准确的描述应当是:我们正处于“Agent 的十年”。十年内,它们将能够真正完成“工作”。
“有点泡沫并不是坏事”,有人这样说道。
无可否认的是,这一年,Agent 成功从技术概念走上了产业应用的舞台,并且赚到钱了。而接下来,还有众多有增长潜力的领域产品正蓄势待发。







评论