写在 Manus “卖身”后：企业级 Agent 只会更像软件，而非魔法

12 月 30 日 Meta 正式宣布与 Manus 达成全资收购协议，收购金额高达数十亿美元，成为 Meta 成立以来，仅次于 WhatsApp（ 190 亿美元）和 Scale AI（未披露具体金额）的第三大收购案。

Manus 创始人肖弘将出任 Meta 副总裁，其核心技术团队将整体并入 Meta AI 部门，公司将继续在新加坡独立运营，现有订阅服务保持不变。肖弘在社交媒体上发文感慨：

“今天是我一生都难以忘却的时刻。”

无论从产品还是营销层面来看，Manus 都堪称生成式 AI 时代的典型创业案例，但也有业内专家表示，看来做一家独立公司很难，通用级 Agent 终究还是巨头的游戏。

这样的评价，也源于 Agent 想要落地企业，本身就存在许多工程交付与产品优化问题，而这一般来说是“大厂专利”。就 ToB 场景而言，企业级 Agent 的使用频率，与资本、品牌市场层面的“表象繁荣”是有些许错位的，创业公司很难组建庞大的工程师团队围绕细分场景做长线研发，遑论贴身服务客户，在价值上形成闭环。

这些所谓的工程交付与产品优化问题，大概可分为以下几类：

幻觉：模型带来的幻觉问题，或许无法被根除，但必须被管理，否则会造成事故；
集成：因为数据孤岛、权限墙的存在，Agent 在很多时候等于“绑着双手”工作；
运维：如何系统地解决版本回归、评测、灰度、告警、审计等问题；
成本可控：Agent 模式下，Token 成本的管理是核心。这里不仅指的是 Token 单价，也包括失败重试、长链路、多轮工具调用带来的不可预测。

没有一项适合创业公司写进“性感”的融资 PPT 中，但每一项都是 B 端客户最关心的问题。在真实的企业场景里，用户不太关心 Token 增量数字，甚至也不太关心产品的想象空间，他们更聚焦当下，更关心：能不能让他现在就少干活，少做回归、少挨骂。

因此当在 IDC《2025 年亚太区 AI 赋能前台对话式 AI 软件厂商评估》报告里的领导者象限看到腾讯云的时候，我非常惊讶——这是唯一的一家中国厂商，而且相比于为了 Token 调用量去猛卷品牌和市场的一众厂商而言，或许相比于卷品牌市场，腾讯云更喜欢、也更擅长卷产品经理，这次站到领导者象限，我不会将其视作“冠军奖杯”，反而更像在即将到来的 2026“困难副本”里，阶段性通关的一个样本。

Agent 越来越像软件产品，而非魔法

当大家都在用品牌市场把 Token 用量推上去时，另一条更务实的路线是：把 Agent 当产品做，当软件做。

这条路或许短期不性感，但更容易在全球化的竞争中活下来。实际上，企业也正把 Agent 驯化成“可控、可审计、可观测”的系统组件，且都要放在精确的业务背景下来谈。

这是一项庞杂的工作，只有产品型团队能够胜任，且完成长期进化。

举个例子，RAG 不是个新技术，对于许多项目型团队，平台提供 RAG 能力，主要的交付任务就已经完成了，剩下的“用量增加”指标，应该交给品牌市场和销售去完成。

但如果作为产品来看，RAG 的迭代空间依然很大。

传统 RAG 的核心是两段式流水线：检索，生成。但其中的每一段都可能出现问题。

对于检索层来说，传统 RAG 的问题是：拿来的资料就可能不对。实际上，检索不是事实保证，只是相似性排序。比如：

召回偏差：Top‑k 里缺了关键证据（查询 A，检索提供的是“看起来像 A”的 B ）；
断章取义：检索时丢失了关键限定条件，如时间、范围、例外条款等；
语料过期 / 错误：只能取内容，不能鉴别真伪；
多文档冲突：检索到互相矛盾的片段，模型可能会“自作主张”进行融合。

以上状况都会导致引入 RAG 技术后，幻觉继续出现。

生成层的问题同样不少，核心是就算证据在眼前，模型也可能不用或用错。比如：

证据利用失败：模型“看见了”，但没按证据约束输出；
证据到答案之间需要推理：片段只给了局部信息，模型需要补全逻辑，补全时出现幻觉；
过度概括：LLM 的训练目标偏向流畅与连贯，而不是严格可证；
指令冲突：系统提示说“只基于资料”，用户又要求“给个确定结论”，模型可能选择“满足用户”。

二者问题叠加，以至于传统 RAG 技术有非常大的局限性。大部分厂商对此的回答是：这是大模型天然的问题，在答案准确度要求较高的场景，不要使用大模型技术。

这话一半是对的，一半是错的。对的部分是，大语言模型存在幻觉确实是底层技术原理导致的，属于生成式 AI 的“本性”。错的部分是，存在不等于失控，如果从产品视角来看，RAG 仍有非常大的优化空间。

腾讯云智能体开发平台的主张是把 RAG 做成“Agentic”的形态：不是一次检索一次回答，而是能规划、多次工具调用、跨文档推理与证据聚合。

所谓 Agentic RAG ，核心在于赋予了系统“思考，行动”的循环能力，而不是简单的“检索，生成”。其关键能力包括：

任务分解与规划：能够理解复杂问题，并将其拆解为多个子问题，逐步解决；
条件化检索：可以判断何时需要检索，以及应该从哪个数据源进行查询；
自我反思与纠错：当发现检索结果不准确时，能够主动调整检索方向，迭代优化答案；
工具使用：不仅能进行文本检索，还能调用外部工具（如数据库、API 、知识图谱）来获取和处理信息；
多智能体协作：多个智能体可以协同工作，分工合作解决更复杂的任务。

通俗来说，Agentic RAG 的核心目标不是“检索得更多”，而是让模型在流程上更像一个人，而不是一个 SaaS 插件。

当然，Agentic RAG 也不能根除幻觉问题，但可以将幻觉出现的空间压缩。对于对正确性要求极高的环境而言，Agentic RAG 能够反复验证事实、查询多个来源，尽可能确保答案的准确性。

另外当进行复杂的数据库交互时，Agentic RAG 也能自主使用工具改进查询策略，避免查询失败。

最后，Agentic RAG 也使得系统能够持续整合新数据，并随着对问题理解的加深而动态调整策略。

当然，Agentic RAG 自身也存在问题，尚未成为 RAG 应用的标配。比如，Agentic RAG 构建与维护成本比较高——有企业在尝试构建商用级智能体时，遇到了知识库上传限制、问答准确率低等工程化难题，需要专业的陪跑支持才能解决。这与更简单的 GraphRAG 面临的构建维护成本高的问题类似。

同时，Agentic RAG 的技术整合复杂度也比较高，需要将规划、反思、工具调用等多个模块有效整合，并确保它们协同稳定工作，存在一定的技术难度。

但这对腾讯云智能体开发平台而言，似乎并不是个大问题——毕竟其入选 IDC 报告领导者象限的一大核心能力就在于此。

从 RAG 到 Agentic RAG，腾讯云智能体开发平台的案例在透露一个信号：Agent 终于开始像工程一样被讨论，它越来越像软件产品，而非某种神奇的魔法。

归根结底，我们终究需要一些没那么浪漫，但是很值钱的解决方案。

生产环境不相信“愿景”

与 RAG 境遇类似的是 Multi-Agent。

区别在于，Multi-Agent 画的“饼”更大——产品经理 Agent 写 PRD，架构师 Agent 拆模块，开发 Agent 写代码，测试 Agent 生成用例与 fuzz，安全 Agent 做依赖扫描与漏洞推演，最后 Reviewer Agent 做代码审查与风险签署。

这样一种群体智能在企业场景的落地实现，让无数企业主心动。

但事实是，Multi-Agent 非常依赖 Agent 平台的“工作流编排”功能，也就是一个极度确定性的执行流程。而在企业内，许多业务场景可能不存在一个明确的 SOP，且越贴近实际业务，越是如此。理论上 AI 应用应该和传统 SaaS 应用存在明确的产品界限，支持更有好的交付，更低的使用门槛。

当行业需要某一项产品能力，但主流厂商都不支持时，就来到了腾讯云的“舒适位面”。腾讯云 Multi-Agent 同时支持“零代码自由转交协同”与“工作流编排”，并新增 Plan-and-Execute（试用阶段）：

“自由协同”更像提高灵活性，适合探索型任务；
“工作流编排”更像提高可控性，适合流程明确、稳定性要求高的任务；
Plan-and-Execute 适合复杂报告 / 网页等任务拆解。

这本质上是在同时覆盖探索型智能与生产型智能：自由协同适合需求不清、路径不定的探索任务；工作流编排更适合流程明确且稳定性要求高的业务；而 Plan-and-Execute 则补上复杂任务的“先规划再执行”能力，便于把报告撰写、网页生成等长链路工作拆成可并行、可回滚的子任务。

如果后续还能配套预算 / 停止条件、验收关卡与权限治理，这套组合就能把“好用的演示”更可靠地推向“可用的生产”。

中国 ToB 软件行业的难点之一是，企业永远会在客户的定制化需求和高利润标品之间摇摆不定。现在腾讯云智能体开发平台，似乎利用 AI 技术找到了很好的折中点：

既可以面向混沌由 AI 新建流程，又可以面对确定流程交付确定结果。

这种一边识别市场真需求，一边利用 AI 能力“既要又要”的模式，几乎可以在腾讯云智能体开发平台 2025 年的所有主要更新中见到。

比如，近日，腾讯云智能体开发平台推出全流程 AI 原生的 Widget 功能，支持自然语言生成和模型原生输出 Widget 组件。这是国内首家从创建到使用全流程都实现了更 AI native 的 Widget 应用方式。

Widget 是一种支持嵌入在对话中的自定义展示组件，可呈现图文、表单、操作按钮等多类型内容。

国内智能体平台的“卡片”功能整体支持组件范围非常有限（尤其是输入类组件），实现方案主要是采用可视化拖拉拽构建前端，再通过手动一一匹配编辑前端组件和数据字段的映射关系实现。一般流程比较复杂、输出效果也不太稳定。

腾讯云智能体开发平台推出的 AI 原生 Widget，兼容 OpenAI Widget 协议，用户可通过模板创建、代码创建、甚至自然语言生成等不同方式配置，自定义创建符合业务需求的专属展示单元。

简单来说，开发人员现在可以用自然语言生成表单，并且将其用在和智能体的交互中，降低交互式组件的开发门槛。

目前，腾讯云智能体开发平台的 Multi-Agent 和工作流模式均已支持 Widget 创建和使用。

客户要的 Multi-Agent “零代码自由转交协同”，有了；用户要的 AI 原生 Widget，也有了。腾讯云向客户 / 用户靠拢的速度，实在是有些快了。

在过去三年 GenAI ToB 的主流叙事里，这个需求几乎有些奢侈：过往，企业是被 AI 舆论裹挟的。AI 有什么就拥抱什么，拥抱不了要反思一下姿势对不对，是不是不够 AI-Native？

腾讯云的想法是，AI 同样需要具备产品思维，主动靠近业务的实际需求和情况，提高端到端复杂任务的完成率。

更进一步看，产品化的本质是拥抱变化、持续进化，这会让企业在全球化战略盛行的今天，走得更稳健。

通关东南亚的“压力测试场“

国际市场最终看中的不只是客情和渠道，还包括最核心的产品能力。

这是文章开头提到的 IDC 这份瞄准亚太区的报告，有着极高的准入门槛—— 亚太区，尤其是东南亚，是典型的企服“压力测试场”，核心挑战包括：语言与语境极端多样性、监管与部署要求。

在“语言和语境的极端多样性”方面，企业需求远远超出当前模型能力。报告提出，真正可用的系统不仅要覆盖更多本地语言和方言，还要深入理解行业术语、业务表达与文化语境——这不仅是自然语言处理的问题，更是对业务理解能力的要求。

而在“区域监管和部署要求”方面，一些企业甚至无法将关键工作负载部署在单一的公有云上，迫使供应商必须提供本地部署、私有云、混合云等多种形式。

所以在报告的入选门槛上，IDC 要求供应商必须提供可商业化的产品或服务，且客户需至少连续使用一年；必须具备面向前台业务的对话式 AI 开发能力；在亚太及日本地区拥有本地机构，并至少在三地设有办公室且区域营收占比超过 10%；在 2024 年至少拥有三家将 FOC AI 解决方案投入生产使用的区域客户，同时该地区 FOC AI 收入需超过 300 万美元。同时，解决方案必须支持典型客户场景（如客服、营销与销售），具备大型语言模型能力，并保持生态系统开放性，可与多种企业系统集成。

而除了以上两方面技术产品优化，腾讯云的一大入选原因也在于成熟的本地化和灵活的部署方式。

腾讯云在整个亚太地区（不包括印度）都有客户基础，并在新加坡、马来西亚、印度尼西亚、泰国和香港等地设有本地化的销售和支持团队。

另外，针对受监管行业（如金融服务业），腾讯云的 FOC AI 产品提供从私有化部署（on-premises）到 SaaS 部署的多种部署选项。

对于众多在 AI 时代完成全球化布局的企业而言，这绝对是个好消息。

比如全球最大的跨境物流服务商之一 DHL ，覆盖全球两百多个国家和地区，提供国际快递、货运和供应链解决方案服务，拥有全球最大的航空快递网络之一，恰恰最需要成熟的技术产品交付能力、本地化的支持，以及灵活的部署方式，因此在客服系统的智能化升级上，和腾讯云智能体开发平台走到了一起。

如其他国际物流巨头一样， DHL 的客服系统面临着严峻挑战，如：繁多的货运环节，较长的物流管理流程，既要满足本地化适配，又要满足全球化管理的协同需求。

通过接入腾讯智能体开发平台，DHL 将传统 AI 客服升级为「大模型客服」，集成到企业小程序、官网、公众号，C 侧用户通过对话形式进行问答，帮助自动化处理快递寄件、收件、信息查询等超过 40 类过程复杂且分支较多的任务，减轻人工客服压力，提升业务服务效率和质量。

最终，DHL 人工维护的知识条数从超 900 条下降至 119 条问答，转人工客服绝对数减少 200 人次 / 天，机器人解决率从 69% 提升至 74%。

这是 Agent 平台型产品，在高度复杂的业务环境下的真实落地案例。

有行业专家判断，Agent 会是 2026 年最主要的 AI 商业化机遇。那么不如说，Agent 背后的产品思维、工程能力、交付能力、进化能力、全球化能力，就是 2026 年企服领域竞争的重点。

从这个角度看，腾讯云为大家做出了极好的示范。

创作场景

写在 Manus “卖身”后：企业级 Agent 只会更像软件，而非魔法

Agent 越来越像软件产品，而非魔法

生产环境不相信“愿景”

通关东南亚的“压力测试场“