金融智能体真的是大模型落地“最后一公里”？

随着大模型、智能体技术的快速演进，金融行业正迎来营销获客、风控、运营、合规、系统支撑等方方面面智能化升级的全新阶段。那么，金融智能体真的是“最后一公里”吗？从尽调到合规，从客服到风控，大模型在金融场景有哪些不同的“打开方式”？

近日 InfoQ《极客有约》X AICon 直播栏目特别邀请了 新希望金科 AI 中心总经理王小东、同盾科技副总裁董纪伟、某银行机构数据智能团队负责人徐小磊、腾讯算法专家欧阳天雄一起，在 AICon全球人工智能开发与应用大会2025 深圳站即将召开之际，共同探讨金融 AI 从业者眼中的大模型实践现状。

部分核心观点如下：

大模型更多解决长尾问题和小模型无法解决的小样本问题，而真正生产执行的依然是经过多年打磨的小模型体系，从执行效率、问题解决率、生产效果等来看，大小模型融合是目前金融业场景中的主要解决方案。
如果未来的超级智能体能解决长时间记忆问题，既避免幻觉，又克服时空错位导致的决策失效，那将是重大突破，但在此之前，不应盲目将大模型智能体视为唯一方案。
智能体在金融业务中有一定的应用，如数据洞察、尽调、投研投顾等场景中，然而智能体受基座模型、工具不完善不成熟、框架不稳定等影响，也存在很多问题。金融对可靠性、可解释性、准确性等要求高，基于工作流的智能体比自主规划智能体目前来更适合用于生产。

在 8 月 22-23 日将于深圳举办的 AICon 全球人工智能开发与应用大会上，我们特别设置了【大模型在金融领域的创新实践】专题。该专题将聚焦于金融投研投顾、智能风控、合规审查等核心业务场景的大模型和智能体应用，邀请业内专家共同探讨技术方案、应用价值与实际落地经验。
查看大会日程解锁更多精彩内容：https://aicon.infoq.cn/2025/shenzhen/schedule

以下内容基于直播速记整理，经 InfoQ 删减。

完整直播回放可查看：https://www.infoq.cn/video/UwtIBw04baOHbR84BODj?utm\_source=home\_video&utm\_medium=article

现在做 AI 项目，第一反应都在想什么？

王小东：当你们在评估一个 AI 项目时，第一反应会关注哪些问题？是看数据？还是合规？还是先算 ROI？你们的标准是怎么形成的？

董纪伟： 商业化固然是最终目标，但在选择适用场景、研制具体模型与智能体的实际应用时，重点关注三点。

第一，大模型的应用应该从“小场景、微切口”切入，首要是能否找到适配的应用场景，以及场景中的痛点问题。

第二，是对技术路径和落地形态的论证。要实现端到端的落地方案，关键在于所依赖的条件是否具备。例如，数据是否合规可用、多源异构数据如何能够接入等。应用时，我们也需要判断是服务式部署，还是以智能体方式进行类似 API 交互的升级。

第三，是 ROI 方面的评估。评估从开发、测试到训练上线的全流程，是否能在特定场景中带来可量化的效益，这包括但不仅限于增收，特别是在智能风控场景中，更强调决策效果的提升、效率的提高，以及资源的成本节约等。

徐小磊： 决定是否使用这一技术可以从两个场景出发来评估。

首先是对内服务，即面向内部员工。在这个方面，Agent 与大模型的结合已经无需再评估是否可行。在我们的工作流平台上，已经搭建了上百个 Agent 工作流，广泛应用于图像识别、PDF/PPT/Excel 等多种文件的综合处理。

第二是对外服务，即面向 C 端用户，这是我们目前最需慎重评估的方向。关键在于两个方面：合规和 ROI。对客的大模型输出必须高度可控，哪怕是一个字或一个标点都不允许出现错误，否则后果严重。此外，我们也在尝试将 Agent 与大模型用于非直接对客的场景，如替换旧模型、数据系统、业务平台等。

最直观的变化是，以往业务人员提出需求后需研发人员编码实现，而现在可以直接在可视化平台上通过拖拽快速搭建。目前，对内应用几乎没有障碍，对外应用则期待能通过智能风控和智能合规的 Agent 解决最后一道门槛。

欧阳天雄： 我们更关注技术如何与数据、业务、资源紧密结合。落地时，我们主要围绕四个问题进行思考。

首先，我们是否具备数据基础？金融风控场景中，我们有用户模型与业务数据的长期积累，沉淀了大量反欺诈知识，因此我们认为 AI 在此领域可以与我们高度结合。

第二，是否必须用 AI 解决当前问题？并非所有场景都适合 AI。以信贷反欺诈为例，规则引擎可覆盖 80% 的案例，长尾难题才需大模型进行增强分析，此时 ROI 才可能成立。

第三，AI 应用是否能形成业务闭环？AI 无法一开始就完美，必须通过业务场景持续反馈实现迭代。若无法闭环，即使技术先进，也难以落地。我们曾尝试将用户特征转化为自然语言，交由生成式大模型判断风险分数，但发现该方式输出不稳定，难以满足风险预测的精确性需求，最终仍需回归判别模型。

第四，是否满足合规要求？对金融行业来说，合规是底线，即便 AI 模型效果再好，如果存在合规风险，也不能采用。

王小东： 使用生成式大模型进行反欺诈，是通过自然语言描述用户的各类特征，然后交由大模型做判断。我们这边也尝试过类似的方向，但偏向视觉理解。但后期我们也转向判别模型，因为策略团队更倾向于概率类模型，而不是生成文本。生成内容缺乏可控性与一致性，确实难以投产。

欧阳天雄： 是的，这会给策略同事带来很大压力，底层模型不稳定会带来诸多问题。

王小东： 没错，同一幅图、相同输入可能会得出不同结果，导致无法实际应用。我们在评估 AI 项目时，更关注问题用最佳的技术解决，并不是因技术而技术，如果问题无需大模型也能解决，我们不会强行使用大模型，而是用小模型。

我们公司还在发展期，因此 ROI 是关键评估标准。我们先评估业务痛点是否真实存在，然后再决定采用哪种技术方案。同时还会评估项目所需的技术栈，比如深度学习、机器学习、大模型、音视频通信等，判断我们团队是否具备相应的人才储备。

接下来我们会进行初步的技术验证，出一个 DEMO 或 POC 给业务方评估效果。如果效果不理想，我们会探讨还需要做哪些优化和改进，直到业务方觉得可行可用，最终才决定是否投入真实产品研发。尤其在风控场景下，哪怕模型效果只提升 1%，收益也可能非常可观。

当然，每家机构评估标准不一样。大厂可能人力物力充足，决策快；我们中小公司则需权衡成本、合规、可解释性和投入产出比等，才能做出投入决策。

智能体是“大模型落地的最后一公里”吗？

王小东：最近圈里有个挺火的说法——智能体是大模型落地的“最后一公里”，你们怎么看？从你们做的项目来看，“智能体”真的帮上忙了吗？

徐小磊： 以投诉为例，过去我们对投诉的分析依赖人工，即便语音可通过 NLP 技术转成文本，提取关键词并生成摘要，最终仍需要客服人员人工查看内容，并将其分发至相关业务部门进行后续处理，效率较低。以往我们尝试用分类式的小模型来辅助归类，准确率大约在 70% 左右，但这类模型的训练需要大量正负样本，调参耗时冗长，整个周期非常长。而从去年至今，我们已经迭代了两个大模型，仅用一两周时间，就能将文本归类的准确率提升至 87%，效果显著。过去需要客服团队在处理客户来电之外，还需投入精力做业务归类和分发，现在大部分工作可以交由大模型自动完成。系统会自动判断内容是否紧急，并分发至相应部门，实现了显著提效。

第二点是训练成本方面。以往训练一个模型需要专门的工程师编写代码、调优，投入巨大，但实际产出有限，ROI 很低。现在，我们只需教会一两个同事编写相对完整的提示词，在大模型软硬件环境相对稳定的前提下，即可获得较一致的输出，极大地降低了人力投入。

第三个优势在于应对新型投诉。当出现原有模型无法覆盖的新类型投诉时，传统模型往往只能归类为“未知”或“其他”。而大模型因具备通用知识能力，且接入了我们内部知识库，能自动识别并生成新分类。这种能力让我们团队明显感受到工作负担的减轻，是一个非常有意义的场景。

王小东：我理解你们现在是将大小模型结合使用，对吗？

徐小磊： 对。尤其在许多业务场景中，对响应速度要求极高，需要毫秒级反馈，而目前的大模型还无法满足这一点。因此，我们目前主要是将大模型作为调度器，调用现有的小模型来完成更复杂的业务流程。大模型更多承担指挥和协调的角色，而真正执行的依然是经过多年打磨的小模型体系。

董纪伟： 大模型与智能体的应用，举例来说，核心是能否解决精准风控或价值分层的问题。例如，近期助贷利率新规出台，导致业务结构及客群分层发生变化，下沉客群也在开展新业务。在此背景下，要考虑精准风控能否实现客群延展下的风险收敛。过去，我们的思路是将大模型和智能体融入决策链路：由小模型先做决策，通过或拒绝的案件按原链路处理，而处于“灰色地带”的部分，则利用大模型提升查准率。这一做法要求实时决策流程具备低时延和高并发能力，让大模型能够处理复杂决策，通过更多维度的数据标签或特征，让原本可疑的部分判断得更精准，无论是在信贷还是交易场景中都适用。

目前，我们基于场景在原有基础上引入多智能体联动，以更好地解决场景具体问题。智能体可分为三类：第一类是反应型智能体，即在给予充分输入后，提供固定且准确的输出。这类不涉及自主规划，但在特定场景下效率最高。第二类是目标型智能体，由目标驱动解决特定场景的问题。例如贷前的申请进件调查或体检预审，涉及准入、客群分层、反欺诈、授信评估、额度或利率设定，以及产品匹配。这类智能体可联动多个子智能体，形成“超级智能体”。在信贷场景中，从贷前欺诈识别到授信风险评估，可以与传统的小模型（如 A 卡、申请反欺诈、授信评估）配合，保持决策链路的稳定。同时，面对更多维度、多源异构的数据标签，可以借助 MCP 调用大模型和智能体能力，完成客群分析与案件研判，并落地到具体场景和成效中。第三类是学习型智能体，也就是具备大模型能力的 AI 虚拟专家。以案件调查为例，尤其在反欺诈、反洗钱等场景中，当有新案件或公安通报的新涉案形式时，可实现倒查、反查、案例查证及证据链归集。原本依赖人工和数据分析的工作，现在可由目标型智能体自主完成流程规划与编排，实现串并案分析、案件挖掘，拦截新风险的泄露点，匹配合适的产品，并挖掘与推荐新的特征、规则和模型。

在特征推荐、规则下钻或模型迭代方面，智能体和大模型也能够生成新规则和新模型。但在应用时，必须关注数据合规、流程设计，以及如何解决幻觉问题。我们的原则是：复杂的工作交给 AI，简单的留给人工。同时，可引入知识图谱或时间序列增强可解释性。在策略生成时，还需考虑与现有线上或开发环境的对接，完成语义转换，实现自动化的精细回测和对比验证，包括 A/BTest 或冠军 - 挑战者策略，并可通过灰度环境测试，利用大模型智能生成正反用例进行回测，或直接在线上完成周期性测试，最终应用环节实现热切换。

目前，智能体的终极应用方向是“超级智能体”，即多个智能体基于自主规划能力完成整个场景的端到端任务。进一步的发展也就是“学习型智能体”，它能够根据态势变化自我反馈、自我进化、自我学习，不再是静态的，而是持续演化的系统。未来，智能体的应用空间将不仅限于单一场景的单点问题，而是能处理整个链路或端到端的多任务组合。

王小东：你刚提到用大模型进行案件调查，是指自动生成案件，还是基于人生成的案件使用智能体进行替代人的具体调查？

董纪伟： 指的是案件智能生成与分析。我们需要一个“种子源”，这在模型构建中称为风险传导源。无论是宏观还是微观、单个还是集体性案件，都有驱动源，例如公安下发名单，或信贷场景中的“职业背债人”。这些风险穿透性强的问题，需要复杂分析。

处理案件的第一步，是对案件进行定性，将其作为种子源。例如，在涉及欺诈的案件中，需要倒查、反查，开展串并案分析。倒查、反查首先要从历史数据中捞取关联交易，这是取数的过程，需要明确逻辑。获得数据后，再进行案例查证、证据链归集，并提炼特征与标签。这样才能准确溯源，完成时间轴、时序及特征标签的整理。

第二步，是将个案扩展到团案，挖掘未知泄露点，阻断潜在风险。许多问题是由相似或雷同的泛化风险引发，单一线性规则无法完全解决。因此，我们基于案件进行串并案分析与查证，从个体延伸到群体，具备挖掘与关联延展能力。

第三步，是将案件特征或标签应用到新特征推荐、新规则发现及模型迭代中。最终目标是精准拦截和管控已知风险，并通过串并案和延展，横向阻断其他潜在风险。同时，需具备动态进化能力，基于现有规则和模型不断迭代与学习。这一阶段的智能体，负责策略挖掘，并与现有平台运行的系统进行对比验证、智能上线和周期性效果评估。

欧阳天雄： 关于“智能体是否是大模型落地的最后一公里”这个问题，我的结论是肯定的，智能体确实能发挥作用。以我们天域的数据模型业务为例，在底层数据特征挖掘阶段，我们会利用大模型的通用知识对用户行为进行粗粒度标注。与人工标注相比，大模型在准确率上可能略逊一筹，但在效率上至少提升 90% 以上。

在模型层面，我们会利用大模型技术，将天域积累的业务标签构建成通用的风控大模型。为有风控需求的下游客户做定制时，只需少量样本，通过类似 prompt 学习的方法，就能蒸馏出可上线的小模型。大小模型结合，可有效满足冷启动等场景的风控需求。

在智能投顾业务中，我们会采用多智能体协作，例如行情数据智能体、社交新闻智能体、基本面分析智能体等，它们各自分析、决策，并汇总形成投顾建议。

无论是大模型还是智能体，都极大提升了生产效率。但“最后一公里”是否已接近完美？我认为仍需设立“检查站”。大模型在任务定义模糊的场景中表现较好，但在垂直场景中可控性较弱，容易出现数据幻觉，因此必须进行人工检查。

王小东：你们在用大模型进行标注时，是直接采用模型结果，还是作为初筛再人工复核？会不会用多个模型一起标注？

欧阳天雄： 我们将大模型标注作为初筛，之后会与人工标注比对。标注过程是多模型协作的：第一步提取关键序列和行为，第二步由另一模型对这些信息释义并定义潜在模式，第三步进行行为归类，最终结果仍需人工复核。

王小东：大家做的项目里，哪些部分是智能体做得更好的？哪些场景还不太行？

徐小磊： 主要使用 workflow 形态的智能体。因为业务流程不能随意变更，必须严格按照既定顺序执行，自主规划型智能体在这种环境下无法应用。我们的平台上已经搭建了大量 workflow，体现了显著的效率和贡献。

适用场景包括：业务流程固定、业务规则明确、交付要求清晰。这类 workflow 智能体执行稳定，不会发散。我们将智能体分为三类：意图识别类、任务执行类、事实核查类。每完成一个子任务，就会调用事实核查类智能体对接知识库进行二次和交叉验证。例如票据识别等中后台流程，很多已由智能体在运行。

欧阳天雄： 从实操来看，大模型在开放性任务（如回答分析思路和结论）中表现良好，但在需要精确事实的任务（如 GDP 数据）中容易出现错误。关于 workflow 与自主规划的选择，应根据任务特性决定，目前我们主要还是采用 workflow 方式。

董纪伟： 对于实践性强、数据密度高的场景，在应用大模型或智能体时会相对复杂一些，并非不能用，但有一定难度。首先，不建议每次都调用底层大模型，因为算力成本难以承受；其次，大模型在决策时效上也存在问题。

也在尝试基于 Dify 的方案，并在应用超级智能体构建中间控制器，即混合型流程适配器或路由模块。关键是如何保证中间控制模块的时效性，这目前是一个棘手问题。比如使用 Dify 时，在单个节点上就可能耗费较长时间，导致无法满足实时性要求。那么，什么场景更适合应用？一般是数据稀疏且维度多的场景，例如对公风控、差异化营销或高净值客户价值挖掘等。

如今，风控已不再是最终目标，其内涵包括利率、敏感度等，更多关注精准识别客户群并进行分层。在这种情况下，我们倾向于将传统 AI 链路与大模型链路结合，通过工作流或流程编排的方式应用智能体。

问题在于，是否需要改变原有业务交互模式。尤其在风险业务中，要确保数据合规、业务连续性，避免因卡点或业务抖动而引发雪崩或被穿透的风险。因此，我们会考虑两个方向：一是提升大模型或智能体的模块化能力；二是在特定场景投入更多人力与分析挖掘能力。当前，大模型更适合处理单一场景，如案调、规则或模型挖掘，以及智能生成面向监管或运营的报告，提升 BI 能力。这些任务可以通过多任务组合或处理复杂链路的方式交由大模型或智能体完成。

归根结底，还是要回到场景应用的本质——时效性、业务决策输出，以及场景目标。最终要选择是部分应用其能力，还是构建超级 Agent 或目标型 Agent 进行研发，这都是策略上的选择。

王小东： 我们这边基本都是硬编码自己写一套流程和工作流来处理，因为很多业务（如反欺诈）对时效性要求极高，需要毫秒级决策，不可能等三四秒再返回结果，自主规划智能体耗时长有些业务并不合适。

目前智能体主要应用在投研、投顾、报告生成，以及数据处理等场景。例如进行风险分析、数据查询、洞察并生成分析报告。这些我们已有落地应用。此外，我们还研发了反欺诈智能体来进行异常感知、反欺诈决策和用户欺诈拦截，调用智能语音电话、智能视频面签、短信等工具，提示并阻断风险。

在信审环节（如授信额度和利率，通过拒绝等），我们仍处于研究阶段，目前智能体能力尚不足以直接落地。尤其是在多智能体自主规划时，若初始节点的决策有误，可能导致后续错误的级联累积。因此，这块虽然在尝试，但尚未投入生产，而在数据洞察、反欺诈、投研投顾、尽调、资料审核等智能体方面，我们已经在生产环境中使用。

金融智能体有哪些“坑”？

王小东：现在从尽调到数据洞察，从客服到风控，金融智能体越来越多。你们在做智能体项目时，觉得最大的坑是什么？

徐小磊：我们必须且只能进行私有化、本地化部署，所有数据只能流入，不能外传。这带来第一个痛点：大模型在本地化部署后性能显著下降。第二，由于必须私有化部署，软硬件必须配套，而硬件成本远高于软件。目前我们给一个业务分配的显卡资源仅有一两块，资源争夺非常激烈。第三，在智能体部署过程中，搭建工作流的并不是研发团队，而是前端业务人员。要准确、严谨地表达需求，并用严格逻辑编写提示词，非常困难。结果就是，虽然业务人员可以快速搭建流程，但实际运行效果往往不理想，与预期差距明显。

硬件和提示词问题尚可解决，但有一个目前无解的问题——大模型对运行环境的敏感程度超出我的预期。举例来说，同一台显卡服务器，如果扩展了 1GB 内存，在相同模型和提示词下，输出结果都有可能不同。这在银行的私有化部署中是极大挑战。

相比之下，传统小模型没有这种问题。无论部署在多少台 X86 服务器上，结果都一致。但大模型不同。比如我们将模型升级，或引入新的开源模型，本地化部署就会因为模型参数微调、蒸馏、升级等变化，导致所有提示词需要重新运行并适配环境。

这种软硬件及数据环境的变化，对业务人员而言难以接受。传统软件工程中，环境迭代升级对代码只需小幅调整；而在大模型环境中，业务逻辑往往需要重新调试多次，耗时耗力。

最后一个痛点是业务系统和数据接入范围。我们有几千个业务系统，数十万份、历时 30 年积累的知识库和文档资产，但目前只接入了很少一部分，对我而言价值有限。要实现 100% 接入可能需要 4~5 年，而业务又等不了那么久。这些都是我在推进过程中遇到的最大问题。

王小东：有没有考虑过通过自动化评测或模型筛选机制来减少模型基座更新带来的人工调优的工作量？毕竟有些新模型虽然参数更多、效果更好，但未必适合特定业务场景。如果能自动筛选和验证，就能减少重复劳动。

徐小磊： 目前我们有两个解决方案：第一，建立自动化评测机制。底层基座模型变更后，会自动触发调度运行并输出结果，但好坏仍需业务人员人工判断。第二，要求供应商针对平台进行大量二次开发，增加额外机制。此外，这颠覆了我十几年的软件工程认知——我们必须在生产环境中开辟独立流量进行验证与测试。因为大模型对环境极其敏感，在测试环境中调通的流程，到了生产环境往往不通。比如测试环境只有 50 个 SKU，而生产环境有 50 万个 SKU，命名规则可能完全不同，导致结果不一致。

因此，我们采取三方面措施：一是研发团队自研外围工具；二是供应商二次开发平台；三是在生产环境建立独立流量空间进行验证，以保证提示词和流程在模型升级时平稳过渡。

王小东： 现在新模型的迭代速度很快，如果每次切换都要重新调优，成本和时间消耗都很大。尤其是提示词的调整，很依赖个人功底，有人可能一天就能调出理想效果，有人可能一个月都未必达到业务要求。

董纪伟： 关于智能体的设计，有两种模式：一个智能体解决多任务，或多个智能体分别解决单任务。这没有标准答案，需要根据场景和执行效率决定。大模型与传统 AI 的执行链路存在差异，在设计链路时需要考虑是否独立分支后再通过决策矩阵融合，或直接综合决策。

从成本角度看，没有必要每次都调用大模型的完整链路。更合理的做法是利用蒸馏或预训练，并结合专家知识体系进行微调，将其作为流程中的节点，这样可以有效控制激活 Token 的数量和使用成本。当前一个难点是大模型对环境和语料库的敏感性，虽然 MCP 提供了记忆缓存功能，但大模型是动态的，我们还缺乏解决“长时间记忆”的有效方法，即在环境或数据变化时，依然能找到全时序上的最优解。

如果未来的超级智能体能解决长时间记忆问题，既避免幻觉，又克服时空错位导致的决策失效，那将是重大突破。但在此之前，不应盲目将大模型智能体视为唯一方案。很多场景中，传统 AI（如知识图谱、LightGBM 等）已能解决 95% 的问题，若仅为剩余 5% 而引入大模型，可能得不偿失。技术选择应因时制宜、因场景而定，才能实现最佳效果。

王小东： 智能体分为基于工作流的和自主规划的，自主规划的智能体适合哪种流程不固定的，需要泛化的场景，金融业务对流程和可靠性要求较高，目前基于工作流的智能体应用较多，自主规划的效果不好，坑存在一定问题，目前应用较少。

展望未来

王小东：面向未来看一看：你们觉得在金融场景里，哪类 AI 能力最值得布局？

欧阳天雄： 现阶段的风控仍是一件非常严肃的事情，它本质上是人与人之间的真实金融活动，不同业务场景下的风控差异很大。目前我们更多是将 AI、大模型和智能体定位为提效工具，而不是直接承担风控业务分析的角色。

对于 AI 在金融领域的发展，我们有两个期待：第一，希望未来能出现具备动态攻防能力的智能体。随着 AI 应用加速，很多黑产团队已经利用大模型发起攻击，例如通过 DeepSeek 伪造 IP 池并快速实施攻击。这类攻击变化快、成本低。作为防守方，我们需要能够在动态攻击下实时调整策略，形成动态防护能力，而不仅仅是依靠策略运营专家调整规则。第二，希望能形成整合全行业风控能力的智能体联盟。当前，各家风控厂商都基于自身数据开发智能体模型，但由于合规和数据壁垒，数据无法互通。未来，能否像 MCP 协议一样建立统一的数据交互平台，使各家基于自身优势数据构建的智能体共同组成行业联盟？这样，每个智能体都可成为高级风险研判官，面对攻击方时，不再是单个厂商作战，而是全行业的防御力量。

目前，我们在调度智能体解决问题时，可以通过 MCP 或工具链，结合不同智能体的优势进行选择。对风控而言，各家数据和能力各有长处，而风控需求是全行业的共同需求，也是国家倡导的方向。如果能建立联盟，让参与方都能从中获益，将是一个很好的范式。

董纪伟： 第一，模型的核心仍在于数据，包括数据安全和语料内容。无论是智能体、大模型，还是传统 AI，传统 AI 的红利依然存在，并未因大模型出现而消失，应考虑如何在特定场景中结合传统 AI 与大模型的优势。第二，针对金融领域，存、贷、汇三大业务的风险决策本身就是动态攻防的过程，涉及风险挖掘和客群分层。除了避免幻觉，还需关注伦理、公平、公正与透明。AI 应该应用于正向价值，而不是被黑灰产或反催收联盟等用于利用业务漏洞谋利。第三，需要建立通用大模型与垂直领域之间的协作机制。目前无论是数据、算力还是算法，都缺乏类似 MCP 这样的行业协议或协同机制。行业应讨论并制定共识、指南或操作规范。

徐小磊： 第一是合规，如果合规层面不接入大模型或智能体，所有应用都无法落地。目前在对客服务上，如果没有合规的智能体，对客应用就无法推进，这是最大的瓶颈。第二是数据质量，大模型与智能体对数据有特别的要求，数据治理的工作量巨大，质量直接影响输出结果。第三是算力，目前我们在做垂直应用时，任务分配要按显卡资源来划分，十分紧张。硬件投入不到位，就看不到指数级的性能提升，这是一个矛盾。希望未来能通过开源小参数模型，在端侧运行，实现新的突破。

王小东： 在金融场景中，可以考虑布局机器人、具身智能与金融结合的方向，例如养老金融、营业厅服务等。我看到工行已在营业厅引入机器人，担任类似大堂经理的角色，与客户互动或进行展览讲解。未来，机器人也可替代固定出票机、叫号机等，通过对话完成出票、排队，叫号等。此外，具身智能（感知、行动、决策）如果能在银行信贷手机应用端植入，将会更好的提升用户体验，更好的防控风险，将有广泛应用。

创作场景

金融智能体真的是大模型落地“最后一公里”？

现在做 AI 项目，第一反应都在想什么？

智能体是“大模型落地的最后一公里”吗？

金融智能体有哪些“坑”？

展望未来