10 月 23 - 25 日,QCon 上海站即将召开,9折优惠最后2天 了解详情
写点什么

金融行业用好大模型,只有“垂直”一个解

  • 2025-09-29
    北京
  • 本文字数:5358 字

    阅读完需:约 18 分钟

大小:2.73M时长:15:53
金融行业用好大模型,只有“垂直”一个解

当大模型以应用落地论英雄时,谁在裸泳显而易见。尤其在复杂业务场景下,面对千丝万缕的业务逻辑,模型能不能用和好不好用之间的界线愈发明显。金融行业作为复杂业务场景的代表,自然成了大模型们的“照妖镜”。观察那些用得好的金融大模型不难发现,它们都有一个共同点,那就是都是垂直模型。


更进一步而言,Agentic Model 垂直模型已经成为实现大模型在金融行业落地最佳价值的最优实现路径


背后的逻辑很简单。金融行业关乎到民生根本,对于准确性、可解释性以及合规性的要求都远高于其他行业,任何一个微小误差,都可能引发蝴蝶效应。显然,这不是一个通用模型就能轻松应对的。回归到技术发展脉络,当前,AI 正处于自主行动阶段,能够实现从理解意图到执行行动全流程自主处理的 Agentic Model,正为行业应用带来更多想象。


这也是为什么,在 2025 云栖大会第二天上午召开的「新模力 新点金:金融大模型技术峰会」,一早就被参会人群围得水泄不通。在通往超级人工智能 ASI 的路上,金融行业迫切需要找到足够智能化的解法,找到能够在刚性约束下解决实际问题的能力。

无法垂直化的 AI,在金融行业没有未来


回顾科技浪潮在金融行业的整体发展脉络不难发现,金融行业因其特殊性,在应用新技术时,往往比其他行业更加谨慎。这种谨慎性延续到了 AI 时代,却也成了企业焦虑的根源。


一方面,AI 技术发展的日新月异,让所有人看到了其在业务场景中带来的真实价值,金融行业同样渴求用 AI 技术为业务带来新解法。另一方面,金融行业对于准确性、可解释性以及合规性的要求从未减弱半分,仓促应用新技术很可能为业务带来不可控的风险因子。


面对 AI,金融科技一时间仿佛只有两种解法。要么从头开始预训练自己的行业模型,要么为基座模型外挂一个知识库。前者需要企业将全部知识、数据投入训练,成本高,周期长,投入产出比严重失衡;后者看似周期短,但对于后续的迭代优化要求极高,智能化程度也比较低。显然,这两种方式都不适合数据密集、技术密集、知识密集的金融行业。


转折点出现在垂直模型。阿里云智能集团公共云事业部副总裁、新金融行业总经理张翅在接受 InfoQ 采访时表示,垂直模型的逻辑是,将那些行业核心知识、能力与经验内化到模型本身,为复杂的领域场景提供确定性解法。从更务实的落地视角来看,垂直也意味着 AI 技术真正开始尊重金融行业的专业性和复杂性,更专注于业务真正需要什么,这才是 AI 在金融领域创造价值的唯一路径。


阿里云智能集团公共云事业部副总裁、新金融行业总经理张翅


在垂直模型的认知上,扎根到千行百业的云服务商们,显然敏锐得多。在前年的云栖大会上,通义千问就带着八大行业模型集体亮相,并且有三款模型是专门面向垂直业务领域的。这其中,就包括面向金融领域构建的通义点金。


市场的反应是检验垂直模型的最终标准。从数据上看,过去一年中国金融大模型市场规模突破 28 亿元,同比增长 80%,并且这种增长势头还在持续。从行业应用上看,通义也交出了一份不错的答卷:九成国有大行、政策性银行均已使用通义大模型,12 家股份制银行全部接入通义大模型, 排位前 10 的财险都在使用通义大模型,他们普遍以通义大模型家族作为主力模型,支撑 70% 以上 AI 场景。



在真实的金融业务场景中,垂直模型到底用得好不好,这次的云栖大会 - 金融大模型技术峰会,以及金融 Agent 展区,实际上已经给出了答案。


招商银行数据资产与平台研发中心总经理杜志明在《招商银行大模型体系与应用实践》主题演讲中提到,目前招行已经构建了覆盖基础设施、模型、中台到应用的四层模型体系,并将大模型技术应用到包括零售金融、对公金融、投资金融、中后台运营在内的多个业务场景中。同时,招行在 2024 就开始与通义实验室探讨合作,并与阿里云联合成立了大模型创新实验室,以推动多模态技术、数据双飞轮驱动在模型训练领域的创新方法,以及在模型安全和模型测评领域的探索。


招商银行数据资产与平台研发中心总经理杜志明


平安集团首席科学家肖京在《人工智能赋能金融业务数字化高质量发展》主题演讲中表示,目前,全集团基于 通义千问、DeepSeek 等开源模型,已部署智能体超 5 万个,覆盖大部分核心岗位 11 万员工,满足员工在不同工作场景中的应用需求,实现业务“三提两降”——提升效果、提升效率、提升用户体验、降低风险、降低成本。


目前在各领域取得显著进展:在营销领域方面,数字人及数字员工整合大模型、图像、语音、NLP 等技术,广泛应用于远程面审、培训陪练、客户服务、内容生成等场景,AI 辅助工具月活跃使用率近 50%,显著提升代理人触访率;在服务方面,全集团每年超 20 亿人次客服由 AI 完成,占比 80% 以上,并已向 30 家外部金融机构输出智能客服能力;在运营方面,车险智能化出单覆盖 1.2 亿单,超 80% 业务由 AI 端到端完成,单均耗时从过去的 5.7 分钟降低至 1.2 分钟,效率提升近 80%;而风控方面则通过 AI 挖掘多维度数据,构建数据图谱,形成从宏观、中观到微观的全维度金融风险管理体系。


平安集团首席科学家肖京


垂直模型在保险行业的核心业务环节中,同样起到了关键支撑。


中国大地保险党委委员、总裁助理刘璞在《保险行业 AI 大模型应用探索与实践》主题演讲表示,人工智能的发展进入全新加速度,伴随通用大模型(如 DeepSeek、通义千问)的广泛普及与算力成本骤降,工程创新大幅降低了微调与蒸馏门槛,使 AI 不再是巨头专属。中小企业可依托“百模千态”开放生态,以轻量化方式实现降本增效与敏捷转型。


大地保险自 2023 年启动大模型预研工作,与阿里云合作广泛,并在 2025 年 8 月联合阿里云共建了“大地 - 阿里云人工智能联合实验室”,共同探索 AI 技术在保险领域的模式创新和人才培养。在平台建设方面,大地保险携手蚂蚁数科打造 AI 中台“灵山界”,该平台集成大模型、数据、算力与开发框架,以“通用大模型 + 行业小模型”为技术路线,在 AI 底层模型方面接入 通义千问、DeepSeek,并支持本地与云端混合部署模式,构建了以感知智能、认知智能和计算智能为核心的 AI 能力体系。目前,大地保险已在多个业务场景中落地 AI 应用,并取得显著成效。以保险营销场景为例,以销售人员日常工作为主线进行智能化重构,AI 营销助手可以自动生成文案、海报;数字续保可以自动生成续保日历与报价方案,并提醒销售人员及时联系客户;数字报价员可以通过语义交互智能采集信息并生成报价,替代传统手工录入。


中国大地保险党委委员、总裁助理刘璞


在金融 Agent 展区,这些应用的实际效果更加显性化。比如,众安信科构建的 AI 保险代理人助理能高效解决信息不对称、需求匹配难、信任建立难以及效率瓶颈四大痛点;中华财险打造的保险产品智能开发助手能覆盖从条款“编写—审核—报备—配置”全生命周期管理过程;中再寿险智能理赔助手能嵌套在理赔业务系统中,大幅优化复杂的理赔流程;大智慧的金融数据 AI 助手能实现企业尽调、风险预警、舆情监测等多场景高效数据服务。


这些应用表明,AI 技术正逐步从单点工具转变为系统性能力,更深的行业 know-how、更精的数据能力、更敏捷的迭代,共同构成新的竞争壁垒。这也使得垂直模型在金融这类复杂业务场景中,正变得越来越不可替代。


但这种垂直并非简单的金融数据与通用模型的叠加,而是从底层架构到应用场景的全链路深度适配。这种深度垂直化能力,也是通义点金本次升级能够引发外界广泛关注的根因——一口气发布了五大开箱即用的垂直模型(Qwen-dianjin-fin-R1、Qwen-dianjin-fin-OCR、Qwen-dianjin-fin-Persona、Qwen-dianjin-fin-TIR、Qwen-dianjin-fin-PRM),构建了“合成 - 训练 - 评测 - 应用 - 迭代”的一站式金融垂直模型生产工场,为行业应用带来的想象空间,无疑是巨大的。显然,行业对垂直模型的价值,还是达成了共识的。

拆解通义点金:如何成为金融行业用好 AI 的一站式工场?


正如前文所言,垂直模型是将行业核心知识、能力与经验内化到模型本身。更进一步而言,只有把足够多的能力内化到模型中,AI 才能真正向前发展。


实现这种内化的关键,在于将大模型的训练方法拆解为企业可用的“模型数据飞轮”。这也是通义点金一直在坚持的技术路线。张翅在接受采访时提到,通义点金选择的是更轻量、敏捷的后训练方案。如果说基座模型决定了大模型的聪明程度,那么后训练的效果,则决定了大模型是否可用、是否好用、是否能用。


其中,一种操作方式是,通过模型蒸馏快速将通用模型的能力与企业的业务数据对齐,提升基准性能。另一种操作方式是,通过强化学习技术,将业务过程中的规则与逻辑反馈给模型,实现持续自我优化。本质上,就是将基础模型训练中的“SFT(监督微调)-RL(强化学习)- 新一轮 SFT”多轮循环,拆解为企业在解决具体问题时可灵活运用的工具。从而让企业能以更小的算力代价、更简单的工程流程,获得更准确、更智能的解决方案。



通义点金在数据飞轮能力上的升级,可以说是本次峰会《新模力·新点金》年度发布最大的一个惊喜点。毕竟要想构建垂直模型,数据是最重要的组成部分之一。


这一次,通义点金提出了 模型与业务双向持续螺旋上升的双飞轮方法论,在平台底层架构实现了两个关键数据飞轮。第一个数据飞轮专注于解决冷启动问题。 冷启动时,业务专家往往难以清晰定义复杂的业务场景与预期结果。通过结合相应数据来模拟真实业务环境,包括原有系统日志、已有智能体的数据,以及第三方数据,进行仿真和拟合,从而实现数据飞轮一。


第二个数据飞轮会引入更系统的评测工具与方法,比如,利用大模型进行交叉评测,从对抗或监管视角检验逻辑合理性,以及将业务中固有的专业校验工具集成到平台层,避免每个智能体重复调用,从而优化流程复杂度与动态编排效率。


“我们希望这个平台真正能做到以模型为核心,专注于金融能力构建的一站式金融垂直模型生产工场”,张翅表示,目前,通义点金已经在数据拟合、模型评测等关键环节取得实质性进展,开源了相关框架与模型能力,并且能够与企业已经在构建的智能体平台实现融合。


数据飞轮得以让模型实现持续迭代,但对金融行业而言,这还不够。金融行业的背后是信任、风险和监管三大支柱的刚性需求,业务本质决定了行业对于可解释性的要求极高。


为了提高模型可解释性,通义点金利用阿里云可观测链路 OpenTelemetry,以及其他可观测服务,以堆栈的形式呈现 Agent 调用过程。在构建评测集上,早期通义点金的实践集中于构建静态金融知识评测集,随着应用场景对模型的考验变得多维且动态,通义点金也在与不同的垂直细分行业领先企业深度共创,共同开发基于真实业务环境的 Agent 实战评测数据集。


本次会上,阿里云和盈米基金联合发布了理财智能体评测集。这类动态数据集的最大价值在于,它不仅能定义优劣标准,更能让模型在模拟实践中迭代,并将反馈信号精准关联至具体的决策环节,从而实现更高效、更定向的能力优化。


除了通义点金的全面升级和理财智能体评测集,这次发布会上还有几个重磅发布值得关注。一个是阿里云和盈米基金联合发布的投顾智能体模型,另一个是阿里云和国通星驿联合发布的商户经营场景识别模型。



前者依托包括通义点金在内的阿里云全栈 AI 能力构筑核心能力层,将 Al 服务范式从 WorkFIow 转向 Agentic,实现工具调用准确性与顺序一致性的提升,服务达成率大幅提升至 90% 以上,有效降低“转人工”比例。后者通过通义点金数据飞轮能力,结合场景数据与行业数据,为支付环节中的不同场景提供多样化 AI 能力,能实现秒级识别问题,等待时长减少 90%,以及同时审核数万商户,减少人工 50% 审核量。


模型层面的能力是表,其背后对应的底层基础设施以及生态支撑,才是内里。对于金融行业而言,稳定可靠的基础设施是业务连续性与客户信任的生命线,甚至能直接决定智能应用的业务价值。根据 IDC 发布的《中国金融云市场(2024 下半年)跟踪》报告,2024 年中国金融云整体市场规模达 692 亿元人民币,同比增长 11%。其中,阿里云以 18.4% 的市场份额稳居第一。并且,自 2019 年上半年起,阿里云已连续 6 年蝉联中国金融云整体市场冠军。


云基础设施的规模效应,是垂直模型在金融行业规模化落地的核心保障。生态层面的深度集成,则是业务价值打通最后一公里的加速器。


进一步而言,技术平台的能力最终必须注入企业具体的业务流程中。对于金融行业来说,这一过程最大的挑战是,复杂且封闭的软件研发环境。每家企业都有自研平台和操作规范,通用的解决方案在此往往水土不服。


因此,实现软件的智能化升级,必须解决一个核心难题:如何深度适配这些异构环境,确保无缝集成,并在测试、研发、生产等多元场景中实现高效的人机协同。数据显示,通义灵码已经服务了八成大型金融企业,已成为国内最受欢迎的辅助编程工具,并且在工商银行、平安集团等多家头部银行、保险、证券等企业成效显著。例如平安集团有超 1.5 万名研发工程师正在通过自研工具“平安爱码”进行 AI 编码,该工具引入了阿里通义灵码为其增强续写功能。AI 编码正覆盖平安集团旗下银行、保险、科技等核心业务线,部分新项目的代码 AI 生成占比超 70%。


依托阿里丰富的产业生态与底层能力,阿里云已经具备全栈金融 AI 能力,未来将向金融行业提供三种服务范式:一站式技术保障与问题解决,端到端的 AI 交付,全生命周期的持续迭代。随着未来垂直模型应用进入深水区,金融行业也将面临新的挑战,但万变不离其宗,问题的答案或许就藏在“更深度垂直化”的道路上。

2025-09-29 16:539

评论

发布
暂无评论

安全高效 | AIRIOT智慧工地管理解决方案

AIRIOT

物联网 智慧工地

一文吃透 Go 内置 RPC 原理

捉虫大师

Go RPC

3.基于Label studio的训练数据标注指南:文本分类任务

汀丶人工智能

信息抽取 数据标注 文本分类 labelstudio

解锁智能合约的力量:区块链入门教程

领创集团Advance Intelligence Group

区块链 智能合约 以太坊

2022 IoTDB Summit:国网信通谢可《Apache IoTDB 在国家电网的应用案例》

Apache IoTDB

数据库·

《数据治理行业实践白皮书》正式发布,开辟数据治理新范式(附下载)

袋鼠云数栈

数据治理

GitLab 专家分享|关于 DevSecOps ,你需要知道这几点

极狐GitLab

DevOps DevSecOps 极狐GitLab 研发运维 安全左移

请你喝一杯 Corretto?谈一谈 JDK 的新选择

亚马逊云科技 (Amazon Web Services)

Java jdk

2022 IoTDB Summit:Dr.Feinauer《Apache IoTDB 在德国汽车生产线多级数据同步中的应用实践》

Apache IoTDB

数据库·

解读场景化视频制作工具的实现过程

阿里云CloudImagine

云计算 智能生产

最佳实践 | 基于腾讯云MRCP-Server打造简单智能外呼系统

牵着蜗牛去散步

人工智能 腾讯云 腾讯 语音识别 智能外呼系统

一文读懂PaddleSpeech中英混合语音识别技术

飞桨PaddlePaddle

语音识别 百度飞桨

Spring中Autowired注解到底怎么实现的

Java spring 框架

再次飙升GitHub榜首!这份“保姆级”的SpringBoot笔记,不服不行

Java spring 微服务 Spring Boot 框架

借助阿里云 AHPA,苏打智能轻松实现降本增效

阿里巴巴云原生

阿里云 容器 云原生 AHPA

【技术干货】第1篇:有道实况OCR技术

有道技术团队

龙蜥LoongArch架构研发全揭秘,龙芯开辟龙腾计划技术合作新范式

OpenAnolis小助手

操作系统 龙蜥社区 龙腾计划 龙芯中科 LoongArch

鲁班软件使用明道云优化项目管理的全过程

明道云

跨境数据传输是日常业务中经常且至关重要的组成部分

镭速

玩好 StarRocks,大厂 offer 接不完!|字节跳动、小红书、京东物流、唯品会、腾讯音乐要的就是你!

StarRocks

数据库

2022 IoTDB Summit:中国工程院院士倪光南《发展开源教育,汇天下英才激活中国创新动能》

Apache IoTDB

数据库· ;开源

基于 eBPF 的 Serverless 多语言应用监控能力建设

阿里巴巴云原生

阿里云 Serverless 云原生

前端已死?我看未必,但「低代码」已剑指前端程序员

引迈信息

面试 Vue 前端 低代码

听说你没法在 JRE 中使用 arthas?不,你可以

阿里巴巴云原生

Java 阿里云 容器 云原生

在云原生和裸金属环境开展NFS存储性能比对测试

QE_LAB

云原生 性能测试

运维训练营第16周作业

好吃不贵

玩转Angular系列:组件间各种通信方式详解

echeverra

angular

深度访谈 Vland CTO:像乐高一样搭建元宇宙

万事ONES

元宇宙 访谈

阿里云云原生每月动态 | 聚焦实战,面向开发者的系列课程全新上线

阿里巴巴云原生

阿里云 云原生

我的sql没问题为什么还是这么慢|MySQL加锁规则

Java MySQL 数据库

从智能进化模型看用友BIP的AI平台化能力

YonBuilder低代码开发平台

金融行业用好大模型,只有“垂直”一个解_阿里巴巴_凌敏_InfoQ精选文章