写点什么

融合风控知识的大模型体系建设与应用实践

  • 2025-11-20
    北京
  • 本文字数:7355 字

    阅读完需:约 24 分钟

融合风控知识的大模型体系建设与应用实践

近几年来国内消费信贷规模快速上升,信贷市场趋于饱和。金融机构的自营业务获客从拉新转变为存量挖掘模式。为了提升“中间客群”的获客和风险效率,“测试 + 敏捷迭代”的运营策略逐渐成为现阶段业务发展的新趋势。


在 AICon 全球人工智能开发与应用大会·深圳站,腾讯算法专家欧阳天雄分享了主题演讲《大模型驱动下的智能风控落地实践》,介绍如何基于大模型技术,融合海量风控知识,解决传统风控模型在小样本 / 零样本场景下的建模难题。同时介绍腾讯天御金融风控大模型构建、预训练、微调的核心实现算法技术、工程实践方案以及相关行业落地案例。希望为传统的金融风控提供新的大模型思路。


12 月 19~20 日的 AICon 北京站将锚定行业前沿,聚焦大模型训练与推理、AI Agent、研发新范式与组织革新,邀您共同深入探讨:如何构建起可信赖、可规模化、可商业化的 Agentic 操作系统,让 AI 真正成为企业降本增效、突破增长天花板的核心引擎。

详细日程见:

https://aicon.infoq.cn/202512/beijing/schedule


以下是演讲实录(经 InfoQ 进行不改变原意的编辑整理)。


面向各位金融机构合作方,我将以乙方技术视角,聚焦金融风控模型的建模方法,并就大模型方向进行探讨。本次分享分为四部分:首先简要介绍金融风控的业务背景及主要挑战;其次说明腾讯天御如何将沉淀的风控知识用于从零训练大模型,并基于该模型为客户建模的范式;然后是展示真实客户落地案例及关键技术要点;最后是总结与展望。

金融风控的业务背景及主要挑战


首先,概述当前风控业务面临的核心挑战。腾讯天御主要服务于银行、消费金融、互联网金融等机构,在信贷审批环节提供 SaaS 化的业务风控服务。金融场景中的信用风险与欺诈风险 均在我们的风险覆盖范围内。下图右侧从客户视角展示了风控业务链条:金融机构首先通过线上渠道或第三方流量合作获取潜在客户;由于不可能对所有人授信或提额,需整合外部服务商的数据能力,进行实时风险决策。



天御在该环节为客户提供贷前、贷中、贷后的全旅程风险服务。当前互联网信贷面临的主要问题包括:随着业务扩张,行业已进入瓶颈期,新客资源日益稀缺,整体转向存量挖掘;同时新客获客成本持续上升。金融机构因此更加侧重存量用户的挖掘与运营,这意味着需要对客户进行多次触达,如何在保障客户体验的同时提升风控效率成为关键挑战。


存量挖掘要求“测试—反馈—迭代”的动态过程:先在小样本、细分客群开展试点测试,依据结果及时调整策略;再结合业务反馈持续优化。当运营与风险的客效比达到最优后,再稳步放量,并在不同业务中保持精细化运营。


“测试—快速迭代”的策略虽有助于业务扩展,但也对风控厂商提出了动态治理方面的挑战。存量挖掘意味着需逐步从低风险客群渗透至高风险区域。在此阶段,风控业务主要面临两方面问题:首先,业务场景快速、动态拓展,导致客群结构持续变化;其次,客群风险随业务阶段而变化,风险定义本身具有动态性与一定模糊性。


在客群与风险定义因客户而异的前提下,我们面向成百上千家机构,不同客户的客群与风险特征差异显著,建模难度随之上升。具体到建模层面,矛盾集中在两点:其一,高效快速迭代的需求与传统定制化建模效率偏低的现实不相匹配。传统流程从客户提供样本、模型训练、评估到上线往往需两三个月,难以跟上业务变化节奏。其二,小样本建模问题突出:在快速迭代过程中,可积累样本有限,如何在小样本条件下完成有效建模成为关键挑战。


传统应对方案通常与前端业务脱节。建模侧多基于需求池逐项受理,采取“case by case”方式,从内部“知识库”(历史样本、特征、模型等)中调用可复用要素,尝试引入数据先验以提升建模效率与效果。


传统方案存在三方面突出不足:首先,过度依赖业务规则与业务洞察,而这恰是建模人员相对欠缺的能力;其次,迁移效率低,只能逐案(case by case)分析;最后,逐案迁移往往仅能利用部分数据与方法,难以显著提升模型整体效果。


基于上述客观需求与建模痛点,自 2022 年起我们开始系统思考:作为具备十余年风控经验的服务商,天御已积累海量数据与技术能力。一方面在迁移学习、元学习等方法上有技术储备;更重要的是,在业务开展中沉淀了三类关键“知识要素”:例如面向底层用户维度的丰富行为数据、覆盖多种风险场景的标签样本、在客户服务中沉淀的存量运营 / 运维模型等。如何将上述三类知识要素融入大模型设计,依托大模型作为载体训练出通用基座,并将其用于真实建模场景呢?

天御的大模型智能风控体系


天御的基本观点是:大模型本质是一种方法论,复杂多样的模型结构只是实现载体。只要能够充分利用垂直场景知识完成训练,即可构成面向该场景的大模型。


在正式介绍金融风控大模型之前,先作一项澄清:大众语境中的“大模型”多指通识层面的生成式 AI 模型,而此处的“风控大模型”并非同类。右图所示更强调一种训练范式:以风控知识为核心进行训练;在使用端,将客户的小样本视作“prompt”,以此适配满足其建模需求的模型。



在整体体系上,天御的智能风控以自研风控大模型与“混元”大模型基座为基础,结合数据—模型—应用各阶段特点进行差异化应用,例如数据挖掘阶段:利用大模型进行底层特征挖掘与数据分析;在应用阶段:支持如智能投顾、验证码等项目。


面向客户交付的建模,我们更侧重金融风控大模型。相比语言类大模型易受效率与“幻觉”影响,风控大模型结合天御覆盖的事前 / 事中 / 事后全链路,以及从流量反欺诈、支付反欺诈到金融反欺诈的多类模型实践,能够在各类场景中以统一底座快速适配。


天御金融风控大模型的核心设计理念,概括为两点:一是融合风控“全要素”知识;二是据此构建风控大模型。


对“全要素”知识的定义包括:


  • 特征:涵盖欺诈、黑产等相关的底层用 户数据;

  • 样本:同时沉淀有标签与无标签样本——前者覆盖多类泛风险场景,后者来自客户线上调用形成的客群数据;

  • 模型:作为对市场进行“360°风险感知”的触角,通过外延式“探头”将各类风险知识纳入体系。


在构建过程中,借鉴通用语言大模型的方法论:采用 Transformer 架构,将上述全要素知识转化为训练样本,先进行预训练,再进行微调。对客户侧而言,仅需提供小样本,即可通过 prompt learning 完成对下游定制模型的增强建模。


与业内常见的 Gradient Boost、LR、DNN 等传统方案相比,本方案具有三点优势:首先规模更大,参数量级上亿,学习与记忆能力更强,能覆盖更丰富的风险模式;其次方案是全知识驱动,架构可完整纳入沉淀知识,充分利用底层数据;最后是低门槛适配:有效支撑小样本建模需求。


此外,2024 年我们与合作部门及头部风控厂商共同讨论,并制定了金融风控大模型的构建标准,从数据、模型、场景三方面给出细化指引:


  • 数据准备:识别有用数据、分层管理、融合多源数据、构建高质量训练集;

  • 模型构建:结构设计、训练流程与基座模型评价指标;

  • 模型应用:满足线上推理需求,适配差异化业务,并产出对齐大模型能力的小模型。



天御金融风控大模型如何实现的呢?我们采用基于 Transformer + MoE 的判别式风控大模型。与生成式模型相比,判别式模型无论输入何种情形,均能给出精确、一致的风险判断,避免生成式模型可能带来的不确定性。


从整体逻辑上看,我们的风控大模型主要由四个部分组成:底层多源输入 → Embedding 表征 → 风险特征感知模块 → Risk Adapter(风险适配)。 在底层多元输入上,我们采用“场景 × 个体 × 行为”的多维感知:先将多源输入统一映射为 Embedding,再由上层的 风险特征感知 抽取关键风险因子,最后通过 Risk Adapter 完成面向具体业务场景的风险适配。


与传统仅依赖标准化的结构化或非结构化特征相比,我们额外引入了客群的场景级描述。例如:该客群处于放贷链路的哪个环节、大致的利率水平、这批样本整体的资质与风险水平等。同时,我们也保留样本级描述信息,如进店(或访问)的时间、ID 等标识信息。


在 Embedding 阶段,针对金融数据的高维稀疏与缺失特性,进行相应处理与多变量拼接,并统一离散编码;为对齐不同模态,增加语义对齐步骤,最终将样本序列化为 token 序列。


从输入形态看,我们的设计与常规语言大模型类似:输入是一串 Token,但这些 Token 之间蕴含多模态信息。所有 Token 先经过统一的 Embedding 模块进行编码,转换为数字化向量;在此之上,进入多层 Transformer Encoder 的标准结构完成表征学习。在最后,我们引入 Risk Adapter(风险适配) 模块。这里我们将样本组织为两类“场景专家”:通用型场景专家垂直场景专家。可直观地理解为:每份样本都能匹配到某些更擅长处理该类风险的专家。


样本级风险预测上,我们希望通过多专家协同(如专家投票 / 集成)的方式,汇聚各类场景专家的判断,最大化组合其风控能力,最终为客户输出稳定、可解释、排序效果优秀的风险评分 / 排序结果


我们的训练流程依据底层输入数据的差异划分为五个阶段:先进行无监督预训练,使用无标签样本,并辅以特征恢复、样本记忆等辅助任务,夯实基础表征;随后开展半监督预训练,在弱标签样本上结合模型库生成伪标签,用于对比学习与风险排序,增强区分度与排序能力;接着进行有监督训练,引入有标签样本,采用多目标学习,并加入“扰动预测”等辅助信号,提升多目标下的综合表现;在 MoE 训练中,汇集泛风险场景样本,先做分层与抽象概念划分,再端到端训练多个专家头,使专家在不同场景与抽象层面形成专长;最后利用业务场景的强监督样本微调 Router 机制,以便在不同场景与通用模型之间进行差异化组合,最大化聚合各类风险能力并产出更优的风险排序结果。


最终模型规模约 1 亿参数,入模特征约 3,000 个(输入维度为数千级),训练资源为 32 张 H20 加速卡,整体约 8,000 卡时完成训练。



前面介绍了基座模型的训练流程。实际对客使用时,线上效率是关键,因此需要将大模型压缩为可部署的小模型,解决大小模型协同的问题。


我们的方案是:先上传样本,经由训练完成的风控大模型处理;基于知识库进行检索增强;再据此对基座模型进行微调。微调后的基座模型利用自身的风险识别能力为这一批样本生成质量最优的风险排序标签;在标签约束下进行多专家投票的联合蒸馏,最终产出面向线上交付的小模型,作为实际部署版本。


在此过程中有两个需要重点介绍的部分:一是小样本场景,二是无标签样本场景。对于小样本场景,我们会利用已有的部分有标签样本数据,并结合增强样本,对整个大模型基座进行微调。在这一过程中,会采用 Top-K 专家模型的激活策略,将这些专家模型的输出作为蒸馏的输入。对于无标签样本的场景,我们会在预训练阶段预留专门用于处理通用风险判别的专家头,在蒸馏时选择这些专家头进行特定的蒸馏适配。



这里简要概括下训练过程中的关键技术要点。多源输入阶段面临特征异构、特征稳定性与特征稀疏等问题,我们采用自适应分词,以及针对连续值的无损向量化编码算法,并引入“水位 embedding”以提升底层输入特征的稳定性。


在模型训练上,重点在于结构设计:整体为“encoding + adapting”的两级架构。生产训练与部署采取解耦方式:对客线上仅部署 adapting 模块,encoding 模块通过“大盘回跑”离线计算并产出表征,线上侧以离线结果作为输入完成后续风险适配。


关于如何联合无监督样本、模型库与有标签样本进行训练,我们按照前述多阶段策略推进;为实现风险场景的全覆盖,引入样本分层、动态专家生成、MoE 样本均衡以及专家投票与路由等算法;在训练效率与稳定性方面采用参数平滑与辅助 loss 优化;在模型适配方面结合 prompt 信息融合与场景适配算法。


在模型迭代方面,我们围绕场景动态性开展了模型动态更新、模型迁移与增量训练等分布对齐算法,确保模型在分布变化下持续自适应。整体效果表现为:模型稳定性优异,甚至较部分原生特征更为稳定;跨域 / 跨时段的 PSI 指标稳定在 0.00x 量级(小数点后三位)。同时,训练流程高效、上线部署灵活;


更重要的是,在实际陪跑中,这套体系对业务带来了可量化的提升。首先,底层输入维度更加丰富,能够更全面地刻画场景与人群差异,从而提升风险识别的覆盖度与分辨率。其次,在基座训练阶段充分利用沉淀知识,将领域经验与历史数据转化为显性先验,实质性增强了模型对复杂风险模式的感知与迁移能力。再次,基于 MoE 的设计实现了对全场景的覆盖,尤其在小样本场景下表现突出,实测在部分场景可带来 20% 以上的效果提升。


同时,整体架构具备快速迭代的能力:当市场发生变化时,可基于最新样本迅速完成更新与上线,以较小的工程改动实现模型的持续适配,形成面向业务的动态防御机制。除了常规的、基于“天御”大模型能力的业务变现之外,今年我们也联合若干合作部门,推进了跨机构的多元大模型联合共建。与传统的“子分融合”方案相比,这一模式首先在数据层面实现了更深层次的融合与增益;


其次在合作机制上更为紧密,从标准到流程到评估体系形成闭环;再次在效果层面,相较单体方案,联合共建在风险控制指标上显示出显著提升。


面向未来,我们希望以大模型的标准化与可对接能力为基础,吸引更多风控厂商参与联合共建,逐步形成行业层面的协作网络与能力共享,推动风控行业迈向以 MCP 为核心的新格局。

风控大模型的落地实践


最后是风控大模型的落地实践。简要说明我们的大模型如何对客使用,并给出两个实际案例。


首先,依托大模型的 MaaS 实践方案,我们覆盖约 80% 的客户定制建模需求。该方案基于云原生技术,采用 B/S 多租户架构,可同时服务银行、金科、消金、互贷等不同类型客户。为客户开通账号后,即可通过平台上传样本,并与我们的建模能力进行融合。系统以统一标准接入不同数据源,支持一键数据回溯与模型部署,使用户专注于数据分析与模型训练。


平台已集成“天域”风控大模型的建模能力,并在 MaaS 上构建了“风控大模型集市”的概念:除单元大模型外,也包含多元大模型;各家数据源如符合统一标准,均可上云部署,客户在训练时可获得更为差异化的选择,以适配各自的业务需求。



其次,针对样本“不可出域”的场景,我们提供在数据留域条件下可携带的大模型建模方案。该场景的核心痛点在于样本不能出域以及客户资源受限(部分合作机构的机器配置有限)。


我们的解决思路基于分离部署:将大模型推理中计算最重的部分预先在天御侧完成;到客户侧仅进行部分推理,并结合 LoRA 与“部分专家头激活”等技术,尽量降低客户侧计算压力,使其在现有硬件条件下可用。验证结果显示:在 5 万样本规模、16 核 CPU 环境下,约 3.3 小时即可完成微调,效果与 GPU 训练基本一致,建模近乎无损。



我们最后汇报的是风控大模型在业务落地的两个案例。风控大模型并不是最近才推出。我们在 2023 年启动,2024 年就有了第一个版本。从内部推送上线到对客使用,我们持续陪跑约一年半。截至目前,累计交付客户 40 多家;基于大模型方案建模并上线的模型约 50+;通过大模型方案建模的模型日均调用量约 140 万次。


案例一:某头部互金的“回捞模型”


“回捞”场景是指:在前置拦截(前塞)模型已拒绝的样本中,再新建一个模型,从这批被拒样本里捞出优质用户。难点在于:前序模型已经难以区分,而且底层数据能力并不支持显著提升。我们的做法是提供风控大模型方案:该方案的效果提升并不依赖新增的底层数据,而是来自模型层面的能力(例如对不同阶段流量的利用,如贷前与贷后流量的差异),从模型的建模方式与结构层面带来改进。最终效果:相较传统模型,总体效果提升约 12%;对头部优质用户的回捞 lift 提升约 20%。


案例二:某商业银行的冷启动“零样本”建模


该项目为冷启动的零样本建模任务。传统方案在零样本 / 无标签场景下较难落地。我们基于前述风控大模型,对无标签场景进行了专有适配,并将大模型基座中沉淀的风险先验知识迁移至客户业务场景。相比传统模型,整体效果提升约 16%


此外,传统的标准化定制建模主要在客户自身的建模样本上进行拟合,一旦客群或业务场景发生变化,其泛化能力往往不足,模型效果容易衰减。相比之下,我们的风控大模型基于海量数据完成预训练,保留了基座模型的原生能力,因此在面临客群迁移或场景变化时,仍能保持较为稳定的泛化表现。

总结与展望



我们将多年沉淀的风控知识系统化地注入大模型,打造出一个以风控效果为核心、能够覆盖全特征与全数据要素流通的基座系统。这个基座支持针对全特征、全样本、全模型的预训练,从而为不同业务线与不同环节的风险治理提供稳定的底座。


与传统方案相比,它显著降低了建模门槛,既能在小样本条件下给出可靠结果,也能在零样本场景里快速建立可用模型。同时,我们把整体流程做成了标准化的算法链路,尽可能减少以往那种需要建模人员 case by case 分析所消耗的大量时间与精力。在实际应用中,这一方案在跨风险场景的迁移中表现出较强的泛化能力与对抗能力,依托“数据—模型—场景”的三层架构,可以较好地支撑当前持续动态演化的风险治理体系。


展望未来,按照我们目前的了解,以这种路径推进落地的团队仍然很少。我们希望更多同行加入,共同构建一个开放的社区。在知识与数据侧,我们会持续把更完整、更体系化的风险知识纳入模型,并尝试将更广泛的用户行为序列真正以“序列”的方式注入,例如覆盖一年到两年的多维长序列数据,进一步丰富底层数据的描述能力,使模型的输入维度可以扩展到万级量级。


在模型层面,我们也在探索更契合风控体制的、更强大的模型架构,期待在风控任务中出现类似生成式 AI 的“知识涌现”,从而带来能力的台阶式提升。与此同时,我们将积极推动更深入的跨机构协作与多方数据源的联合共建,力争在行业层面改变目前风控建模的格局与生态。


对于生成式 AI,我们抱有明确期待:一方面通过更强的技术路线缓解“幻觉”问题并提升决策精确性,另一方面在工程上逐步构建面向风控智能体的 MCP 协议。理想状态下,未来的风控流程可以由多个智能体协同完成——当一个样本进入决策链路,不同机构或不同能力侧的智能体(例如 A、B、C)能够在统一协议下进行联合作答与协同判断,最终产出更稳健、更高效的风险决策。


嘉宾介绍

欧阳天雄,腾讯算法专家硕士毕业于北京邮电大学,现任腾讯 CSIG 云与智慧产业群安全产品二部的金融风控中心大模型算法专家,负责金融风控大模型设计、研发和迭代优化,拥有丰富的金融风控业务与大模型项目经验。参与发布 IEEE 金融风控大模型国际标准,并以第一作者申请发明专利 10 项。


2025-11-20 11:002

评论

发布
暂无评论
发现更多内容

基于STM32的智能饮水机系统设计

DS小龙哥

6 月 优质更文活动

实现10倍提升!昇思MindSpore SPONGE套件助力核磁共振蛋白质动态结构解析加速

彭飞

昇思 昇思MindSpore

向量数据库的行业标准逐渐清晰!Vector DB Bench 正式开源!

Zilliz

非结构化数据 测试工具 Milvus 向量数据库 zillizcloud

2023-06-20:给定一个长度为N的数组arr,arr[i]表示宝石的价值 你在某天遇到X价值的宝石, X价值如果是所有剩余宝石价值中的最小值,你会将该宝石送人 X价值如果不是所有剩余宝石价值中的

福大大架构师每日一题

Go rust 算法、 福大大架构师每日一题

Golden Gate’s (GGX) : 通过多方计算实现跨链一体化

股市老人

商业版数据库断供风险愈发扩大,浅谈GaussDB与国内企业的应对方式

轶天下事

科创西安:秦创原·信创人才培养暨鸿蒙生态产教融合发展论坛举行

坚果

OpenHarmony 6 月 优质更文活动

用友BIP全球司库十问之大型企业如何管好资金预算?

用友BIP

全球司库

【TypeScript】TS条件类型

不叫猫先生

typescript 6 月 优质更文活动

开发者聚焦 | 不容错过的开发者新专栏就要来啦!

亚马逊云科技 (Amazon Web Services)

亚马逊云科技

透过数据看世界,打开AIGC的天窗——TE产服为AIGC新商业而来

TE智库

人工智能 openai AIGC 生成式AI

谁是远程界的天花板?2023年5款最常用的远程软件横测:ToDesk、向日葵、TeamViewer、Splashtop、AnyDesk

dvlinker

向日葵 远程软件 ToDesk TeamViewer AnyDesk

华为云GaussDB:为企业提供智能、高效、安全的数据库解决方案

轶天下事

Wallys/wifi 6 router ipq8072 enterprise wireless dual band /support wifi6e card

Cindy-wallys

IPQ8072

在AIGC魔法世界里,你是麻瓜吗?

白洞计划

AIGC

C语言编程语法—利用栈实现对后缀表达式的求解

芯动大师

C语言 6 月 优质更文活动

华为云数据库GaussDB,无惧“卡脖子”,给世界一个更优选择

轶天下事

以GaussDB举例,浅谈商业版数据库的断供风险以及国产数据库的重要性

轶天下事

MySQL一个关于derived table的bug描述与规避

GreatSQL

SUFS: 存储资源使用量预测服务

KaiwuDB

KaiwuDB 存储资源使用量预测

从辅助驾驶到自动驾驶道路还很远

数据堂

IT知识百科:什么是计算机蠕虫?

wljslmz

计算机蠕虫 6 月 优质更文活动

在AIGC魔法世界里,你是麻瓜吗?

脑极体

AI

谁是蔡崇信?|耶鲁大学QA

B Impact

第四课 设计千万级学生管理系统考试试卷存储方案

家有两宝

架构训练营

融合风控知识的大模型体系建设与应用实践_腾讯_欧阳天雄_InfoQ精选文章