【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

富滇银行:中小金融机构如何思考和实现 AIGC 应用?

  • 2023-09-11
    北京
  • 本文字数:6636 字

    阅读完需:约 22 分钟

富滇银行:中小金融机构如何思考和实现AIGC应用?

嘉宾 | 李涛 富滇银行数字金融中心副主任


大模型的出现从根本上改变了数字化转型的赛道,反之,数字化转型也成为了大模型智能化应用的基石。


为了抓住新风口下的机遇,富滇银行最近已经与技术商展开合作,针对大模型进行 POC(概念验证)相关的工作。经过基础模型和行业模型选择、场景的选择、模型的评估、部署和监控四个关键步骤,在业务、营销、运营、内部管理、科技项目研发流程等多个场景落地 AIGC 应用。


“当然,很多工作目前仍处于探索阶段。特别是在金融生产级别的应用,我们仍然有很长的路要走。”

在 InfoQ《超级连麦. 数智大脑》直播中,富滇银行数字金融中心副主任李涛深入探讨了自身对于 AIGC 在金融领域创新方面的思考,同时也分享了银行数字化发展的历程及背后的架构演进,以及智能技术在金融领域的发展现状。


以下是分享全文(经 InfoQ 进行不改变原意的编辑整理)(点击链接可查看完整直播回放):https://www.infoq.cn/video/k0QUqSaEI4Hxbb4V94hZ

银行数字化发展历程及背后的架构演进


银行的数字化发展历程可以分为四个阶段:第一个阶段是人工和手工时代;


第二个阶段是信息化时代,它主要解决了流程性问题。在这个阶段,数据是软件系统的附属产物,对数据的重视程度较低,流程、业务和合规是该阶段的中心。


第三个是数字化时代,数据成为了生产的重要组成部分,流程和软件系统是该时代的核心工具。该时代的特点是以业务价值为中心,驱动数字化进程的发展。


第四个阶段称为数智化时代。这个时代伴随着大型语言模型如 ChatGPT 的出现,为银行业带来了全新的机遇。数智化时代的主要特征是以用户价值为核心,真正将数字化进程融入业务中。这标志着数字化发展进程的新篇章。


在这个过程中,银行的 IT 架构持续演进,相对应地也分为四个阶段。

第一个阶段是单体式架构,以核心系统为代表,逐步过渡到第二阶段,即分布式云优先架构。此时,“云优先”的理念逐渐崭露,尽管中小型银行对云服务的适用性存在疑虑,但也在为将来的数字化和云端部署做准备。这一阶段持续时间较长,也是银行同质化问题最为严重的阶段,的特点是以产品为中心,衍生出产品即服务的商业模式。


到了第三阶段,基于私有云的大数据架构成为主流。中小型银行借鉴大型银行的经验,进行架构的迭代升级,特点是计算和服务的重要性逐渐凸显。


最终,进入第四个阶段,以大型模型在特定领域的深度应用为核心。银行不得不走出自身的舒适区和生态圈。在这个时代,涌现出私有 AI、混合 AI 和混合云的模式,成为智能在线的时代。

富滇银行的一体两翼双态架构


如下图,当前,中小型银行数字化转型呈现出一体两翼、双态的特征,“一体”代表着信息化和数字化的双重状态,而“双态”则体现了稳态和敏态。



在稳态方面,我们专注于解决金融产品全面支持能力的问题。同时,致力于提升银行的信息化水平,取代手工操作,从而将更多人力资源释放到营销领域,减少操作风险。同时,我们也要确保适应监管合规的要求。这一阶段的关注点主要是确保银行的生存。


而在敏态方面,我们着眼于解决银行的持续发展问题。通过数字化手段,以用户为中心,对银行业务价值、流程和组织架构进行重塑和变革。



基于这一战略,富滇银行构建了一体式架构,上图展示了我们的双态架构。在架构的右边,我们有 ESB 作为稳态,建立在核心为中心的信息化系统上,用于流程传导;在内联网关的左边作为敏态,采用薄前台、厚中台和敏后台的一体式架构应用。


在这个架构中,业务中台、数据中台和 AI 中台三大中台能力支持全面数字化的应用。然而,大模型的出现彻底改变了 AI 中台在三大中台中的角色。目前,根据我们的战略规划,AI 中台的地位可能会超越其他两个。

智能技术在金融领域发展历程和现状


关于智能技术在金融领域发展的历程,同样也经历了四个阶段。


第一个阶段是手工阶段,靠面对面沟通和手工查账。


第二阶段是表格检索和呼叫中心阶段,这个阶段从 1996 年开始,引入了人工坐席和移动互联网业务,但智能化程度相对较低,主要依赖经验和简单的在线查询服务。


第三阶段人工智能阶段,从 2012 年开始至今。在这个阶段中,出现了智能客服、数据营销、外呼机器人等应用。这些能力主要基于 NLP(自然语言处理)和语音识别等核心算法,但大部分还是以人工配规则的方式实现,形成了所谓的规则型智能。


目前,我们处在第三到第四阶段的转变过程中。2022 年,大模型的出现以及基于多模态和上下文理解的生成式人工智能的兴起,将银行的智能化发展推向了另一个层面。可以说,去年,我们还在研究如何更好地利用 NLP 技术为行内外用户提供服务,而今年,我们提到的各种数字人、NLP 等技术都成为了大模型上层应用的工具,这标志着发展的新趋势。


  • 智能客服


在金融行业的现状中,特别是在中小银行领域,智能化的发展趋势相似。这张图展示了一个典型情况,左边是常见的问答式机器人,也就是智能客服,右边是一些银行引入的数字人。基于这两种能力,我们通过以下五种方式提供智能化服务。


  1. FAQ 问答:这种能力提供了常见知识类查询的服务。

  2. 任务式问答:它支持多轮对话,能够处理复杂的条件和集成服务参数。

  3. 表格问答:基于数据和表格的问答,可以处理条件和数据查询。

  4. 知识图谱问答:这种能力可以应对多跳逻辑和推理性问题。

  5. 文档问答:通过机器对文档的阅读和检索,实现文档相关的查询。


通过这五种方式以及智能间距,再加上一些自动化工具,我们构建了现在智能客服的智慧水平,同时也涵盖了数字人和智能员工的应用。


  • 机器人矩阵


另一个领域涉及到一些银行正在研究的多机器人矩阵。通过整合 PRA 和 NLP 等技术,构建了一个机器人矩阵,在矩阵中,包括了智能客服机器人、智能管理机器人、智能稽核机器人、智能外呼机器人以及智能助手机器人等,可以提升客户服务和内部效率的标准能力。


  • 规则型智能


上面这幅图展示了我们目前基于规则型的智能化设置,以贷款外呼为例:在图中,我们可以看到贷款外呼的情况被分成多个条件,每个条件又有不同的分支。通过数据回流模型的训练和不断的迭代,我们基于这些分支形成了目前的基础规则,支撑了基于规则的人工智能能力。

AIGC 在金融领域的创新思考


通用大语言模型的出现从根本上改变了数字化转型的赛道。也可以说,数字化转型成为了大模型智能化应用的基石。

AIGC 在金融领域的应用模式



近期,我们也计划与一些厂商合作,进行一些 POC(概念验证)方面的工作。上图展示了我们根据现有情况所判断出的应用模式。从客户端的角度来看,用户会提出问题,然后生成式智能会负责回答这些问题。从应用的角度来看(图右侧),通用大语言模型会负责进行海量知识的训练,也就是注入基础知识。


在图中的金融行业数据连接这一部分,我们训练出了金融行业的模型,也就是所谓的垂直领域行业模型。在这个垂直领域行业模型上,我们将银行内部的数据连接起来,进行场景模型的训练。


其中这三个环代表了三种模型,从通用模型到行业模型再到专业模型。然后我们通过提示工程,包括指令微调、监督微调和人类反馈强化学习等方法,不断提升生成文本的质量。这个提示工程包括 FTF、SFT 和 RLHF,用来提高生成文本的质量,从而更好地为客户提供服务。


在这个过程中,微调技术能够针对特定业务场景的要求,优化模型的回答生成能力,使生成的回答更加准确、流畅和相关。


通过微调,模型能够更好地理解输入对话的上下文信息,捕捉到对话中的语义和逻辑关系,从而生成更具连贯性和相关性的回答。这使得模型在各种自然语言处理任务中表现出更高的性能,如问答系统、客服机器人、智能对话系统等。

AIGC 在金融领域落地步骤


在将 AIGC 应用于金融领域的落地过程中,我们考虑了以下四个关键步骤。


第一步是选择基础模型和行业模型。对于中小银行和金融机构来说,自行训练大型模型(如 Meta 或清华的 GLM)成本非常高昂。因此,我们更倾向于选择国内通用模型,如通义、盘古、混元、文心等,在其基础上对金融行业进行训练,形成垂直领域模型。


第二步是根据银行的客户服务场景选择适当的场景。在选择场景后,我们会将银行相关的知识嵌入到模型中,并进行微调。通过不断的提示工程微调、训练等手段,提升模型回答的准确性。


第三步是模型的评估。评估主要包括通用模型、垂直行业模型以及产品模型的性能评估。同时,进行 AB 测试以及模型回答的质量评估也是必不可少的,因为通过持续的训练,模型回答才能更好地适应实际业务需求。


第四步是部署和监控。对于银行来说,模型一定要进行私有化部署,确保敏感信息不泄露。此外,对于生成式学习模型,我们还需要进行答案价值的监控,因为模型可能根据我们的要求生成答案,但其价值和准确性需要实时监测。

AIGC 在金融领域的应用发展地



在讲述了方向性内容后,我将更具体地说明我们银行在这一领域的实际应用思路。在业务层面上,我们认为在客服、培训和稽核等方面,可以有许多落地的应用,特别是对数字员工的支持。这主要体现在以下几个方面:


首先是智能辅助,既包括人工员工,也包括数字员工。在业务推荐前端、用户风险识别等场景,都可以由 AIGC 来完成。智能客服可以进行对话总结,将对话要点提炼出来,并且在这之后可以通过提供优质的对话样本来不断投喂、训练,使数字员工的回答更贴近人类,更能理解用户的情感和真实意图。此外,还包括质检、抽样质检和执行质检等。


对于业务推荐,用户风险识别等,AIGC 可以提供准确的指导,为客户提供更好的服务体验。通过不断的训练和优化,数字员工的回答可以更加自然地与用户交流,并更好地满足用户需求。


最后,对于质检方面,AIGC 可以帮助自动检测和校验员工的回答是否准确,从而提高服务质量和效率。同时,通过抽样质检和执行质检,我们可以持续监测模型的性能和回答的质量,确保其与业务要求相符。


第二个层面则是实现真正的“千人 N 面”。“千人 N 面”基本上是基于规则的交互式界面,我认为这种交互式的新兴能力将会重构整个银行业的应用程序以及客户互动的方式。未来,可能在明年甚至更早,一些银行的应用程序只会包含一个数字人、一个数字员工。用户可以与其对话,讨论自己需要什么业务,而数字员工可以具体指导业务流程,协助前端填写表单,最终完成业务提交。



在营销层面,生成文案素材和话术,目前在许多金融机构中已经在应用。我想重点强调的是复杂营销活动的策划,这一过程涉及根据营销活动的目标,对目标人群进行匹配和圈选。根据不同的活动形式和渠道,生成相应的文案素材和话术。例如,在制定营销短信、推送消息,以及智能外呼方面,这些内容都可以由模型生成。根据用户的意愿和投放核销权益的情况配置权益和积分。这些实践在营销领域中具有重要意义。


在运营领域的应用主要包括运营报告和运营分析的图表。在此,要特别强调用户建模的重要性。无论是针对对话机器还是数字员工,我们都可以通过分析用户的对话回答和查询历史记录,来建立对用户兴趣和偏好的模型。这一模型可以提取用户语言特征信息和关键标签信息,从而更好地理解用户需求和兴趣,形成丰富的用户标签。


目前,我们通常将用户进行标记的任务交由团队来完成,同时也依赖一些外部数据的标记。然而,用户建模实际上也是至关重要的一部分。


内部管理涵盖了知识库的建设,会议纪要的记录,内外部制度合规审查,以确保文档是否符合监管规定。同时还包括报告的自动生成,根据提纲生成各个领域的报告,这也是我们目前正在应用和实施的内容。


此外,还涉及整个管理流程的自动化,这可以与机器人流程自动化(RPA)相结合,将各类管理流程进行自动化连接和创新。


在科技和项目研发管理的全流程中,涉及几个关键方面。首先,从产品设计角度来看,我们可以进行产品竞品分析,确定产品设计的关键要点。在这方面,我们已经在应用一些技术能力,如 ChatGPT、通义、文心等。


我们也在考虑辅助研发的代码编写,目前还需要进一步研究。在数据模型的构建、经典算法代码示例以及辅助类的创建方面,我们已经开始应用一些编码能力,这也是我们在自己研究编码过程中的一部分。


另一个关键点是平台工程,近年来这个领域变得相当热门。整个平台工程可以说从 2022 年开始逐步发展,目前的情况还需要持续观察。从我们的角度来看,我们可以从 SRE(Site Reliability Engineering)的角度出发,逐步改进我们科技研发过程中的痛点,这是我们在科技研发方面的一些思路。

AIGC 应用落地过程中问题与挑战


当然,在应用落地过程中还又一些关键问题必须考虑。


首先,如何选择合适的模型。对于银行业而言,选择一个经过金融领域参数训练的模型是至关重要的。目前,针对金融领域模型还没有一个统一的评价标准。不过,令人振奋的是,腾讯和信通院在 7 月 28 日开始编制了第一个行业大模型的标准,这是一个积极的信号。


模型的选择需要考虑多个维度。第一,需要确定模型是否支持中文。如果选择国内的大模型,我们要看它是否开源,是否支持微调,以及它的模型生态是否完善。最重要的是,我们需要确保模型支持私有化部署。


此外,模型的参数规模也是一个重要的考虑因素,特别是在金融领域模型中的参数规模。以阿里的通义为例,它专门训练了一个适用于金融行业的模型,该模型的参数规模大约在 7 个 B 左右。



第二个问题是,应用落地过程中普遍面临的挑战。尽管我们已经进行了许多实践并探索了应用的方法,但实际操作中,要在金融领域构建出生产级别的解决方案,尤其是在客户服务领域,仍然需要很长的路要走。


目前,我们主要采用的方法是将行业知识库和产品知识库嵌入到特定的语义模型中,然后通过微调的方式不断训练模型,包括之前提到的指令工程。在这里,我想介绍一种我们采用的微调方法 LoRA,它主要基于行业大模型的底层分支流程进行微调。


举个例子,我们可以将线上消费贷款的所有信息,包括合规信息和操作信息,导入到我们的产品模型库中。针对线上消费贷款,它可能涵盖各种类型的贷款,比如消费贷款、经营贷款等。根据不同的贷款业务规则,在相同的主干分支上,我们需要训练多个贷款产品的不同分支。在这种情况下,我们可以通过 LoRA 的方法来实现这种分支的构建。通过在主干分支上设置多个子分支,以支持对不同细分产品层面的用户问题进行回答。



第三个问题,出现在智能技术应用的第三阶段,也就是规则型智能阶段。在这个阶段,我们积累了大量的规则,涵盖了 FAQ、任务、表格、知识图谱和文档等各种类型。那么在这些基于规则的引擎和大型模型之间,如何进行结合?因为它们的底层逻辑不同,对于金融行业来说,如何做出明智的选择?目前,我们正在进行 POC 阶段,实际上也在思考这个问题。



第四个问题,正如大家所了解的,大语言模型如 ChatGPT 等都基于参数的潜在表示知识,通过概率进行推理和回答。然而,金融领域的回答需要的是准确的、结构化的阶段性过程,这与大型模型的功能有一定的差距。


关于这个问题我们进行了深入的研究,目前大家认为比较可靠的解决方法是与知识图谱相结合。在后续的 POC 阶段,我们也会纳入考虑。目前,我们已经开始进行一些企业图谱和活动图谱的结合,以实现更精准的回答。


最后,我想谈一下当前整个行业的情况。尽管过去的大半年里这个行业迅猛发展,但实际上许多领域仍处于探索阶段。特别是在金融生产级别的应用,尤其是客户服务方面,我们仍然有很长的路要走。在这个过程中,我们需要专业的知识、专业的人才和专业的技能。这些是我们将要面临的挑战。


点击链接下载本次演讲 PPT:https://www.infoq.cn/minibook/UootzcUo2C52ZsrFbKaw

嘉宾介绍:

李涛,富滇银行数字金融中心副主任,富滇银行“滇峰”计划架构设计负责人。具有 19 年金融 IT 架构和敏捷实践经验,曾任职中国工商银行软件开发中心主要从事对私、对公核心业务架构设计和敏捷实践。2015 年加入富滇银行主要担任新一代核心系统建设架构师、项目经理。富滇银行全面数字化转型“滇峰”计划项目架构和产品团队负责人,并牵头负责“滇峰”计划项目组织敏捷改进相关工作。

活动推荐

首届FCon全球金融科技大会将于 11 月 19-20 日在上海举办。大会将围绕金融领域数字化转型挑战探索、DevOps 在金融企业落地实践、金融行业大模型应用、创新的金融科技应用、金融实时数据平台建设之路、金融安全风险管控、数据要素流通与数据合规等 10+专题进行交流。


目前大会邀请了汇丰科技中国区的代理总经理马国栋、度小满金融数据智能部总经理杨青先、蚂蚁集团副总裁 & 首席技术安全官韦韬博士、恒生聚源总经理吴震操担任大会联席主席。更多嘉宾仍在邀请中......


我们诚挚地邀请您加入我们,共同探索金融科技的未来,点击链接即可查看全部演讲专题。


目前 5 折 优惠购票,仅限前 100 人,咨询购票可联系:17310043226(微信同手机号)。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-09-11 13:523107

评论

发布
暂无评论
发现更多内容

模型评估指标-1-基础篇-FPR/TPR/F1/ROC/AUC

一直学习一直爽

机器学习 模型评估 分类模型 一直学习一直爽

业务中台建设 - 4种部署模式

孝鹏

部署图 隔离性 中台架构

架构设计篇之微服务实战笔记(九)

小诚信驿站

架构师 刘晓成 小诚信驿站 28天写作

用例2

z

区块链架构下的智慧城市发展加速

CECBC

信息安全

产品经理训练营 - 作业五

胡小湖

c++基本语法详解

张鹤羽

28天写作 3月日更

谈学习

Ryan Zheng

学习方法

最值得阅读的数据仓库书籍推荐

白程序员的自习室

大数据 数据仓库 推荐书籍 数仓 构建模型

mybatis的通用插入更新方案

altantisor

Java mybatis

Java 中 Vector 和 SynchronizedList 的区别

看山

Java 线程安全 vector SynchronizedList

论文阅读:通过动态预测/完备在稀疏知识图谱上进行多跳推理

Alocasia

自然语言处理 深度学习 nlp 强化学习

诊所数字化:诊所私域直播

boshi

直播带货 数字化医疗 七日更 28天写作

SwiftUI数据流之State&Binding

kingnight_pig

ios swift SwiftUI

【LeetCode】单调数列Java题解

Albert

算法 LeetCode 28天写作 2月春节不断更

SQL Server 多表数据增量获取和发布 1

happlyfox

学习 28天写作 2月春节不断更

数字经济发展的时代特色

CECBC

数字经济

Linux入门篇 —— 一文带你彻底搞懂Linux 文件权限管理

若尘

Linux 权限 linux 文件权限控制

易语言使用与研究

慕容

易语言

dubbo 源码 v2.7 分析:SPI机制

程序员架构进阶

Java spi 七日更 28天写作 2月春节不断更

架构师训练营 4 期 第9周

引花眠

架构师训练营 4 期

作业 - 第四章 业务流程与产品文档 (二)

hao hao

程序员成长第十六篇:代码重构

石云升

程序员 28天写作 2月春节不断更

SwiftUI数据流之StateObject& ObservedObject探讨

kingnight_pig

ios swift SwiftUI

(28DW-S8-Day9) 区块链如何对坏节点容错:拜占庭将军问题

mtfelix

28天写作 拜占庭容错 拜占庭将军

我眼中的IT售前工作

小谢同学

云计算 职场 解决方案 售前

第五周作业-第四章作业(二)

Geek_72d5ab

一文搞懂Cookie、Storage、IndexedDB

执鸢者

大前端 Cookie indexedDB storage

第四章作业(二)

墨狂之逸才

“他者”德意志(三):“翻险峰”的德国电动汽车产业

脑极体

2.2 Go语言从入门到精通:Go语言变量

xcbeyond

变量声明 28天写作 Go 语言

富滇银行:中小金融机构如何思考和实现AIGC应用?_银行_李涛 富滇银行_InfoQ精选文章