北大 AI 公开课 2019 | 度小满金融副总裁许冬亮:AI 在金融科技中的应用

阅读数:4048 2019 年 5 月 14 日

人工智能已经深入到了人们的生活当中,而金融业务则是受到 AI 影响最深的行业之一,“智能金融”的概念在近几年也炒得火热。那么智能金融到底是如何影响金融领域的?它到底能为金融领域带来哪些价值?来自度小满金融副总裁许冬亮将为我们分享,AI 在金融科技中的应用。

北京大学最受欢迎的 AI 公开课“人工智能前沿与产业趋势”于 2019 年 2 月 20 日正式开课。本学期的课程邀请到了商汤科技副总裁沈徽、驭势科技 CEO 吴甘沙、微软亚洲研究院副院长周明、360 人工智能研究院院长颜水成、YC 中国创始人及 CEO、百度集团副董事长陆奇等 14 位来自产业界的大咖进行授课,AI 前线作为独家合作媒体将全程跟进并对北大这 14 场公开课进行整理,敬请关注!

image

课程导师:雷鸣, 天使投资人,百度创始七剑客之一,酷我音乐创始人,北大信科人工智能创新中心主任,2000 年获得北京大学计算机硕士学位,2005 年获得斯坦福商学院 MBA 学位。

image

特邀讲师:许冬亮,度小满金融副总裁。2005 年毕业于清华大学计算机系,三年多时间即成长为百度搜索算法领域的领军人物。曾任百度搜索主任架构师、百度 LBS 主任架构师、百度搜索技术委员会主席等。在自然语言处理、搜索算法及架构、知识图谱、LBS、智能营销及反欺诈等领域屡破难关。2016 年,许冬亮加入百度金融(度小满前身),致力于以大数据及 AI 能力为基础,打造 AI 时代的金融科技能力及风控管理能力。

北大 AI 公开课第十讲回顾《科大讯飞刘聪:人工智能的“顶天立地”之路》

以下为 AI 前线独家整理的课程内容(略有删减)

同学们大家好!很荣幸接受雷鸣老师的邀请,跟大家进行交流。同时感谢张铭老师的介绍!我很幸运,研究生选择的是自然语言处理方向,毕业以后做的是搜索,最近在做智能金融。

这一路走来,我基本上都是在与人工智能的关键技术打交道,而现在,我们看到 AI 已经成为了一个非常强有力的趋势,AI 正在和各个产业进行深度的融合,用一个时髦的话来说:AI 技术正在推动第四次工业革命,所以我们是处在非常好的一个时代。

在这里也介绍一下度小满金融,它的前身是百度金融,也是去年刚拆分出来的。因为“人工智能在金融科技中的应用”这个话题是比较大的,所以下面我会结合度小满在过去的几年当中,在金融科技层面对于 AI 的具体应用的实践,给大家分享一下这段时间的一些思考,以及我们的一些收获。

智慧金融发展概述

先用几幅图让大家感受一下时代的变迁。

image

第一张图是 80 年代的时候,我还记得那时候跟着父母亲去当地银行存款,存钱需要手工写存款的凭证,那个时候银行的柜员还要用算盘,甚至是人脑去记利率。我印象很深,当时需要站在柜台门口等很长时间,因为处理一个人的业务时间都很长。

第二张图展示的就是计算机普及以后,可以不用算盘了,因为计算机有很强的计算能力,整个效率相对之前有很大的提升,对数据计算又快又准。但是,柜台门口人的数量没有明显减少,当然也是说明人们更加富裕了,存款的人多了。

然后到了移动互联网时代,我们看到银行排队的人终于减少了,人们终于不用长时间的排队等待,为什么?因为很多线下的业务搬到了线上,不需要去大厅里面存款取款,用户在手机上就可以买卖股票,做理财,进行各种各样的金融活动。

时代的变迁里总是蕴含了科技的进步。我们可以看到,从过去到现在,可以把金融和科技的发展分为几个时段。

image

第一个时段就是算盘到计算机的时代。这个时代是建立金融的科技时代,计算机的大规模应用,大大地提升了自动化,也提升了效率;

第二个时代是从计算机到移动互联网的时代,也可以说是互联网金融时代。这个时代的金融业务从线下转移到线上,效率又比之前有很大的提升;

现在我们正在大步地迈进第三个时代,可以叫“金融科技 3.0 时代”,或者智能金融时代。迈进这个时代有很重要的基础:一方面是大数据的积累,另一方面是因为算力有了大幅的提升,导致以深度神经网络为代表的先进算法得到切实地应用。

在 2012 年,人们有一个印象很深的事件:就是在计算机视觉领域,应用了深度学习的算法,之后每一年在计算机视觉领域取得的进步都比过去的几年,甚至十年取得的进步都大。

而金融从出生开始就在和数据打交道,而且金融产品极其简单。现在的金融产品就只有几个要素,产品越简单,背后对数据、对技术的依赖越强。所以在大数据以及 AI 技术的推动下,金融已经进入到智能金融的时代。

那么在智能金融的时代下会发生很多变化,金融企业服务的客户群会比之前有更大的拓展,人们的体验也会有大幅度地提升,比如过去需要在线下做一些直接面签的事,现在在互联网上可以通过视频直接搞定。与此同时,企业运营的效果,相比过去也会有一个大的提升,因为技术的升级会使的企业的经营变得更加的快捷高效,同时运营的成本也会降低,所以智能技术在大幅地去改变我们现在的时代。

从另外角度去看,智能金融也为市场带来更加巨大的价值空间。

image

上图是 2018 年的数据,最新的数据肯定比这个更好一些。先看看信贷领域,按照当时的数据,经济活跃人口有 8 亿,其中在中央行征信有记录的人群为 4.4 亿,同时线上化率只有 10%,这是指金额的线上化率只有 10%。所以线上化的提升在未来是可以有效拓展信贷服务边界的。

理财资管领域也是一样的,大家可以看到,可提升的空间的幅度也非常大。同时在运营和客服的这个层面原本是需要万亿级的成本,如果通过智能技术是可以有希望降低 50% 以上的成本,这些都是智能技术、智能金融可以带来的巨大升级空间。

资本投资的市场上也反映了这个趋势。2018 年 VC 融资当中,金融科技领域的融资接近四百亿美金,占到当年 VC 融资的 19%,而 2014 年到 2018 年 VC 融资在金融科技领域的年复合增速是 48%,差不多是大盘的两倍。

从这些数据上大家可以看到,智能金融是现在非常值得关注的第一个优选赛道,在这个大环境下面,智能金融会给整个金融领域带来价值,并且辅助整个产业获得价值提升。

image

度小满金融继承了百度的技术基因。百度通过做搜索,沉淀了包括自然语言处理、语音识别、语义理解、图像识别,深度学习的经验,百度也是国内最早成立深度学习研究院的企业,在这个层面做了非常深度的积累,同时,百度又有非常广阔的产品线,和用户之间建立了很强的连接。在这个基础上,度小满才能够去开展智能金融的系列实践。

智能金融如何扩大服务边界

接下来跟大家分享一下,智能金融如何扩大服务边界。

先看信贷业务。信贷业务很多时候是要看征信,央行征信是非常强大的数据源,提供了很重要的信息。最早的征信依靠商人进行传播,商人有一句话叫做诚信为本,他们之间会相互传播信誉的情况。在欧洲也会有些小的一些活动,叫欢乐大篷车,其实就是在有新邻居搬过来的时候,一些人会带着东西去找新邻居一起喝茶聊天,顺便打听一下这个新邻居的经济实力、家庭情况、信誉情况等等,然后拿着信息上报给对应上级的金融机构,他们也算是最早的情报员。

image

从这些案例中大家可以看到:对用户了解的信息越多,在信贷领域对用户的判断就会越准。但是在央行征信这么强大的体系之下,我们还是可以看到有相当比例的用户属于无征信或者薄征信的。无征信的用户,由于关键信息的缺乏,很难判断他工作的稳定性以及未来的情况;薄征信的人群很多是刚刚毕业,初入职场开始工作的群体,他们的信息比较少,当然未来是有很强的发展空间的。

那么如何把这些用户服务得更好,或者扩展出更大的空间,有两个非常重要的挑战:

  • 第一,因为不了解某个用户,这个用户会不会欺骗我们,甚至是有团伙组织欺骗?

  • 第二,如何在征信处于相对比较缺乏的情况下,依托大数据对用户的风险做更好的判断?

先看第一个挑战:欺诈问题。

其实解决欺诈的传统方法有很多,比如黑名单,或者是通过集中度分析发现异常的一些攻击行为,还可以通过设备指纹,查看是否有虚假的模拟痕迹,或者观察一群人是不是有相同的行为模式,对异常行为序列进行识别等等。

今天重点介绍利用大规模的智能图计算进行反欺诈,这是在反欺诈的领域,尤其是面向群体欺诈领域非常强的利器。

通常很难通过用户个人行为去发现他的某些意向,但是如果把用户之间的关联放到一张图上去看,大家就会发现:个体身上看不出来的意向,在群体里会得到鲜明的展现。

第一张图是一个健康的机构内的用户情况,大家可以看到用户的分布、关联关系等等都相对均匀的;再比较一下第二个机构,这是存在异常欺诈的机构,像癌症图一样,有异常的连接出现在中间。所以在个体上看不出明显异常的东西,放到一个关联关系上,这种异常就会很容易的暴露出来。如果我们把很多机构放在一起,再放到一个图上,明显的异常点会看得更加清晰。

这其实就是大规模的关联网络、图计算发挥的最大价值。

第二个问题是:在欺诈过程中存在一些称之为“金融中介”的群体,而他们实际上是做了信息差的生意。有两类是金融中介服务的人:一类是缺乏了解各种信贷渠道的人,他们不知道这信息,所以需要金融中介提供服务,在中间收取服务费;另外一类是某个人的信用记录已经很差,需要中介帮他去包装、造假,欺骗对应的金融机构,而在这个过程中,“黑中介”一般要收收取 10% 到 20% 的佣金,资质差的甚至要收到 50%,这类中介是非常恶劣的。

那么基于多维度的分析,我们会捕获到类似这样的中介的信息,大家可以看一下演示图:

image

这是我们挖掘出来的一些中介的聚集点,将这些点放在百度地图上通过街景查看,我们发现这是一条街,街上的每个门面上都写的是某某金融中介,所谓的“金融中介一条街”,在全国我们也发现若干类似的街道。

第二部分我们要说一说用户信用的区分和判断。

大数据的时效性好,能够快速进行更新,同时大数据有一个非常鲜明的特点:它高维稀疏,跟过去的强精度数据不一样,因为数据量比较大,维度比较多,所以如果想要去造假欺诈它的成本是比较高的。

同时因为数据量比较大,高维稀疏,而且时效性需要很快的速度,那就对技术层面提出了各种挑战。

除此之外还有一个挑战,小样本,它的样本量相对传统的样本量数据比较小。举个例子,比如信贷领域的坏样本,一个“坏”用户,如果他的逾期金额是 5000 元,那么你要积累两万的样本,就需要付出一亿的成本,这其实是很大的代价。

从技术层面来说,AI 是可以辅助解决这些问题的。第一个是高维稀疏的问题。

image

这里有两个数据。通过 GBDT,我们对高维数据进行处理,可以看到:随着树的数量增多,区分效果也是越来越明显,当然最后会趋于收敛。这样的做法在用户的信用的风险区分能力上相对传统方法有 10% 的提升度,这是一个很显著的变化。

针对稀疏数据,embedding 的方式是比较有效的,能够把稀疏数据聚拢。也取得不错的效果。

再看一个 embedding 的例子。

image

前面我们提到的:某一个群体的用户往往会表现出相对近似的效果,比如公务员、老师,他们的信用往往会比较好,因为他们的工作很稳定,收益也很有保障,都处在一个发展期,而商务人士的信用相对比较高,IT 程序员群体的信用也会非常好。

所以我们如果把用户的高维的画像 embedding 到一个三维的空间,就可以清晰地看到,人以群分的聚集效应。

再来看一下小样本问题。

image

不像搜索、广告、推荐,动辄拥有亿级的样本,而金融的训练样本,尤其是信贷的训练样本没有那么多,数十万、数百万级的样本量是相对比较常见的,那么我们的问题是:在相对小的样本条件下,如何把效果做起来?

我们采用的是通过多路大数据进行协同训练的方式。小样本在训练过程中,我们会不断地挑出更加高置信的样本补充进去,组成更大的样本体系。而这个过程当中,虽然样本集增加了,但是样本分布相对过去而言发生了变化。我们也有使用迁移学习的方式,使得更多样本集构建出来的训练空间的神经网络结构得到保留,同时在我们原有的样本上去调优它的参数,通过这个方式,使得小样本在原有基础上取得比原来更好的训练效果。

上图的左下角是一个实例。我们在某个数据上通过协同训练 + 迁移学习的方式,发现最后的单路数据的区分度取得了显著的提升,做金融的同学会知道:KS 值提升 5.8 是一个非常显著的变化,这就是技术层面带来的收益。

再看一个实例。

在搜索时代,基于超链分析,会使得搜索质量往上提升一大截。

image

在智能金融领域,前文所讲的图关系依然存在,而且这样的图关系在更早的时候其实没能得到非常好的应用。我们尝试在图关系上进行迭代,让用户的信用进行传递,通过这种方式,我们能够扩展出一批用户群体,就如右上图所示,扩展出的这部分用户群体,他们的信用分布和扩展前的群体是相对接近和相似的,同时,从风险表征上去看,它的风险也能表现出很好的区分度。

所以依托于整个图计算与迭代运算,我们可以使得对用户识别的空间扩展地更大,依托这种方式,我们能够扩展出 20% 的用户,并为他们做出更好的区分和识别,用这种方式来弥补最初始的样本不足以及数据相对稀疏的挑战。

这些智能技术结合在一起,给我们贡献了非常多的价值,具体可以看看在场景信贷层面的应用。

除了用前面的区分技术对用户有很好的理解区分以外,场景贷面临最大的一个挑战是来自于机构的欺诈风险,尤其是群体型欺诈。

image

面对这个问题应该如何防范?我们可以去甄别出存在异常行为的用户,发现存在欺诈的机构或用户,可以及时地进行处理和关停。关停以后,我们发现了一个有意思的现象:被处理的这些欺诈用户,又流转到其他的机构,呈现出一个用户之间流转的分布图,重点排查这些用户,就可以及早预防新的欺诈出现。结合这些技术可以有效的去控制整个产品方面的风险,在控制欺诈风险以后,就可以给产品用户提供非常优质的服务。

image

到目前为止,我们已经服务了超过两百万的用户。这些用户中,大专以下的学历的群体大约有 85 万,很多是从农村、从大山里出来的孩子,缺少相关的学历,通过我们的场景贷分析,他们能更容易获得培训与教育,从而可以更好地在城市里生活,而他们享受的利率也是很低的。在这个过程中,技术带来很大的一个核心变化,就是大大去降低人们信贷的成本,使得想实现梦想的人有机会去获得很好的金融服务,我们自身也能感觉到,我们在做一件非常有意义的事情。

而前面说的很多是关于信贷的,那么在财富管理领域也是有一些实践可以和大家进行分享。

image

财富管理中大家会经常会遇到一些问题。

  • 首先,面对这么多理财产品,用户很多时候不知道该怎么选;

  • 其次,资产描述太专业了,很多用户看不懂,不知道资产当中的某些描述是什么含义,它究竟是好还是不好;

  • 第三类,其实是情绪会影响投资,追涨杀跌,忙到最后还是不赚钱。

那么我们看看技术在这三个挑战当中能帮到什么。

image

用户在面向资产选择的时候,自己往往不知道该选择什么。传统做法是首先了解这个用户的风险偏好,用户需要自己填写一份风险偏好表,但是用户自己填写的信息是否真实呢?我们做过一个小调研,结论非常有意思:大多数的用户会选择中庸,但是选择中庸的用户和选择偏激进或者是偏保守的用户的行为偏向并不是很明显。

如果把用户分成五档,从谨慎到激进,真正言行一致性较好的是谨慎型的用户,其他的用户的描述跟实际的行为并不是完全一致。所以有一句话,行胜于言,行动才会表现出用户真实的偏好。而这一点是基于大数据分析得出的,我们对用户全方位绘制了画像,从他的个人行为、人生阶段、金融行为、风险偏好等等建立起模型,这时候对他的识别会更精准。

而对用户做了更加精准的风险评估之后,就可以辅助用户进行资产选择,同时也能主动的帮用户进行一些纠偏管理。比如这个用户的行为是很激进的,但是评估完他资产的承受能力,以及个人实际能够承受的的风险水平,与他真正可以承受的风险并不一致的情况下,就可以主动去帮用户去进行管理,使得他的投资能够做得更加的健康。

所以第一点非常重要,基于 AI 用户画像,给用户提供更加优质资产选择的机会和判断。

第二个痛点,就是用户对于资产不专业、看不懂。因为有很多用户,会在对资产不了解的情况下进行盲目投资。

image

市面上有很多基金,基金背后有很多基金经理存在,他们拥有很强的投资经验,但是传统的基金一个季度才会公布一次它的持仓,时效性比较差,在季度中间是没有办法去监控基金的持仓的变化,为了能更好的去理解基金的水平,通过技术就可以把这样一个黑盒打开。

整体来看,我们可以打开基金持仓的一个黑盒,去判断基金仓位的变化,去观察基金的资金行业的配置,甚至深入到行业内,去判断基金经理的选股能力。

当我们把这些能力放到一起的时候,就会发现基金在用户面前会变得更加透明,而且用户能够了解的信息更多,可以判断这个基金预期的收益是多少,基于这个方式可以加深对资产的理解。

接着第三点,就是通过程序化的方式帮用户自动生成资产配置,匹配上个人的投资计划,或者风险偏好方式。

image

其中,再平衡引擎能够帮助用户更好地去匹配个人资产,如果是选择是统一的匹配方案,比如说大家买基金的时候,不同的时间买进,对应的资产配置方案不一定合适,比如一个季度调一次仓,或者说一个月调一次仓,用户在不同的时间点买进,最早做出的资产配置已经不是最优质的配置了,而智能推荐的方式,可以在一个用户进行资产配置时间点,给他最优的一个配置方案,做到千人千面,这个时候会给用户带来很大的价值。

而程序化的方式,又能让用户去克服他原来情绪波动的障碍,让用户对资产的管理能力变得更强。

智能金融如何提升运营效率

前面花了很多的篇幅给大家分享,在扩大服务边界的层面,智能金融带来的价值,那么接下来重点谈一谈智能金融如何提升金融效率。

以信贷为例,当一个提供信贷服务的企业经营效率得到很大的提升以后,它让给用户的利益就会更多,简单来说,它可以用更低的利率去服务用户,因为它自身的内部效率提升了,付出的成本变少了,它就有更大的空间,用更低的价格去提供服务。

所以提升经营效率,是可以让整个企业乃至社会经营效率得到不断提升的一个重要方式。在这个过程里涉及了几个要点。

提升经营效率,首先要对企业的用户客群进行分类管理,通过实时的大数据分析以及建模,我们可以把用户的状态更加清晰的表示出来,比如说用户的风险预测,或者是否存在资金流失的风险,或者是不是现在是有新的需求产生,应该要给他提供新的产品。

image

基于深度学习,我们把用户群体的状态刻划出来,让用户形成不同的群组,每个群组可以采用不同的经营方案。比如说,匹配市场需求进行调额调价,及时进行风险管制,或者发送优惠券等等,每个经营动作是基于对用户的分析理解建模的基础上开展的。

把一个用户的生命周期拉出来以后,时间纬度一些反映出来的特征也是很能说明问题的。但是这样的时间纬度行为特征,依靠人工去挖掘是非常费精力的,LSTM 在这当中帮到我们很多。

image

通过 LSTM,我们发现在贷后的风险区分能力上出现一个巨幅的提升,整个区分能力相对没有没用时序序列的能力提升了 20%,这其实是一个非常显著的变化,同时带来的好处是,机器能够帮人干很多事,能够自主的发现一些东西,这就是技术革新带来的价值。

我们再来看一个客户经营层面的应用案例。

因为用户的需求是实时发生变化的,比如说前段时间还没有需求,但是现在可能想要买一个笔记本电脑,或者买一个名牌的包,或者买个手机;而市场的竞争也在发生着变化,可能突然有个竞争对手给你的客户发了一个更好的 Offer,来吸引这个用户,所以整个市场的需求、竞争状况是在时刻发生变化的,那么如何能够及时的在客户经营当中发现这样的变化,捕获它并且去适应它?

image

在这个过程中,我们建立了一个赤兔平台,在这个上面进行大规模的实验,这个平台具备每天并行数百个实验的经营能力。在这个平台上,我们能够根据实验结果去选择一个更优的方案。而这样的实验,在赤兔平台上可以长时间、快速的开展,这样就能够更加及时的去捕获用户需求的变化,从而及时进行调整。

智能金融如何降低运营成本

下面我会从另一个角度去谈一下,智能金融是怎么降低经营成本的。

image

通过公开的统计数据,我们可以看到仅银行业的客服从业人员就有 5.12 万人,人工电话的接通量已经超过了 10 亿通,这还只是银行业,金融行业还有其他的企业和机构,而且客服人员只是提供一方面的服务。还有像信审、催收、电销人员,他们的工作都有一定的相似性,就是会存在大量的重复劳动,人力成本相对比较高。

从另外一个角度来说,企业都会遇到一些突发性的事件,比如说,每年春节的时候会有抢红包,每个企业都会用大量的客服人员支撑,因为它要及时响应用户报出来的各种问题,使用解决方案,引导大家。

在今年的春节抢红包活动中,我们的智能机器人发挥了很大的作用,承接了 97% 的用户咨询工作,机器人所解决的问题,使的我们服务量下降了一个量级,大量机器人在线的问答解答,并且问题的解决率是很高的,这是智能机器人所发挥的非常重要的作用。

image

大家都知道,对于智能客服机器人来说,语音识别、自然语言处理、语义理解等等技术都是很重要的,但是在垂直领域,它可以得到更深的优化。以金融领域的智能机器人为例,除了垂直领域非常重要的知识,它还拥有一个完整的意图识别知识图谱,我们构建起了一个智能客服机器人在金融领域相对更大的领域知识图谱,建立起这样的语义理解的关联关系。

大家可以看到,这个关联关系的语义理解知识图谱是个相对复杂的连接,基于这个连接,机器人可以在应答客户的当前对话的情况下,再选择跳到下一个对话,进行用户的交互。整体的效果上来看,其实智能机器人的服务效率已经接近人类,但是还没有完全达到人的效果,机器人还在进步过程中。而机器人的成本,大概只有人工成本的 1%。

我们有一个真实的案例演示(点此观看视频回放)。

大家可以看到,机器人和人类之间已经做到了自由的对话,还可以看到开发人员会根据机器人对话的例子,不断地去训练机器人,帮它实现更好的回答。有一次,我们的机器人打来一个电话,当时我还不确定是不是机器人,我就问:“你是不是机器人?”结果它跟我说了一句话:“这个问题不重要。”

从另外的角度来说,经过多轮的训练以及知识图谱的扩充,智能机器人会覆盖到越来越多的知识点,从而去应对各种对话,有这样一个技术,可以使得人工成本大幅下降。

另外一个很重要的场景就是催收。

image

首先催收员所做的事情是什么?就是在用户逾期的时候进行提醒,并且告知用户逾期以后会带来的风险,或者用户需要承担的损失。比如信用记录可能会出现的问题,以后再办理其他的各种服务甚至房贷、车贷都会受到影响。

催收员是非常辛苦的,承受着巨大的压力,他们去接打用户的各种电话,有些被强行挂断,有些是很没有礼貌地强硬地进行回应,说一些很过分的话,而催收员只能叹一口气,再拨打下一个电话。

所以这个行业的人员也是很难受的,催收人员有的时候还会出现话术不够标准化,没有严格按照要求去执行的情况发生,同时情绪上还经常会出现波动。但机器人不会存在这个问题,机器人不会存在情绪波动,它会非常严格地按照已经定义好的方式去执行,所以机器人相对人类而言,标准化做得非常好,逻辑严谨,不用担心出现什么违规的现象。

我们在用机器人来逐步替代人工时候,首先是把用户按照催收的难易程度进行排序,先从相对容易一点用户开始实验,看看效果。结果发现,通过这样的变化之后,相对于人工而言机器人的效率更高,因为情绪没有波动,最后得到的效率还提升了。

在这个基础上,我们也不断地去演进智能机器人技术,有些时候让机器人用方言和催收对象沟通,一步一步地在进化。和客服机器人相比,催收机器人会有更强的要求,它的控制能力更强。

助力智能银行

银行是非常重要的金融机构。在与银行机构的对接中我们发现,他们具备很强的前瞻性,关于金融科技层面很多事情他们看得非常清楚,所以在拥抱 AI 这个变化当中,银行也是提前做布局部署,把 AI 能力融入到他们的基础建设中来。

现在营业厅人越来越少,大家越来越多通过掌上银行,或者互联网方式来享受服务。我们和农业银行从 2017 年开始就共建智能金融大脑,基于金融大脑上层搭建各种各样的企业能力。

image

金融大脑的左脑和右脑分工也是比较清晰的。决策引擎负责一体化的机器学习的流程,换言之,负责的是金融大脑的思考;感知引擎包括语音识别,图像识别,人脸识别,语义理解,解决的是金融大脑的听说读写问题,这两部分构建起了金融大脑的左右脑,为金融大脑提供思考的能力。

在 2018 年,金融大脑一期已经顺利上线,投入实际生产的应用当中。有了这样的金融大脑,金融机构就可以实现各种各样的对 AI 能力的使用,就包括像智能营销、精准营销、风险控制、智能客服等等一系列的应用都可以开展。在投入上线之后,农行构建了一个自己的掌上应用,其中就用到了这样的引擎,可以进行人脸识别、语音识别等等。

在这款应用的背后我们看到,通过技术建设以及智慧大脑的构建,金融机构逐步开始拥有一些使用 AI 的能力,可以为用户提供越来越多的金融的服务,我们现在就处在一个非常好的时代,在这个时代里面,每一个具备 AI 的能力人,都可以贡献自身的力量,去帮助企业、帮助行业、帮助整个社会大幅度的提升效率,我们也会跟大家一起努力,来做强我们的智能金融。

对话许冬亮

Q1:现在的深度学习模型有一个特别大的问题,就是通过模型做出来的东西,它的可解释性不够好,怎么样说服用户来接受这个模型,接受来自 AI 的投资决策呢?

许冬亮:从金融的领域来说,可解释性是非常重要的,但可解释性可以分解到整个体系框架中去,不是直接用一个不可解释的大模型,我们自上而下是有一个清晰的知识体系框架,而这个知识体系框架其实就是关于金融的东西,或者金融行业的经验沉淀,有这个框架沉淀,它能保证不会出大问题。而深度学习在这样的知识体系框架内做调优,去追求一个局部最优的参数,这种情况下它的风险是相对可控的,而不是说完全交给机器学习,交给算法,这时候的确会冒很多风险。

大家看量化交易出现之后,为什么要加一个熔断机制?因为如果完全交给交易体系,它必然会出现一些不可控的状况,因为机器学习也好,深度学习也好,它其实都是从历史去预测未来。而从历史去预测未来,它一定不会什么都能预测到,因为未来的不确定性是很强的,所以一定是需要在一个框架的束缚下进行。换言之,人工智能至少目前的阶段还是需要人工和智能结合的,人工定框架去控风险,而靠智能去做到效能的优化。

Q2:量化投资领域对人工智能的人才的需求是什么样的,有没有标准,你觉得一个量化投资领域的人工智能人才,他身上要具有哪些特质?

许冬亮:从我的理解上来说,对于人才需求,一方面是在 AI 层面要有深厚的积累,同时,是需要对量化投资,或者说对于资产分析这个层面有一定的经验,这两个层面复合到一起,才能在这个行业做得比较深。但是,最重要的能力是人的学习能力和可成长性,没有经验没关系,有很好的 AI 基础,同时又具备很强的学习能力,那也是我们非常渴求的人才,因为在未来的几年,他可以在实际的工作当中学到很多行业知识,再跟他的技术结合起来,那时候就会是非常棒的人才。

Q3:您刚才提到这个银行问题,从算法构建层面来说,因为从 0 到 1 构建算法成本比较大,而且风险也比较大,但是从 1 到 2,再到后续的 3 或者 4,它的成本比较小,而从客户层面来看,应该如何看待这种风险?是否有一套机制能够使得后续客户的成本比较小?

许冬亮:这是个很好的问题,和银行业务合作当中,从 0 到 1 这一步很难,从 1 到 2,2 到 3 的部署就相对容易一点。怎么样去考虑这样一些问题?很多的合作其实是双方共性的,既然是合作,肯定不是单方的,双方都有诉求,比如说从农行的角度看,它有很高的前瞻性,要提升自身基础设施当中对 AI 能力的掌握。那么对我们而言,要去推广智能金融科技在产品当中的应用,从出发点来说,大家是目标一致的,是能够合作到一起。

从 0 到 1 的这个过程中,必然是要付出很多的努力,是会冒很多风险的,如果成功做出来以后它就有示范效应,从 1 就可以到 2,到 3,它的扩展速度是很快的。

从 0 到 1,并不是很简单的能够被复制,其中很多坑在具体实施过程中才会遇到。所以先做完从 0 到 1 的,会有先发的优势。最后,金融行业是最强调风险控制的,它有一整套的流程和机制,会使新的尝试的风险控制在相对比较小的范围之内。当然需要付出时间成本,相对于互联网的各种迭代来说,不会多快,但是可能很稳固的向前推进。

下期预告

5 月 15 日 周三晚 18:40,北京大学“人工智能前沿与产业趋势”第十二讲,将由阿里云量子技术首席科学家施尧耘为大家授课。

感兴趣的小伙伴可以添加 AI 前线编辑微信:caifangfang842852,备注“北大听课 + 公司名称 + 职位 or 学校 + 专业”,通过后可进入课程活动群,第一时间获取直播链接、视频回放、课程内容整理、北大 AI 公开课系列课程信息,以及与其他小伙伴互动交流。
祝大家听课愉快~

学习资料

在 AI 前线微信公众号(ID:ai-front)后台回复关键词“北大 AI 公开课”,可获取往期课程文字材料 + 视频回顾等学习资料。

image

收藏

评论

微博

发表评论

注册/登录 InfoQ 发表评论