年终盛会:QCon 上海站将于 12 月举办,拟邀请 70 位嘉宾前来分享!>>> 了解详情
写点什么

QCon 金融行业闭门会:数据治理是管理问题,还是技术问题?

  • 2023-06-01
    北京
  • 本文字数:2833 字

    阅读完需:约 9 分钟

QCon金融行业闭门会:数据治理是管理问题,还是技术问题?

在 5 月 26 日,QCon全球开发者大会(广州站)顺利落地,在现场,InfoQ 特别策划了五场闭门会,主题分别为《企业在 LLM、AIGC 浪潮下的研发探索》《DevOps vs 平台工程,必要性和 ROI 探讨》《破解成本优化后的稳定性问题》《业务出海之架构、合规、运营》《金融行业数据治理经验分享》,本文为《金融行业数据治理经验分享》研讨纪要整理~



出席此次闭门会参会嘉宾如下:

主持人:Yolanda InfoQ 极客传媒总经理

  1. 李杨,平安资管科技平台交易系统团队开发组负责人

  2. 王劲,数果智能创始人兼 CEO 

  3. 周程伟,链融科技 CTO,TGO 深圳会员

  4. 李龙,众安国际 Fundamental Tech VP

针对不同监管部门发布的不同标准,你们如何应对?

李龙提到,首先是内部需要有理解监管,而且为业务目标共同努力的联合团队;第二点,需要实时了解监管动态;第三,落地的时候,需要充分的保护好企业,进行相关证明材料、法律意见的存档,例如数据跨境风险,在监管政策上,内地和香港的政策有一定差异,这里的数据处理和合规风险需要非常慎重,留好记录,确保业务合规开展。

 

李杨指出,保险投资公司与银行有一些不同之处,他服务对象包括平安集团的保险资金以及第三方资金。由于可能涉及大规模的投资交易,监管机构担心某些操作造成不正常市场波动,为遵守监管要求,将风控措施嵌入到内部系统中。公司内部风控要求会更加严格,以避免违反监管规定。

 

他们还有内部评级和事中监控系统,用于监控交易员执行交易时是否触发监管或者内部的一些要求。如果超过设置的某些阈值,系统会提醒交易员。一般来说公司的要求会高于监管既定的阈值以避免引起不必要的风险。与此同时,我们公司注重合规文化,常常进行合规宣传以及相应的学习。

 

周程伟谈到不同监管部门存在不同的标准,尤其在跨境交易方面。然而,国内监管机构的标准在逻辑上是一致的,且核心逻辑是非标和综合规则。虽然不同行业可能存在一些差异。随着监管对金融科技的加强,进行某些操作变得越来越困难,需要大量的沟通和解释。在个人信息保护方面,涉及敏感信息的处理更加严格。另外,金融领域的监管目前还没有明确分工,但企业需要建立合规和数据管理体系。

 

王劲也发表了自己的观点,他认为“作为乙方单位,我们在为甲方提供服务时,也感受到金融监管对数据安全和个人隐私的重视程度,尤其在与银行和其他金融机构合作时。监管部门对 APP 数据采集的要求非常高,包括数据分析和分类的明确要求,以及加密算法保护用户身份证、电话和银行卡等敏感信息。在数据分析过程中,数据脱敏是常用的方法,确保数据的安全性和隐私性。整个行业对数据安全和隐私的要求越来越严格,不仅限于金融领域,包括央企在内的各个行业也高度重视数据资产的安全。

如何解决数据孤岛?

 

李杨率先谈到:很多企业声称正在进行数字化转型,解决数据孤岛和数据联通的问题,但实际上数字化转型对于任何企业来说都是较大的挑战。“我认为数据孤岛是必然会产生的,并且会持续存在。业务部门往往相对独立,构建了各自的业务系统,导致出现隔离和数据孤岛的问题。”他认为解决数据孤岛问题是一项困难的任务,特别是在组织不够痛时。他也指出数据孤岛问题可能永远存在,只能不同企业缓解的程度不一样。无法完全解决,处于 on the way 的状态。因为组织架构和业务系统支持的效率等因素影响着解决该问题的难度。他认为企业应该建立统一的数据中心和数据服务中台,以提高数据的一致性和故障处理能力。

 

王劲谈到,数据治理在数据资源和数据库方面并不是最新的概念,而是从数仓时代开始逐渐形成的。然而,许多公司在进行数据治理时存在一个重要问题,就是过于关注治理而忽视了从业务出发的重要性。数据治理必须回归到业务场景,并从一个业务场景的角度全面治理数据,否则即使在数据层面上取得了一些成果,也无法解决实际业务问题。因此,数据治理需要由业务牵头,并将技术服务于业务需求。另外,关注数据指标是实现数据治理的关键,指标是离业务最近的,通过围绕指标展开数据治理,将指标相关的数据汇总起来,可以解决数据孤岛、数据质量等问题。

 

周程伟提到了数据孤岛的问题正在逐渐变好,解决数据孤岛是一个动态变化的过程。于此同时,他也谈到,规范化的产品研发和数据管理流程可以解决现有问题。管理科学和数据质量是需要解决的关键问题,但在传统企业中很难做到完美。

 

李龙则强调了数据与组织架构的关系。他认为数据的最终形态取决于组织架构,他强调数据的统一口径和标准,并指出数据科学部门的独立性和与业务部门的协作。同时他也认为 CEO 和 CTO 在解决数据与组织架构问题上起关键作用,必须通过合理的设计来解决这个问题。他还提到了众安保险和数据科学应用中心的数据团队在公司文化中的重要性,以及数据在业务增量中的作用。

 

数据质量参差不齐,大家如何解决?

 

王劲认为数据质量的关键在于回归到业务平台。从业务角度出发,大家需要确定基于特定场景和业务的数据指标体系,进行梳理和定义。通过分析,将整个数据链路串联起来,并在每个节点实现管控和监控。数据质量参差不齐的情况下,出现故障或问题往往需要花费大量时间和资源进行排查。因此,确保数据质量需要建立一个闭环的监督体系,以业务为中心,实现数据活动和关键节点的快速定位。在技术层面上,可以采用多数据源的比对和检查,以及监控系统的建立。此外,指标的偏离度和数据的准确性、及时性、完整性也是数据质量的重要考虑因素。

 

李杨谈到数据治理涉及数据质量、数据标准和数据安全。其中,数据质量指标包括一致性、完备性、完整性、及时性和有效性等。通过交叉验证和调度平台生成数据质量报告,满足对数据质量的要求和监控。从技术层面来看,实现并不复杂,通过调度和手工制定规则来完成。然而,我们需要确保能够清楚地收集业务关心的数据指标,并生成及时准确的数据指标,这是一个比较重要但也比较困难的任务。另外,数据分为 OLAP 和 OLTP 对于 OLTP 型数据,对数据的及时性监控更为重要。现有的基础设施能否满足对 OLTP 型数据质量的监控是一个难点。

 

王劲在这里提出了疑问,他认为在考虑数据质量时,不能仅从技术角度出发,而应该从业务结果的角度去倒推。数据质量问题是与业务密切相关的,例如,如果每天的交易量应该达到 1000 亿,但实际只有 800 亿,这涉及到了数据质量的问题。数据的质量与业务是紧密相连的,不能将其分开看待。

 

李龙最后谈到,在进行原始数据定义和口径梳理时,需要意识到不同部门可能有不同的口径定义。建模团队应该能够发现这些不同的口径,并将其整合起来,避免分析过程中的冲突和重复。这一点非常重要。在这个基础上,通过数据质量的监控规则和机制来保证数据的准确性。同时,业务部门也应自觉地发现问题,并促使解决。数据团队在此过程中扮演着收口的角色,不是简单地新增数据,而是通过识别相同数据中的不同问题,避免冗余。

 

活动推荐:

2023 年 9 月 3 - 5 日,在北京·富力万丽酒店, QCon 全球软件开发大会(北京站)已开启,现已开启售票,提前订票,可享受 7 折早鸟价,购票参会可以直接电话 / 微信联系票务经理 18514549229。



2023-06-01 11:232924

评论

发布
暂无评论
发现更多内容

十分钟速成DevOps实践

华为云开发者联盟

后端 开发

Java培训技术学习哪个前景不错

小谷哥

数字孪生实操——实践类

阿里云AIoT

物联网 数据采集 传感器 数字孪生

软件测试 | 测试开发 | Docker 镜像构建可以分享的快乐

测吧(北京)科技有限公司

测试

西安Java培训班哪家比较好

小谷哥

小间距LED显示屏未来十大发展方向

Dylan

LED显示屏 led显示屏厂家 户内led显示屏

软件测试 | 测试开发 | BAT大厂都在用的Docker。学会这三招,面试、工作轻松hold住

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | 黑盒测试方法论—等价类

测吧(北京)科技有限公司

测试

武汉web前端开发培训机构学费多少

小谷哥

软件测试 | 测试开发 | 30 分钟轻松搞定正则表达式基础

测吧(北京)科技有限公司

测试

【开发者说】携住数智酒店,用原子化服务创造全新入住体验

HarmonyOS开发者

HarmonyOS

开放算力,云启未来!与龙蜥一起开启 2022 云栖大会之旅

OpenAnolis小助手

开源 科技 峰会 云栖大会 龙蜥社区

链上自动化何以成就更好的 Web3 | 对话 OAK Network

One Block Community

区块链 自动化 专访 波卡生态

NFT 离商业化还有多远?

One Block Community

区块链 程序员 NFT 商业化

西安前端培训班学习哪家比较好

小谷哥

IoT数据倾斜如何解决——实践类

阿里云AIoT

算法 流计算 物联网 数据处理 并行计算

大数据开发培训机构怎么选择

小谷哥

资源画像,看得见的容器资源优化助手

阿里巴巴云原生

阿里云 容器 云原生 ACK

国庆福利:6大云原生落地指南、100余页实用转型干货 免费下载!

York

容器 DevOps 微服务 云原生 应用现代化

软件测试 | 测试开发 | Git实战(四)| Git分支管理实操,搞定在线合并和本地合并

测吧(北京)科技有限公司

测试

Java | interface 和 implements关键字【接口,看这篇就够了】

Fire_Shield

Java 接口 9月月更

软件测试 | 测试开发 | 黑盒测试方法论—场景法

测吧(北京)科技有限公司

测试

弯曲矫正技术概述

合合技术团队

人工智能 深度学习 图片处理

软件测试 | 测试开发 | Dubbo-admin+Zookeeper 的环境搭建实操与 Could-not-extract-archive 报错踩坑

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | Git实战(五)| 让工作更高效,搞定Git的分支管理

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | Git 实战(三) | Github 必会高频基础命令与 IDE 的 Git 集成

测吧(北京)科技有限公司

测试

Hibernate 缓存与 MyBatis 缓存的理解以及比较

codeshero

Java hibernate 缓存 mybatis缓存 9月月更

隐私计算大规模落地场景的解决之道:分布式计算架构

Jessica@数牍

隐私计算 分布式技术 分布式计算框架

DAPP系统开发Web3合约技术

薇電13242772558

dapp web3

关于事务注解中的常用参数详解

codeshero

Java 后端 事务 注解 9月月更

软件测试 | 测试开发 | BAT 大厂最流行的性能压测、监控、剖析技术体系解析

测吧(北京)科技有限公司

测试

  • 扫码添加小助手
    领取最新资料包
QCon金融行业闭门会:数据治理是管理问题,还是技术问题?_QCon_李忠良_InfoQ精选文章