9折倒计时一周! QCon 全球软件开发大会·上海站讲师上线95% >>> 了解详情
写点什么

中国工商银行大数据和人工智能实验室 / 部门经理袁一确认出席 FCon ,分享工商银行大数据平台助力全行数字化转型之路

  • 2023-09-11
    北京
  • 本文字数:1535 字

    阅读完需:约 5 分钟

大小:896.81K时长:05:06
中国工商银行大数据和人工智能实验室 / 部门经理袁一确认出席 FCon ,分享工商银行大数据平台助力全行数字化转型之路

FCon 全球金融科技大会,将于 11 月在上海召开。中国工商银行大数据和人工智能实验室 / 部门经理袁一将发表题为《工商银行大数据平台助力全行数字化转型之路》主题分享,介绍实时数仓技术在工商银行的技术实践及典型案例、在运营大规模大数据集群和大数据平台在实践信创转型时的经验、在向大数据平台云原生架构演进的实践,以及数据洞察平台(EasyDI)的实施。


袁一,从 2011 年开始接触大数据相关技术,从零到一全程参与了工商银行大数据平台的建设,是工商银行大数据技术领域的先行者和技术专家,先后多次在中国信通院、华为金融峰会、Flink Forward Asia 等行业大会上就工行大数据体系的建设发表过公开演讲,发表大数据领域的专利 11 篇。


在最近几年里,持续关注行业新技术的动态,并积极引入新技术,成功落地了多个大型项目,包括主机下平台转型、SAS 国产化转型、实时数仓演进、湖仓一体云原生架构演进等,为工商银行的数字化转型工作提供了持续的持和助力。他在本次会议的演讲内容如下:


演讲:工商银行大数据平台助力全行数字化转型之路


本次演讲,将主要介绍工商银行大数据平台在近几年数字化转型过程中,对大数据平台的使用越来越重,因此立足于解决业务痛点,在近几年里主要推进了如下几项工作:


1、业务侧对数据时效的要求越来越高,原先 T+1 已无法满足,而基于 ORC 文件做定时存增量合并的方式资源开销很大,因此引入了 Flink+Hudi 的实时数仓加工模式,并提炼了设计模式,最终使数据加工时效最快达到了 1 分钟级。同步通过 CDC 技术,将主机或 Oracle 等数据库中产生的数据实时地同步到大数据平台,实现业务下主机。


2、随着实时数仓技术的不断成熟,工商银行大数据平台逐步将所有数据切换成实时入湖的 Hudi 格式,形成了基于 Flink 开发的实时数仓和基于 Spark 开发的离线数仓的两条并行加工链路,两条加工链路之间数据可以共享,无需冗余存储,同时为配合实时数仓链路中 Flink 中所要关联的维表,工商银行大数据平台根据不同的业务场景,建设了关系型、键值型、多维搜索、时序、空间、向量等多种类型的联机数据库。


3、推进大数据平台向存算分离云原生化演进。工商银行大数据平台最大的 Hadoop 集群目前规模近 3000 台物理机,随着集群规模越来越大,在资源隔离、弹性扩缩容等方面的不足越来越明显。因此通过参照互联网企业的做法,开始实践云下存算一体向云原生存算分离架构演进,在此过程中同步推动了数据平台信创转型。


4、建设 EasyDI 平台,在 2022 年面向全集团分析师提供了可视化报表开发工具,使报表开发不再依赖于科技。在 2023 年中通过策略模板中心形成了不同分行、不同部室之间用数模式复用的能力,构建了出生态。同时 2023 年 2 季度起正在研究基于生成式大模型技术实现对话式 BI 用数助理的课题,旨在通过 AI 技术进一步降低用数门槛。


演讲提纲:


  1. 实时数仓技术在工商银行的技术实践及典型案例

  2. 工商银行在运营大规模大数据集群时的若干经验

  3. 工商银行在向大数据平台云原生架构演进的若干实践

  4. 工商银行大数据平台在实践信创转型时的若干经验

  5. 工商银行数据洞察平台(EasyDI)的若干实施


你将获得:


○ 了解到实时数仓技术在工商银行的技术实践及典型案例

○ 了解到工商银行在运营大规模大数据集群时的若干经验

○ 了解到工商银行在向大数据平台云原生架构演进的若干实践

○ 了解到工商银行大数据平台在实践信创转型时的若干经验

○ 了解到工商银行数据洞察平台(EasyDI)的若干实施


除上述演讲外,FCon 上海还将围绕 DevOps 在金融企业落地实践金融行业大模型应用创新的金融科技应用金融实时数据平台建设之路金融安全风险管控数据要素流通与数据合规等进行交流。


FCon 上海 2023,相约 11 月!现在购票,前 100 人可享 5 折特惠购票,咨询购票请联系:17310043226(微信同手机号)。



2023-09-11 11:302155
用户头像

发布了 75 篇内容, 共 28.5 次阅读, 收获喜欢 8 次。

关注

评论

发布
暂无评论
发现更多内容

1月月更|推荐学java——Spring之AOP

逆锋起笔

spring SSM框架 spring aop 依赖注入 面向切面编程

使用无参数函数进行命令执行

网络安全学海

黑客 网络安全 信息安全 渗透测试 安全漏洞

Python 为什么不设计 do-while 循环结构?

Python猫

Python

GIS :元宇宙未来发展的有力技术支撑

华为云开发者联盟

AI GIS 虚拟世界 数字孪生 云宇宙

TDSQL PG版企业级分布式数据库技术创新实践

腾讯云数据库

tdsql 国产数据库

ONES CTO 冯斌|如何低成本地做出高质量决策

万事ONES

3DCAT荣获2021金陀螺“年度XR行业技术创新奖”“年度优秀VR行业应用奖”两项大奖

3DCAT实时渲染

云计算 教育 VR/AR 渲染 渲染器

架构实战营第 4 期 -- 模块七作业

烈火干柴烛灭田边残月

架构实战营

Kafka 为什么这么快?多的是你不知道的事

码哥字节

kafka 消息队列 1月日更 1月月更

混沌工程之 Linux 网络故障模拟工具TC

zuozewei

Linux 混沌工程 1月月更

为什么HashMap会产生死循环?

王磊

软件设计——依赖倒置

苏州程序大白

架构师

Hoo虎符研究院|区块链简报 20220117期

区块链前沿News

Hoo虎符 Hoo 虎符研究院 区块链资讯

十大视频场景化应用工具+五大视频领域冠军/顶会算法重磅开源!

百度大脑

如何处理消息丢失问题?

JavaEdge

1月月更

(1-14/14) 首位销售人员

mtfelix

300天创作 2022Y300P

Chrome插件:摸鱼倒计时、每日摸鱼时间统计,奋斗逼、卷王必备,用于减少摸鱼时间和频率

OBKoro1

效率 开源 效率工具 chrome扩展 高效率

TDSQL-C for PostgreSQL 主从架构详解

腾讯云数据库

tdsql 国产数据库

如何基于知识图谱实体解析技术进行数据优化?

索信达控股

人工智能 AI 知识图谱 数据优化 索信达控股

Scrum Master如何参与每日Scrum(Daily Scrum)

Bruce Talk

Scrum 敏捷 Agile Coach/Facilitate

TDSQL | 将企业级分布式数据库做到极致

腾讯云数据库

tdsql 国产数据库

前额皮质如何影响我们的工作效率?

LigaAI

工作效率 脑科学

redis未授权访问漏洞复现

喀拉峻

redis 黑客 网络安全 安全 信息安全

低代码实现探索(二十二)如何构建一个可以看的懂的系统

零道云-混合式低代码平台

Scrum Master需要具备哪些能力和经验

华为云开发者联盟

Scrum 敏捷 团队 教练 Scrum Master

Go 语言快速入门指南:Go 并发初识

宇宙之一粟

golang 并发 Go 语言 1月月更

项目管理是做什么

PingCode

架构实战训练营-模块7-作业

温安适

「架构实战营」

Hive SQL底层执行原理

五分钟学大数据

Hive SQL 1月月更

【高并发】导致并发编程频繁出问题的“幕后黑手”

冰河

并发编程 多线程 高并发 协程 异步编程

人效将是快消品企业未来发展的最大瓶颈

百度大脑

人工智能

  • 扫码添加小助手
    领取最新资料包
中国工商银行大数据和人工智能实验室 / 部门经理袁一确认出席 FCon ,分享工商银行大数据平台助力全行数字化转型之路_银行_徐晓博_InfoQ精选文章