NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

金融系统去 Oracle 实践,到底需要解决哪些问题?

  • 2020-03-12
  • 本文字数:2555 字

    阅读完需:约 8 分钟

金融系统去Oracle实践,到底需要解决哪些问题?

“去 O”一直是最近 10 年描述系统架构改造中最常出现的词之一。虽然“去 O”被很多工程师和技术从业者津津乐道,但业界真正能实现把系统全部去 O,特别是金融场景的核心系统全部去 O 的案例并不多。那么去 O 到底难在哪里呢。


为了解答这个问题,首先我们要理解去 O 架构改造的本质是什么?去 O 架构改造的本质其一是让系统架构具备在线更换数据库的能力,无论去 O 的目标库是 MySQL,或是其他的关系型数据库,最终都是要解决这样一个问题。


在线更换数据库到底难在哪里,会遇到哪些问题呢?

问题一:如何无感知的实时动态数据的迁移?

首先数据库作为交易型系统最核心的组件没有之一,这一点对于数据库的重要性评价一点都不夸张。当前大部分知名的网站和系统都是 7x24 小时对外提供服务,数据库也是 7*24 小时无时不刻处理着大量的读写服务,要实现去 O 就意味着你要在一个 Oracle 库还在对外提供服务的时候,在某个时间点让一个 MySQL 库快速替换掉 Oracle 库,并平稳的接管 Oracle 的所有服务。


不同于无状态的系统组件切换把流量切走即完成切换工作,而数据库作为有状态的系统组件,如何设计一套从应用改造、到数据同步、再到数据库流量切换的稳妥去 O 方案,可以非常谨慎的把一个正在对外提供服务,数据处在实时变化状态的 Oracle 库上的数据无缝的方式迁移至 MySQL 中。


为了有效解决这个问题,陆金所研发的去 O 工具包含一整套完善的在线数据迁移功能。在工具中勾选需要去 O 的 Oracle 表,工具会自动完成 O to M 的全量同步、增量同步,并通过解析 Oracle redolog 来追增量日志,最终形成一个 Oracle 为主库,MySQL 为备库的异构实时备库。

问题二:如何管理和协调好高频迭代的去 O 改造和功能改造?

其次去 O 架构改造的主体工作是对应用层代码的重构,特别对 DAO(数据访问层)的重构,对于某些复杂的系统来说,重构的时间会持续数月甚至更久。在这段漫长的去 O 改造时间窗口里,不但 Oracle 库的数据在动态发生变化,对于一个处在高速迭代中的网站和系统来说,应用的功能代码也在不断发生变化。如果 A 团队在为应用做去 O 架构改造,而这个期间 B 团队在不断的给应用开发新的功能,如何进行去 O 的工作拆分可以有效的管理和协调好两个开发团队的编码和上线节奏呢。


为了有效应对这个场景,陆金所研发的去 O 工具会在去 O 架构改造和应用业务改造之前进行有效协调,并向业务开发尽可能屏蔽去 O 架构改造的影响。比如业务改造需要在处于 O 和 M 并行双写的库上修改表结构并发布新的数据库访问接口,大量的工作会由去 O 工具来自动化完成。


问题三:如何稳妥落地数据库流量的在线切换?

当某个库的应用去 O 改造完成并上线后,会实施生产环境 Oracle 的流量切换到 MySQL 上。在这个切换过程中,如何确保 Oracle 上的最后一笔事务提交成功,并同步到 MySQL 后完成数据一致性校验,且针对这个 Oracle 库的所有写操作能在快速、全部切换到 MySQL 上,不会出现部分写流量 Oracle,部分写流量 MySQL,两库双写的异常状态。


当流量切换到 MySQL 后 a,如果出现应用报错或 bug、MySQL 性能问题等在前期压测或准备工作中未覆盖到的突发情况,如何实现流量快速回切到 Oracle 上,且确保在 MySQL 中写入的数据也能完全一致的回到 Oracle 中。


解决好这个问题,是控制好去 O 落地风险的核心所在。陆金所设计了一整套在线切换数据库的架构框架来确保在瞬间把流量从 Oracle 切走到 MySQL 中,同时也可以瞬间把流量切回到 Oracle,并确保两边的数据完全一致。


问题四:如何有效拆分去 O 的任务,从而实现对全站业务单次影响小、迭代频度快的去 O 上线?

要实现全站去 O,必然面临着对一些复杂、庞大的核心系统进行去 O 改造。以陆金所为例,在全站中像用户中心、资产中心、资金账户等这种给全站所有金融产品线都提供基础服务的子系统就是这类复杂和庞大的核心系统,同时包括基金、主账户等专属金融产品线的业务逻辑复杂,所以子系统也非常庞大。


所以对于这类子系统,如果需要在一个大版本里全部去 O 改造完成,并在一个晚上业务低峰期一次性全部从 O 切换到 M,无论是当晚的切换风险,还是切换完成后,在第二天业务高峰期出现问题和 bug 的风险,包括开发团队短时间内去 O 改造的工作量和出现重大 bug 的机率都是非常大且不可控的。


如何把一个庞大且重要的复杂子系统拆分成多个去 O 的版本按批次上线和切换流量,且做到单个批次影响可控,也是全站去 O 中需要谨慎设计的方案。


而这也是整个去 O 过程中架构设计最有趣的部分。


上面提到了去 O 中在架构层实现在线换库需要解决的四大问题。除了在线换库外,去 O 架构改造的本质其二是引入更多的存储引擎在合适的场景来承接 Oracle 数据库的计算和存储能力。这就引出了第五个问题。

问题五:如何在各种场景下使用合适的开源存储引擎来去 O,并且在架构上进行融合。

首先 Oracle 是个非常强大的关系型数据库,无论在 OLTP 和 OLAP 场景表现都很出色,且具备一整套完善、好用的运维和监控工具。但于此同时 Oracle 虽然对各种场景支持较为全面,但在各个特定场景下,一些开源的数据库或存储引擎在性能或成本投入的综合考量上胜过 Oracle,都会是比 Oracle 更合适的选择方案。


所以全站去 O 不仅仅是去 O 到 MySQL 中,MySQL 能承接的只是 Oracle 的部分计算和存储能力,在整个陆金所的全站去 O 落地过程中,除了 MySQL 外,我们还在不同的场景下使用 ES、HBase、TiDB、Impala+kudu 等存储引擎,甚至是应用层的代码来承接和替换 Oracle,并且整体收益比使用 Oracle 更好。


在完成去 O 后,陆金所的生产环境出现了大量开源的存储引擎来支撑各种合适的业务场景。同时我们也研发了数据总线平台来实现数据在一个地方写入和提交,秒级同步到其他存储引擎的架构。



上述是陆金所在全站去 O 过程中遇到的 5 个实战问题大类,整个全站去 O 过程中需要解决细节问题还有很多,这里无法一一列举,因为去 O 作为一个复杂的系统架构改造本身就要求技术团队事无巨细的处理好各种细节问题。


基于此,陆金所优化和开发了一整套方案和工具来,有效推进去 O 改造稳妥落地且保障风险可控。后续会推出一个系列的去 O 专题和大家分享,希望给有去 O 改造计划的技术团队和公司带来一些参考和借鉴价值,敬请期待。


作者介绍:


王英杰,陆金所数据架构团队负责人,负责陆金所全站存储引擎运营和智能化工具研发。


2020-03-12 15:574529

评论 2 条评论

发布
用户头像
Oracle现在在各个行业都开始弃用了吧.
2020-03-13 08:55
回复
大势所趋吧
2020-03-13 09:23
回复
没有更多了
发现更多内容

Qt | QWidget的一些总结

YOLO.

qt 7月月更

strcat() - 连接字符串

謓泽

7月月更

QT|QLabel显示多行文本过多后显示省略号

中国好公民st

qt 7月月更

使用Flutter开发小程序+App)的一种组合思路

Geek_99967b

小程序

Prometheus 发布 LTS 长期支持版本啦

耳东@Erdong

release Prometheus 7月月更

数据平台的发展历程

奔向架构师

大数据 7月月更

python小知识-什么是上下文管理

AIWeker

Python python小知识 7月月更

系统刷JavaScripit 构建前端体系(语法篇)

程序员海军

JavaScript 7月月更

C# DataGridView数据导出Excel文件

IC00

C# 7月月更

王者荣耀商城异地多活架构

Pengfei

KUDU1.11 环境安装

怀瑾握瑜的嘉与嘉

7月月更 kudu

jQuery 请求

Jason199

jquery js post GET 7月月更

汽车电子行业开发者的内功心法:汽车软件开发V模型(瀑布模型)

不脱发的程序猿

嵌入式开发 瀑布模型 汽车软件开发 V模型

Flink实战:消费Wikipedia实时消息

程序员欣宸

Java flink 7月月更

分享 15 个 Vue3 全家桶开发的避坑经验

pingan8787

Vue Vue3

读书笔记之数据密集型应用的可维护性

宇宙之一粟

设计数据密集型应用 7月月更

【愚公系列】2022年7月 Go教学课程 013-常量、指针

愚公搬代码

7月月更

Java中的设计模式

Java学术趴

7月日更

试着换个角度理解低代码平台设计的本质

pingan8787

Vue 前端 React 低代码平台

一篇文章带你快速学会Flex布局

bo

CSS 前端 Flex 7月月更

没有了可用Task slot,Flink新增任务会怎样?

程序员欣宸

Java flink 7月月更

qt 实现日历美化

小肉球

qt 7月月更

Envoy监听管理

阿泽🧸

envoy 7月月更

VLAN再见,我选择用QinQ!1000字带你详细了解QinQ技术

wljslmz

VLAN 网络技术 7月月更 QinQ

zookeeper-集群和zab协议

zarmnosaj

7月月更

【MySql 实战】高度聚合的数据项拆分为多行多列

安逸的咸鱼

MySQL 实战 7月月更

Java核心技术之泛型详解

小明Java问道之路

Java 后端 泛型 Java泛型 7月月更

LeetCode-数组中数字出现的次数(单身狗问题)

芒果酱

c++ C语言 数据结构算法 Leet Code 7月月更

C#入门系列(二十五) -- 接口

陈言必行

7月月更

STM32+DHT11读取温湿度数据显示

DS小龙哥

7月月更

Kubernetes网络插件详解- Flannel篇

巨子嘉

云计算 容器 云原生

金融系统去Oracle实践,到底需要解决哪些问题?_数据库_王英杰_InfoQ精选文章