写点什么

银行持续交付实战:一个单体系统足以撑起全球大项目

  • 2020-05-10
  • 本文字数:2960 字

    阅读完需:约 10 分钟

银行持续交付实战:一个单体系统足以撑起全球大项目

本文由 dbaplus 社群授权转载。


我们的核心系统是一个单体系统,支撑全球多个国家和地区的业务。同时,业务部门近年生意红火,接了几个大客户,针对这些大客户的大型项目也在如火如荼地进行中。


由于生产环境只有一套,而且已经有业务在生产环境上跑,这些大项目最终也要在这套生产环境上上线。这套系统是糅合了各地、各不同业务的复杂系统。


之前,为了满足各个客户交付时间,每个项目都拉了一个独立的分支进行开发,减少各项目之间的依赖,但这也导致了每个项目各自为政,互不交流。一旦这些项目开发完成,要和生产环境的版本进行合并。这种巨型合并势必带来巨大风险,相互隔绝的开发模式也将带来大量的合并冲突。


我们一直在思考如何降低这种合并风险,以及如何打破各大型项目各自为政的困局,实现产品化的敏捷交付。回归测试成为实现这些使命的基础。

使命——实现敏捷交付

前面提到,目前的开发模式是针对不同的大客户,分别设立了不同的大型项目进行开发。这些项目的交付周期往往数以年计,交付周期长,风险大。


生产环境又只有一套,而且已经有业务在生产环境上跑,代码合并困难,上线风险巨大。


我们希望能打破这种大型项目的交付形式,以产品化的思维进行管理。


具体实施的思路是:


  1. 合并——对各大型项目的现有代码与生产环境的版本进行一次性的合并;

  2. 统一 Backlog——各类需求(包括现在以大型项目形式服务的大客户的需求)以用户故事的形式进入到同一个 Backlog;

  3. Scrum——建立以 Scrum 为形式的持续交付机制,以一个月作为 Sprint 的周期,通过 Sprint 计划会议敲定 Sprint 的交付计划;

  4. 持续交付——每个 Sprint 完成计划内各用户故事的交付全流程,包括回归测试和上线到生产环境。


要实现以上模式,上线前的回归测试至关重要。而且由于一个 Sprint 内,也就是一个月内,要完成 Sprint 交付计划内所有用户故事的需求澄清、设计、开发、测试、用户验收和上线,时间非常紧,回归测试也必须在一、两天内完成。


如何实现既能充分保护生产环境,又能实现快速反馈的回归测试,成为一个重要议题。

自动化大量功能测试不可行

对于如何设计和实施覆盖率高、执行稳定而且快速的自动化回归测试,一直是一个难题。


我们曾经的一个思路是把现有的功能测试用例进行自动化,但很快发现这个思路不可行,主要原因如下:


  1. 只能依赖 UI 测试——由于核心系统是供应商产品,开发是由供应商负责的,对我们来说就是个黑盒子,我们只能通过 UI 进行测试。众所周知,UI 的自动化测试,开发、维护成本高,脆弱而且执行时间长;

  2. 无法快速反馈——通过功能进行覆盖,要求不断增加测试用例来提高覆盖率,由于 UI 测试的执行时间长,用例越多,整体执行时间越长,如果执行周期要数以天计,则无法达到快速反馈的目的;

  3. 性价比低——功能测试用例的覆盖率其实是不可见的,即使把所有功能测试都自动化了,其实际覆盖率依然不高,也就是说这个投入的性价比很低。


我们必须要寻找一种方法,以最小的投入获取最大的保障。


我们对回归测试自动化的预期进行了重新定位。 我们进行回归测试,就是要保护生产环境的关键业务可以照常进行。我们要防止的,是新的特性发布造成生产环境灾难,也就是导致关键业务无法进行的大面积故障。 对于非灾难性的小故障,完全可以通过运维手段来处理。


因此,我们不应该把回归测试定位为防止一切问题。

以不变应万变

基于以上对回归测试预期的重新定位,我们和业务部门协商,请他们列举出当前在生产环境上最关键的业务过程有哪些。我们要保证的是, 当新的特性上线后的首个交易日,原有的最关键的业务过程不会受到严重影响。


基于这个预期,我们以业务部门提供的关键业务过程作为测试用例,并形成以下的回归测试思路:


准备阶段:


  1. 在某个测试环境里,系统版本与生产环境版本相同;

  2. 备份环境数据;

  3. 以某个交易日为基准,执行相应的测试用例;

  4. 备份输入、输出数据(包括生成的接口文件和报表)。


执行阶段:


  1. 在该测试环境里,导入在准备阶段备份的环境数据;

  2. 升级系统到目标版本;

  3. 以准备阶段相同的交易日和相同的输入数据(在准备阶段已备份)执行相同的测试用例,生成相应的接口文件和报表;

  4. 与准备阶段的输出(接口文件和报表)进行比对;

  5. 如果目标版本的输出与原版本的对比没有非预期的差异,视为通过。


简单总结, 就是对比两个系统版本在相同测试环境、相同环境数据、相同交易日、相同输入的情况下,输出是否有非预期的差异。


这个思路的最大特点是,以不变应万变。生产环境的关键业务过程不会经常变化,也就是说测试用例基本上比较固定。通过反复运行固定的测试用例实现回归测试的目标,保护生产环境上的关键业务过程,避免灾难。以最少的用例实现最大的保护。


而且测试的结果验证是通过比对不同版本的输出,我们 不必在乎具体的输出内容 ,只需要关注输出是否有非预期差异。


当然,一旦有新的大客户上线,也就是有新的关键业务过程,这些过程也应该放入到回归测试用例中,当然,用例的选择还是以避免灾难为准则。


在前面提到的功能测试思路里,我们需要不断增加测试用例以增加测试覆盖率,但是由于测试只能在 UI 进行,这样无限增加功能测试用例是不可持续的。


通过实践,我们发现要充分发挥这个新思路的价值,要注意以下几点:


  1. 专属环境——由于这套环境需要反复整理环境数据和升级,一定要为这个回归测试准备一套专属的测试环境,不要在共享的环境里进行;

  2. 明确检查点——由于执行测试输出的接口文件、报表里一定有时间戳、自增 ID 等每次执行都会变化的信息,不能简单通过文件来比对。在拟定测试用例时,就应该明确这些接口文件、报表里的有哪些数据需要检查。在每个版本交付时,开发人员也应该明确告知哪些数据检查点会有预期差异。否则对比工作将耗费大量的时间和精力;

  3. 变更范围要小——如果对比的两个系统版本的变更范围太大,会导致输出有大量差异,比对意义不大。因此这个方法不太适合大的合并,比较适合落实了敏捷交付后,由于每个 Sprint 的变更范围较小,两个系统版本间的输出差异不多,比对较容易。


以这个思路建立了回归测试框架,我们便可以着手执行过程的自动化,从而提升其执行的效率。

总结

我们的核心系统是一套单体复杂系统,支撑全球多个国家和地区不同的业务。


为了实现敏捷交付,我们希望打破目前以大型项目为形式的各自为政,把各项目的所有需求放在统一的 Backlog 通过 Scrum 的方法进行持续交付。


要实现这一点,我们需要在每个 Sprint 都进行有效的回归测试,以保护生产环境的关键业务在新特性上线后不会有灾难性的故障。


通过对比两个系统版本在相同测试环境、相同环境数据、相同交易日、相同输入的情况下,执行关键业务过程的有限的测试用例,输出是否有非预期的差异的回归测试方法,以少胜多,以不变应万变,持续保护生产环境的核心业务,为持续交付保驾护航。


作者介绍


刘华(Kenneth),就职于世界 500 强银行,负责基金服务业务软件开发与交付,DevOps 团队负责人。敏捷、精益、DevOps 领域专家,精通极限编程、Scrum、看板方法、测试驱动开发、持续集成、行为驱动开发、DevOps 工具栈。著有《猎豹行动:硝烟中的敏捷转型之旅》一书。


原文链接


https://mp.weixin.qq.com/s?__biz=MzI4NTA1MDEwNg==&mid=2650787928&idx=1&sn=610825e3cb730f6294a685e1e102e9f0&chksm=f3f965cdc48eecdb5cffbdf7ffa7c02aba82d4edcf5b43e2eff14e467e10d29111455b511c22&scene=27#wechat_redirect


2020-05-10 10:062930

评论

发布
暂无评论
发现更多内容

服务调用链相关基础知识

luojiahu

调用链

网络攻防学习笔记 Day14

穿过生命散发芬芳

5月日更 网络攻防

API网关关键技术

lenka

5月日更

这个世界不会欺负诚实的人,也绝对不会亏待努力的人

小天同学

5月日更 真诚 诚信 努力

Golang library source file 库源码文件

escray

学习 极客时间 Go 语言 5月日更

iOS 面试策略之系统框架-UIScrollView及其子类

iOSer

ios 面试 UIScrollView UICollectionView

用Python找出100以内的质数 - DAY6

Qien Z.

5月日更 ptyhon 找质数 质数

全文检索的介绍

五分钟学大数据

大数据 5月日更

5分钟速读之Rust权威指南(二)

wzx

rust

学生管理系统考试试卷存储方案

Simon

架构实战营

Nginx通过split_client实现客户端分流

运维研习社

nginx 灰度发布 5月日更 分流

打破思维定式(十)

Changing Lin

不是会员不让复制粘贴?看我“三板斧”!

liuzhen007

使用技巧 5月日更

数据挖掘从入门到放弃(一):线性回归和逻辑回归

数据社

机器学习 5月日更

JavaScript 进阶——井字棋游戏智能AI搭建

空城机

JavaScript 大前端 5月日更 web游戏

数据续谈

顿晓

数据 5月日更

花一周整理!Python全系列学习资料,全是干货

Python研究者

聊聊Spring的XML Schema扩展机制的使用方式

Hex

spring

消息队列系统架构设计

王硕

架构训练营

Netty整体架构学习笔记

风翱

Netty 5月日更

今日学习小结

Nydia

学习

声网2020实时大会后的弱网对抗实践

Fenngton

音视频 网络环境 视频编解码 声网 弱网下的极限实时视频通信

Android设备实时音视频传输有效方案

小驰笔记

android 音视频 引航计划

20个不良用户体验

老猿Python

程序员 用户体验 程序开发

就这?腾讯云高工熬夜手写'Java微服务学习笔记'也就让我月薪涨3k

Java 编程 程序员 架构 面试

数据科学指南#基础篇 Bokeh入门

Lev

Python 学习 数据分析 数据科学

Spark为什么会流行

大数据技术指南

大数据 5月日更

通过实践带你揭开TCP中CLOSE_WAIT和TIME_WAIT的神秘面纱

linux大本营

c++ Linux TCP 网络协议 epoll

Python-XPath

若尘

Python编程 5月日更

量化网格交易策略系统,马丁倍投策略软件源码

APP透露的焦虑

wgc

杂谈

银行持续交付实战:一个单体系统足以撑起全球大项目_软件工程_dbaplus社群_InfoQ精选文章