【锁定直播】字节、华为云、阿里云等技术专家讨论如何将大模型接入 AIOps 解决实际问题,戳>>> 了解详情
写点什么

陆金所机房一键切换平台建设

  • 2019-08-11
  • 本文字数:1145 字

    阅读完需:约 4 分钟

陆金所机房一键切换平台建设

ArchSummit深圳2019大会上,刘俊讲师做了《陆金所机房一键切换平台建设》主题演讲,主要内容如下。


演讲简介


陆金所于 2017 年 11 月完成同城双活机房建设,在闭环 CMDB 和运维自动化变更云平台建设完成的基础上,为保证机房发生灾难情况下,将业务影响降至最低,陆金所技术运营部于 2018 年 4 月份启动了机房一键切换项目。


2018 年 12 月 1 日,陆金所用 4 分 38 秒成功将网站所有服务进行机房级切换演练(包含 1429 个应用系统,120 个 DB 实例,310 个外部网关,3100 个 job,11 个 A/S 应用,文件服务等核心架构组件),达成机房一键切换的设计目标。


2018 年 12 月 22 日,陆金所利用一键切换平台将主机房从宝信切换至外高桥机房。2019 年 3 月 30 日,陆金所将主机房从外高桥切换至宝信机房,耗时缩短到 4 分 05 秒。一键切换平台的完成,代表陆金所具备机房级容灾 5 分钟内恢复的能力,达到业界领先水平。


演讲提纲


1、设计目标:


  • 在宝信机房正常提供服务的情况下,通过一键切换平台 10 分钟内切换宝信机房至外高桥。


2、项目挑战:


  • 全站 1400+应用系统,100 套+DB 实例,300+大网关,3000+job 调度,梳理 A/S 应用(数量庞大,架构复杂,系统多样)

  • 数据一致性保障,CMDB 自动化闭环,自动化平台重构,一键切换多任务并发执行时效,时效要求高(技术框架改造量大)

  • 生产应用标准化改造工作量大(历史遗留问题多)


3、设计方案关键点:


  • 双活机房有状态的服务需要可以在机房之间做灵活切换

  • 服务经全面梳理确认为 7 大类型

  • 7 大服务切换需要反复生产验证,确保接口健壮性

  • 机房切换需分批次,逐步加量验证

  • DB 切换涉及百套以上 DB,Oracle/MySQL/Redis 都需要完成切换目标

  • 一键切换平台需具备高可用/权限控制/切换过程输出/服务展示/切换进度/自动检查/CMDB 闭环等功能


听众受益点


  1. 陆金所的运维自动化的根本实现原则是分而治之,大而化小

  2. 每个服务目录,无论是复杂的组合操作还是简单的原子操作,都统一遵循以上 4 步流程

  3. 所有涉及的元数据都要求从 CMDB 中获取,完成变更后所有变化也需要反应到 CMDB 中从而形成闭环

  4. 变更流程的所有细节都需要在变更设计阶段却确定并提交到相关审批流程中(切换过程自动化审批)

  5. 变更的执行要求全生命周期管理,过程中的状态以及产生的所有日志都会留存并提供用户实时查询与相关干预操作


讲师介绍


刘俊


陆金所 技术运营部运维开发团队经理


2016 年 4 月入司至今,先后在规划管理团队和运维开发团队担任资深架构师、团队经理职务。负责陆金所核心 IT 技术运营系统的建设与保障工作,负责陆金所 DevOps 核心运营流程与工具链的持续优化改进以及技术运营相关业务的技术选型、方案制定与架构设计。同时也负责 IT 技术体系可用率保障的相关技术工作。












完整演讲 PPT 下载链接


https://archsummit.infoq.cn/2019/shenzhen/schedule


2019-08-11 00:001555

评论

发布
暂无评论
发现更多内容

趣学前端」为什么有的页面背景颜色是渐变的

叶一一

CSS 前端 10月月更

ReentrantLock可重入、可打断、锁超时实现原理

JAVA旭阳

Java 并发 10月月更

Apache RocketMQ 在阿里云大规模商业化实践之路

阿里巴巴云原生

Apache 阿里云 云原生 消息队列 商业化

JWT详解

Java学术趴

10月月更

Go语言开发小技巧&易错点100例(一)

海风极客

10月月更

Linux下编写ENC28J60网卡驱动,完善网络设备框架

DS小龙哥

10月月更

Kafka的客户端NetworkClient如何发起的请求

石臻臻的杂货铺

Kafk 10月月更

用Java实现计算器功能

魏铁锤

10月月更

行业实践:RocketMQ 业务集成典型行业应用和实践

阿里巴巴云原生

阿里云 RocketMQ 云原生

super关键字的作用

魏铁锤

10月月更

Go-Excelize API源码阅读(二十一)——GetDefinedName()、DeleteDefinedName()

Regan Yue

Go 源码阅读 源码刨析 10月月更

Go-Excelize API源码阅读(二十三)——SetDocProps、GetDocProps

Regan Yue

Go 开源 源码刨析 10月月更

「趣学前端」容器上的折角边框是图形吗?

叶一一

CSS 前端 10月月更

常见大数据应用场景

穿过生命散发芬芳

大数据 10月月更

搭建Linux下QT开发环境与Android开发环境(嵌入式与PC机)

DS小龙哥

10月月更

图解ReentrantLock的条件变量Condition机制

JAVA旭阳

Java 并发 10月月更

前端开发提效小技巧之业务功能篇

叶一一

前端 提高效率 10月月更

浅谈etcd服务注册与发现

海风极客

Go 微服务 etcd 10月月更

一文搞懂Go整合captcha实现验证码功能

海风极客

Go Web 安全 10月月更

B类纯资金业务的资金安全保障

agnostic

资金安全 B类业务 纯资金业务

「趣学前端」box-shadow的多重用法

叶一一

CSS 前端 10月月更

一文搞懂常见的网络I/O模型

海风极客

网络 网络io 10月月更

用栈操作构建数组

掘金安东尼

算法 10月月更

如何在 Linux 上重新启动网络接口?

wljslmz

Linux 网络 网络接口 10月月更

华为云从入门到实战 | 负载均衡服务原理

TiAmo

华为 云开发 10月月更

面试官:说说你对Node中的Stream的理解

CoderBin

面试 前端 Node 10月月更

Go-Excelize API源码阅读(二十二)——SetAppProps(appProperties *AppProperties)

Regan Yue

Go 开源 源码分析 Excelize 10月月更

「趣学前端」页面上吸顶的效果是怎么做到的

叶一一

CSS 前端 10月月更

【一Go到底】第十五天---continue快速入门

指剑

Go golang 10月月更

JavaSE 抽象类和接口

whispar

接口 Java应用 10月月更

Serverless的应用场景

阿泽🧸

Serverless 10月月更

陆金所机房一键切换平台建设_ArchSummit_刘俊_InfoQ精选文章