写点什么

陆金所机房一键切换平台建设

  • 2019-08-11
  • 本文字数:1145 字

    阅读完需:约 4 分钟

陆金所机房一键切换平台建设

ArchSummit深圳2019大会上,刘俊讲师做了《陆金所机房一键切换平台建设》主题演讲,主要内容如下。


演讲简介


陆金所于 2017 年 11 月完成同城双活机房建设,在闭环 CMDB 和运维自动化变更云平台建设完成的基础上,为保证机房发生灾难情况下,将业务影响降至最低,陆金所技术运营部于 2018 年 4 月份启动了机房一键切换项目。


2018 年 12 月 1 日,陆金所用 4 分 38 秒成功将网站所有服务进行机房级切换演练(包含 1429 个应用系统,120 个 DB 实例,310 个外部网关,3100 个 job,11 个 A/S 应用,文件服务等核心架构组件),达成机房一键切换的设计目标。


2018 年 12 月 22 日,陆金所利用一键切换平台将主机房从宝信切换至外高桥机房。2019 年 3 月 30 日,陆金所将主机房从外高桥切换至宝信机房,耗时缩短到 4 分 05 秒。一键切换平台的完成,代表陆金所具备机房级容灾 5 分钟内恢复的能力,达到业界领先水平。


演讲提纲


1、设计目标:


  • 在宝信机房正常提供服务的情况下,通过一键切换平台 10 分钟内切换宝信机房至外高桥。


2、项目挑战:


  • 全站 1400+应用系统,100 套+DB 实例,300+大网关,3000+job 调度,梳理 A/S 应用(数量庞大,架构复杂,系统多样)

  • 数据一致性保障,CMDB 自动化闭环,自动化平台重构,一键切换多任务并发执行时效,时效要求高(技术框架改造量大)

  • 生产应用标准化改造工作量大(历史遗留问题多)


3、设计方案关键点:


  • 双活机房有状态的服务需要可以在机房之间做灵活切换

  • 服务经全面梳理确认为 7 大类型

  • 7 大服务切换需要反复生产验证,确保接口健壮性

  • 机房切换需分批次,逐步加量验证

  • DB 切换涉及百套以上 DB,Oracle/MySQL/Redis 都需要完成切换目标

  • 一键切换平台需具备高可用/权限控制/切换过程输出/服务展示/切换进度/自动检查/CMDB 闭环等功能


听众受益点


  1. 陆金所的运维自动化的根本实现原则是分而治之,大而化小

  2. 每个服务目录,无论是复杂的组合操作还是简单的原子操作,都统一遵循以上 4 步流程

  3. 所有涉及的元数据都要求从 CMDB 中获取,完成变更后所有变化也需要反应到 CMDB 中从而形成闭环

  4. 变更流程的所有细节都需要在变更设计阶段却确定并提交到相关审批流程中(切换过程自动化审批)

  5. 变更的执行要求全生命周期管理,过程中的状态以及产生的所有日志都会留存并提供用户实时查询与相关干预操作


讲师介绍


刘俊


陆金所 技术运营部运维开发团队经理


2016 年 4 月入司至今,先后在规划管理团队和运维开发团队担任资深架构师、团队经理职务。负责陆金所核心 IT 技术运营系统的建设与保障工作,负责陆金所 DevOps 核心运营流程与工具链的持续优化改进以及技术运营相关业务的技术选型、方案制定与架构设计。同时也负责 IT 技术体系可用率保障的相关技术工作。












完整演讲 PPT 下载链接


https://archsummit.infoq.cn/2019/shenzhen/schedule


2019-08-11 00:001685

评论

发布
暂无评论
发现更多内容

MySQL从入门到入魔(03)

海拥(haiyong.site)

MySQL 数据库 28天写作 12月日更

比较PostgreSQL与MySQL两大开源关系数据库管理系统

Ethereal

MySQL 数据库 postgresql

读《思辨与立场》-07-02指导原则

wood

28天写作 批判性思维 思辨与立场

架构实战营-模块七作业

随风King

「架构实战营」

Flink 实践教程-进阶(3):窗口操作

腾讯云大数据

flink 流计算 Oceanus

混沌工程之 ChaoBlade 的实现原理

zuozewei

混沌工程 ChaosBlade 12月日更

Vuepress 2.X + Element-Plus 的基本使用

AR7

typescript Vue3 vuepress Element Plus Vuepress2.X

基于流计算 Oceanus 和 Elasticsearch Service 构建百亿级实时监控系统

腾讯云大数据

流计算 Oceanus Elastic Search

【大咖直播】Elastic 企业搜索实战工作坊(第二期)

腾讯云大数据

Elastic Search

用户日活月活怎么统计 - Redis HyperLogLog 详解

程序员历小冰

redis 28天写作 近似算法 12月日更 HyperLogLog

架构实战营

ren

如何在Linux系统中安装Docker?

Ethereal

Docker

Prometheus Exporter (三十三)BIND Exporter

耳东@Erdong

Prometheus 28天写作 bind exporter 12月日更

阿里云(腾讯云)服务器使用宝塔,搭建Python环境,运行 django 程序

梦想橡皮擦

12月日更

[Pulsar] TopicPolicy的同步过程

Zike Yang

Apache Pulsar 12月日更

模块七作业:王者荣耀商城异地多活架构设计

dean

架构实战营

一年一度绩效考核

搬砖的周狮傅

绩效管理

百度智能云以知识智能化驱动产业智能化升级

百度大脑

Dart 条件语句

坚果

flutter dart 28天写作 12月日更

Dubbo框架学习笔记八

风翱

dubbo 12月日更

51 K8S之Helm基础应用

穿过生命散发芬芳

k8s 28天写作 12月日更

浅谈protobuf

lecury

协议 服务器端开发 protobuf

感情是麻烦出来的(21/28)

赵新龙

28天写作

DDD领域驱动设计实战(一)-领域模型、子域、核心域、通用域和支撑域等基本概念

JavaEdge

12月日更

21《重学JAVA》-- 集合 (三)

杨鹏Geek

Java25周年 28天写作 12月日更

基于SLA的测试

QualityFocus

云原生 测试 SLA

【CSS 学习总结】第一篇 - HTML 的语义化

Brave

CSS 12月日更

百度搜索中台海量数据管理的云原生和智能化实践

lecury

云原生 数据架构 架构演进 技术创新 百度搜索

Flink 实践教程-进阶(4):TOP-N

腾讯云大数据

flink 流计算 Oceanus

妙解RIP协议和OSPF协议的优缺点,建议收藏!

Ethereal

网络协议 OSPF 网络技术 网络技术联盟站 rip

语音输入还是打字输入

将军-技术演讲力教练

陆金所机房一键切换平台建设_ArchSummit_刘俊_InfoQ精选文章