NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

陆金所机房一键切换平台建设

  • 2019-08-11
  • 本文字数:1145 字

    阅读完需:约 4 分钟

陆金所机房一键切换平台建设

ArchSummit深圳2019大会上,刘俊讲师做了《陆金所机房一键切换平台建设》主题演讲,主要内容如下。


演讲简介


陆金所于 2017 年 11 月完成同城双活机房建设,在闭环 CMDB 和运维自动化变更云平台建设完成的基础上,为保证机房发生灾难情况下,将业务影响降至最低,陆金所技术运营部于 2018 年 4 月份启动了机房一键切换项目。


2018 年 12 月 1 日,陆金所用 4 分 38 秒成功将网站所有服务进行机房级切换演练(包含 1429 个应用系统,120 个 DB 实例,310 个外部网关,3100 个 job,11 个 A/S 应用,文件服务等核心架构组件),达成机房一键切换的设计目标。


2018 年 12 月 22 日,陆金所利用一键切换平台将主机房从宝信切换至外高桥机房。2019 年 3 月 30 日,陆金所将主机房从外高桥切换至宝信机房,耗时缩短到 4 分 05 秒。一键切换平台的完成,代表陆金所具备机房级容灾 5 分钟内恢复的能力,达到业界领先水平。


演讲提纲


1、设计目标:


  • 在宝信机房正常提供服务的情况下,通过一键切换平台 10 分钟内切换宝信机房至外高桥。


2、项目挑战:


  • 全站 1400+应用系统,100 套+DB 实例,300+大网关,3000+job 调度,梳理 A/S 应用(数量庞大,架构复杂,系统多样)

  • 数据一致性保障,CMDB 自动化闭环,自动化平台重构,一键切换多任务并发执行时效,时效要求高(技术框架改造量大)

  • 生产应用标准化改造工作量大(历史遗留问题多)


3、设计方案关键点:


  • 双活机房有状态的服务需要可以在机房之间做灵活切换

  • 服务经全面梳理确认为 7 大类型

  • 7 大服务切换需要反复生产验证,确保接口健壮性

  • 机房切换需分批次,逐步加量验证

  • DB 切换涉及百套以上 DB,Oracle/MySQL/Redis 都需要完成切换目标

  • 一键切换平台需具备高可用/权限控制/切换过程输出/服务展示/切换进度/自动检查/CMDB 闭环等功能


听众受益点


  1. 陆金所的运维自动化的根本实现原则是分而治之,大而化小

  2. 每个服务目录,无论是复杂的组合操作还是简单的原子操作,都统一遵循以上 4 步流程

  3. 所有涉及的元数据都要求从 CMDB 中获取,完成变更后所有变化也需要反应到 CMDB 中从而形成闭环

  4. 变更流程的所有细节都需要在变更设计阶段却确定并提交到相关审批流程中(切换过程自动化审批)

  5. 变更的执行要求全生命周期管理,过程中的状态以及产生的所有日志都会留存并提供用户实时查询与相关干预操作


讲师介绍


刘俊


陆金所 技术运营部运维开发团队经理


2016 年 4 月入司至今,先后在规划管理团队和运维开发团队担任资深架构师、团队经理职务。负责陆金所核心 IT 技术运营系统的建设与保障工作,负责陆金所 DevOps 核心运营流程与工具链的持续优化改进以及技术运营相关业务的技术选型、方案制定与架构设计。同时也负责 IT 技术体系可用率保障的相关技术工作。












完整演讲 PPT 下载链接


https://archsummit.infoq.cn/2019/shenzhen/schedule


2019-08-11 00:001560

评论

发布
暂无评论
发现更多内容

🔥对线面试官-线程入门第一课

派大星

线程 Java 面试题

专家论道: 唐贤香云纱塑造中国非遗国际品牌

Geek_2d6073

基于YonGPT 的智能招聘,全新的数智化招聘体验!

用友BIP

企业服务大模型 YonGPT

SUSECON 深圳 2023 创新峰会开启报名

Rancher

腾讯云 ES 重磅推出,一站式全托管的自治索引终于来了!

腾讯云大数据

ES

高效能ScrumMaster的三大权利

ShineScrum捷行

Scrum ScrumMaster

「2023最新版」Java基础、中级、高级面试题总结(1000道题含答案解析)

架构师之道

Java 面试

Gartner首发中国数据、分析与人工智能技术成熟度曲线,柏睿数据入选实时数据管理典型厂商

新消费日报

《云管理产品与服务图谱(2023)》发布!MIAOYUN荣登【运维平台】板块

MIAOYUN

云计算 运维平台 云管理平台 云管理 云管理产品与服务图谱

可视化分析30天免费,瓴羊Quick BI助力企业转型

流量猫猫头

现代化税收征管的“四精”目标 科学技术发挥关键作用

用友BIP

税务管理

JMeter笔记17 | JMeter逻辑控制器简介

测试 单元测试 Jmeter 性能测试 接口测试

云智慧x统信软件:智能化IT服务管理,提升客户服务价值

云智慧AIOps社区

ITSM IT运维 智能运维AIOps 工单管理系统

阿里云出品—高分计算机好书推荐榜

穿过生命散发芬芳

计算机图书

AB实验遇到用户不均匀怎么办?—— vivo游戏中心业务实践经验分享

vivo互联网技术

AB实验 分层抽样 用户不均匀 事前用户分层

文本 Embedding 基本概念和应用实现原理

Dify

技术分享 Embedding word embedding

Ubuntu如何配置软件镜像源?

百度搜索:蓝易云

云计算 Linux ubuntu 运维 蓝易云

IoT 场景下 TimescaleDB 与 TDengine 的性能对比测试报告出炉!点击查看

爱倒腾的程序员

数据库

Flink Unaligned Checkpoint 在 Shopee 的优化和实践

Apache Flink

大数据 flink 实时计算

ubuntu编译安装kernel教程。

百度搜索:蓝易云

云计算 Linux ubuntu 云服务器 内核

Dify.AI 用户直面会总结:Embedding 技术与 Dify 数据集设计/规划

Dify

开源项目 AI技术实践 LLMOps

面试 JVM 一问三不知?看这篇就够

java易二三

Java 编程 程序员 计算机

北京信息化协会信息技术应用创新工作委员会一行到开放原子开源基金会交流学习

开放原子开源基金会

开源 开放原子开源基金

火山引擎DataLeap的Data Catalog系统搜索实践 (上)

字节跳动数据平台

数据中台 数据治理 数据安全 数据研发 企业号 8 月 PK 榜

百度搭台,千家打擂,文心杯创业大赛成投资人新宠?

热爱编程的小白白

CentOS搭建squid正向代理教程。

百度搜索:蓝易云

云计算 Linux centos 运维 squid

打包自己的Python应用并上传到PYPI

Rayzh

Python

GPU 容器虚拟化新能力发布和全场景实践

百度Geek说

人工智能 企业号 8 月 PK 榜

香港云主机的优势,为何成为新一代网站托管首选?

一只扑棱蛾子

云主机 香港云主机

重磅更新 | 大幅提升数据集命中预期;AI 联网搜索能力也来了!

Dify

AI技术 开源软件 LLMOps

山东布谷科技iOS端分析直播app源码秒开技术(二):缓冲功能

山东布谷科技

软件开发 ios 开发 首帧秒开 缓冲 直播APP源码

陆金所机房一键切换平台建设_ArchSummit_刘俊_InfoQ精选文章