如何避免GitHub那样断网43秒瘫痪 24 个小时？_文化 & 方法_Geek_cb7643_InfoQ精选文章

速来报名！AICon北京站鸿蒙专场~ 了解详情 



 写点什么

登录/注册

如何避免GitHub那样断网43秒瘫痪 24 个小时？

小蚂蚁说：
蚂蚁金服自研的金融级分布式关系型数据库 OceanBase 的高可用及容灾能力在发生城市级故障时，让系统秒级完成智能切换，实现自愈，用户的资金、数据 0 丢失。

今日，GitHub 技术负责人 Jason Warner 的一篇技术深度解析稿成为 IT 圈爆款。文中，Jason 坦诚地对外讲述了 10 月 21 日 100G 光缆设备故障后，Github 服务降级的应急过程以及反思总结。

从 Jason Warner 的文章中不难看出，造成断网 43 秒瘫痪 24 小时的罪魁祸首是数据库。由于部署在两个数据中心的数据库集群没有实时同步。意外发生时，Github 的工程师担心数据丢失，不敢快速将主数据库安全切换到东海岸的备份数据中心。

程序员们在 GitHub 这篇“忏悔录”下面留言，表达对数据库集群的“哀悼”。但更多 IT 从业者关心的问题是，如何避免这样的灾难事件降临到自己的公司，自己维护的系统。

蚂蚁金服 OceanBase 分布式数据库专家认为，此次 Github 事件是典型的城市级故障。如果系统采用的是高可用的三地五中心解决方案，就可以自如应对。

就在一个月前，今年的杭州云栖大会上，蚂蚁金服副 CTO 胡喜现场模拟剪断支付宝近一半的服务器光缆。只用了 26 秒，模拟环境中的支付宝就完全恢复了正常，这背后即是 OceanBase 城市级别故障的自愈能力。

原来，Github 类似银行采用的传统数据库两地三中心模式，即“主库（主机房）+同城热备库（同城热备机房）+异地灾备库（异地灾备机房）”。这种方式下通常只有主机房的服务器能提供写服务。如果主城市出现城市级故障，灾备城市的数据库虽然可以工作，但由于没有同步的最新数据，因此灾备库的数据是有损的。

但在三地五中心部署下，任何单个城市故障，OceanBase 都不会停止服务，数据也不会有任何损失。

Github 表示，为了保证数据完整性，他们不得不牺牲恢复时间。其实，这个问题采用三地五中心方案可以更好的应对。城市故障时，OceanBase 只要活着的两个城市的三个机房两两之间能够通信，就可以正常服务，也不会有任何的数据损失。

本文转载自公众号蚂蚁金服科技（ID：Ant-Techfin）。

原文链接：

https://mp.weixin.qq.com/s/29cwS71iKVLhZ_6YgS-rRQ

评论

发布

暂无评论

【YashanDB知识库】yac修改参数后关闭数据库hang住

yashandb 崖山数据库崖山DB

面试题：如何解决缓存和数据库的一致性问题？

人工智能|思维链

霍格沃兹测试开发学社

解密可观测行业中的语义规范 — 代码世界中的“语言艺术”

Greptime 格睿科技

数据库可观测性代码系统可观测性语义规范

MobPush 撤回/取消推送

MobTech袤博科技

Java 开发者产品动态

想做出好看的PPT课件？这3款AI生成PPT工具助你一臂之力！

人工智能效率工具 PPT 办公软件 AI生成PPT

盘点那些国际知名黑客（上）

网络安全服务

C#开源、简单易用的Dapper扩展类库 - Dommel

开讲在即！免费参加第五届“解放军总医院—麻省理工学院医疗大数据学术交流及 Datathon 活动”会前培训班

观测云：全球布局的监控先锋

可观测技术

淘宝天猫商品详情API：商品描述与图片的获取方法

技术冰糖葫芦

API Explorer api 货币化 API 文档 pinduoduo API

客户在哪儿AI助大客户销售最高成功概率的见到目标客户决策层

客户在哪儿AI

ToB营销 ToB获客 ToB增长大客户营销

异构智算，打赢智算时代「牧野之战」

体育赛事直播APP开发：现成源码专注优化用户界面与体验

软件开发-梦幻运营部

观测云：企业数据安全的守护者

可观测技术

淘宝店铺商品API返回值分析：优化商品展示与推荐

技术冰糖葫芦

API Explorer API 编排 API 文档 pinduoduo API

ShareSDK ios端扩展功能业务设置

MobTech袤博科技

Java 开发者产品动态

MobPush Android常见问题

MobTech袤博科技

开发者产品动态

内网穿透

小程序开源前端后端

【YashanDB知识库】v$instance视图中实例角色含义不明确

yashandb 崖山数据库崖山DB

简化运维，提升效率：观测云在企业监控中的独特优势

可观测技术

参加的活动或展会每年都是同一批人 ToB企业该怎么办

客户在哪儿AI

ToB营销活动营销 ToB增长大客户营销

AV-Comparatives发布企业杀毒软件测评报告

Zilliz 推出 Spark Connector：简化非结构化数据处理流程

程序员 AI Milvus Zilliz 向量数据库

技术干货丨InspirePolyFoam 高级应用：发泡仿真

Altair RapidMiner

制造业仿真智能制造新材料 altair

淘宝商品详情数据接口| 淘宝API接口

淘宝商品详情接口淘宝商品API接口淘宝API 淘宝商品详情数据

实战教程：利用淘宝API接口批量抓取商品列表数据

淘宝商品列表数据接口淘宝商品数据采集淘宝商品列表数据采集淘宝商品列表接口淘宝商品API

用二维码介绍旅游行程，扫码就能获取路线信息

草料二维码

二维码草料二维码旅游行程旅游简介

Elasticsearch基本概念与使用

爱吃小舅的鱼

elasticsearch 数据分析

轻松获取天气信息：免费天气API一览

API 天气api 免费API

MobPush 鸿蒙端SDK API

MobTech袤博科技

Java 开发者产品动态