发布在即!企业 AIGC 应用程度测评,3 步定制专属评估报告。抢首批测评权益>>> 了解详情
写点什么

从携程网的故障中我们应该反思什么?

  • 2015-05-28
  • 本文字数:2207 字

    阅读完需:约 7 分钟

今天携程业务瘫痪事件,成为了今天最热门的事件,目前官方还未公布确切的原因。但此事件我认为也将成为普及数据管理重要性意识的一次公开课。 近年来 IT 趋势发生了很大的的变化,特别是以云(Cloud)、大数据(Analytics & Big Data)、移动(Mobile)和社交(Social)(简称 CAMS)为代表的新趋势迅猛发展。互联网公司以及政企组织也在逐步云化的进程中。但我认为,新的 IT 趋势形成,并不代表上一代数据中心架构会迅速消亡,很多组织机构中的数据中心架构切换需要一定时间,因此这种混合的 IT 架构将是常态。然而混合环境给数据管理带来新的难题,需要我们主动积极地思考与应用。

不变的数据管理

尽管 IT 环境不断地发生着变化,但我们会注意到,数据管理在过去的十几年里,核心要点并未发生变化。我总结下来主要有三点。

数据备份保护

数据备份是数据保护的最后一道防线。数据备份的核心价值是通过有效的数据备份手段,降低数据丢失风险,提升数据安全保障。近年来,一些新的技术名词不断涌现,各种宣传、炒作,给用户造成了不小的困惑与误导:有人说有存储镜像比备份更好,不需要备份;有人说 CDP 取代备份;有人说双活数据中心方案很安全,不需要备份等。但我始终认为,不管 IT 趋势如何发展,数据备份一直都将是不可或缺的组成部份。只是在数据备份的形式或技术上发生变化,而这些变化是为了更好地满足新的 IT 架构和环境下保护数据备份的需求。数据保护技术也在不断演进,从磁带备份到磁盘备份,备份与归档融合,再到公有云存储以及蓝光存储备份,等等。数据备份的关键是有效性。数据管理规划中,如何更有效地进行数据备份保护是重点。数据备份不是目的,可恢复才是关键。有效的数据备份需要进行合理的规划,包括合理的备份窗口、备份的可恢复性、跨站点或远距离备份容灾等。如果需要更安全的保护,那么道理很简单,那就是做更多的冗余,多样的介质冗余,多地的冗余;同时定期进行数据恢复演练与验证。

如何保障用户数据高可用与业务连续

数据的高可用性与一致性,是业务连续性的基础。为了提升数据高可用性,诞生了很多我们耳熟能详的技术:RAID、镜像、复制、双活高可用、分布式技术,等等。这些技术诞生的背后,很多都是基于当时的用户对数据高可用与业务连续性的需求。对于业务连续性要求很高的用户来说,如金融、医院等用户,构建一套能够确保数据高可用的系统非常关键。因此,在设计重要业务系统的数据管理架构时,数据高可用与业务连续性的规划也是必不可少的一部份。

如何节省用户数据存储与管理成本

有效的数据管理,不仅仅是为了提升数据安全性与业务连续性,同时也是为了降低数据存储与管理的总成本。关于数据存储的成本,我们通常想到的是存储容量成本,如每 TB 多少钱。实际上,数据存储与管理的成本远远不止这些,还涉及容量成本、IO 成本、安全成本、电力成本、运维成本等。然而大多数公司只注重容量成本,却忽略了其他成本,例如安全成本。当数据量小,IO 压力不大时,这些成本支出还可以接受;但数据量大、IO 需求也大时,安全、电力、运维成本也将大幅增加,总体成本的支出将可能难以承受。

新趋势,数据管理挑战

CAMS 新趋势到来,IT 架构与业务环境正在发生巨大变化,这也带来了新的数据管理挑战。如上所述的三大数据管理核心点,新趋势带来的变化所引发的数据管理挑战将是前所未有的。那么是哪些变化带来了新的挑战呢?

数据指数级的增长

在云计算、大数据、移动与社交的背后,数据量的增长只是浮在水面上的冰山,水面之下潜藏的则是更大的问题,如数据访问压力,以及随之而来的机房配套与运维管理压力。这些变化给数据管理带来了新挑战。1TB 与 100TB 或 PB 级的数据管理压力是截然不同的。尽管我们可能很难量化数据爆炸式增长带来的数据管理难度,但可以明确的是风险的不可控因素增加。如数据保护、灾难恢复的挑战等。

更高的可用性要求

在新趋势下,不管是云、大数据、移动还是社交,因为最终使用者会在任何时间、任何地点、以多种方式进行业务与数据访问,要求 7x24 小时提供业务服务。这对数据与业务服务的可用性,提出了更高的要求。

数据环境混合化

以往我们主要依赖传统数据中心,现在不仅有传统数据中心,还有基于软件定义的数据中心,混合 IT 环境以及混合云应用。例如:一部份业务部署在公有云或私有云平台,一部份在内部原有数据中心;各种数据库与应用平台混合使用,等等。数据环境的混合化,同样带来了新的挑战。混合环境的数据管理不仅仅是技术层面,同时组织架构与其能力也要匹配。 新的趋势、新的需求、新的技术不断涌现,但始终不变的是:数据越重要,就越需要做到最完善的备份保护;业务越集中,就越需要更高的可用性;数据量越大,就越需要高性价比的存储与管理。 尽管 CAMS 大趋势不可逆转,但是以往的很多风险控制体系、数据管理(数据保护与灾难恢复,特别是 RTO/RPO)经验都是可以继承的,特别是在企业级的业务中,向云计算架构迁移非常重要,没有哪种技术是绝对可靠的。数据为王,风控应为先。今天携程的事故原因还未清楚,我们不要胡乱臆测,更不要火上浇油。最坏的事情可能发生在我们每个公司,每个机构组织身上。自查组织内部业务风控情况,完善自身的数据管理体系。有云虽好,可不要忘了数据安全。以上是我的一些观点与看法,如有不当之处,敬请指正与交流。

作者简介

吴米香 来自爱数软件,就职 10 年,专注数据备份、灾难恢复以及软件定义存储领域。可以通过邮箱(wu.mixiang@eisoo.com)与作者联系。

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2015-05-28 10:245092

评论

发布
暂无评论
发现更多内容

MASA Stack 1.0 发布会讲稿 —— 产品篇

MASA技术团队

.net 云原生 MASA MASA Blazor

Apipost自动化测试功能概述

不想敲代码

自动化测试 测试自动化 apipost

聊一聊,我对DDD的关键理解

阿里技术

DDD

Apifox 1 月更新 | 将接口调试做到「极简」的新模式上线

Apifox

Apifox API

GaussDB(DWS)现网案例:collation报错

华为云开发者联盟

数据库 后端 华为云 企业号 2 月 PK 榜 华为云开发者联盟

提升软件质量?为什么不试试华为云CodeArts Check

华为云开发者联盟

云计算 华为云 企业号 2 月 PK 榜 华为云开发者联盟

直播预告丨 立即解锁 ALB Ingress 高级特性

阿里巴巴云原生

阿里云 容器

从一个Demo说起Zookeeper服务端源码

宋小生

zookeeper

使用 NineData GUI 创建与修改 ClickHouse 表结构

NineData

MySQL 分布式数据库 Clickhouse Dbeaver NineData

南宁等级测评机构有几家?分别是哪几家?

行云管家

等保 南京 等级保护 等级

【等保小知识】过等保后可以收到哪些资料?

行云管家

等保 等级保护 过等保

物联网平台选型葵花宝典:盘点开源、SaaS及通用型平台的优劣对比

AIRIOT

物联网 物联网平台选型 平台选型

VSCode一键接入Notebook体验算法套件快速完成水表读数

华为云开发者联盟

人工智能 华为云 企业号 2 月 PK 榜 华为云开发者联盟

OpenHarmony 3.2 Beta多媒体系列——视频录制

OpenHarmony开发者

OpenHarmony

给 Databend 添加 Aggregate 函数 | 函数开发系例二

Databend

直播预约|数据库掌门人论坛召开,共谋中国数据库生态发展新路径

镜舟科技

数据库 大数据 开源

2023年最新互联网大厂精选Java面试真题集锦(JVM、多线程、MQ、MyBatis、MySQL、Redis、微服务、分布式、ES、设计模式)

架构师之道

编程 程序员 计算机 java面试

有了 ETL 数据神器 dbt,表数据秒变 NebulaGraph 中的图数据

NebulaGraph

数据库 大数据 数据处理 图数据库

什么是智能制造,为什么它对传统制造业影响如此之大?

PreMaint

智能工厂 智能制造

高级java体系课第1期第二周作业

刘博

【活动报名】re:Invent - AI 应用助力企业构建数字战略

亚马逊云科技 (Amazon Web Services)

火山引擎DataLeap:3个关键步骤,复制字节跳动一站式数据治理经验

字节跳动数据平台

大数据 数据治理 数据研发 实际应用 企业号 2 月 PK 榜

优秀实践案例征集火热开启,快来投稿!

Apache RocketMQ

消息列队

使用 QuTrunk+Amazon Deep Learning AMI(TensorFlow2)构建量子神经网络

亚马逊云科技 (Amazon Web Services)

深度学习 量子计算

云原生技术在容器方面的应用

统信软件

容器 云原生 云服务

基于 Kubernetes 的企业级大数据平台,EMR on ACK 技术初探

阿里巴巴云原生

阿里云 容器 云原生

记录一次还算优雅的代码设计

京东科技开发者

线程 cpu 优雅 代码设计 企业号 2 月 PK 榜

统一观测丨如何使用Prometheus 实现性能压测指标可观测

阿里巴巴云原生

阿里云 云原生 Prometheus 压测

百度APP iOS端内存优化-原理篇

百度Geek说

ios 内存 企业号 2 月 PK 榜

OpenInfra峰会议程已公布,特色主题演讲,百余场专题会议等你来参与!

Geek_2d6073

新思科技解读2023年软件安全行业六大趋势

InfoQ_434670063458

新思科技 软件安全

从携程网的故障中我们应该反思什么?_DevOps & 平台工程_吴米香_InfoQ精选文章