NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

从携程网的故障中我们应该反思什么?

  • 2015-05-28
  • 本文字数:2207 字

    阅读完需:约 7 分钟

今天携程业务瘫痪事件,成为了今天最热门的事件,目前官方还未公布确切的原因。但此事件我认为也将成为普及数据管理重要性意识的一次公开课。 近年来 IT 趋势发生了很大的的变化,特别是以云(Cloud)、大数据(Analytics & Big Data)、移动(Mobile)和社交(Social)(简称 CAMS)为代表的新趋势迅猛发展。互联网公司以及政企组织也在逐步云化的进程中。但我认为,新的 IT 趋势形成,并不代表上一代数据中心架构会迅速消亡,很多组织机构中的数据中心架构切换需要一定时间,因此这种混合的 IT 架构将是常态。然而混合环境给数据管理带来新的难题,需要我们主动积极地思考与应用。

不变的数据管理

尽管 IT 环境不断地发生着变化,但我们会注意到,数据管理在过去的十几年里,核心要点并未发生变化。我总结下来主要有三点。

数据备份保护

数据备份是数据保护的最后一道防线。数据备份的核心价值是通过有效的数据备份手段,降低数据丢失风险,提升数据安全保障。近年来,一些新的技术名词不断涌现,各种宣传、炒作,给用户造成了不小的困惑与误导:有人说有存储镜像比备份更好,不需要备份;有人说 CDP 取代备份;有人说双活数据中心方案很安全,不需要备份等。但我始终认为,不管 IT 趋势如何发展,数据备份一直都将是不可或缺的组成部份。只是在数据备份的形式或技术上发生变化,而这些变化是为了更好地满足新的 IT 架构和环境下保护数据备份的需求。数据保护技术也在不断演进,从磁带备份到磁盘备份,备份与归档融合,再到公有云存储以及蓝光存储备份,等等。数据备份的关键是有效性。数据管理规划中,如何更有效地进行数据备份保护是重点。数据备份不是目的,可恢复才是关键。有效的数据备份需要进行合理的规划,包括合理的备份窗口、备份的可恢复性、跨站点或远距离备份容灾等。如果需要更安全的保护,那么道理很简单,那就是做更多的冗余,多样的介质冗余,多地的冗余;同时定期进行数据恢复演练与验证。

如何保障用户数据高可用与业务连续

数据的高可用性与一致性,是业务连续性的基础。为了提升数据高可用性,诞生了很多我们耳熟能详的技术:RAID、镜像、复制、双活高可用、分布式技术,等等。这些技术诞生的背后,很多都是基于当时的用户对数据高可用与业务连续性的需求。对于业务连续性要求很高的用户来说,如金融、医院等用户,构建一套能够确保数据高可用的系统非常关键。因此,在设计重要业务系统的数据管理架构时,数据高可用与业务连续性的规划也是必不可少的一部份。

如何节省用户数据存储与管理成本

有效的数据管理,不仅仅是为了提升数据安全性与业务连续性,同时也是为了降低数据存储与管理的总成本。关于数据存储的成本,我们通常想到的是存储容量成本,如每 TB 多少钱。实际上,数据存储与管理的成本远远不止这些,还涉及容量成本、IO 成本、安全成本、电力成本、运维成本等。然而大多数公司只注重容量成本,却忽略了其他成本,例如安全成本。当数据量小,IO 压力不大时,这些成本支出还可以接受;但数据量大、IO 需求也大时,安全、电力、运维成本也将大幅增加,总体成本的支出将可能难以承受。

新趋势,数据管理挑战

CAMS 新趋势到来,IT 架构与业务环境正在发生巨大变化,这也带来了新的数据管理挑战。如上所述的三大数据管理核心点,新趋势带来的变化所引发的数据管理挑战将是前所未有的。那么是哪些变化带来了新的挑战呢?

数据指数级的增长

在云计算、大数据、移动与社交的背后,数据量的增长只是浮在水面上的冰山,水面之下潜藏的则是更大的问题,如数据访问压力,以及随之而来的机房配套与运维管理压力。这些变化给数据管理带来了新挑战。1TB 与 100TB 或 PB 级的数据管理压力是截然不同的。尽管我们可能很难量化数据爆炸式增长带来的数据管理难度,但可以明确的是风险的不可控因素增加。如数据保护、灾难恢复的挑战等。

更高的可用性要求

在新趋势下,不管是云、大数据、移动还是社交,因为最终使用者会在任何时间、任何地点、以多种方式进行业务与数据访问,要求 7x24 小时提供业务服务。这对数据与业务服务的可用性,提出了更高的要求。

数据环境混合化

以往我们主要依赖传统数据中心,现在不仅有传统数据中心,还有基于软件定义的数据中心,混合 IT 环境以及混合云应用。例如:一部份业务部署在公有云或私有云平台,一部份在内部原有数据中心;各种数据库与应用平台混合使用,等等。数据环境的混合化,同样带来了新的挑战。混合环境的数据管理不仅仅是技术层面,同时组织架构与其能力也要匹配。 新的趋势、新的需求、新的技术不断涌现,但始终不变的是:数据越重要,就越需要做到最完善的备份保护;业务越集中,就越需要更高的可用性;数据量越大,就越需要高性价比的存储与管理。 尽管 CAMS 大趋势不可逆转,但是以往的很多风险控制体系、数据管理(数据保护与灾难恢复,特别是 RTO/RPO)经验都是可以继承的,特别是在企业级的业务中,向云计算架构迁移非常重要,没有哪种技术是绝对可靠的。数据为王,风控应为先。今天携程的事故原因还未清楚,我们不要胡乱臆测,更不要火上浇油。最坏的事情可能发生在我们每个公司,每个机构组织身上。自查组织内部业务风控情况,完善自身的数据管理体系。有云虽好,可不要忘了数据安全。以上是我的一些观点与看法,如有不当之处,敬请指正与交流。

作者简介

吴米香 来自爱数软件,就职 10 年,专注数据备份、灾难恢复以及软件定义存储领域。可以通过邮箱(wu.mixiang@eisoo.com)与作者联系。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2015-05-28 10:245103

评论

发布
暂无评论
发现更多内容

C++开发,这些GUI库一定不要错过!

Jackpop

相见恨晚!Git这些功能太好用了!

Jackpop

实战整了一个后台服务,真香!

风铃架构日知录

多线程 线程池 网络 HTTP CGI

一文了解 Dubbo 的代码架构

Apache Dubbo

Java 开源 源码 微服务 云原生

选取数据的原则

穿过生命散发芬芳

数据分析 12月月更

ZBC陆续在主要CEX开启Staking,锁定市场大部分流通量成大利好

BlockChain先知

SpringBoot整合Swagger2,再也不用维护接口文档了!

@下一站

12月日更 12月月更 springboot整合 swagger2

Python开发游戏?也太好用了吧!

Jackpop

ZBC陆续在主要CEX开启Staking,锁定市场大部分流通量成大利好

EOSdreamer111

chatGPT的49种应用场景介绍,各开发语言接入chatGPT参考指南

非喵鱼

Java Python 前端 编程语言 ChatGPT

专利进阶(一):软件专利工程师浅谈如何针对计算机软件类专利申请进行技术挖掘

No Silver Bullet

专利 12月月更 软件专利工程师 技术挖掘

2022 Gartner全球云数据库管理系统魔力象限发布 腾讯云数据库入选

科技热闻

Chrome浏览器竟然可以用ChatGPT了!

Jackpop

数据库原理及MySQL应用 | 数据库安全加固

TiAmo

安全 数据库· 12月月更

数据权限就该这么设计!!!

风铃架构日知录

数据 优化 数据权限 rbac 数据库权限

性能优化-内存泄漏、内存溢出、cpu占用高、死锁、栈溢出、FullGC频繁检测手段-总结与分享

C++后台开发

性能优化 后端开发 内存泄漏 linux开发 C++开发

Atlassian FaaS 云开发平台Forge解析

填空时光

敏捷 Faas Atlassian Jira

ZBC陆续在主要CEX开启Staking,锁定市场大部分流通量成大利好

股市老人

架构实战营模块8作业

冷夫冲

架构 构架 「架构实战营」

ZBC陆续在主要CEX开启Staking成近期利好,锁定市场大部分流通量

西柚子

AngularJS进阶(四十二)ng-options渲染的第一项为空问题分析及解决方案

No Silver Bullet

12月月更 ng-options 页面渲染 上拉加载

SQL查找是否"存在",别再count了!

风铃架构日知录

MySQL 后端 Java、 java程序员 sql

架构训练营-第10期-模块2作业

Geek_4db2d5

精华推荐 | 【深入浅出RocketMQ原理及实战】「性能原理挖掘系列」透彻剖析贯穿RocketMQ的事务性消息的底层原理并在分析其实际开发场景

洛神灬殇

分布式事务 RocketMQ 可靠消息最终一致 12 月 PK 榜

模块二 -- 朋友圈高性能复杂度分析

陈实

「架构实战营」

多名网络主播因恶意炒作被列入警示名单,如何打击这种违规行为

石头IT视角

Vue进阶(贰零柒):Webpack 性能优化措施汇总

No Silver Bullet

性能优化 Vue webpack 12月月更

数据权限就该这么设计!!!

小小怪下士

Java 程序员 数据权限

2022-12-16:给你一个长度为n的数组,并询问q次 每次询问区间[l,r]之间是否存在小于等于k个数的和大于等于x 每条查询返回true或者false。 1 <= n, q <= 10^5 k

福大大架构师每日一题

golang 算法 福大大

2022中国产业数字化发展成熟度区域指数分析——充分利用特长,形成区域比较优势,夯实中国式现代化建设基础

易观分析

数字化 产业

模块2

KING

从携程网的故障中我们应该反思什么?_DevOps & 平台工程_吴米香_InfoQ精选文章