写点什么

为首次部署 MongoDB 做好准备:备份和安全

  • 2014-05-12
  • 本文字数:2729 字

    阅读完需:约 9 分钟

在该系列的第一篇文章中,我们讨论了部署关系型数据库时使用的哪些概念、操作和过程可以直接应用到MongoDB 上,同时还介绍了硬件选择以及部署和监控的最佳实践。

在该系列的第二篇文章中,我们将会介绍如何使用备份工具和安全策略保护你的部署。

MongoDB 备份和恢复

备份 MongoDB 数据库常见的方式有三种:

  • 使用 MongoDB 管理服务(MMS)进行云备份
  • 使用文件系统快照
  • 使用 MongoDB 自身的mongodump工具

使用 MongoDB 管理服务 (MMS) 备份

除了上一篇文章提到的监控方法之外,MMS 提供了一个管理全面的云备份解决方案,它托管在可靠、有冗余且安全的数据中心上。用户需要将MMS 备份代理本地安装到MongoDB 集群上并执行初始同步,在那之后加密和压缩的oplog 数据(用于MongoDB 复制集)会从备份代理流到MMS 上。快照每6 小时创建一次。

MMS 备份是唯一一个支持复制集时间点恢复和分片集群整体快照的解决方案。过去 24 小时之内的 oplog 数据会被存储起来,你可以使用这些数据为一个复制集创建定制快照。对于分片集群,负载均衡每 6 小时会暂停一次,同时一个无操作令牌会被插入到所有分片、Mongos 和配置服务器上。oplog 能够被应用到集群中的所有复制集上(直到令牌插入的那个点),为整个集群提供了一个一致的快照。

恢复数据的时候,你可以通过 SCP 直接将数据发送到你的服务器上,或者可以通过生成的自定义 URL 下载它们。MMS 需要对所有恢复进行双重认证。如果你想了解与 MMS 备份服务相关的更多信息,那么可以查看 MongoDB 网站上的文档页面

文件系统备份

文件系统备份,例如Linux LVM 提供的方式,我们可以快速有效地创建一个文件系统的一致性快照,然后复制该快照用于数据的备份或者恢复。如果你想了解如何使用文件系统快照创建MongoDB 备份,那么可以参考文档:使用文件系统快照进行备份和恢复

mongodump

mongodump 是与 MongoDB 捆绑在一起的一个工具,它能对 MongoDB 中的数据进行实时备份。我们可以使用mongodump dump 整个数据库、集合或者一个查询的结果。mongodump 可以通过 dump oplog 创建能够反映某个时间点数据的 dump 文件,然后通过 mongorestore (一个能够从 mongodump 产生的 BSON 数据库 dump 文件中导入数据的工具)重放。mongodump 还能处理不活动的数据库文件集。

备份和恢复策略的 MongoDB 文档页面上可以找到更多与备份创建相关的信息。

安全

与其他所有的软件一样,MongoDB 管理员也必须考虑与 MongoDB 部署相关的安全和风险问题。减轻风险没有魔幻的解决方案,维持一个安全的 MongoDB 部署环境需要持续不间断的努力。

纵深防护(Defense in Depth)

纵深防护是安全的 MongoDB 部署推荐使用的方法,它有很多不同的方法可用于管理并降低风险。纵深防护的目的是把环境分层,确保系统中没有可以让侵入者或者不受信任的团体利用的错误点,从而使其无法获取到存储在 MongoDB 数据库中的数据。降低暴露风险最有效的方法就是让 MongoDB 运行在受信任的环境中,通过访问限制、遵循最小权限系统、遵循安全的部署生命周期、遵循最佳部署实践等方法实现良好的风险管控。

所有处理敏感信息的数据库都需要提供全面的安全防护机制,包括:

  • 通过用户权限管理限制对敏感数据的访问,通过认证和授权控制实现。
  • 记录数据库操作日志并对其进行审计。
  • 对需要通过网络传输的数据和存储在数据库中的数据进行加密保护。
  • 环境和流程控制。

MongoDB 2.4 引入的很多功能可以处理上面的需求,同时 MongoDB 2.6 将会继续提供这些功能。点击这里获取MongoDB Enterprise 2.6 开发者预览版。

认证

对访问MongoDB 的实体进行认证的方式包括使用数据库本身的认证机制和集成外部的安全机制(包括MongoDB Enterprise 2.4 的 Kerberos 服务、 LDAP 以及 Windows 活动目录和 MongoDB 2.6 中新增的 x.509 证书认证)。

授权

MongoDB 允许管理员定义一个应用程序或者用户应该拥有哪些权限,在执行查询的时候能够看到哪些数据。MongoDB 拥有大量的内置角色,同时在MongoDB 2.6 中用户能够配置细粒度的自定义角色。例如,某些用户可能有权查看某一条记录,但是永远不能更新或者删除这条记录。MongoDB 2.6 提供了域级别的安全机制让用户能够对敏感数据进行细粒度的安全授权控制,同时能够定义在运行时实现的声明式安全策略。通过域级别的管理控制,描述某个资源的单个文档可以包含使用多个安全级别的数据,避免了需要将使用不同安全级别的单个信息分离到多个数据库中的复杂性。

审计

MongoDB 2.6 通过维护审计日志增加了对记录数据库管理操作的支持。为了便于使用,分布在一个MongoDB 集群中的审计日志可以被合并到一个单独的log 文件中,从而能够将由某个单独的操作产生且影响多个节点的事件关联起来。

加密

MongoDB 能够对需要在网络间进行传输的数据和位于持久存储中的数据进行加密。

对SSL 的支持允许客户端通过加密通道连接到MongoDB。如果使用FIPS 验证的Cryptographic 模块在FIPS 模式下运行,那么MongoDB 还能支持 FIPS 140-2 加密

有多种方式能对 MongoDB 中的数据进行加密。一种方式是在应用程序层使用合适且必要的加密类型对域级别的数据进行加密。

另一种方式是使用像 NcryptFS 和 LUKS 这样的第三方类库,它们作为操作系统内核的一部分为 Linux 提供了磁盘级别的加密,它们所提供的高级管理功能可以确保只有得到授权的进程才能访问这些数据。对于 Windows 平台而言,可以使用像 IBM Guardium 数据加密、BitLocker 驱动盘加密和 TrueCrypt 这样的技术。

下面是一个创建安全部署所需关键步骤的检查列表:

查询注入

对于 MongoDB 客户端程序而言,它生成的查询为 BSON 对象,而不是字符串,所以传统的 SQL 注入攻击对将查询作为 BSON 对象提交的系统不会造成危险。

但是,有一些 MongoDB 操作允许对任意 JavaScript 表达式求值,这时候应该注意避免恶意表达式。幸运的是大部分查询能够被表示为 BSON,同时在必须使用 JavaScript 的情况下用户能够混合 JavaScript 和 BSON,所以用户特定的值会被评估为值而不是代码。

结论

MongoDB 用户能够通过本文以及前一篇文章所讨论的最佳实践满足当今业务系统对维护高可用、安全和可扩展运营的需要。

这些介绍以及其他的最佳实践在 MongoDB 运营指南(PDF 文档)中有非常详细的介绍。

关于作者

Mat Keep (@matkeep) 是 MongoDB 产品营销团队的一员,负责为 MongoDB 的产品和服务构建愿景、定位和内容,同时也负责对市场趋势和客户需求进行分析。在就职于 MongoDB 之前,Mat 是 Oracle 公司的产品管理总监,负责 MySQL 数据库在 Web、电信行业、云和大数据方面的应用。在这之后他还在技术供应商和面向最终用户的公司中从事过一系列的工作,包括销售、商业开发与分析、程序员。

查看英文原文 Preparing for Your First MongoDB Deployment: Backup and Security

2014-05-12 02:528221
用户头像

发布了 321 篇内容, 共 129.6 次阅读, 收获喜欢 19 次。

关注

评论

发布
暂无评论
发现更多内容

为什么 NGINX 的 reload 不是热加载?

API7.ai 技术团队

Apache nginx 开源 api 网关 APISIX

袋鼠云数据湖平台「DataLake」,存储全量数据,打造数字底座

袋鼠云数栈

数据中台 数据仓库 数据湖 数据中台场景实践 数据湖分析

OceanBase 4.0 解读:分布式查询性能提升,我们是如何思考的?

OceanBase 数据库

数据库 oceanbase

六年三次架构迭代,OceanBase 单机分布式一体化会是大势所趋吗?

OceanBase 数据库

数据库 oceanbase

链上挖矿分红智能合约DAPP系统开发部署模式定制

开发微hkkf5566

【11.18-11.25】写作社区优秀技术博文回顾

InfoQ写作社区官方

热门活动

从react源码看hooks的原理

flyzz177

React

基于 RocketMQ 的 Dubbo-go 通信新范式

Apache RocketMQ

RocketMQ RPC dubbo-go dubbogo

数据卡顿怎么办,瓴羊Quick BI强劲数据引擎来帮忙

小偏执o

从元宇宙、地产数字化到呼叫中心,华为云携手伙伴共创新价值

华为云开发者联盟

云计算 华为云 元宇宙

从源码角度看React-Hydrate原理

flyzz177

React

python常用内置函数用法精要(二)

乔乔

11月月更

【从零开始学爬虫】采集猫眼电影热门资讯数据

前嗅大数据

爬虫 数据采集 爬虫软件 爬虫教程 数据采集教程

多点DMALL × Apache Kyuubi:构建统一SQL Proxy探索实践

网易数帆

hadoop spark 开源 Apache Kyuubi

华为云区块链三大核心技术国际标准立项通过

华为云开发者联盟

区块链 华为云

云原生系列 【轻松入门容器基础操作】

叶秋学长

云原生 沙箱实验 11月月更

【看球和学Go】错误和异常、CGO、fallthrough

王中阳Go

Go golang 面试题 Go web 11月月更

信创产业多点开花,AntDB数据库积极参与行业标准研制,协同价值链伙伴共促新发展

亚信AntDB数据库

AntDB aisware antdb AntDB数据库

记一次TiDB数据库Insert语句执行报错的处理过程

TiDB 社区干货传送门

Python(文件操作)

浅辄

Python 文件 11月月更

好好的系统,为什么要分库分表?

程序员小富

Java 数据库 面试 分库分表

火山引擎 DataTester 应用故事:一个A/B测试,将产品DAU提升了数十万

字节跳动数据平台

大数据 AB testing实战

自制操作系统日记(8):变量显示

操作系统

从recat源码角度看setState流程

flyzz177

React

流程编排、如此简单-通用流程编排组件JDEasyFlow介绍

京东科技开发者

数据库 架构 服务端 流程引擎 流程编排

高性能数据访问中间件 OBProxy(六):一文讲透数据路由

OceanBase 数据库

oceanbase

InterruptedException异常会对并发编程产生哪些影响?

冰河

并发编程 多线程 高并发 协程 异步编程

Fiori Elements 框架里 Smart Table 控件的工作原理介绍

汪子熙

SAP Fiori SAP UI5 ui5 11月月更

BSN-DDC基础网络DDC SDK详细设计(六):交易查询、区块查询、签名事件

BSN研习社

BSN

云享·人物丨造梦、探梦、筑梦,三位开发者在华为云上的寻梦之旅

华为云开发者联盟

云计算 后端 华为云

记录一次TiDB v5.2.3迁移到v6.1.0的过程

TiDB 社区干货传送门

迁移 实践案例

为首次部署MongoDB做好准备:备份和安全_数据库_Mat Keep_InfoQ精选文章