本文档介绍如何通过MongoShake实现实例间的延迟同步。

前提条件

MongoShake版本为2.4.6及以上。详情请参见MongoShake发布页面

背景信息

在使用MongoShake实时同步多个实例时,当用户在主实例中执行了误操作以后,MongoShake会将该误操作实时同步到从实例,导致最终只能通过数据恢复来复原。因此,MongoShake在2.4.6版本的更新中提供了设置延迟同步的参数,给主从实例之间的同步设置一段缓冲的时间,当主实例中执行了误操作后,可以在这段时间内关闭同步,并直接将业务切换到还未发生误操作的从实例。
说明 本文档着重介绍延迟同步参数incr_sync.target_delay,有关使用MongoShake的其他事项请参见使用MongoShake实现MongoDB副本集间的单向同步

搭建MongoDB间的延迟同步架构

本示例以ECS上的Ubuntu系统为例介绍如何搭建延迟同步架构。详情请参见准备工作

  1. 登录ECS实例
  2. 执行如下命令格式下载MongoShake程序。
    wget 最新版MongoShake包下载地址
    示例:
    wget https://github.com/alibaba/MongoShake/releases/download/release-v2.0.7-20190817/mongo-shake-2.0.7.tar.gz
    说明 最新版本的MongoShake包下载地址请参见releases页面
  3. 执行如下命令格式解压MongoShake程序。
    tar xvf mongoshake包文件名
    示例:
    tar xvf mongoshake-2.0.tar.gz
  4. 执行vi collector.conf命令配置MongoShake。各参数说明请参见MongoShake参数表。找到incr_sync.target_delay参数,根据实际业务需求设置该参数的值,单位为秒。本示例中将延迟时间设置为30分钟。
    incr_sync.target_delay = 1800
  5. 保存并退出collector.conf文件,至此延迟同步架构已经搭建完毕。
  6. 执行如下命令使用配置好的collector.conf文件开启同步,并打印日志信息。
    ./collector.linux -conf=collector.conf -verbose
    说明 此时您在主实例中执行的任何更改,都将会在30分钟后同步到从实例。

误操作后切换主从实例

在主实例中日常执行CURD操作时,可能会存在某条语句误写入等误操作的情况发生,此时您可以通过下列步骤将业务切换到还没有发生误操作的从实例中。

  1. 通过查询MongoDB的操作日志(oplog)定位到误操作发生的时间点。例如:您可以通过执行如下命令来查询2020年6月1日至2020年6月2日之间所有的操作日志。关于查询oplog的详情请参见MongoDB官方文档
    use local #切换到local数据库
    db.oplog.rs.find({"o.createTime": {$gte:new Date(2020,6,1),$lte:new Date(2020,6,2)}}) #根据条件查看oplog。
  2. 通过RESTful接口远程向MongoShake注入ExitPoint参数来实现在指定时间点终止MongoShake程序的目的。命令格式如下:
    curl -X POST --data '{"ExitPoint": <Unix时间戳>}' <MongoShake服务器ID>:<端口号>/sentinel/options

    示例:

    curl -X POST --data '{"ExitPoint": 1593534600}' 127.0.0.1:9100/sentinel/options
    说明 1593534600是Unix时间戳,表示2020年6月30日16:30:00。MongoShake同步到这个时间点后将会自动退出。
  3. 执行vi collector.conf命令打开配置文件,将原主从实例的地址调换。详细操作方法请参见使用MongoShake实现MongoDB副本集间的单向同步
  4. 执行如下命令使用配置好的collector.conf文件重新开启同步,并打印日志信息。
    ./collector.linux -conf=collector.conf -verbose
  5. 将业务切换到最新的主实例上,完成主从实例切换操作。

监控MongoShake状态

详情请参见监控MongoShake状态