灾备即是容灾与备份结合的保障企业数据、业务高可用的方案之一。根据可防范的风险内容、RTO/RPO核心灾备技术指标,可将灾备防护分为不同的等级。

关键技术指标

进行灾备解决方案设计时,需关注灾备的两个关键技术指标:
  • RTO:RecoveryTime Object,恢复时间目标。指灾难发生后,从IT系统宕机导致业务停顿之刻开始,到IT系统恢复至可以支持各部门运作,业务恢复运营之时,此两点之间的时间段称为RTO。RTO是反映业务恢复及时性的指标,体现了企业能容忍的IT系统最长恢复时间。RTO值越小,代表容灾系统的恢复能力越强,但企业投资也越高。
  • RPO:Recovery Point Object,恢复点目标。指灾难发生后,容灾系统进行数据恢复,恢复得来的数据所对应的时间点称为RPO。RPO是反映数据丢失量的指标,体现了企业能容忍的最大数据丢失量的指标。RPO值越小,代表企业数据丢失越少,企业损失越小。

灾备等级

根据《中华人民共和国国家标准 GB/T 20988-2007 信息安全技术 信息系统灾难恢复规范》,灾备的防护等级可分为以下几个等级。
防护等级 数据备份 数据备份处理 可防范的风险 RTO RPO
第1级 基本支持
  • 完全数据备份,每周一次
  • 备份介质场外存放
- 业务数据破坏 2天以上 1~7天
第2级 备用场地支持
  • 完全数据备份每天一次
  • 备份介质场外存放
  • 每天多次定时批量传送
灾难时调配
  • 业务数据损坏
  • 业务处理场地不可用
24小时以上 1~7天
第3级 电子传输和部分设备支持
  • 完全数据备份每天一次
  • 备份介质场外存放
  • 每天多次定时批量传送
配备部分数据处理设备
  • 业务数据损坏
  • 业务处理场地不可用
  • 部分设备/网络故障
12小时以上 数小时~1天
第4级 电子传输及完整设备支持
  • 完全数据备份每天一次
  • 备份介质场外存放
  • 每天多次定时批量传送
全部设备,可用状态(冷战)
  • 业务数据损坏
  • 业务处理场地不可用
  • 全部备用设备/网络故障
数小时~2天 数小时~1天
第5级 实施数据传输及完整设备支持
  • 完全数据备份每天一次
  • 备份介质场外存放
  • 数据实时复制
全部设备,就绪/运行状态(温站)
  • 业务数据损坏
  • 业务处理场地不可用
  • 全部备用设备/网络故障
数分钟~2天 0~30分钟
第6级 数据零丢失和远程集群支持
  • 完全数据备份每天一次
  • 备份介质场外存放
  • 同步实时备份,实现数据零丢失
  • 备用与生产的处理能力一致并完全兼容
  • 应用软件集群、实时无缝切换
  • 远程集群系统的实时监控和自动切换(热活)
  • 业务数据损坏
  • 业务处理场地不可用
  • 全部备用设备/网络故障
数分钟 0

灾备方案要点

灾备方案的核心内容是帮助企业平衡 RTO 和RPO 的需求,找到最佳实现技术和手段。 从经济角度,帮助企业找到最佳的总体投入( TCO )和投资回报( ROI )。