DBS备份数据查询功能,可以在不恢复备份数据的情况下,直接查询云存储中备份集的数据。

背景信息

传统的备份数据查询有两种方式:
  • 将备份数据文件导入至数据库,再通过数据库操作对数据进行查询,但是这种方式耗费时间长,且可能会导致数据文件被修改。
  • 通过Hive的方式直接对文件进行查询,但是这种方式对数据文件格式有严格的要求,且技术成本较高。

数据库备份服务DBS提供了云上备份数据查询功能,您只需要简单的SQL语句,即可查询到您的备份数据,且备份数据不会被修改,该功能只针对查询所涉及的数据量收费,成本低。

同时,DBS还提供查询多个备份集的功能,您可以更好地分析历史备份数据,进行横向对比分析,挖掘数据的价值,操作详情请参见查询多个备份集

工作原理

DBS与数据湖Data Lake Analytics深度集成,提供备份集在线查询能力,通过DLA直接对OSS上的备份数据文件进行查询。备份集查询功能的整体架构如下图所示。

DBS也支持在单个备份计划下查询多个备份集。您需要选择目标备份集并创建数据湖,就可以在离线数据湖中通过SQL语句查询到该表在不同备份集中的数据。

应用场景

  • 高效查询备份集:在不恢复数据库的情况下,仅需简单的SQL语句即可查询到备份数据。
  • 搭建离线数据仓库:您可以将DBS备份数据作为数据湖存储,搭建离线数据仓库,实现湖仓一体,挖掘数据价值。
  • 应对审计需求:全量备份数据保存在DBS中,若有临时审计需求,可以快速过滤出需要的数据进行审计分析。
  • 快速定位数据: 库-表-分区的新架构,并且引入dbs_dla_partition字段,为每个数据提供备份集版本号,帮助您快速定位数据问题,详情请参见查询多个备份集

费用说明

DBS会调用DLA接口查询目标备份集,该过程中DBS不会产生费用,DLA会根据扫描的数据量进行计费,详情请参见计费方式