本文为您介绍数据资产等级的定义,以及如何定义生产链路上的相关数据的资产等级。

数据资产等级定义

根据数据质量不满足完整性、准确性、一致性、及时性时,对业务的影响程度划分数据的资产等级。通常,划分为5个性质的等级:
  • 毁灭性质:数据一旦出错,将会引起重大资产损失,面临重大收益损失等。标记为A1。
  • 全局性质:数据直接或间接用于企业级业务、效果评估和重要决策等。标记为A2。
  • 局部性质:数据直接或间接用于某些业务线的运营、报告等,如果出现问题会给业务线造成一定的影响或造成工作效率降低。标记为A3。
  • 一般性质:数据主要用于日常数据分析,出现问题带来的影响极小。标记为A4。
  • 未知性质:无法明确数据的应用场景。标记为Ax。

这些性质的重要性依次降低,即重要程度为A1>A2>A3>A4>Ax。如果一份数据出现在多个应用场景汇总,则根据其最重要程度进行标记。

分析数据链路

定义数据资产等级后,您可以从数据流转链路开始进行数据资产等级打标,完成数据资产等级的确认,给不同的数据定义不同的重要程度。

MaxCompute进行数据加工基本流程为从业务系统上产生数据,通过同步工具(DataWorks的数据集成或阿里云DTS)进入数据数仓系统(MaxCompute),数据在数仓中进行清洗、加工、整合、算法、模型等一系列运算后,再通过同步工具输出到数据产品中进行消费。整个流程数据都存放在表中,流转链路大致如下图所示。
在数据流转链路上,您需要整理各个表对应的应用业务产品。通过给这些应用业务产品划分数据资产等级,结合数据的上下游血缘,将整个链路打上某一类资产等级的标签。例如,一个A2等级的数据应用产品对应的导出表Table1、Table2、Table3,几个表都打上A2-xxx数据产品标记。根据血缘往上追溯,将这几个表的上游都打上A2的标记,一直标记到源数据业务系统,如图所示。