根据需求调研输出的文档中,主要包含业务需求的规范定义文档(派生指标、原子指标、业务限定、业务过程、统计粒度(即维度))。在进行模型设计前,建议先完成该部分工作,以便设计出易于业务使用的数据仓库。

指标定义注意事项

原子指标是明确的统计口径、计算逻辑。派生指标即常见的统计指标,派生指标=时间周期+业务限定+原子指标+统计粒度

实际操作过程中,DWD事实模型或DIM维度模型定义完成,才能创建原子指标。通常情况下,了解具体报表需求之后,即可进行派生指标的创建。在新建派生指标前,必须完成原子指标的创建,且需要确认原子指标的来源模型中有维度模型(关联,或者本身即维度模型),以保证可以设置派生指标的统计粒度。注意事项如下:
  • 原子指标和业务限定来源于同一张维度表或事实表,且继承来源表的数据域。
  • 统计粒度和时间周期必选,是否选择业务限定由具体的派生指标语义决定。例如,如果支付金额为原子指标,则最近七天买家支付金额(统计粒度为买家、时间周期为最近七天)和最近七天买家支付宝支付金额(统计粒度为买家、业务限定为支付宝支付、时间周期为最近七天)都可以作为派生指标。
  • 派生指标唯一归属于一个原子指标,且继承原子指标的数据域。

根据业务需求确定指标

本教程中,用户是A公司电商营销部门的营销数据分析师。数据需求为最近一天厨具类目的商品在各省的销售总额、该类目销售额Top10的商品名称、各省用户购买力分布(人均消费额)等,用于营销分析。

根据之前的分析,我们确认业务过程为确认收货(交易成功),需要用到对应事实模型中的度量——商品的销售金额。因此根据业务需求,我们可以定义出:
  • 原子指标:商品成功交易的金额的总和。
  • 派生指标为:
    • 最近一天全省厨具类目各商品的销售总额。
    • 最近一天全省厨具类目的人均消费额(消费总额除以人数)。

将最近一天全省厨具类目各商品的销售总额降序排序,取前10名的名称,即可得到该类目销售额Top10的商品名称。

创建指标

完成原子指标、派生指标、业务限定、维度和业务过程的创建,详情请参见规范建模