原子指标是对指标统计口径、具体算法的抽象。Dataphin创新性地提出了设计即开发的理念,指标定义同时也明确了设计统计口径(即计算逻辑),提升了研发效率,并保证了统计结果的一致性。

背景信息

Dataphin根据计算逻辑的差异性,支持创建原子指标和衍生原子指标。详细说明如下:
  • 原子指标是原生原子指标。例如,支付金额。
  • 衍生原子指标是基于已提交原子指标,设定计算逻辑而构成的指标。例如,一个已提交的原子指标为支付金额,另一个已提交的原子指标为支付人数,您可以通过新建衍生原子指标的方式统计人均支付金额。

新建原子指标的权限限制,详情请参见数据开发权限列表

新建原子指标

  1. 登录Dataphin控制台
  2. 在Dataphin控制台页面,选择工作区地域后,单击进入Dataphin>>
    您可以通过以下方式,快速进入工作区:
    • 选择工作区地域后,单击快速开始相关工作区域中相应的功能模块。
    • 选择工作区地域后,单击快速进入研发项目后的DevProdBasic页签,选择相应的项目。
  3. 进入维度页面。
    1. 在Dataphin首页,单击顶部菜单栏中的研发
    2. 在数据开发页面,单击项目名称后的test图标后,单击DevBasic页签,选择数据开发的DevBasic(非Data_distill)项目。
      如果您当前访问的是DevBasic(非Data_distill)项目,且项目为您的数据开发空间,则不需要选择项目。
    3. 在数据开发页面,单击规范建模
      如果进入数据开发页面后,系统默认进入规范建模页签,则无需再次单击规范建模页签。
    4. 规范建模页签,单击左侧导航栏中cegfah原子指标图标。
  4. 原子指标页面,单击原子指标后的图标,选择新建原子指标
    您也可以通过以下方式,进入新建原子指标
    • 单击项目名称后的图标,选择规范定义 > 原子指标
    • 在页面右侧的数据开发总览区域,单击原子指标下的图标后,选择新建原子指标
    • 原子指标页面左下方,单击原子指标对象列表。在对象列表页原子指标页签,单击新建原子指标
  5. 新建原子指标页面,选择数据域来源表
    参数 描述
    数据域 选择数据域。
    说明 划分数据域,详情请参见划分数据域
    来源表 选择来源表。为保证建模标准规范,来源表仅支持维度逻辑表或事实逻辑表。
  6. 新建原子指标页面,单击新建原子指标
    ceshg
  7. 新建原子指标对话框,配置参数。
    参数 描述
    主要来源字段 基于所选来源表,选择事实表或维度表中的字段。
    英文名 基于所选主要来源字段,英文名自动填充为字段名,您也可以修改英文名。英文名由字母、数字或下划线(_)组合组成。
    说明 英文名不能超过64个字符。
    名称 名称由汉字、字母、数字、下划线(_)或短划线(-)组合组成。
    说明 名称不能超过64个字符。
    描述 填写原子指标的简单描述。
    数据类型 数据类型包括STRINGBIGINTDOUBLEDATETIMEDECIMAL
    是否累加 基于不同大小统计周期的数据,选择是否需要累加计算。例如,最近7天支付金额,是否需要基于最近1天支付金额进行累加计算。
    计算逻辑 基于来源逻辑表模型,定义所需指标的计算逻辑:
    1. 编写SQL代码。

      例如count(distinct order_id),其中order_id为来源逻辑表模型中的字段。

      您也可以单击主键计算逻辑后的参考示例,可以查看SQL编写示例。

    2. 单击主键计算逻辑后面的规范性校验,可以校验您编写的SQL是否符合规范。

      如果规范性校验校验失败,您可以单击格式化,系统会自动为您调整SQL语句的格式。

  8. 提交和发布原子指标。
    1. 单击提交
    2. 提交备注对话框,填写备注信息。
    3. 单击确定并提交
    4. 可选:发布原子指标。
      • 如果您的开发模式是Dev-Prod,则需要发布已提交的原子指标,详情请参见发布任务
      • 如果您的开发模式是Basic,则提交成功的原子指标,即可进入生产环境。

新建衍生原子指标

  1. 原子指标页面,单击原子指标后的图标,选择新建衍生原子指标
    您也可以通过以下方式,进入新建衍生原子指标
    • 单击项目名称后的图标,选择规范定义 > 衍生原子指标
    • 在页面右侧的数据开发总览区域,单击原子指标下的图标后,选择新建衍生原子指标
    • 原子指标页面左下方,单击原子指标对象列表。在对象列表页原子指标页签,单击新建衍生原子指标
  2. 新建衍生原子指标对话框,配置参数。
    参数 描述
    英文名 英文名由字母、数字、下划线(_)组合组成。
    说明 英文名不能超过64个字符。
    名称 名称名称由汉字、字母、数字、下划线(_)或短划线(-)组合组成。
    说明 名称不能超过64个字符。
    描述 对衍生指标的简单描述。
    数据类型 数据类型包括:STRINGBIGINTDOUBLEDATETIMEDECIMAL
    是否累加 基于不同大小统计周期的数据,选择是否需要累加计算。例如,最近7天支付金额,是否需要基于最近1天支付金额进行累加计算。
    计算逻辑 基于已提交原子指标,组合设定所需指标的统计计算方式:
    • 在SQL语句输入框中输入衍生指标的计算公式,其中计算公式中引用的原子指标均为已提交的原子指标。
      1. 单击引用原子指标后的后,单击数据域来源表显示框,在下拉列表中选择数据域来源表
      2. 鼠标悬停至筛选出来的原子指标后,单击添加,将原子指标添加在右侧的SQL语句输入框中。

      或在后输入原子指标关键字进行快速搜索,单击搜索出来的原子指标后的添加,将原子指标添加在右侧的SQL语句输入框中。

    例如,计算人均下单金额crt_amt/usr_cnt,其中crt_amt为下单金额对应的已提交原子指标,usr_cnt为用户数对应的已提交原子指标。

  3. 提交衍生原子指标。
    1. 单击提交
    2. 提交备注对话框,填写备注信息。
    3. 单击确定并提交
  4. 发布衍生原子指标。
    • 如果您的开发模式是Dev-Prod,则需要发布已提交的衍生原子指标,详情请参见发布任务
    • 如果您的开发模式是Basic,则提交成功的衍生原子指标,即可进入生产环境。