基于Dataphin数据建模研发沉淀的数据,数据萃取提供以目标对象为中心的数据打通和深度挖掘功能,并生成代码与调度任务,完成实体对象识别、连接及标签生产,可快速应用于各类业务。

初始化配置

  1. 登录Dataphin控制台
  2. 在Dataphin控制台页面,选择工作区Region后,单击进入Dataphin>>
  3. 在Dataphin页面,单击顶部菜单栏中的研发
  4. 将鼠标悬停在开发上后,单击萃取,进入初始化配置页面。ddd
  5. 根据页面提示选择计算引擎源后,单击测试连接性

    如果您没有计算引擎源,则需要创建计算引擎源,详情请参见计算引擎源

  6. 测试连接通过后,单击确定并开始初始化,初始化成功后即可在萃取模块进行数据的开发。

萃取简介

萃取行为中心标签中心组成:
  • 行为中心提供明细行为的配置及行为数据统计信息。
  • 标签中心支持标签可视化配置并自动生成标签调度任务,管理不同开发状态的标签任务。

注意事项

请勿删除萃取模块中的系统表,如下表所示。
表名 名称 描述
oi_behavior_detail_d 行为中心源数据接入 抽取源数据的行为大宽表。
oi_behavior_detail_d_sample 行为中心抽样表 oi_behavior_detail_d的抽样表,用于行为看板查看数据。
oi_behavior_label_value_d 行为中心打标结果 行为打标的中间表。
oi_behavior_label_value_all 行为中心打标结果 行为打标的累积表。
oi_person_label_value_all 行为中心打标结果 行为中心打标结果的表。
oi_label_value_rule_d 标签打标规则表 标签打标的中间表。
oi_dim_behavior_id 行为定义维表 行为定义的表,从源数据同步而来。
oi_behavior_stat_d 行为数据统计天表 行为数据统计表。
oi_behavior_stat_sync 行为数据统计90天表 行为统计90天的数据。
oi_behavior_object_all 行为数据对象累积年表 行为对象,对象属性的累积表。
oi_behavior_property_value 行为数据属性表 对象值表,存储行为、对象以及对象值的表,供您在标签打标时参考。