本章节将指引您基于Dataphin快速完成一次完整的数仓建设。

Dataphin数据构建基本流程如下。
主流程 说明 操作指导
准备工作 开通和配置Dataphin、创建MaxCompute项目和准备数据源。 步骤一:准备工作
规划数仓 规划本入门教程的数仓,包括创建业务板块、计算源、数据源、项目及项目中的成员。 步骤二:规划数仓
集成数据 同步源数据源中的数据至Dataphin的项目空间。 步骤三:集成数据
规范定义 基于Dataphin支持的数据研发模块,分析数据并明确统计指标。包括维度、业务过程、原子指标、业务限定和派生指标。 步骤四:规范定义
规范建模 基于规范定义部分中数据的圈定,利用Dataphin中的研发模块进行数据的研发。 步骤五:规范建模
开发环境补数据 通过开发环境中的维度逻辑表、事实逻辑表和汇总逻辑表补数据,验证数据模型是否正确及符合预期。 步骤六:开发环境补数据
验证数据 补数据操作完成后,您可以通过即席查询来验证数据,验证通过的数据即可发布至生产环境。 步骤七:验证数据
发布任务 发布开发环境的数据至生产环境,参与生产环境的运维调度。 步骤八:发布任务
生产环境补数据 发布至生产环境的数据次日才会参与调度,本教程为了让您快速熟悉智能数据构建与管理的流程,采用补数据的方式,模拟生产环境调度任务生成实例。 步骤九:生产环境补数据
查看运行结果 查看生产环境中数据运行结果是否符合预期,即汇总逻辑表是否能够统计到各省份办公用品和技术产品最近1天的销售总额。 步骤十:查看运行结果