本章节将指引您基于Dataphin快速完成一次完整的数仓建设。
Dataphin数据构建基本流程如下。
主流程 | 说明 | 操作指导 |
---|---|---|
准备工作 | 开通和配置Dataphin、创建MaxCompute项目和准备数据源。 | 步骤一:准备工作 |
规划数仓 | 规划本入门教程的数仓,包括创建业务板块、计算源、数据源、项目及项目中的成员。 | 步骤二:规划数仓 |
集成数据 | 同步源数据源中的数据至Dataphin的项目空间。 | 步骤三:集成数据 |
规范定义 | 基于Dataphin支持的数据研发模块,分析数据并明确统计指标。包括维度、业务过程、原子指标、业务限定和派生指标。 | 步骤四:规范定义 |
规范建模 | 基于规范定义部分中数据的圈定,利用Dataphin中的研发模块进行数据的研发。 | 步骤五:规范建模 |
开发环境补数据 | 通过开发环境中的维度逻辑表、事实逻辑表和汇总逻辑表补数据,验证数据模型是否正确及符合预期。 | 步骤六:开发环境补数据 |
验证数据 | 补数据操作完成后,您可以通过即席查询来验证数据,验证通过的数据即可发布至生产环境。 | 步骤七:验证数据 |
发布任务 | 发布开发环境的数据至生产环境,参与生产环境的运维调度。 | 步骤八:发布任务 |
生产环境补数据 | 发布至生产环境的数据次日才会参与调度,本教程为了让您快速熟悉智能数据构建与管理的流程,采用补数据的方式,模拟生产环境调度任务生成实例。 | 步骤九:生产环境补数据 |
查看运行结果 | 查看生产环境中数据运行结果是否符合预期,即汇总逻辑表是否能够统计到各省份办公用品和技术产品最近1天的销售总额。 | 步骤十:查看运行结果 |
在文档使用中是否遇到以下问题
更多建议
匿名提交