项目是一种物理空间上的划分,助您管理数据中台建设过程中的物理资源及开发人员。本文为您介绍如何新建项目。

前提条件

请参见计算源,完成计算源。

背景信息

新建项目的限制:
  • 仅支持超级管理员角色和板块管理员角色的用户新建项目。
  • 一个计算源只能被一个项目绑定。
  • 项目绑定计算源后,不支持修改计算源。
  • 如果Dev项目中配置了实时计算源或离线计算源,为了对应的Prod项目中任务正常计算,则Prod项目需要配置实时计算源或离线计算源。

Dataphin支持两种模式的项目,详情请参见下表。

项目 描述
Dev-Prod模式 生成Dev项目与Prod项目相隔离,更强保障Prod项目中的数据安全,以强管控数据生产过程、生产的数据。如果您管理诉求较强,数据研发人员较多且能力及分工明确,数据计算存储预算较高,推荐此模式。
说明 在Dev-Prod模式下,新建项目默认生成两个项目。其中开发环境下的项目英文名默认以_dev作为后缀。
Basic模式 生成独立灵活的Basic项目,数据生产过程相对稳定而便捷,生产的数据可管控。如果您关注数据研发效率而非强管控,研发人员职能边界相对模糊,计算存储预算有限制,推荐此模式。

新建Dev-Prod模式的项目

  1. 登录Dataphin控制台
  2. 在Dataphin控制台页面,选择工作区Region后,单击进入Dataphin>>
  3. 进入数仓规划页面。
    • 在Dataphin首页,单击顶部菜单栏的规划
    • 在Dataphin首页,单击顶部菜单栏下方的智能数仓规划
  4. 在左侧导航栏中,单击项目管理
  5. 项目管理页面,单击右上方的新建项目
  6. 根据页面提示,选择Dev-Prod模式
  7. 单击下一步
  8. 根据新建项目页面提示,配置参数。
    faga
    区域 参数 说明
    名称设置 公共名称 填写公共名称。公共名称的说明如下:
    • 公共名称由汉字、数字、字母、下划线_或连字符-组合组成。
    • 不支持以LD_开头(业务板块英文名默认以LD_作为前缀),以免引用逻辑表和物理表时出现冲突。
    公共英文名 填写公共英文名。公共英文名的说明如下:
    • 公共英文名由字母、数字、下划线组合组成。
    • MaxCompute计算类型下,建议您将项目的公共英文名设置为与对应的MaxCompute项目名一致。
    • 不支持以LD_开头(业务板块英文名默认以LD_作为前缀),以免引用逻辑表和物理表时出现冲突。
    命名空间 业务板块 非必填写项。为新建的项目选择所属业务板块。
    空间类型 用于区分项目开发任务及产出数据特征,默认为应用层。空间类型包括3种:
    • 基础层:来自各个业务数据库的原始数据存储,是后续所有数据建设的来源与基础,也可称为垂直数据中心。
    • 公共层:基于各业务数据,抽象公共的主题,沉淀标准、规范、可共用的数据,是连接基础层与应用层的中间桥梁,也称为公共数据中心。
    • 应用层:面向业务需求,定义生成可应用于不同场景的个性化、多样化的数据指标等。
    项目1:Dev 离线 选择离线计算源,说明如下:
    • 绑定计算源时,如果提示计算源与其他项目重复,建议您确认后再绑定,以免出现计算源中数据写入冲突。
    • 如果您有多个项目,建议您确认配置的Access Key是否为项目管理员权限(是否具有跨项目访问权限)。如果没有管理员权限,则需要根据赋权代码进行Access Key授权。以免您在Dataphin系统中跨项目访问时物理层的数据库鉴权失败。
    • 已绑定项目的离线计算源,无法被其他项目再次绑定。
    实时 选择实时计算源。
    英文名 无需配置,系统根据公共英文名,进行命名。命名规则为公共英文名_dev
    名称 无需配置,系统根据公共名称,进行命名。命名规则为公共名称_开发
    描述 对Dev项目的简单描述。
    项目2:Prod 实时 选择实时计算源。
    离线 请参见项目1:Dev中离线计算源的描述。
    说明 Dev项目和Prod项目不允许绑定同一个计算源。
    实时 选择实时计算源。
    英文名 无需配置,系统根据公共英文名,进行命名。
    名称 无需配置,系统根据公共英文名,进行命名。
    描述 对Prod的简单描述。
    其他设置 沙箱白名单 配置Shell、Python任务可以访问的IP地址、域名或数据库的链接地址等,操作步骤如下:
    1. 单击新建,根据页面提示输入访问地址端口
    2. 单击图标,完成沙箱白名单的添加。

    您也可以单击沙箱白名单所在行的操作下的图标,删除已有的沙箱白名单。

  9. 参数配置完成后,单击确定,完成项目的创建。

新建Basic模式项目

  1. 项目管理页面,单击右上方的新建项目
  2. 根据页面提示,选择Basic模式
  3. 单击下一步
  4. 根据新建项目页面提示,配置参数。
    fagag
    区域 参数 说明
    基本设置 离线 选择离线计算源,说明如下:
    • 绑定计算源时,如果提示计算源与其他项目重复,建议您确认后再绑定,以免出现计算源中数据写入冲突。
    • 如果您有多个项目,建议您确认配置的Access Key是否为项目管理员权限(是否具有跨项目访问权限)。如果没有管理员权限,则需要根据赋权代码进行Access Key授权。以免您在Dataphin系统中跨项目访问时物理层的数据库鉴权失败。
    • 已绑定项目的离线计算源,无法被其他项目再次绑定。
    实时 选择实时计算源。
    英文名 填写英文名。英文名的说明如下:
    • 由字母、数字、下划线_组合组成。
    • 不支持以LD_开头(业务板块英文名默认以LD_作为前缀),以免引用逻辑表和物理表时出现冲突。
    名称 填写名称。名称的说明如下:
    • 名称由中文、数字、字母、下划线_或连字符-组合组成。
    • 不支持以LD_开头(业务板块英文名默认以LD_作为前缀),以免引用逻辑表和物理表时出现冲突。
    描述 对Basic项目简单描述。
    命名空间 业务板块 非必填写项。为新建的项目选择所属业务板块。
    空间类型 用于区分项目开发任务及产出数据特征,默认为应用层。空间类型包括3种:
    • 基础层:来自各个业务数据库的原始数据存储,是后续所有数据建设的来源与基础,也可称为垂直数据中心。
    • 公共层:基于各业务数据,抽象公共的主题,沉淀标准、规范、可共用的数据,是连接基础层与应用层的中间桥梁,也称为公共数据中心。
    • 应用层:面向业务需求,定义生成可应用于不同场景的个性化、多样化的数据指标等。
    其他设置 沙箱白名单 配置Shell、Python任务可以访问的IP地址、域名或数据库的链接地址等,操作步骤如下:
    1. 单击新建,根据页面提示输入访问地址端口
    2. 单击图标,完成沙箱白名单的添加。

    您也可以单击沙箱白名单所在行的操作下的图标,删除已有的沙箱白名单。

  5. 参数配置完成后,单击确定,完成项目的创建。