在调度侧实现弹性配额的功能,可以使不同租户在满足保障资源的前提下相互共享资源。本文介绍如何通过AI运维控制台管理弹性配额组。

前提条件

  • 已安装配置AI运维控制台组件。具体操作,请参见安装云原生AI套件
  • 已获得系统管理授权。关于授权方法,请参见访问AI运维控制台
  • Kubernetes集群版本不低于1.18。但弹性配额能力在不低于1.20的集群才会生效,低于1.20的集群,会降级为K8s的ResourceQuota。

新增配额组

  1. 用管理员RAM子账号和密码登录AI运维控制台。
  2. 在AI运维控制台左侧导航栏中,选择弹性配额组 > 配额组列表
  3. 配额组列表页面,选择没有Namespace的配额节点(即父配额节点),单击添加
    说明 在配额树中新增配额节点时,需满足以下几点:
    • 当节点下已挂载namespace时,该节点不能新建子节点。
    • 当namespace中有Running状态的Pod存在时,该namespace不能挂载节点或从节点卸载。
    • 只有叶子节点可以挂载namespace,父节点不能挂载namespace。
    • 在配额树添加配额节点时,需满足以下条件:
      • 节点Min小于等于Max。
      • 父节点Min必须大于等于对应子节点的Min之和
      • 父节点Max必须大于等于对应任意子节点的Max
    • Min默认值为0,表示没有保障资源(Guaranteed Resource),但是您依然可以提交作业。
    • Max默认值为NA,表示最大可用的资源数不受限制。
    kubeai_add_quota_group
    1. 输入配额组名称,且要求在其父配额节点下唯一。
    2. 输入该配额组管理的Namespace,可多选。如果不填可以继续添加子配额节点。
    3. 填入待管理的资源及其配额,字段及其含义如下:
      字段 含义 是否必填
      资源类型 资源唯一标识 是。
      Min 保障资源,即集群资源紧张时,依然保障可提供的资源量 否,不填默认为0。
      Max 最多可用资源量 否,不填代表不限制。
    4. 单击保存
    新增配额组创建完成后,您可以在配额组列表页面看到刚才创建的资源配额组。

变更资源类型

  1. 用管理员RAM子账号和密码登录AI运维控制台。
  2. 在AI运维控制台左侧导航栏中,选择弹性配额组 > 配额组列表
  3. 单击变更资源类型,单击添加删除图标。
  4. 单击保存

更新配额组

  1. 用管理员RAM子账号和密码登录AI运维控制台。
  2. 在AI运维控制台左侧导航栏中,选择弹性配额组 > 配额组列表
  3. 找到待更新的配额组,单击编辑
  4. 编辑配额对话框中,更新对应配额组资源。
    说明 更新与新增配额组的设置需满足的条件相同。更多信息,请参见新增配额组
  5. 单击保存
    update_eqtree

删除配额组

  1. 用管理员RAM子账号和密码登录AI运维控制台。
  2. 在AI运维控制台左侧导航栏中,选择弹性配额组 > 配额组列表
  3. 找到待删除的配额组,单击删除
    说明 配额树中,仅可删除未挂载namespace的叶子节点,且根节点禁止删除。
    delete_quota_node

查询配额组

  1. 用管理员RAM子账号和密码登录AI运维控制台。
  2. 在AI运维控制台左侧导航栏中,选择弹性配额组 > 配额组列表
  3. 配额组名文本框输入待查询的配额组名称。
  4. 单击查询
    说明 支持配额组名称模糊查询,查询结果会展示所有满足条件的节点及其祖先节点。