本文介绍如何在AI开发控制台提交一个Tensorflow训练任务和定时任务。

前提条件

提交Tensorflow训练任务

  1. 登录开发控制台。具体操作,请参见步骤二:登录开发控制台
  2. 在AI开发控制台的左侧导航栏中,单击提交任务
  3. 基本信息区域,填写任务名称,选择任务类型(默认值为TF单机)、命名空间数据配置代码配置等参数,并填写执行命令
    注意 命名空间只能选择为集群管理员为您分配的命名空间,其他选项可根据需要配置。
  4. 任务资源配置区域,填写模型训练的实例数量镜像,以及训练任务需要的CPU(核数)(默认值为4)、内存(GB)(默认值为8 GB)、GPU(卡数)(默认值为0)。
  5. 单击提交任务
  6. 任务提交完成后,在AI开发控制台的左侧导航栏中,单击任务列表,在该页面您可查看到任务的名称、执行状况等信息。

提交定时任务

  1. 在AI开发控制台的左侧导航栏中,单击提交任务
  2. 基本信息区域,填写任务名称,选择任务类型(默认值为TF单机)、命名空间数据配置代码配置等参数,并填写执行命令
    注意 命名空间只能选择为集群管理员为您分配的命名空间,其他选项可根据需要配置。
  3. 打开定时任务开关,填写定时任务相关的参数。
    • 定时策略:标准的Crontab表达式。关于如何使用Crontab表达式,请参见how-use-cron-linux
    • 如果当前训练任务尚未结束,定时任务的并行策略支持以下三种:
      • Allow:允许创建新的训练任务。
      • Forbid:在训练任务结束前,禁止创建新的任务。
      • Replace:创建一个新的训练任务,替换当前未结束的任务。
  4. 任务资源配置区域,填写模型训练的实例数量镜像,以及训练任务需要的CPU(核数)(默认值为4)、内存(GB)(默认值为8 GB)、GPU(卡数)(默认值为0)。
  5. 单击提交任务
  6. 任务提交完成后,在AI开发控制台的左侧导航栏中,单击任务列表,在该页面您可查看到任务的名称、执行状况等信息。