文档

新建MAX_COMPUTE_MR任务

更新时间:

本文为您介绍如何基于Dataphin构建MapReduce类型的离线计算任务。

前提条件

完成JAR资源包的上传,详情请参见上传资源及引用

背景信息

MapReduce任务中引用到的JAR资源包需提前创建,因此需要您在资源管理中上传JAR资源包,然后在MapReduce代码任务中引用。

操作步骤

  1. 在Dataphin首页,单击顶部菜单栏的研发

  2. 在数据开发页面,按照下图操作指引进入新建MAX_COMPUTE_MR任务对话框。

    image

  3. 编写并运行代码。

    1. 新建MAX_COMPUTE_MR任务对话框,配置参数。

      参数

      描述

      任务名称

      填写离线计算任务的名称,例如MR。

      调度类型

      选择任务的调度类型。调度类型包括:

      • 周期性节点,自动参与系统的周期性调度。

      • 手动节点,需要手动触发任务的运行。

      选择目录

      选择任务所存放的目录。若无所需目录,您可按照下图操作指引,填写您目录名称和选择目录所在位置进行创建。image

      使用模板

      支持使用创建的离线代码模板以实现高效研发,模板任务代码为只读不可编辑,您只需配置模板参数即可完成代码研发。模板创建,请参见新建离线计算模板

      描述

      填写对任务的简单描述,1000字符以内。

    2. 单击确定

    3. 代码编写页面,编写MapReduce离线计算任务的代码。MapReduce开发详情请参见MapReduce

      image

    4. 代码编写完成后,单击页面上方的运行,可运行代码。

  4. 单击页面侧边栏属性,配置任务。属性包括任务的基本信息参数配置运行配置

    • 基本信息

      用于定义调度任务的名称、对应责任人、描述等基本信息。详情请参见配置任务基本信息

    • 参数配置

      若您的代码中调用了参数变量,您可在属性中对参数进行赋值,从而支持节点调度时,参数变量可以自动被替换为相应的变量值。详细说明请参见:参数配置及使用节点参数

    • 运行配置

      您可根据业务场景为离线计算任务配置任务级的运行超时时间和任务运行失败时的重跑策略。未配置则默认继承租户级设置的默认值。详细说明请参见:计算任务运行配置

      说明
      • 如果离线计算任务的调度类型为手动任务,需要手动触发任务的调度。

      • 如果离线计算任务的调度类型为周期任务,除属性基本信息外,还需配置任务的调度属性及调度依赖。详情请参见:

  5. 在代码编写页面,保存并提交SQL任务。

    1. 单击页面上的image图标,保存代码。

    2. 单击页面右上方的image图标,提交代码。

  6. 提交备注页面,填写备注信息。

  7. 单击确定并提交

后续步骤

  • 如果您的开发模式是Dev-Prod模式,则需要发布MapReduce任务,详情请参见管理发布任务

  • 如果您的开发模式是Basic模式,则提交成功后的MapReduce任务,即可参与生产环境的调度。您可前往运维中心查看您发布的任务。详情请参见运维中心概述

  • 本页导读 (0)
文档反馈