资源(Resource)是MaxCompute的特有概念,如果您想使用MaxCompute的自定义函数(UDF)或MapReduce功能,需要依赖资源来完成。本文为您介绍添加、查看、下载及删除资源等常用资源操作。

资源操作常用命令如下。
类型 功能 角色 操作入口
添加资源 添加资源至MaxCompute项目空间中。 具备更新资源权限(Write)的用户。 本文中的命令您可以在如下工具平台执行:
查看资源信息 查看资源的详细信息。 具备读取资源权限(Read)的用户。
查看资源列表 查看当前项目空间下所有的资源。 具备项目空间查看对象列表权限(List)的用户。
为资源创建别名 为资源创建别名。 具备更新资源权限(Write)的用户。
下载资源 下载MaxCompute项目空间中的资源到本地。 具备更新资源权限(Write)的用户。
删除资源 删除MaxCompute项目空间中已经存在的资源。 具备删除资源权限(Delete)的用户。

添加资源

添加资源至MaxCompute项目空间中。

  • 使用限制
    • MaxCompute不支持添加外部表为资源。
    • 每个资源文件的大小不能超过500 MB。单个SQL、MapReduce作业所引用的资源总大小不能超过2048 MB。
  • 命令格式
    add file <local_file> [as <alias>] [comment '<comment>'][-f];
    add archive <local_file> [as <alias>] [comment '<comment>'][-f];
    add table <table_name> [partition (<spec>)] [as <alias>] [comment '<comment>'][-f];
    add py|jar <localfile> [comment '<comment>'][-f];
  • 参数说明
    • file|archive|table|py|jar:必填。资源类型。资源类型详情请参见资源
    • local_file:必填。表示本地文件所在路径。并以文件名作为资源名,资源名是资源的唯一标识。
    • table_name:必填。表示MaxCompute中的表名。
    • spec:必填。当添加的资源为分区表时,MaxCompute仅支持将某个分区作为资源,不支持将整张分区表作为资源。
    • alias:可选。指定资源名,不加该参数时默认文件名为资源名。JAR及PYTHON类型资源不支持此参数。
    • comment:可选。为资源添加注释。
    • -f:可选。当存在同名的资源时,此操作会覆盖原有资源。如果不指定此选项,存在同名资源时,操作将失败。
  • 使用示例
    • 示例1:添加一个FILE类型文件资源到MaxCompute。
      add file banking.txt;
      返回结果如下。
      OK: Resource 'banking.txt' have been created.
    • 示例2:添加一个别名为sale.res的分区表资源到MaxCompute。
      add table sale_detail partition (ds='20150602') as sale.res comment 'sale detail on 20150602' -f;
      返回结果如下。
      OK: Resource 'sale.res' have been updated.
    • 示例3:添加Python资源到MaxCompute。
      add py python.py [comment '<comment>'][-f];
      返回结果如下。
      OK: Resource 'python.py' have been created.

查看资源信息

查看当前项目空间下指定资源的信息,包含资源名、所有者、资源类型、资源大小、创建时间、上一次修改时间、资源文件的MD5值等信息。

  • 命令格式
    desc resource <resource_name>;
  • 参数说明

    resource_name:必填。已存在的资源名称。

  • 使用示例
    --查看资源topn_new.jar的信息。
    desc resource topn_new.jar;
    返回结果如下。
    Name                                    topn_new.jar
    Owner                                   ALIYUN$****@test.aliyunid.com
    Type                                    JAR
    Comment                                 cloudopenapi
    CreatedTime                             2020-12-29 13:55:11
    LastModifiedTime                        2020-12-29 13:55:11
    LastUpdator
    Size                                    11438795
    Md5sum                                  8bcf6aabf****56c0

查看资源列表

查看当前项目空间下所有的资源,包含资源名、所有者、创建时间、上一次修改时间、资源类型等信息。

  • 命令格式
    list resources;
  • 使用示例
    list resources;
    返回结果如下。
    Resource Name         Owner                 Creation Time         Last Modified Time    Type          Last Updator Resource Size  Source         comment
    getaddr.jar           ALIYUN$****           2020-06-18 15:47:28   2020-06-18 15:47:28   jar           1353716                                    cloudopenapi
    ip.dat                ALIYUN$****           2020-06-18 15:49:46   2020-06-18 15:49:46   file          8525962                                    cloudopenapi
    2 resources

为资源创建别名

为资源创建别名。alias命令可以在不修改代码的前提下,在MapReduce自定义函数(UDF)代码中,通过某个固定的资源名读取不同资源(数据)。

  • 命令格式
    alias <alias>=<real>;
  • 参数说明
    • alias:命名后的资源别名。
    • real:资源的原名。
  • 使用示例
    --新增资源res_20121208和res_20121209。
    add table sale_detail partition (ds='20121208') as res_20121208;
    add table sale_detail partition (ds='20121209') as res_20121209;
    --命名资源res_20121208的别名为resName,并调用它。
    alias resName=res_20121208;
    jar -resources resName -libjars work.jar  -classpath ./work.jar com.company.MainClass args ...;  
    --命名资源res_20121209的别名为resName,并调用它。
    alias resName=res_20121209;
    jar -resources resName -libjars work.jar  -classpath ./work.jar com.company.MainClass args ...; 

上例中的资源别名resName在两个作业里引用了不同的资源表,您无需修改代码便可读取到不同的数据。

下载资源

下载MaxCompute项目空间中的资源到本地。资源类型必须为FILE、JAR、ARCHIVE或PY,不支持Table类型。

  • 命令格式
    get resource <resource_name> <path>;
  • 参数说明
    • resource_name:必填。要下载的资源名称。
    • path:必填。资源保存到本地的路径。
  • 使用示例
    get resource getaddr.jar D:\;

删除资源

删除MaxCompute项目空间中已经存在的资源。

  • 命令格式
    drop resource <resource_name>;
  • 参数说明

    resource_name:待删除资源的名称。

  • 使用示例
    drop resource getaddr.jar;
    返回结果如下。
    Confirm to "drop resource getaddr.jar" (yes/no)? y
    OK