本文为您介绍Python SDK及其常见方法。

MaxCompute的Python版本的SDK即为Pyodps,提供对MaxCompute对象的基本操作和DataFrame框架,让您可以轻松地在MaxCompute上进行数据分析。更多详情请参见Github项目和包括所有接口、类的细节等内容的Pyodps文档
  • 在您开始使用PyODPS之前请先安装PyODPS,详细内容参见PyODPS安装指南
  • 了解更多关于PyODPS的开发内容,请参见PyODPS开发指南
  • 关于PyODPS的社区信息请参见PyODPS云栖社区专辑
  • 欢迎各位开发者参与到PyODPS的生态开发中,详情请参见GitHub文档
  • 欢迎提交Issue和Merge Request,加快PyODPS生态成长,更多详情请参见代码
  • 钉钉技术交流群:11701793。

初始化入口

在使用Pyodps之前,您需要用阿里云账号初始化一个MaxCompute的入口,如下所示。
from odps import ODPS
odps = ODPS('**your-access-id**', '**your-secret-access-key**', '**your-default-project**',endpoint='**your-end-point**')
需要配置的参数如下:
  • your-access-id:账户的AccessKey ID。
  • your-secret-access-key:账户的AccessKey Secret。
  • your-default-project:使用的项目空间名称。
  • your-end-point:MaxCompute服务所在区域的Endpoint。详情请参见配置Endpoint

根据上述操作初始化后,便可对表、资源、函数等对象进行操作。

方法说明

PyODPS提供直接针对MaxCompute对象的基本操作方法,详情请见下表。
操作类型 方法名称 方法说明
项目空间 get_project(project_name) 获取项目空间。
exist_project(project_name) 判断某个项目空间是否存在。
list_tables() 列出项目空间下的所有表。
exist_table(table_name) 判断表是否存在。
get_table(table_name,project=project_name) 获取指定表。允许跨项目获取表。
create_table() 创建表。
read_table() 读取表数据。
write_table() 写入表数据。
delete_table() 删除已经存在的表。
表分区 exist_partition() 判断分区是否存在。
get_partition() 获取分区。
create_partition() 创建分区。
delete_partition() 删除分区。
SQL execute_sql()/run_sql() 执行SQL语句。
open_reader() 读取执行结果。
任务实例 list_instances() 获取项目空间下的所有的Instance。
exist_instance() 判断是否存在某Instance。
get_instance() 获取实例。
stop_instance() 停止Instance。
资源 create_resource() 创建资源。
open_resource() 打开资源。
get_resource() 获取资源。
list_resources() 列出所有资源。
exist_resource() 判断资源是否存在。
delete_resource() 删除资源。
函数 create_function() 创建函数。
delete_function() 删除函数。
数据上传下载通道 create_upload_session() 创建上传数据会话。
create_download_session() 创建下载数据会话。