前提条件
  • 创建对象存储的bucket, 用于数据存储, 详情请参见创建存储空间
  • 在Databricks数据洞察产品中创建一个集群,详情请参见创建集群

步骤一 :示例下载

步骤二 :创建项目空间

在左侧导航栏中,选择项目空间,单击新建项目按钮,填写项目名称、项目描述,单击创建按钮。

项目空间

二级菜单选择作业编辑,新建作业。

新建作业

步骤三 :编写并提交作业

--class com.aliyun.emr.example.spark.SparkWordCount oss://databricks-demo/test-sparksubmit-word-count/spark-wordcount-examples-1.2.0.jar 
oss://databricks-demo/test-sparksubmit-word-count/The_Sorrows_of_Young_Werther.txt 
oss://databricks-demo/test-sparksubmit-word-count/output/temp/01 1
作业示例

步骤四 :验证作业

作业执行完成后,查看作业运行记录。

查看状态

作业执行成功后,可在OSS相应目录查看当前作业产出数据。

OSS数据目录