5.5 委托管理
6.2.1 新增作业并执行
功能介绍
在MRS集群中新增一个作业,并执行作业。该接口不兼容Sahara。 集群ID可参考查询 集群列表接口获取。
接口约束
● DistCp作业需要配置文件操作类型(file_action)。
● Spark SQL需要配置Spark SQL语句(hql)和sql程序路径(hive_script_path)。
● 开启Kerberos认证的安全集群暂不支持使用该接口提交作业。
调试
您可以在API Explorer中调试该接口。
URI
POST /v1.1/{project_id}/jobs/submit-job
表6-38 路径参数
参数 是否必选 参数类型 描述
project_id 是 String 项目编号。获取方法,请参见获 取项目ID。
请求参数
表6-39 请求 Body 参数
参数 是否必选 参数类型 描述
job_name 是 String 作业名称,只能由字母、数字、
中划线和下划线组成,并且长度 为1~64个字符。
说明: 不同作业的名称允许相 同,但不建议设置相同。
cluster_id 是 String 集群ID。
jar_path 否 String 执行程序Jar包或sql文件地址,
需要满足如下要求:
● 最多为1023字符,不能包含;|
&><'$特殊字符,且不可为空 或全空格。
● 需要以“/”或“s3a://”开 头。OBS路径不支持KMS加 密的文件或程序。
● Spark Script需要以“.sql”
结尾,MapReduce和Spark Jar需要以“.jar”结尾,sql 和jar不区分大小写。
input 否 String 数据输入地址,必须以“/”或
“s3a://”开头。请配置为正确 的OBS路径,OBS路径不支持 KMS加密的文件或程序。
最多为1023字符,不能包含;|
&>'<$特殊字符,可为空。
output 否 String 数据输出地址,必须以“/”或
“s3a://”开头。请配置为正确 的OBS路径,如果该路径不存 在,系统会自动创建。
最多为1023字符,不能包含;|
&>'<$特殊字符,可为空。
job_log 否 String 作业日志存储地址,该日志信息
记录作业运行状态。必须以
“/”或“s3a://”开头,请配置 为正确的OBS路径。
最多为1023字符,不能包含;|
&>'<$特殊字符,可为空。
参数 是否必选 参数类型 描述
job_type 是 Integer 作业类型码。
● 1:MapReduce
● 2:Spark
● 3:Hive Script
● 4:HiveSQL(当前不支持)
● 5:DistCp,导入、导出数 据。
● 6:Spark Script
● 7:Spark SQL,提交SQL语 句(该接口当前不支持)
file_action 否 String 文件操作类型,包括:
export:从HDFS导出数据至 OBS import:从OBS导入数据 至HDFS
arguments 否 String 程序执行的关键参数,该参数由
用户程序内的函数指定,MRS只 负责参数的传入。 最多为 150000字符,不能包含;|&>'<
$!"\特殊字符,可为空。 说明:
用户输入带有敏感信息(如登录 密码)的参数时,可通过在参数 名前添加“@”的方式,为该参 数值加密,以防止敏感信息被明 文形式持久化。在查看作业信息 时,敏感信息显示为“*”。 例 如:username=admin
@password=admin_123
参数 是否必选 参数类型 描述
hql 否 String Spark SQL语句,该语句需要进
行Base64编码和解码,
“ABCDEFGHIJKLMNOPQRST UVWXYZabcdefghijklmnopqrst uvwxyz0123456789+/”为标准 的编码表,MRS使用
“ABCDEFGHILKJMNOPQRST UVWXYZabcdefghijklmnopqrst uvwxyz0123456789+/”进行 Base64编码。在编码后所得字 符串首位任意加上一个字母,即 得到Hql参数的值。后台自动进 行解码得到Spark SQL语句。 使 用样例:
1. 在Web界面输入Spark SQL 语句“show tables;”。
2. 使用
“ABCDEFGHILKJMNOPQR STUVWXYZabcdefghijklmno pqrstuvwxyz0123456789+/
”编码后得到字符串
“c2hvdyB0YWLsZXM7”。
3. 在“c2hvdyB0YWLsZXM7”
首位任意加上一字母,例如
“gc2hvdyB0YWLsZXM7”
,即Hql参数的值。
4. 后台自动进行解码得到Spark SQL语句“show tables;”。
hive_script_pa
th 否 String sql程序路径,仅Spark Script和 Hive Script作业需要使用此参 数。需要满足如下要求:
● 最多为1023字符,不能包含;|
&><'$特殊字符,且不可为空 或全空格。
● 需要以“/”或“s3a://”开 头,OBS路径不支持KMS加 密的文件或程序。
● 需要以“.sql”结尾,sql不 区分大小写。
响应参数
状态码: 200
表6-40 响应 Body 参数
参数 参数类型 描述
templated Boolean 作业执行对象是否由作业模板生成。
created_at Long 作业创建时间,十位时间戳。
updated_at Long 作业更新时间,十位时间戳。
id String 作业ID。
tenant_id String 项目编号。获取方法,请参见获取项目ID。
job_id String 作业应用ID。
job_name String 作业名称,只能由字母、数字、中划线和下划线 组成,并且长度为1~64个字符。
说明: 不同作业的名称允许相同,但不建议设置 相同。
input_id String 数据输入ID。
output_id String 数据输出ID。
start_time Long 作业执行开始时间,十位时间戳。
end_time Long 作业执行结束时间,十位时间戳。
cluster_id String 集群ID。
engine_job_id String Oozie工作流ID。
return_code String 运行结果返回码。
is_public Boolean 是否公开。 当前版本不支持该功能。
is_protected Boolean 是否受保护。 当前版本不支持该功能。
group_id String 作业执行组ID。
jar_path String 执行程序Jar包或sql文件地址,需要满足如下要 求:
● 最多为1023字符,不能包含;|&><'$特殊字 符,且不可为空或全空格。
● 需要以“/”或“s3a://”开头。OBS路径不支 持KMS加密的文件或程序。
● Spark Script需要以“.sql”结尾,MapReduce 和Spark Jar需要以“.jar”结尾,sql和jar不区 分大小写。
input String 数据输入地址,必须以“/”或“s3a://”开头。
请配置为正确的OBS路径,OBS路径不支持KMS 加密的文件或程序。
最多为1023字符,不能包含;|&>'<$特殊字符,可 为空。
参数 参数类型 描述
output String 数据输出地址,必须以“/”或“s3a://”开头。
请配置为正确的OBS路径,如果该路径不存在,
系统会自动创建。
最多为1023字符,不能包含;|&>'<$特殊字符,可 为空。
job_log String 作业日志存储地址,该日志信息记录作业运行状 态。必须以“/”或“s3a://”开头,请配置为正 确的OBS路径。
最多为1023字符,不能包含;|&>'<$特殊字符,可 为空。
job_type Integer 作业类型码。
● 1:MapReduce
● 2:Spark
● 3:Hive Script
● 4:HiveSQL(当前不支持)
● 5:DistCp,导入、导出数据。
● 6:Spark Script
● 7:Spark SQL,提交SQL语句,(该接口当前 不支持)
说明: 只有包含Spark和Hive组件的集群才能新 增Spark和Hive类型的作业。
file_action String 文件操作类型,包括: - export:从HDFS导出数 据至OBS - import:从OBS导入数据至HDFS arguments String 程序执行的关键参数,该参数由用户程序内的函
数指定,MRS只负责参数的传入。 最多为 150000字符,不能包含;|&>'<$!"\特殊字符,可为 空。 说明: 用户输入带有敏感信息(如登录密 码)的参数时,可通过在参数名前添加“@”的 方式,为该参数值加密,以防止敏感信息被明文 形式持久化。在查看作业信息时,敏感信息显示 为“*”。 例如:username=admin
@password=admin_123 hql String Hive&Spark Sql语句 job_state Integer 作业状态码。
● -1:Terminated
● 1:Starting
● 2:Running
● 3:Completed
● 4:Abnormal
● 5:Error
参数 参数类型 描述 job_final_stat
us Integer 作业最终状态码。
● 0:未完成
● 1:执行错误,终止执行
● 2:执行完成并且成功
● 3:已取消 hive_script_pa
th String sql程序路径,仅Spark Script和Hive Script作业需 要使用此参数。需要满足如下要求:
● 最多为1023字符,不能包含;|&><'$特殊字 符,且不可为空或全空格。
● 需要以“/”或“s3a://”开头,OBS路径不支 持KMS加密的文件或程序。
● 需要以“.sql”结尾,sql不区分大小写。
create_by String 创建作业的用户ID。
为兼容历史版本,保留此参数。
finished_step Integer 当前已完成的步骤数。
为兼容历史版本,保留此参数。
job_main_id String 作业主ID。
为兼容历史版本,保留此参数。
job_step_id String 作业步骤ID。
为兼容历史版本,保留此参数。
postpone_at Long 延迟时间,十位时间戳。
为兼容历史版本,保留此参数。
step_name String 作业步骤名。
为兼容历史版本,保留此参数。
step_num Integer 步骤数量
为兼容历史版本,保留此参数。
task_num Integer 任务数量。 为兼容历史版本,保留此参数。
update_by String 更新作业的用户ID。
credentials String 令牌,当前版本不支持。
user_id String 创建作业的用户ID。
历史版本兼容,不再使用。
job_configs Map<String,O
bject> 键值对集合,用于保存作业运行配置。
extra Map<String,O
bject> 认证信息,当前版本不支持。
参数 参数类型 描述 data_source_u
rls Map<String,O
bject> 数据源URL。
info Map<String,O
bject> 键值对集合,包含oozie返回的作业运行信息。
请求示例
● MapReduce作业请求示例
POST https://{endpoint}/v1.1/{project_id}/jobs/submit-job { "job_type" : 1,
"job_name" : "mrs_test_jobone_20170602_141106", "cluster_id" : "e955a7a3-d334-4943-a39a-994976900d56",
"jar_path" : "s3a://mrs-opsadm/jarpath/hadoop-mapreduce-examples-2.7.2.jar", "arguments" : "wordcount",
"input" : "s3a://mrs-opsadm/input/", "output" : "s3a://mrs-opsadm/output/", "job_log" : "s3a://mrs-opsadm/log/", "file_action" : "",
"hql" : "",
"hive_script_path" : ""
}
● Spark作业请求示例
POST https://{endpoint}/v1.1/{project_id}/jobs/submit-job { "job_type" : 2,
"job_name" : "mrs_test_sparkjob_20170602_141106", "cluster_id" : "e955a7a3-d334-4943-a39a-994976900d56", "jar_path" : "s3a://mrs-opsadm/jarpath/spark-test.jar", "arguments" : "org.apache.spark.examples.SparkPi 10", "input" : "",
"output" : "s3a://mrs-opsadm/output/", "job_log" : "s3a://mrs-opsadm/log/", "file_action" : "",
"hql" : "",
"hive_script_path" : ""
}
● Hive Script作业请求示例
POST https://{endpoint}/v1.1/{project_id}/jobs/submit-job { "job_type" : 3,
"job_name" : "mrs_test_SparkScriptJob_20170602_141106", "cluster_id" : "e955a7a3-d334-4943-a39a-994976900d56", "jar_path" : "s3a://mrs-opsadm/jarpath/Hivescript.sql", "arguments" : "",
"input" : "s3a://mrs-opsadm/input/", "output" : "s3a://mrs-opsadm/output/", "job_log" : "s3a://mrs-opsadm/log/", "file_action" : "",
"hql" : "",
"hive_script_path" : "s3a://mrs-opsadm/jarpath/Hivescript.sql"
}
● DistCp导入作业请求示例
POST https://{endpoint}/v1.1/{project_id}/jobs/submit-job
{ "job_type" : 5,
"job_name" : "mrs_test_importjob_20170602_141106", "cluster_id" : "e955a7a3-d334-4943-a39a-994976900d56",
"input" : "s3a://mrs-opsadm/jarpath/hadoop-mapreduce-examples-2.7.2.jar", "output" : "/user",
"file_action" : "import"
}
● DistCp导出作业请求示例
POST https://{endpoint}/v1.1/{project_id}/jobs/submit-job { "job_type" : 5,
"job_name" : "mrs_test_exportjob_20170602_141106", "cluster_id" : "e955a7a3-d334-4943-a39a-994976900d56", "input" : "/user/hadoop-mapreduce-examples-2.7.2.jar", "output" : "s3a://mrs-opsadm/jarpath/",
"file_action" : "export"
}
● Spark Script作业请求示例
POST https://{endpoint}/v1.1/{project_id}/jobs/submit-job { "job_type" : 6,
"job_name" : "mrs_test_sparkscriptjob_20170602_141106", "cluster_id" : "e955a7a3-d334-4943-a39a-994976900d56", "jar_path" : "s3a://mrs-opsadm/jarpath/sparkscript.sql", "arguments" : "",
"input" : "s3a://mrs-opsadm/input/", "output" : "s3a://mrs-opsadm/output/", "job_log" : "s3a://mrs-opsadm/log/", "file_action" : "",
"hql" : "",
"hive_script_path" : "s3a://mrs-opsadm/jarpath/sparkscript.sql"
}
响应示例
状态码: 200 新增作业成功。
{ "job_execution" : { "templated" : "false", "created_at" : "1496387588", "updated_at" : "1496387588",
"id" : "12ee9ae4-6ee1-48c6-bb84-fb0b4f76cf03", "tenant_id" : "c71ad83a66c5470496c2ed6e982621cc", "job_id" : "",
"job_name" : "mrs_test_jobone_20170602_141106", "input_id" : null,
"output_id" : null,
"start_time" : "1496387588", "end_time" : null,
"cluster_id" : "e955a7a3-d334-4943-a39a-994976900d56", "engine_job_id" : null,
"return_code" : null, "is_public" : null, "is_protected" : null,
"group_id" : "12ee9ae4-6ee1-48c6-bb84-fb0b4f76cf03",
"jar_path" : "s3a://mrs-opsadm/jarpath/hadoop-mapreduce-examples-2.7.2.jar", "input" : "s3a://mrs-opsadm/input/",
"output" : "s3a://mrs-opsadm/output/", "job_log" : "s3a://mrs-opsadm/log/", "job_type" : "1",
"file_action" : "",
"arguments" : "wordcount", "hql" : "",
"job_state" : "2", "job_final_status" : "0", "hive_script_path" : "",
"create_by" : "b67132be2f054a45b247365647e05af0", "finished_step" : "0",
"job_main_id" : "", "job_step_id" : "",
"postpone_at" : "1496387588", "step_name" : "",
"step_num" : "0", "task_num" : "0",
"update_by" : "b67132be2f054a45b247365647e05af0", "credentials" : "",
"user_id" : "b67132be2f054a45b247365647e05af0", "job_configs" : null,
"extra" : null,
"data_source_urls" : null, "info" : null
}}
状态码
状态码 描述
200 新增作业成功。
错误码
请参见错误码。