• 沒有找到結果。

7.1 训练作业

7.1.4 查询训练作业详情

示例代码

在ModelArts notebook平台中,Session鉴权无需输入鉴权参数。其它平台的Session 鉴权请参见Session鉴权。

● 方式一:根据指定的job_id和version_id查询

from modelarts.session import Session from modelarts.estimator import Estimator session = Session()

estimator = Estimator(modelarts_session=session, job_id="182626", version_id="278813") job_info = estimator.get_job_info()

print(job_info)

● 方式二:根据创建训练作业生成的训练作业对象查询

job_info = job_instance.get_job_info() print(job_info)

● 方式三:根据查询训练作业版本列表返回的指定训练作业版本对象查询

job_info = job_version_instance_list[0].get_job_info() print(job_info)

参数说明

7-11 Estimator 请求参数说明

参数 是否必

参数类 型

描述

modelarts_sess

ion 是 Object 会话对象,初始化方法请参见Session鉴权。

job_id 是 String 训练作业的ID。job_id可通过创建训练作业 生成的训练作业对象查询,如

“job_instance.job_id”。或可通过查询训练

作业列表的响应中获取。

version_id 是 String 训练作业的版本ID。version_id可通过创建训

练作业生成的训练作业对象查询,如

“job_instance.version_id”。或可通过查询

训练作业列表的响应获取。

7-12 get_job_info 返回参数说明

参数 参数类型 描述

error_msg String 调用失败时的错误信息。

调用成功时无此字段。

error_code String 调用失败时的错误码,具体请参见错误码。

调用成功时无此字段。

is_success Boolean 接口调用是否成功。

job_id Long 训练作业的ID。

job_name String 训练作业的名称。

job_desc String 训练作业的描述信息。

version_id Long 训练作业的版本ID。

version_name String 训练作业的版本名称。

pre_version_id Long 训练作业前一版本的名称。

参数 参数类型 描述

engine_type Short 训练作业的引擎类型。“engine_type”和

“engine_name”对应关系如下:

● engine_type:1,engine_name:

"TensorFlow"

● engine_type:2,engine_name:

"MXNet"

● engine_type:3,engine_name: "Ray"

● engine_type:4,engine_name:"Caffe"

● engine_type:5,engine_name:

"Spark_MLlib"

● engine_type:9,engine_name:

"XGBoost-Sklearn"

● engine_type:10,engine_name:

"PyTorch"

● engine_type:12,engine_name:

"Horovod"

engine_name String 训练作业的引擎名称。目前支持的引擎名称 如下:

● Caffe

● Horovod

● MXNet

● PyTorch

● Ray

● Spark_MLlib

● TensorFlow

● XGBoost-Sklearn engine_id Long 训练作业的引擎ID。

engine_version String 训练作业使用的引擎版本。

status Integer 训练作业的状态,详细作业状态列表请参见

作业状态参考。

app_url String 训练作业的代码目录。

boot_file_url String 训练作业的代码启动文件。

create_time Long 训练作业的创建时间。

parameter JSON Array 训练作业的运行参数,为label-value格式;

当为自定义镜像训练作业的时候,此参数为 容器环境变量。

duration Long 训练作业的运行时间,单位为毫秒。

参数 参数类型 描述

spec_id Long 训练作业资源规格ID。

core String 资源规格的核数。

cpu String 资源规格CPU内存。

gpu_num Integer 资源规格GPU的个数。

gpu_type String 资源规格GPU的类型。

worker_server_n

um Integer 训练作业worker的个数。

data_url String 训练作业的数据集。

train_url String 训练作业输出文件OBS路径。

dataset_version_

id String 训练作业的数据集版本ID。

dataset_id String 训练作业的数据集ID。

data_source JSON Array 训练作业使用的多数据集。

model_id Long 训练作业的模型ID。

model_metric_li

st JSON Array 训练作业的模型评测参数。

system_metric_li

st JSON Array 训练作业的系统监控指标。

user_image_url String 自定义镜像训练作业的自定义镜像的SWR-URL。

user_command String 自定义镜像训练作业的自定义镜像的容器的 启动命令。

7-13 data_source 属性列表

参数 参数类型 描述

dataset_id String 训练作业的数据集ID。

dataset_version String 训练作业的数据集版本ID。

type String 数据集类型。

“obs”:表示使用OBS的数据。

“dataset”:表示使用数据集的数据。

data_url String OBS的桶路径。

7-14 model_metric_list 属性列表

参数 参数类型 描述

metric JSON Array 训练作业的模型单个分类测评参数。

total_metric JSON Array 训练作业的模型总测评参数。

7-15 system_metric_list 属性列表

参数 参数类型 描述

cpuUsage JSON Array 训练作业CPU资源占用率。

memUsage JSON Array 训练作业内存资源占用率。

gpuUtil JSON Array 训练作业GPU资源占用率。

7-16 metric 属性列表

参数 参数类型 描述

metric_values JSON Array 训练作业模型单个分类测评参数指标。

reserved_data JSON Array 预留字段。

metric_meta JSON Array 训练作业模型单个分类,包含类ID和类 名。

7-17 metric_values 属性列表

参数 参数类型 描述

recall JSON Array 训练作业模型单个分类召回率。

precision JSON Array 训练作业模型单个分类精确率。

accuracy JSON Array 训练作业模型单个分类准确率。

7-18 total_metric 属性列表

参数 参数类型 描述

total_metric_met

a JSON Array 预留字段。

total_reserved_d

ata JSON Array 预留字段。

参数 参数类型 描述 total_metric_valu

es JSON Array 训练作业模型总测评参数指标。

7-19 total_metric_values 属性列表

参数 参数类型 描述

f1_score Float 训练作业模型总召回。

recall Float 训练作业模型总召回率。

precision Float 训练作业模型总精确率。

accuracy Float 训练作业模型总准确率。