7.1 训练作业
7.1.4 查询训练作业详情
示例代码
在ModelArts notebook平台中,Session鉴权无需输入鉴权参数。其它平台的Session 鉴权请参见Session鉴权。
● 方式一:根据指定的job_id和version_id查询
from modelarts.session import Session from modelarts.estimator import Estimator session = Session()
estimator = Estimator(modelarts_session=session, job_id="182626", version_id="278813") job_info = estimator.get_job_info()
print(job_info)
● 方式二:根据创建训练作业生成的训练作业对象查询
job_info = job_instance.get_job_info() print(job_info)
● 方式三:根据查询训练作业版本列表返回的指定训练作业版本对象查询
job_info = job_version_instance_list[0].get_job_info() print(job_info)
参数说明
表7-11 Estimator 请求参数说明
参数 是否必
选
参数类 型
描述
modelarts_sess
ion 是 Object 会话对象,初始化方法请参见Session鉴权。
job_id 是 String 训练作业的ID。job_id可通过创建训练作业 生成的训练作业对象查询,如
“job_instance.job_id”。或可通过查询训练
作业列表的响应中获取。
version_id 是 String 训练作业的版本ID。version_id可通过创建训
练作业生成的训练作业对象查询,如
“job_instance.version_id”。或可通过查询
训练作业列表的响应获取。
表7-12 get_job_info 返回参数说明
参数 参数类型 描述
error_msg String 调用失败时的错误信息。
调用成功时无此字段。
error_code String 调用失败时的错误码,具体请参见错误码。
调用成功时无此字段。
is_success Boolean 接口调用是否成功。
job_id Long 训练作业的ID。
job_name String 训练作业的名称。
job_desc String 训练作业的描述信息。
version_id Long 训练作业的版本ID。
version_name String 训练作业的版本名称。
pre_version_id Long 训练作业前一版本的名称。
参数 参数类型 描述
engine_type Short 训练作业的引擎类型。“engine_type”和
“engine_name”对应关系如下:
● engine_type:1,engine_name:
"TensorFlow"
● engine_type:2,engine_name:
"MXNet"
● engine_type:3,engine_name: "Ray"
● engine_type:4,engine_name:"Caffe"
● engine_type:5,engine_name:
"Spark_MLlib"
● engine_type:9,engine_name:
"XGBoost-Sklearn"
● engine_type:10,engine_name:
"PyTorch"
● engine_type:12,engine_name:
"Horovod"
engine_name String 训练作业的引擎名称。目前支持的引擎名称 如下:
● Caffe
● Horovod
● MXNet
● PyTorch
● Ray
● Spark_MLlib
● TensorFlow
● XGBoost-Sklearn engine_id Long 训练作业的引擎ID。
engine_version String 训练作业使用的引擎版本。
status Integer 训练作业的状态,详细作业状态列表请参见
作业状态参考。
app_url String 训练作业的代码目录。
boot_file_url String 训练作业的代码启动文件。
create_time Long 训练作业的创建时间。
parameter JSON Array 训练作业的运行参数,为label-value格式;
当为自定义镜像训练作业的时候,此参数为 容器环境变量。
duration Long 训练作业的运行时间,单位为毫秒。
参数 参数类型 描述
spec_id Long 训练作业资源规格ID。
core String 资源规格的核数。
cpu String 资源规格CPU内存。
gpu_num Integer 资源规格GPU的个数。
gpu_type String 资源规格GPU的类型。
worker_server_n
um Integer 训练作业worker的个数。
data_url String 训练作业的数据集。
train_url String 训练作业输出文件OBS路径。
dataset_version_
id String 训练作业的数据集版本ID。
dataset_id String 训练作业的数据集ID。
data_source JSON Array 训练作业使用的多数据集。
model_id Long 训练作业的模型ID。
model_metric_li
st JSON Array 训练作业的模型评测参数。
system_metric_li
st JSON Array 训练作业的系统监控指标。
user_image_url String 自定义镜像训练作业的自定义镜像的SWR-URL。
user_command String 自定义镜像训练作业的自定义镜像的容器的 启动命令。
表7-13 data_source 属性列表
参数 参数类型 描述
dataset_id String 训练作业的数据集ID。
dataset_version String 训练作业的数据集版本ID。
type String 数据集类型。
“obs”:表示使用OBS的数据。
“dataset”:表示使用数据集的数据。
data_url String OBS的桶路径。
表7-14 model_metric_list 属性列表
参数 参数类型 描述
metric JSON Array 训练作业的模型单个分类测评参数。
total_metric JSON Array 训练作业的模型总测评参数。
表7-15 system_metric_list 属性列表
参数 参数类型 描述
cpuUsage JSON Array 训练作业CPU资源占用率。
memUsage JSON Array 训练作业内存资源占用率。
gpuUtil JSON Array 训练作业GPU资源占用率。
表7-16 metric 属性列表
参数 参数类型 描述
metric_values JSON Array 训练作业模型单个分类测评参数指标。
reserved_data JSON Array 预留字段。
metric_meta JSON Array 训练作业模型单个分类,包含类ID和类 名。
表7-17 metric_values 属性列表
参数 参数类型 描述
recall JSON Array 训练作业模型单个分类召回率。
precision JSON Array 训练作业模型单个分类精确率。
accuracy JSON Array 训练作业模型单个分类准确率。
表7-18 total_metric 属性列表
参数 参数类型 描述
total_metric_met
a JSON Array 预留字段。
total_reserved_d
ata JSON Array 预留字段。
参数 参数类型 描述 total_metric_valu
es JSON Array 训练作业模型总测评参数指标。
表7-19 total_metric_values 属性列表
参数 参数类型 描述
f1_score Float 训练作业模型总召回。
recall Float 训练作业模型总召回率。
precision Float 训练作业模型总精确率。
accuracy Float 训练作业模型总准确率。