• 沒有找到結果。

提交不同名称的训练作业

在ModelArts中,训练作业一旦提交后,作业名称不允许修改,每提交一次训练作业,

实质上是创建了一个训练作业的新版本。如需提交一个不同名称的训练作业,请参见 如下操作指导。

提交一个不同名称的训练作业

例如,当前已有一个手写数字识别的训练算法,提交了“Job Name”为“train-mnist”的训练作业,首次提交后,作业版本为V0001,运行完成后,用户对算法代码 进行了优化,再次提交作业,此时系统会在作业“train-mnist”下创建V0002版本。

工具指南 3 训练模型

3-14 提交训练作业

当用户再有一个新的训练算法,如物体检测,此时想提交一个“Job Name”为“dog-cat-recognize”的训练作业,可执行如下步骤完成。

1. 单击“Edit Training Job Configuration”配置框右上角的加号,添加一个新的训 练作业配置。填写完毕后单击“Apply and Run”提交训练作业即可。

3-15 添加一个新的训练作业配置

2. 当再次打开“Edit Training Job Configuration”配置界面时,可以看到“Job Name”的下拉菜单中显示了两个作业的名称,单击名称后可以查看作业的配置信 息。

工具指南 3 训练模型

3-16 配置中包含 2 个作业名称

删除其中一个训练作业

当存在多个不同名称的训练作业时,如果不需要保留本地的训练作业配置信息时,可 以单击右上角的减号,删除本地作业配置。

说明

该操作是删除本地的配置信息,不会删除公有云侧ModelArts管理控制台的作业。

3-17 删除训练作业配置信息

工具指南 3 训练模型

单击减号后,系统将弹出确认框,确认信息无误后,单击“是”即可删除本地保存的 作业配置。

3-18 确认删除

说明

配置信息删除后无法恢复,请谨慎操作。

工具指南 3 训练模型

4 部署上线

针对训练好的模型,您也可以在ToolKit工具中一键部署为在线服务。

说明

当前仅支持部署为在线服务,不支持部署批量服务和边缘服务。

背景信息

● 已完成模型训练,且训练作业状态为成功。

● 针对ModelArts公有云端已有的训练作业,也支持在PyCharm ToolKit工具中一键 部署上线。

● 针对训练好的模型,在部署前,需完成推理脚本及配置文件的开发。推理脚本和 配置文件的开发规范请参见模型包规范、模型配置文件编写说明、模型推理代码 编写说明。

● 推理代码和配置文件需存储至模型输出位置。在PyCharm工具中运行的训练作 业,其模型输出位置,可双击作业版本,在“ModelArts Training Job”区域中

“Training Output Path”参数值即为此训练作业模型输出位置,此路径为OBS路 径。

4-1 模型输出位置

工具指南 4 部署上线

● 部署完成的服务,将呈现在ModelArts管理控制台的“部署上线 > 在线服务”列

1. 在ModelArts Explorer区域对应的训练作业版本中,右键选择“Deploy to Service”。

4-2 Deploy to Service

2. 在弹出的对话框中,填写部署模型所需信息,详细参数说明请参见表4-1。

4-1 部署服务的参数说明

参数 说明

Service Name 在线服务的名称,请按照界面提示规则填写。

Auto Stop 启用该参数并设置时间后,服务将在指定时间后自动停 止。

启用该功能后,默认设置为1小时后自动停止,您也可以 根据实际情况设置自动停止的时间,如5小时之后。

Model Source 如果您是通过具体训练作业版本启动的部署任务,

“Training Job”和“Model Path”将自动填写完成。您 也可以根据实际情况,去更改配置。

● “Training Job”:表示训练作业的名称,以及其对应 的版本。

● “Model Path”:表示训练输出模型的存储路径,为 OBS路径。

Specifications 选择部署在线服务时使用的资源,目前支持“CPU 2核 8GiB”和“CPU:2核 8GiB GPU:1*P4”两种规格。

工具指南 4 部署上线

参数 说明

Compute Nodes 设置资源的实例个数。如果节点个数设置为1,表示后台 的计算模式是单机模式;如果节点个数设置大于1,表示 后台的计算模式为分布式的。请根据实际编码情况选择计 算模式。

Environment

Variables 设置环境变量,注入环境变量到容器实例。多个环境变量 使用英文分号隔开。

4-3 设置部署服务的相关参数

3. 参数填写完成后,单击“OK”启动服务部署。部署任务启动后,工具左下角的

“Event Log”实时展示部署状态。

部署为在线服务耗费时间较长,请耐心等待。部署完成后,将在界面中提供在线

5 OBS 上传下载

当用于训练的数据需要存储至OBS时,您可以使用PyCharm TookKit提供的OBS上传下 载功能,在PyCharm界面将本地文件和文件夹上传到OBS,或者将OBS上的文件或文 件夹下载到本地。

上传至OBS后,您的训练脚本中,可直接定义为对应的OBS路径。

将本地文件或文件夹上传至 OBS

1. 在Project窗口单击鼠标右键,在弹出的选项中选择“ModelArts Upload”。

工具指南 5 OBS 上传下载

5-1 ModelArts Upload

2. 在弹出的配置框中填写“OBS Path”和“Local File Path”,上传的文件或文件 夹大小建议不超过10MB。配置完成后单击“Upload File”。

“OBS Path”:表示本地文件需要上传的OBS路径。

“Local File Path”:表示需上传的文件或文件夹所在的本地目录。如果上传文 件,此参数请指定对应的具体文件。

工具指南 5 OBS 上传下载

5-2 填写文件路径

3. 在“ModelArts Event Log”窗口中可以看到上传的日志。

5-3 查看上传日志

OBS 下载文件或文件夹

1. 在Project窗口单击鼠标右键,在弹出的选项中选择“ModelArts Download”。

2. 在弹出的配置框中填写“OBS Path”和“Local File Path”,配置完成后,单击

“Download File”。

“OBS Path”:表示下载文件的OBS路径。当下载的是具体文件时,此处需指定 为此文件的文件名。

“Local File Path”:表示下载文件需要存储的本地路径。

工具指南 5 OBS 上传下载

5-4 从 OBS 下载文件

3. 当本地的目录下已经存在同名文件时,将提示是否选择覆盖,选择“是”表示覆 盖,选择“否”表示有冲突的文件就跳过了不下载了,其他没有冲突的文件继续 下载 。请根据实际情况进行选择。

5-5 选择是否覆盖

4. 在“ModelArts Event Log”窗口中可以看到下载的日志。

5-6 查看下载日志

工具指南 5 OBS 上传下载

6 常见问题

相關文件