在ModelArts中,训练作业一旦提交后,作业名称不允许修改,每提交一次训练作业,
实质上是创建了一个训练作业的新版本。如需提交一个不同名称的训练作业,请参见 如下操作指导。
提交一个不同名称的训练作业
例如,当前已有一个手写数字识别的训练算法,提交了“Job Name”为“train-mnist”的训练作业,首次提交后,作业版本为V0001,运行完成后,用户对算法代码 进行了优化,再次提交作业,此时系统会在作业“train-mnist”下创建V0002版本。
工具指南 3 训练模型
图3-14 提交训练作业
当用户再有一个新的训练算法,如物体检测,此时想提交一个“Job Name”为“dog-cat-recognize”的训练作业,可执行如下步骤完成。
1. 单击“Edit Training Job Configuration”配置框右上角的加号,添加一个新的训 练作业配置。填写完毕后单击“Apply and Run”提交训练作业即可。
图3-15 添加一个新的训练作业配置
2. 当再次打开“Edit Training Job Configuration”配置界面时,可以看到“Job Name”的下拉菜单中显示了两个作业的名称,单击名称后可以查看作业的配置信 息。
工具指南 3 训练模型
图3-16 配置中包含 2 个作业名称
删除其中一个训练作业
当存在多个不同名称的训练作业时,如果不需要保留本地的训练作业配置信息时,可 以单击右上角的减号,删除本地作业配置。
说明
该操作是删除本地的配置信息,不会删除公有云侧ModelArts管理控制台的作业。
图3-17 删除训练作业配置信息
工具指南 3 训练模型
单击减号后,系统将弹出确认框,确认信息无误后,单击“是”即可删除本地保存的 作业配置。
图3-18 确认删除
说明
配置信息删除后无法恢复,请谨慎操作。
工具指南 3 训练模型
4 部署上线
针对训练好的模型,您也可以在ToolKit工具中一键部署为在线服务。
说明
当前仅支持部署为在线服务,不支持部署批量服务和边缘服务。
背景信息
● 已完成模型训练,且训练作业状态为成功。
● 针对ModelArts公有云端已有的训练作业,也支持在PyCharm ToolKit工具中一键 部署上线。
● 针对训练好的模型,在部署前,需完成推理脚本及配置文件的开发。推理脚本和 配置文件的开发规范请参见模型包规范、模型配置文件编写说明、模型推理代码 编写说明。
● 推理代码和配置文件需存储至模型输出位置。在PyCharm工具中运行的训练作 业,其模型输出位置,可双击作业版本,在“ModelArts Training Job”区域中
“Training Output Path”参数值即为此训练作业模型输出位置,此路径为OBS路 径。
图4-1 模型输出位置
工具指南 4 部署上线
● 部署完成的服务,将呈现在ModelArts管理控制台的“部署上线 > 在线服务”列
1. 在ModelArts Explorer区域对应的训练作业版本中,右键选择“Deploy to Service”。
图4-2 Deploy to Service
2. 在弹出的对话框中,填写部署模型所需信息,详细参数说明请参见表4-1。
表4-1 部署服务的参数说明
参数 说明
Service Name 在线服务的名称,请按照界面提示规则填写。
Auto Stop 启用该参数并设置时间后,服务将在指定时间后自动停 止。
启用该功能后,默认设置为1小时后自动停止,您也可以 根据实际情况设置自动停止的时间,如5小时之后。
Model Source 如果您是通过具体训练作业版本启动的部署任务,
“Training Job”和“Model Path”将自动填写完成。您 也可以根据实际情况,去更改配置。
● “Training Job”:表示训练作业的名称,以及其对应 的版本。
● “Model Path”:表示训练输出模型的存储路径,为 OBS路径。
Specifications 选择部署在线服务时使用的资源,目前支持“CPU 2核 8GiB”和“CPU:2核 8GiB GPU:1*P4”两种规格。
工具指南 4 部署上线
参数 说明
Compute Nodes 设置资源的实例个数。如果节点个数设置为1,表示后台 的计算模式是单机模式;如果节点个数设置大于1,表示 后台的计算模式为分布式的。请根据实际编码情况选择计 算模式。
Environment
Variables 设置环境变量,注入环境变量到容器实例。多个环境变量 使用英文分号隔开。
图4-3 设置部署服务的相关参数
3. 参数填写完成后,单击“OK”启动服务部署。部署任务启动后,工具左下角的
“Event Log”实时展示部署状态。
部署为在线服务耗费时间较长,请耐心等待。部署完成后,将在界面中提供在线
5 OBS 上传下载
当用于训练的数据需要存储至OBS时,您可以使用PyCharm TookKit提供的OBS上传下 载功能,在PyCharm界面将本地文件和文件夹上传到OBS,或者将OBS上的文件或文 件夹下载到本地。
上传至OBS后,您的训练脚本中,可直接定义为对应的OBS路径。
将本地文件或文件夹上传至 OBS
1. 在Project窗口单击鼠标右键,在弹出的选项中选择“ModelArts Upload”。
工具指南 5 OBS 上传下载
图5-1 ModelArts Upload
2. 在弹出的配置框中填写“OBS Path”和“Local File Path”,上传的文件或文件 夹大小建议不超过10MB。配置完成后单击“Upload File”。
“OBS Path”:表示本地文件需要上传的OBS路径。
“Local File Path”:表示需上传的文件或文件夹所在的本地目录。如果上传文 件,此参数请指定对应的具体文件。
工具指南 5 OBS 上传下载
图5-2 填写文件路径
3. 在“ModelArts Event Log”窗口中可以看到上传的日志。
图5-3 查看上传日志
从 OBS 下载文件或文件夹
1. 在Project窗口单击鼠标右键,在弹出的选项中选择“ModelArts Download”。
2. 在弹出的配置框中填写“OBS Path”和“Local File Path”,配置完成后,单击
“Download File”。
“OBS Path”:表示下载文件的OBS路径。当下载的是具体文件时,此处需指定 为此文件的文件名。
“Local File Path”:表示下载文件需要存储的本地路径。
工具指南 5 OBS 上传下载
图5-4 从 OBS 下载文件
3. 当本地的目录下已经存在同名文件时,将提示是否选择覆盖,选择“是”表示覆 盖,选择“否”表示有冲突的文件就跳过了不下载了,其他没有冲突的文件继续 下载 。请根据实际情况进行选择。
图5-5 选择是否覆盖
4. 在“ModelArts Event Log”窗口中可以看到下载的日志。
图5-6 查看下载日志
工具指南 5 OBS 上传下载