4.9.1 工作流介绍
工作流简介
相是指成分和组织均匀统一的物质部分,金属材料中,一般除了基体相外,还会存在 许多的第二相。而第二相对整个金属材料的影响也是巨大的。在钢铁或其下游企业,
常需要对钢铁显微成像的金相图片第二相面积含量进行测定。ModelArts Pro提供第二 相面积含量测定工作流,能快速准确的返回第二相面积含量测定结果。
在“ModelArts Pro>视觉套件”控制台选择“我的工作流>第二相面积含量测定工作 流”新建应用,详细操作请见新建应用。您可以构建第二相面积含量测定模型,能快 于模型训练的数据,上传至OBS 中。 的“数据标注”页面,ModelArts Pro会自动标注数据,自动标注完 成后,可对每个数据的标注结果进 行核对和确认。
工作流介绍
流程 说明 详细指导 应的API和SDK识别。
部署服务
4.9.2 准备数据
在使用第二相面积含量测定工作流开发应用之前,您需要提前准备用于模型训练的数 据,上传至OBS服务中。
数据标签
标注基于ModelArts的图像分割标注基础能力,由于第二相边界多为不规则形状,目前 采用多边形标注第二相,标签为“second_phase”。
数据集要求
● 文件名规范,不能有中文,不能有+、空格、制表符。
● 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、
BMP。
● 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。
● 为保证模型的泛化能力,数据集尽量覆盖所有材质类型的待定级图片。
● 为保证训练效果,需要准备至少20张待训练的图片数据,低于20张工作流数据处 理会报错。此外,为优化模型,建议对金相图像的第二相边界标注清晰。
● 针对未标注数据,要求将图片放在一个目录里,示例如下所示。
├─dataset-import-example
│ IMG_20180919_114732.jpg
│ IMG_20180919_114745.jpg
│ IMG_20180919_114945.jpg
– 如果导入位置为OBS,用户需具备此OBS路径的读取权限。
– 只支持JPG、JPEG、PNG、BMP格式的图片。
● 针对已标注数据,要求用户将标注对象和标注文件存储在同一目录,并且一一对 应,如标注对象文件名为“IMG_20180919_114745.jpg”,那么标注文件的文件 名应为“IMG_20180919_114745.xml”。
第二相面积含量测定工作流标注时使用多边形标注框标注图片。如果标注框坐标 超过图片,将无法识别该图片为已标注图片。
第二相标注的标注文件需要满足PASCAL VOC格式,格式详细说明请参见表 4-27。
表4-27 PASCAL VOC 格式说明
字段 是否
必选
说明
folder 是 表示数据源所在目录。
filename 是 被标注文件的文件名。
size 是 表示图像的像素信息。
● width:必选字段,图片的宽度。
● height:必选字段,图片的高度。
● depth:必选字段,图片的通道数。
segmented 是 表示是否用于分割。
mask_source 否 表示图像分割保存的mask路径。
字段 是否 必选
说明
object 是 表示物体检测信息,多个物体标注会有多个object 体。
● name:必选字段,标注内容的类别。
● pose:必选字段,标注内容的拍摄角度。
● truncated:必选字段,标注内容是否被截断(0表 示完整)。
● occluded:必选字段,标注内容是否被遮挡(0表 示未遮挡)
● difficult:必选字段,标注目标是否难以识别(0 表示容易识别)。
● confidence:可选字段,标注目标的置信度,取值 范围0-1之间。
● polygon:必选字段,标注框的类型。第二相面积 含量测定工作流标注时使用多边形标注框,即标 注框类型选择“polygon”,标注信息如下所示。
各点坐标。
<x1>100<x1>
<y1>100<y1>
<x2>200<x2>
<y2>100<y2>
<x3>250<x3>
<y3>150<y3>
<x4>200<x4>
<y4>200<y4>
<x5>100<x5>
<y5>200<y5>
<x6>50<x6>
<y6>150<y6>
<x7>100<x7>
<y7>100<y7>
● mask_color:可选字段,标签的颜色,以RGB值 表示。
示例:
├─dataset-import-example
│ IMG_20180919_114732.jpg
│ IMG_20180919_114732.xml
│ IMG_20180919_114745.jpg
│ IMG_20180919_114745.xml
│ IMG_20180919_114945.jpg
│ IMG_20180919_114945.xml
标注文件的示例如下所示:
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<annotation>
<folder>NA</folder>
<filename>image_0006.jpg</filename>
<source>
<database>Unknown</database>
</source>
<size>
<width>512</width>
<height>400</height>
<depth>3</depth>
</size>
<segmented>1</segmented>
<object>
<name>not_edge</name>
<pose>Unspecified</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<occluded>0</occluded>
</annotation>
上传数据至 OBS
使用ModelArts Pro进行应用开发时,您需要将数据上传至OBS桶中。
1. 首先需要获取访问OBS权限,在未进行委托授权之前,无法使用此功能。您需要 提前获得OBS授权,详情请见配置访问权限。
2. 已创建用于存储数据的OBS桶及文件夹,且数据存储的OBS桶与ModelArts Pro在 同一区域(目前仅支持华为-北京四),详情请见创建OBS桶。
3. 上传数据至OBS,OBS上传数据的详细操作请参见《对象存储服务快速入门》。
说明
● 您在创建OBS桶时,需保证您的OBS桶与ModelArts Pro在同一个区域。
● 建议根据业务情况及使用习惯,选择OBS使用方法。
● 如果您的数据量较小(小于100MB)或数据文件较少(少于100个),建议您使 用控制台上传数据。控制台上传无需工具下载或多余配置,在少量数据上传时,
更加便捷高效。
● 如果您的数据量较大或数据文件较多,建议选择OBS Browser+或obsutil工具上 传。OBS Browser+是一个比较常用的图形化工具,支持完善的桶管理和对象管理 操作。推荐使用此工具创建桶或上传对象。obsutil是一款用于访问管理OBS的命 令行工具,对于熟悉命令行程序的用户,obsutil是执行批量处理、自动化任务较 好的选择。
● 如果您的业务环境需要通过API或SDK执行数据上传操作,或者您习惯于使用API 和SDK,推荐选择OBS的API或SDK方法创建桶和上传对象。
上述说明仅罗列OBS常用的使用方式和工具,更多OBS工具说明,请参见《OBS 工具 指南》。
4.9.3 选择数据
在使用第二相面积含量测定工作流开发应用时,您需要选择训练数据集,后续训练模 型操作是基于您选择的训练数据集。
训练数据集可以选择创建一个新的数据集,也可以选择导入基于第二相面积含量测定 工作流创建的其他应用中已创建的数据集。
● 新建训练数据集
● 导入数据集
前提条件
● 已在视觉套件控制台选择“第二相面积含量测定工作流”新建应用,详情请见新 建应用。
● 已准备数据并上传至OBS,详情请见准备数据。
进入应用开发页面
● 方式一:首次进入
基于预置工作流新建应用后,直接进入“应用开发”v1版本页面。
● 方式二:新建应用后进入
a. 登录“ModelArts Pro>视觉套件”控制台。
默认进入“应用开发>工作台”页面。
b. 选择已新建的应用名称,单击“操作”列的“查看”。
进入“应用总览”页面。
图4-67 进入应用总览
c. 在开发版本列表中单击“操作”列的“查看”。
进入“应用开发”页面。
图4-68 进入应用开发
新建训练数据集
在“数据选择”页面,单击“新建训练数据集”,右侧弹出“新建数据集”页面,根 据数据存储位置和数据标注情况,按表4-28填写数据集基本信息,然后单击“确 定”。
图4-69 新建训练数据集
表4-28 新建训练数据集参数说明
参数 说明
数据集名称 待新建的数据集名称。
描述 数据集简要描述。
数据集输入位置 训练数据存储至OBS的位置。
单击“数据集输入位置”右侧输入框,
在弹出的“数据集输入位置”对话框 中,选择“OBS桶”和“文件夹”,然 后单击“确定”。
数据集输出位置 待新建的数据集存储至OBS的位置。
待新建的数据集有一个默认存储位置。
如果需要修改数据集存储位置,请单击
“数据集输出位置”右侧的“修改”,
在弹出的“数据集输出位置”对话框 中,选择“OBS桶”和“文件夹”,然 后单击“确定”。
说明
“数据集输出位置”不能与“数据集输入位 置”为同一路径,且不能是“数据集输入位 置”的子目录。“数据集输出位置”建议选 择一个空目录。
新建训练数据集后,勾选当前应用开发所需的训练数据集。
由于模型训练过程需要有标签的数据,针对已上传的数据集:
● 手动添加或修改标签
单击数据集操作列的“标注”,进入数据集详情页单击右上角的“开始标注”,
在“数据标注”页面手动标注数据,详细的操作指导请参考标注数据-图像分割。
● 自动标注数据
单击“下一步”,标注数据。
导入数据集
1. 在“数据选择”页面,单击“导入数据集”。
弹出“导入数据集”对话框。
“导入数据集”对话框会显示您在第二相面积含量测定工作流创建的数据集信息 以及在ModelArts中导入的数据集,包括“数据集名称”和“标注进度”。
单击数据集左侧的 ,可查看数据集的“创建时间”和“标签集”。
图4-70 导入数据集
2. 勾选数据集,然后单击“确定”。
数据集导入后,“数据选择”页面右上角会显示“数据集导入成功”。
3. 导入勾选数据集后,在数据选择页面勾选当前应用开发所需的训练数据集。
由于模型训练过程需要有标签的数据,针对已上传的数据集,手动添加或修改标 签。
单击数据集操作列的“标注”,进入数据集概览页单击右上角的“开始标注”,
在“数据标注”页面手动标注数据,详细的操作指导请参考标注数据-图像分割。
说明
第二相面积含量测定工作流标注数据时,必须使用多边形标注框标注数据。
后续操作
选择训练数据集后,单击右下角的“下一步”,进入应用开发的“数据标注”步骤,
详细操作指引请参见标注数据。
4.9.4 标注数据
针对已经选择的数据,在应用开发的“数据标注”页面,ModelArts Pro会自动标注数 据,自动标注完成后,可对每个数据的标注结果进行核对和确认。
前提条件
已在视觉套件控制台选择“第二相面积含量测定工作流”新建应用,详情请见标注数 据。
自动标注数据
在“数据标注”页面,会显示自动标注的进度,如果自动标注完成,标注进度为 100%。
图4-71 自动标注完成。
标注完成后,您可以单击“标注结果确认”中的“前往确认”,进入标注概览页。
在标注概览页单击右上方的“开始标注”,进入手动标注数据页面,针对“已标注”
的数据进行核对和检查,详情请见标注数据-图像分割。针对标注错误的数据修改标
的数据进行核对和检查,详情请见标注数据-图像分割。针对标注错误的数据修改标