• 沒有找到結果。

4.9.1 工作流介绍

工作流简介

相是指成分和组织均匀统一的物质部分,金属材料中,一般除了基体相外,还会存在 许多的第二相。而第二相对整个金属材料的影响也是巨大的。在钢铁或其下游企业,

常需要对钢铁显微成像的金相图片第二相面积含量进行测定。ModelArts Pro提供第二 相面积含量测定工作流,能快速准确的返回第二相面积含量测定结果。

在“ModelArts Pro>视觉套件”控制台选择“我的工作流>第二相面积含量测定工作 流”新建应用,详细操作请见新建应用。您可以构建第二相面积含量测定模型,能快 于模型训练的数据,上传至OBS 中。 的“数据标注”页面,ModelArts Pro会自动标注数据,自动标注完 成后,可对每个数据的标注结果进 行核对和确认。

工作流介绍

流程 说明 详细指导 应的API和SDK识别。

部署服务

4.9.2 准备数据

在使用第二相面积含量测定工作流开发应用之前,您需要提前准备用于模型训练的数 据,上传至OBS服务中。

数据标签

标注基于ModelArts的图像分割标注基础能力,由于第二相边界多为不规则形状,目前 采用多边形标注第二相,标签为“second_phase”。

数据集要求

● 文件名规范,不能有中文,不能有+、空格、制表符。

● 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、

BMP。

● 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。

● 为保证模型的泛化能力,数据集尽量覆盖所有材质类型的待定级图片。

● 为保证训练效果,需要准备至少20张待训练的图片数据,低于20张工作流数据处 理会报错。此外,为优化模型,建议对金相图像的第二相边界标注清晰。

● 针对未标注数据,要求将图片放在一个目录里,示例如下所示。

├─dataset-import-example

│ IMG_20180919_114732.jpg

│ IMG_20180919_114745.jpg

│ IMG_20180919_114945.jpg

– 如果导入位置为OBS,用户需具备此OBS路径的读取权限。

– 只支持JPG、JPEG、PNG、BMP格式的图片。

● 针对已标注数据,要求用户将标注对象和标注文件存储在同一目录,并且一一对 应,如标注对象文件名为“IMG_20180919_114745.jpg”,那么标注文件的文件 名应为“IMG_20180919_114745.xml”。

第二相面积含量测定工作流标注时使用多边形标注框标注图片。如果标注框坐标 超过图片,将无法识别该图片为已标注图片。

第二相标注的标注文件需要满足PASCAL VOC格式,格式详细说明请参见表 4-27。

4-27 PASCAL VOC 格式说明

字段 是否

必选

说明

folder 是 表示数据源所在目录。

filename 是 被标注文件的文件名。

size 是 表示图像的像素信息。

● width:必选字段,图片的宽度。

● height:必选字段,图片的高度。

● depth:必选字段,图片的通道数。

segmented 是 表示是否用于分割。

mask_source 否 表示图像分割保存的mask路径。

字段 是否 必选

说明

object 是 表示物体检测信息,多个物体标注会有多个object 体。

● name:必选字段,标注内容的类别。

● pose:必选字段,标注内容的拍摄角度。

● truncated:必选字段,标注内容是否被截断(0表 示完整)。

● occluded:必选字段,标注内容是否被遮挡(0表 示未遮挡)

● difficult:必选字段,标注目标是否难以识别(0 表示容易识别)。

● confidence:可选字段,标注目标的置信度,取值 范围0-1之间。

● polygon:必选字段,标注框的类型。第二相面积 含量测定工作流标注时使用多边形标注框,即标 注框类型选择“polygon”,标注信息如下所示。

各点坐标。

<x1>100<x1>

<y1>100<y1>

<x2>200<x2>

<y2>100<y2>

<x3>250<x3>

<y3>150<y3>

<x4>200<x4>

<y4>200<y4>

<x5>100<x5>

<y5>200<y5>

<x6>50<x6>

<y6>150<y6>

<x7>100<x7>

<y7>100<y7>

● mask_color:可选字段,标签的颜色,以RGB值 表示。

示例:

├─dataset-import-example

│ IMG_20180919_114732.jpg

│ IMG_20180919_114732.xml

│ IMG_20180919_114745.jpg

│ IMG_20180919_114745.xml

│ IMG_20180919_114945.jpg

│ IMG_20180919_114945.xml

标注文件的示例如下所示:

<?xml version="1.0" encoding="UTF-8" standalone="no"?>

<annotation>

<folder>NA</folder>

<filename>image_0006.jpg</filename>

<source>

<database>Unknown</database>

</source>

<size>

<width>512</width>

<height>400</height>

<depth>3</depth>

</size>

<segmented>1</segmented>

<object>

<name>not_edge</name>

<pose>Unspecified</pose>

<truncated>0</truncated>

<difficult>0</difficult>

<occluded>0</occluded>

</annotation>

上传数据至 OBS

使用ModelArts Pro进行应用开发时,您需要将数据上传至OBS桶中。

1. 首先需要获取访问OBS权限,在未进行委托授权之前,无法使用此功能。您需要 提前获得OBS授权,详情请见配置访问权限。

2. 已创建用于存储数据的OBS桶及文件夹,且数据存储的OBS桶与ModelArts Pro在 同一区域(目前仅支持华为-北京四),详情请见创建OBS桶。

3. 上传数据至OBS,OBS上传数据的详细操作请参见《对象存储服务快速入门》。

说明

● 您在创建OBS桶时,需保证您的OBS桶与ModelArts Pro在同一个区域。

● 建议根据业务情况及使用习惯,选择OBS使用方法。

如果您的数据量较小(小于100MB)或数据文件较少(少于100个),建议您使 用控制台上传数据。控制台上传无需工具下载或多余配置,在少量数据上传时,

更加便捷高效。

如果您的数据量较大或数据文件较多,建议选择OBS Browser+或obsutil工具上 传。OBS Browser+是一个比较常用的图形化工具,支持完善的桶管理和对象管理 操作。推荐使用此工具创建桶或上传对象。obsutil是一款用于访问管理OBS的命 令行工具,对于熟悉命令行程序的用户,obsutil是执行批量处理、自动化任务较 好的选择。

如果您的业务环境需要通过API或SDK执行数据上传操作,或者您习惯于使用API 和SDK,推荐选择OBS的API或SDK方法创建桶和上传对象。

上述说明仅罗列OBS常用的使用方式和工具,更多OBS工具说明,请参见《OBS 工具 指南》。

4.9.3 选择数据

在使用第二相面积含量测定工作流开发应用时,您需要选择训练数据集,后续训练模 型操作是基于您选择的训练数据集。

训练数据集可以选择创建一个新的数据集,也可以选择导入基于第二相面积含量测定 工作流创建的其他应用中已创建的数据集。

● 新建训练数据集

● 导入数据集

前提条件

● 已在视觉套件控制台选择“第二相面积含量测定工作流”新建应用,详情请见新 建应用。

● 已准备数据并上传至OBS,详情请见准备数据。

进入应用开发页面

● 方式一:首次进入

基于预置工作流新建应用后,直接进入“应用开发”v1版本页面。

● 方式二:新建应用后进入

a. 登录“ModelArts Pro>视觉套件”控制台。

默认进入“应用开发>工作台”页面。

b. 选择已新建的应用名称,单击“操作”列的“查看”。

进入“应用总览”页面。

4-67 进入应用总览

c. 在开发版本列表中单击“操作”列的“查看”。

进入“应用开发”页面。

4-68 进入应用开发

新建训练数据集

在“数据选择”页面,单击“新建训练数据集”,右侧弹出“新建数据集”页面,根 据数据存储位置和数据标注情况,按表4-28填写数据集基本信息,然后单击“确 定”。

4-69 新建训练数据集

4-28 新建训练数据集参数说明

参数 说明

数据集名称 待新建的数据集名称。

描述 数据集简要描述。

数据集输入位置 训练数据存储至OBS的位置。

单击“数据集输入位置”右侧输入框,

在弹出的“数据集输入位置”对话框 中,选择“OBS桶”和“文件夹”,然 后单击“确定”。

数据集输出位置 待新建的数据集存储至OBS的位置。

待新建的数据集有一个默认存储位置。

如果需要修改数据集存储位置,请单击

“数据集输出位置”右侧的“修改”,

在弹出的“数据集输出位置”对话框 中,选择“OBS桶”和“文件夹”,然 后单击“确定”。

说明

“数据集输出位置”不能与“数据集输入位 置”为同一路径,且不能是“数据集输入位 置”的子目录。“数据集输出位置”建议选 择一个空目录。

新建训练数据集后,勾选当前应用开发所需的训练数据集。

由于模型训练过程需要有标签的数据,针对已上传的数据集:

● 手动添加或修改标签

单击数据集操作列的“标注”,进入数据集详情页单击右上角的“开始标注”,

在“数据标注”页面手动标注数据,详细的操作指导请参考标注数据-图像分割。

● 自动标注数据

单击“下一步”,标注数据。

导入数据集

1. 在“数据选择”页面,单击“导入数据集”。

弹出“导入数据集”对话框。

“导入数据集”对话框会显示您在第二相面积含量测定工作流创建的数据集信息 以及在ModelArts中导入的数据集,包括“数据集名称”和“标注进度”。

单击数据集左侧的 ,可查看数据集的“创建时间”和“标签集”。

4-70 导入数据集

2. 勾选数据集,然后单击“确定”。

数据集导入后,“数据选择”页面右上角会显示“数据集导入成功”。

3. 导入勾选数据集后,在数据选择页面勾选当前应用开发所需的训练数据集。

由于模型训练过程需要有标签的数据,针对已上传的数据集,手动添加或修改标 签。

单击数据集操作列的“标注”,进入数据集概览页单击右上角的“开始标注”,

在“数据标注”页面手动标注数据,详细的操作指导请参考标注数据-图像分割。

说明

第二相面积含量测定工作流标注数据时,必须使用多边形标注框标注数据。

后续操作

选择训练数据集后,单击右下角的“下一步”,进入应用开发的“数据标注”步骤,

详细操作指引请参见标注数据。

4.9.4 标注数据

针对已经选择的数据,在应用开发的“数据标注”页面,ModelArts Pro会自动标注数 据,自动标注完成后,可对每个数据的标注结果进行核对和确认。

前提条件

已在视觉套件控制台选择“第二相面积含量测定工作流”新建应用,详情请见标注数 据。

自动标注数据

在“数据标注”页面,会显示自动标注的进度,如果自动标注完成,标注进度为 100%。

4-71 自动标注完成。

标注完成后,您可以单击“标注结果确认”中的“前往确认”,进入标注概览页。

在标注概览页单击右上方的“开始标注”,进入手动标注数据页面,针对“已标注”

的数据进行核对和检查,详情请见标注数据-图像分割。针对标注错误的数据修改标

的数据进行核对和检查,详情请见标注数据-图像分割。针对标注错误的数据修改标