可训练技能模板介绍_企业级AI应用开发专业套件 ModelArts Pro_用户指南_HiLens套件_HiLens安全帽检测技能_华为云

(1)

用户指南

文档版本 01

发布日期 2020-08-15

(2)

非经本公司书面许可，任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部，并不得以任何形式传播。

商标声明

和其他华为商标均为华为技术有限公司的商标。

本文档提及的其他所有商标或注册商标，由各自的所有人拥有。

注意

您购买的产品、服务或特性等应受华为公司商业合同和条款的约束，本文档中描述的全部或部分产品、服务或特性可能不在您的购买或使用范围之内。除非合同另有约定，华为公司对本文档内容不做任何明示或暗示的声明或保证。

由于产品版本升级或其他原因，本文档内容会不定期进行更新。除非另有约定，本文档仅作为使用指导，本文档中的所有陈述、信息和建议不构成任何明示或暗示的担保。

华为技术有限公司

地址：深圳市龙岗区坂田华为总部办公楼邮编：518129

网址： https://www.huawei.com

客户服务邮箱：[email protected] 客户服务电话：4008302118

(3)

1 如何使用 ModelArts Pro

1.1 使用流程

ModelArts Pro 是为企业级AI应用打造的专业开发套件。基于华为云的先进算法和快速训练能力，提供预置工作流和模型，提升企业AI应用的开发效率，降低开发难度。当前ModelArts Pro开放了文字识别套件、自然语言处理套件、视觉套件、HiLens套件，

详细介绍请见产品介绍。用户基于自身行业、场景的需求，快速自定制需求，选择合适的套件以及工作流，然后根据工作流指引进行应用开发。

用户使用ModelArts Pro开发应用的流程如图1-1所示，首次使用ModelArts Pro的操作指引请见表1-1。

图1-1 使用 ModelArts Pro

表1-1 首次使用 ModelArts Pro 操作指引

序号操作指引

1 注册华为云账号，登录ModelArts

Pro 注册华为云帐号

2 申请套件公测权限，进入套件申请行业套件 3 使用委托授权，配置访问权限配置访问授权

(8)

序号操作指引

4 使用预置工作流开发应用文字识别套件自然语言处理套件视觉套件

HiLens套件

1.2 注册华为云帐号

在使用华为云服务之前您需要注册华为云帐号。通过此帐号，只需为使用的服务付费，即可使用所有华为云服务。

进入华为云官网，参考帐号注册指导及界面提示信息，完成帐号注册。

注册成功后即可自动登录华为云，您需要完成“实名认证”才可以正常使用服务。具体认证方式请参考帐号实名认证。

1.3 申请行业套件

目前ModelArts Pro已开通自然语言处理套件、视觉套件、文字识别套件、HiLens套件，其中文字识别套件和自然语言处理套件已商用，可直接进入套件使用，视觉套件和HiLens处于公测阶段，首次使用套件需要申请套件开通公测权限。

申请套件

针对处于公测阶段的套件，需要申请套件开通公测权限。

登录ModelArts Pro控制台，选择行业套件卡片并单击“申请公测”，在申请公测页面根据界面提示填写所需信息。

申请公测操作完成后，单击“前往我的公测”，进入“我的公测”页面。当“审批状态”显示为“审批通过”时，表示您已经获得了该行业套件的公测权限。

申请行业套件的公测权限后，即可进入套件使用相关功能。

进入套件

登录ModelArts Pro控制台，选择行业套件卡片并单击“进入套件”，即可进入行业套件的控制台。

例如单击自然语言处理套件卡片的“进入套件”，即可进入自然语言处理套件的控制台。

(9)

图1-2 进入套件

1.4 配置访问授权

在您使用ModelArts Pro过程中，ModelArts Pro需要访问ModelArts服务的云资源，如果没有授权，相关功能将不能正常使用。因此，没有进行访问授权的用户在使用 ModelArts Pro之前，需要进行访问授权。ModelArts Pro当前仅支持使用委托授权。

使用委托授权后，即将依赖服务ModelArts的所有操作权限委托给ModelArts Pro服务，让ModelArts Pro以您的身份使用依赖服务，代替您进行一些资源操作。在华为云中，只能使用帐号创建委托，并为此帐号下的IAM用户创建委托授权。

授权配置

● 如果已获得ModelArts委托授权，则可以直接进入ModelArts Pro控制台使用行业套件，无需再次配置访问权限。

● 如果未获得ModelArts委托授权和访问秘钥（AK/SK）授权，当进入ModelArts Pro控制台的行业套件时，会弹出“访问授权”对话框。

在弹出的“访问授权”对话框填写授权信息，然后单击“同意授权”，完成访问授权的配置。

– “用户名”为当前需要授权的用户名，保持默认值。

– “委托”单击“自动创建”，选择“modelarts_agency”。

– 勾选“我已经详细阅读并同意《ModelArts服务声明》”。

图1-3 访问授权

(10)

● 如果未获得ModelArts委托授权，但是已获得访问秘钥（AK/SK）授权，当进入 ModelArts Pro控制台的行业套件时，在弹出的“访问授权”对话框中会提示删除秘钥授权。

图1-4 访问授权

a. 单击“访问授权”对话框上方的“删除”，删除旧的授权。

删除成功后，对话框中就没有删除秘钥授权的提示了。

b. 在“访问授权”对话框填写授权信息，然后单击“同意授权”，完成访问授权的配置。

▪

“用户名”为当前需要授权的用户名，保持默认值。

▪

“委托”选择“modelarts_agency”。

▪

勾选“我已经详细阅读并同意《ModelArts服务声明》”。

(11)

2 ^{文字识别套件}

2.1 行业套件介绍

文字识别套件基于丰富的文字识别算法和行业知识积累，帮助客户快速构建满足不同业务场景需求的文字识别服务，实现多种版式图像的文字信息结构化提取。

文字识别套件的介绍请参见产品介绍。

预置工作流

文字识别套件当前提供了单模板工作流和多模板工作流，自主构建文字识别模板，识别模板图片中的文字，提供高精度的文字识别模型，保证结构化信息提取精度。

● 通用单模板工作流

通过构建文字识别模板，识别单个板式图片中的文字，提供高精度的文字识别模型，保证结构化信息提取精度。

● 多模板分类工作流

支持用户自定义多个文字识别模板，通过模型训练，自动识别图片所需使用的模板，从而支持从大量不同板式图像中提取结构化信息。

详细介绍请见产品介绍>文字识别套件。

使用预置工作流开发应用流程

文字识别套件提供了单模板工作流和多模板工作流，您可以通过预置的工作流，自主构建文字识别模板，识别模板图片中的文字，提供高精度的文字识别模型，保证结构化信息提取精度。

(12)

图2-1 使用预置工作流开发应用

表2-1 使用预置工作流开发应用流程

流程说明详细指导

选择文字识别套件根据您的实际使用需求选择文字识别套件。您也可以通过查看工作流定位所需使用的套件。

在ModelArts Pro控制台界面，单击“文字识别”套件卡片的“进入套件”，进入文字识别套件控制台。

新建应用基于已选择的工作流新建应用，填写应用基本信息、选择工作流。

新建应用

开发应用

通用单模板工作流

根据工作流指引，创建单模板服务，通过模板训练文字识别模型，实现单模板图像的文字信息结构化提取。

创建单模板

多模板分类工作流

根据工作流指引，创建多模板服务，通过多模板训练模板分类器和文字识别模型，实现多模板图像的文字信息结构化提取。

创建多模板

2.2 新建应用

在ModelArts Pro使用预置工作流开发应用之前，需要新建应用，填写应用基本信息、

选择工作流。

(13)

前提条件

● 使用ModelArts Pro服务请根据如何使用ModelArts Pro罗列的要求，提前完成准备工作。

● 保证华为云帐号不欠费。在ModelArts Pro控制台开发应用时，会占用OBS资源，

需要收取一定费用，收费规则请参见对象存储服务 OBS。

操作步骤

1. 在ModelArts Pro控制台界面，单击“文字识别”套件卡片的“进入套件”。

进入文字识别套件控制台。

图2-2 进入套件

2. 在左侧导航栏选择“应用开发>工作台”。

默认进入“我的应用”页签。

图2-3 工作台

3. 在“我的应用”页签下，单击“新建应用”。

进入“新建应用”页面。

图2-4 新建应用

(14)

您也可以单击“我的工作流”，切换至“我的工作流”页签，选择工作流并单击卡片中的“新建应用”。

4. 根据业务需求填写“应用名称”、“应用负责人”和“应用描述”，仅支持英文、中文、数字、下划线、中划线。选择“所属行业”及工作流。

图2-5 新建应用

5. 确认信息后，单击“确定”。

成功新建应用。

后续操作

根据所选的预置工作流开发应用。

通用单模板工作流多模板分类工作流

2.3 通用单模板工作流

2.3.1 工作流介绍

工作流简介

● 功能介绍

支持构建文字识别模板，识别单个板式图片中的文字，提供高精度的文字识别模型，保证结构化信息提取精度。

● 适用场景

– 用户认证识别

识别证件中关键信息，节省人工录入，提升效率，降低用户实名认证成本，

准确快速便捷。

– 快递单自动填写

识别图片中联系人信息并自动填写快递单，减少人工输入。

– 合同录入与审核

(15)

自动识别结构化信息与提取签名盖章区域，有助快速审核。

● 优势

– 解决手工录入投入大、效率低、语种多等问题，提升业务效率。

– 一键式部署，快速输出高精度结构化数据。

工作流流程

在“ModelArts Pro>文字识别套件”控制台选择“通用单模板分类工作流”新建应用，详细操作请见新建应用。您可以创建单模板服务，通过模板训练文字识别模型，

实现单模板图像的文字信息结构化提取。

图2-6 创建单模板流程

表2-2 创建单模板流程说明

上传模板图片

在使用单模板工作流开发应用之前，需要上传模板图片，明确以哪张图片作为模板训练文字识别模型。

上传模板图片

定义预处

理上传模板图片后，需要对模板图片进行预处理，

保留图片的关键内容，去掉冗余部分，保持图片内容清晰可见，保证模型识别的准确性。

定义预处理

框选参照字段

在图片模板中框选参照字段，用于用于矫正图片的方向，进而在正确的方向上，识别图片中的结构化信息。

框选参照字段

框选识别区

在图片模板中框选识别区，确定模板图片中需要识别的文字位置。

框选识别区

评估应用通过上传与模板图片同一板式的测试图片，评估图片识别结果是否正确。

评估应用

部署服务模板图片评估后，可以部署模板至文字识别开发套件中，开发属于自己的文字识别应用，此应用用于识别自己所上传的模板样式的图片。

部署服务

2.3.2 上传模板图片

在使用单模板工作流开发应用之前，必须要明确文字识别的模板类型，明确以哪张图片作为模板训练文字识别模型，基于自己的业务需求制定针对性的文字识别模型。例如上传某一格式的发票图片作为模板，训练的文字识别模型就能识别并提取同格式发票上的关键字段。

前提条件

● 已授权ModelArts服务和对象存储服务（OBS）。

(16)

● 已在文字识别套件控制台选择“通用单模板工作流”新建应用，详情请见新建应用。

● 提前准备待识别的图片，图片要求请见图片要求。

图片要求

● 保证图片质量：不能有损坏的图片；目前支持的格式包括JPG、JPEG、PNG、

BMP。

● 图片最大边不大于4096px，最小边不小于100px，且大小不超过4M。

进入应用开发页面

1. 登录“ModelArts Pro>文字识别套件”控制台。

默认进入“应用开发>工作台”页面。

2. 在“我的应用”页签下，选择应用并单击“操作”列的“查看”。

进入“应用资产”页面。

3. 单击“创建模板”。

进入“应用开发”页面，开始开发应用。

图2-7 应用开发

上传模板图片

在“应用开发>上传模板图片”页面，配置如下信息：

图2-8 上传模板图片

“模板名称”：输入模板名称。

“模板类型”：选择模板类型，当前可选“文档”、“通用”、“票证”。

“上传图片”：单击“上传图片”区域，或鼠标直接拖拽图片至“上传图片”区域，

上传本地一张图片作为模板，用于业务场景的文字结构化识别。

确认信息后，单击“下一步”，进入定义预处理步骤，对上传的模板图片进行自动旋转、去印章等预处理。

(17)

2.3.3 定义预处理

使用通用单模板工作流上传模板图片后，需要对模板图片进行预处理，通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容，去掉冗余部分，保持图片内容清晰可见，保证模型识别的准确性。

前提条件

已在文字识别套件控制台选择“通用单模板工作流”新建应用，并上传模板图片，详情请见上传模板图片。

定义预处理

在“应用开发>定义预处理”页面，您可以“选择预处理逻辑”快速处理图片，也可以按左上角操作指标调整图片。

图2-9 定义预处理

右侧“选择预处理逻辑”区域勾选对应操作，当前仅支持“自动旋转”和“去印章”

操作。

● “自动旋转”：系统自动旋转文字方向不正确的图片，保持图片中的文字方向正确。

● “去印章”：系统自动去除印章，避免印章妨碍文字识别。

单击预处理区域左上方的操作图标，调整模板图片的大小、方向等。

：单击图标重置图片为初始状态，即未进行任何处理的状态。

：单击图标，在“图片裁剪”窗口调整图片裁剪范围，然后单击“裁剪”，调整图片的大小。

：单击图标，在“图片旋转”窗口，鼠标选中调整图片的方向，然后单击“确认”，调整图片的方向。

：单击图标，向左旋转图片90°。

：单击图标，向右旋转图片90°。

：单击图标，缩小图片大小。

：单击图标，放大图片大小。

：单击选择图片放大比例。

(18)

处理完后，单击“下一步”，进入框选参照字段步骤。

2.3.4 框选参照字段

在文字识别过程中，需要确定所识别图片的方向是否正确，这就需要在图片模板中框选参照字段。通过识别框选参照字段确定图片的方向，进而在正确的方向上，识别图片中的结构化信息。

参照字段指为了确定所识别的图片的方向，需要和模板图片做对照的字段。所有需要识别的图片中都会包含参照字段，且位置固定不变。

前提条件

已在文字识别套件控制台选择“通用单模板工作流”新建应用，并对上传的模板图片进行预处理，详情请见定义预处理。

操作步骤

图2-10 框选参照字段

1. 在“应用开发>框选参照字段”页面，通过单击左上方操作图标，调整模板图片到合适大小。

2. 单击框选操作图标，单击参照字段左上角，移动鼠标，使得矩形框覆盖参照字段。

– 参照字段是文字内容、位置固定不变的文本框区域。

– 建议选取图片中不会重复出现的文字作为参照字段，否则影响模板匹配效果。

– 参照字段为单行文本框，不可以框选竖版文字或跨行框选。

– 框选参照字段个数须不少于4个，并尽量分散在图片的四周。

– 参考字段尽量框选独立文本块，避免框选某一个文本块的一部分，有利于识别精度提升。

3. 核对右侧“框选参照字段”中的参照字段是否与框选的参照字段一致。

4. 框选并核对完所有参照字段后，单击“下一步”，进入框选识别区步骤。

2.3.5 框选识别区

在文字识别过程中，需要确定图片中识别的文字位置，这就需要在图片模板中框选识别区。所有需要识别的图片中都会包含此识别区的字段，且位置固定不变，因此模型可以通过识别区找到需要识别内容的位置。

(19)

识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段，且位置固定不变，因此模型可以通过识别区找到需要识别内容的位置。

前提条件

已在文字识别套件控制台选择“通用单模板工作流”新建应用，并框选参照字段，详情请见框选参照字段。

操作步骤

图2-11 框选识别区

1. 在“应用开发>框选识别区”页面，通过单击左上方操作图标，调整模板图片到合适大小。

2. 单击框选操作图标，单击待识别文字的左上角，移动鼠标框选识别区，使得矩形框覆盖待识别的文字。

框选识别区应尽量扩大识别区范围，使所框选识别区覆盖字段值可能出现的区域。

3. 在右侧“框选识别区”中填写“框选字段”，选择“字段类型”。

“字段类型”指待识别文字的内容，您可以在默认字段类型中选择，当前可选择的默认字段类型包括“姓名”、“数字”、“常规”、“电话号码”、“地址”、“金额”、“长数字”、“长字段”，每个识别区可选择多个字段类型。

如果“默认字段类型”不能满足您的业务需求，您可以在字段类型下拉框单击

“创建新字段类型”，创建新字段类型。

4. 框选并核对完所有识别区后，单击“下一步”，进入评估应用步骤。

创建新字段类型

如果鼠标框选识别区后，在“框选识别区”选择字段类型时，“默认字段类型”不能满足您的业务需求，您可以创建新的字段类型。

1. 在“应用开发>框选识别区”页面单击框选操作图标，单击待识别文字的左上角，移动鼠标框选识别区。

2. 在右侧“框选识别区”中的“字段类型”下拉框中，单击“创建新字段类型”。

弹出“创建字段类型”对话框。

3. 填写字段类型信息。

(20)

图2-12 创建字段类型

“字段类型名称”：填写待创建的字段类型名称，如识别身份证照片，可新增字段类型“出生日期”。

“字段属性”：选择字段属性，可选择“自定义正则提取”和“自定义字典”，

然后按表2-3填写相关信息。

表2-3 字段属性参数说明

字段属性参数参数说明举例

自定义字典

取值范围

在识别当前字段类型的文字时，选择字典的取值范围中最相似的取值为最后识别结果。

例如：

“字段类型名称”：

“城市”

“字段属性”：“自定义字典”

“取值范围”：

“Shenzhen”、

“Beijing”、

“Xi'an”

在识别“字段类型”

为“城市”的文字时，从“Shenzhen”、

“Beijing”、

“Xi'an”中找出与待识别文字最相似的取值，作为识别结果。

(21)

字段属性参数参数说明举例自定义正

则提取

预过滤对初始的待识别文字进行预处理。

左边输入框填写待识别文字中被替换字符的正则表达式。

右边输入框填写所替换的新字符。

不填写时，默认不做预处理。

如果需要多次预处理，可单击

，填写新增的预处理规则。

例如：

“出生日期”

“字段属性”：“自定义正则提取”

“预过滤”：“”/

“”

“提取”：“\d+年\d +月\d+日”

“后处理”：“年”/

“.”、“月”/

“.”、

“日”/“”

在识别字段类型为出生日期的文字“2020 年1月1日出生”时，

首先不做预过滤，然后提取关键字符

“2020年1月1日”，

最后做后处理，最终提取内容为

“2020.1.1”。

提取对经过“预处理”的文字进行关键字符提取。

在输入框中填写查找关键字符的正则表达式。

不填写时，默认提取全部字段。

如果需要多个提取规则，单击新增提取规则。提取时按从上到下优先级规则提取，选择第一个非空的提取内容作为提取后的内容。

后处理根据实际情况，对经过“提取”后的文字进行“后处理”。

2.3.6 评估应用

确定模板图片的参照字段和识别区后，需要对模板图片进行评估和考察。您可以通过上传测试图片，在线评估模板的识别情况，保证能正确识别同样模板下其他图片中的识别区文字。

前提条件

已在文字识别套件控制台选择“通用单模板工作流”新建应用，并完成框选识别区步骤，详情请见框选识别区。

进入评估页面

登录“ModelArts Pro>文字识别套件”控制台，默认进入“应用开发>工作台”页面。

选择应用并单击“操作”列的查看，进入“应用资产”页面。

图2-13 进入评估页面

(22)

● 在“应用资产”页面，单击已有模板操作列的“评估”，进入“应用开发>评估”

页面。

● 在“应用资产”页面，单击已有模板操作列的“编辑”，进入“应用开发”页面，依次完成“上传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”步骤，单击“下一步”，进入“评估”页面。

本地上传图片

图2-14 评估模板

1. 在“应用开发>评估”页面，默认进入“本地上传”页签。

2. 根据自身需要选择“打开动态识别”开关，单击“上传图片”，或者拖拽测试图片至虚线框内上传图片区域，上传本地的图片作为测试图片。

“动态识别”：如果待识别图片与模板图片的版式相似但是并不完全一致，如识别区域在样本上的相对位置存在上下浮动的位置变化，建议打开“动态识别”开关进行评估。如果是固定版式的模板评估，建议关闭“动态识别”开关。

3. 测试图片上传成功后，右侧会显示识别结果。

您可以核对识别结果是否正确。

如果不正确，可单击“创建新模板”，重新创建一个模板，或者单击“上一步”，对当前模板进行修改。

如果识别结果正确，可单击“下一步”，部署模板。

上传在线图片

1. 在“应用开发>评估”页面，单击“在线URL”，切换至“在线URL”页签。

图2-15 上传在线图片

2. 在“开始识别”左侧输出框中输入待测试的图片URL地址，或者拖拽测试图片至虚线框内上传图片区域。

3. 单击“开始识别”，右侧会显示识别结果。

如果不正确，可单击“创建新模板”，重新创建一个模板，或者单击“上一步”，对当前模板进行修改。

(23)

2.3.7 部署服务

评估模板应用后，就可以部署模板应用至文字识别开发套件中，开发属于自己的文字识别应用，此应用用于识别自己所上传的模板样式的图片。

前提条件

已在文字识别套件控制台选择“通用单模板工作流”新建应用，并完成评估模板步骤，详情请见评估应用。

操作步骤

在“应用开发>部署”页面完成模板评估后，单击“下一步”，进入“创建模板>部署”页面直接发布模板，页面显示“恭喜您，已发布成功”。

图2-16 部署模板

发布模板后，在“应用开发>部署”页面，您可以进行如下操作。

“评估”：单击“评估”，继续上传测试图片评估模板。

“继续编辑”：单击“继续编辑”，返回“应用开发>上传模板图片”页面，重新创建模板。

“返回列表”：单击“返回列表”，返回至应用详情页。

“调用API和SDK”：下方调用指南区域，可直接调用API或SDK轻松调用当前模板服务。

调用 API 和 SDK

“应用开发>部署”页面下方的调用指南，显示“API调用”和“SDK调用”页签，您可以通过调用API和SDK调用当前模板服务。

● 调用API

服务自动生成“API URI”，您可以单击URI右边的“复制”，复制API URI，调用当前模板服务。调用方式请见API调用指南。错误码请参见错误码。

● 调用SDK

文字识别服务（OCR）提供服务软件开发工具包（SDK），是对文字识别服务的 REST API进行封装。

(24)

服务提供SDK工具包，包括“JavaSDK”、“PythonSDK”、“IOSSDK”、

“AndroidSDK”、“Node.jsSDK”，您可以单击下载您所需要的SDK调用模板服务。

使用方式请参见SDK使用指南。

2.3.8 自定义字段类型

在应用开发过程中“框选识别区”时会选择“字段类型”，如您框选的文字内容是数字，可选择默认字段类型“数字”。

如果“默认字段类型”不能满足您的业务需求，您可以创建新的字段类型。

前提条件

已在文字识别套件控制台选择“通用单模板工作流”新建应用，详情请见新建应用。

操作步骤

图2-17 进入应用资产

3. 单击“自定义字段类型”，进入“自定义字段类型”页签。

图2-18 自定义字段类型

4. 单击“创建字段类型”。

(25)

自定义字典

取值范围

例如：

“城市”

“Shenzhen”、

“Beijing”、

“Xi'an”

“Beijing”、

(26)

字段属性参数参数说明举例自定义正

则提取

例如：

“出生日期”

“预过滤”：“”/

“”

“.”、“月”/

“.”、

“日”/“”

“2020年1月1日”，

“2020.1.1”。

您也可以在“应用开发>框选识别区”过程中创建新的字段类型，详情请见创建新字段类型。

2.3.9 编辑应用

对于已经创建的模板应用，您可以修改模板的配置信息以匹配业务变化。

前提条件

已存在创建的模板应用。

编辑模板配置信息

(27)

3. 在“模板列表”页签，选择模板名称，单击操作列的“编辑”。

图2-21 模板列表

进入“应用开发”页面，您可以依次修改“上传模板图片”、“定义预处理”、

“框选参照字段”、“框选识别区”、“评估”步骤的信息，重新部署模板。操作指引如下：

– 上传模板图片

– 定义预处理

– 框选参照字段

– 框选识别区

– 评估应用 – 部署服务

2.3.10 删除应用

如果已创建的模板应用不再使用，您可以删除模板释放资源。

操作步骤

(28)

3. 在“模板列表”页签，选择模板名称，单击操作列的“删除”。

弹出“确认删除”对话框。

图2-23 删除模板

4. 单击“确认”，删除模板。

2.4 多模板分类工作流

2.4.1 工作流介绍

工作流简介

● 功能介绍

支持用户自定义多个文字识别模板，通过模型训练，自动识别图片所需使用的模板，从而支持从大量不同板式图像中提取结构化信息。

● 适用场景

– 用户认证识别

识别证件中关键信息，节省人工录入，提升效率，降低用户实名认证成本，

准确快速便捷。

– 快递单自动填写

识别图片中联系人信息并自动填写快递单，减少人工输入。

– 合同录入与审核

自动提取合同结构化信息，有助快速审核。

● 优势

– 解决手工录入投入大、效率低、语种多等问题，提升业务效率。

– 一键式部署，快速输出高精度结构化数据。

– 解决单据复杂、单据板式多、语种多问题，支持自定义多个图像板式，快速适配新板式，快速接入业务。

– 支持从多个不同板式图像中提取结构化信息。

工作流流程

在“ModelArts Pro>文字识别套件”控制台选择“多模板分类工作流”新建应用，详细操作请见新建应用。您可以创建多模板服务，通过多模板训练模板分类模型和文字识别模型，实现多模板图像的文字信息结构化提取。

图2-24 创建多模板流程

(29)

表2-5 创建多模板流程说明

上传模板图片

在使用多模板工作流开发应用之前，需要上传模板图片，明确以哪些图片作为模板训练文字识别模型。

上传模板图片

定义预处理

上传模板图片后，需要对模板图片进行预处理，

保留图片的关键内容，去掉冗余部分，保持图片内容清晰可见，保证模型识别的准确性。

定义预处理

框选参照字段

在图片模板中框选参照字段，用于用于矫正图片的方向，进而在正确的方向上，识别图片中的结构化信息。

框选参照字段

框选识别区

在图片模板中框选识别区，确定模板图片中需要识别的文字位置。

框选识别区

上传训练集

多模板分类工作流可以通过追加上传训练集，用于训练模板分类模型，使服务能够精准地分类多个模板图片，然后对多个模板图片进行文字识别和结构化提取。

上传训练集

评估应用通过上传测试图片，在线评估模板分类情况和模板的文字识别情况，保证能在多个模板情况下正确分类测试图片的模板，并且能正确识别测试图片中的识别区文字。

评估应用

部署服务模板图片评估后，可以部署模板至文字识别开发套件中，开发属于自己的文字识别应用，此应用用于识别自己所上传的多模板样式的图片。

部署服务

2.4.2 上传模板图片

在使用多模板分类工作流开发应用之前，必须要明确文字识别的模板类型，明确以哪几种板式图片作为模板训练文字识别模型，基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板，训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。

前提条件

● 已授权ModelArts服务和对象存储服务（OBS）。

● 已在文字识别套件控制台选择“多模板分类工作流”新建应用，详情请见新建应用。

● 提前准备模板图片以及训练分类器的数据集，其要求请见数据要求。

数据要求

● 保证图片质量：不能有损坏的图片；目前支持的格式包括JPG、JPEG、PNG、

BMP。

● 图片最大边不大于4096px，最小边不小于100px，且大小不超过4M。

(30)

● 训练分类器的数据集要求将图片放在一个目录里，并压缩成zip文件，文件大小不应大于10M。

进入应用开发页面

3. 单击“创建分类器”。

进入“应用开发”页面，开始开发应用。

图2-26 创建分类器

填写基本信息

在“应用开发>上传模板图片”页面，输入多模板分类器的“名称”和“描述”。

图2-27 上传模板图片

然后上传模板图片，可选择新增模板配置，也可直接添加已有的模板配置。

● 新增模板配置

● 添加已有模板

新增模板配置

默认进入“新增模板配置”页签。

(31)

图2-28 新增模板配置

单击添加多个模板，针对每个模板，选择模板类型，并且上传图片。

“模板类型”：选择模板类型，当前可选“文档”、“通用”、“票证”。

“上传图片”：单击“上传图片”区域，或鼠标直接拖拽图片至“上传图片”区域，

上传本地一张图片作为模板，用于业务场景的文字结构化识别。

“修改模板名称”：单击图片右侧的，在弹出的输入框中输入新的模板名称，单击

“确认”。

“删除模板”：单击图片右侧“删除”，在弹出的确认删除对话框中单击“确认”。

确认信息后，单击“下一步”，进入定义预处理步骤，对上传的模板图片进行自动旋转、去印章等预处理。

添加已有模板

1. 单击“添加已有模板”，进入“添加已有模板”页签。

2. 单击“添加已有模板”，弹出“添加已有模板”对话框。

对话框中仅显示已发布的模板。

图2-29 添加已有模板

3. 在对话框中勾选已有模板，单击“确定”。

(32)

图2-30 添加已有模板

2.4.3 定义预处理

使用多模板分类工作流上传模板图片后，需要对模板图片进行预处理，通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容，去掉冗余部分，保持图片内容清晰可见，保证模型识别的准确性。

前提条件

已在文字识别套件控制台选择“多模板分类工作流”新建应用，并上传模板图片，详情请见上传模板图片。

定义预处理

在“应用开发>定义预处理”页面上方选择模板，对每个模板图片进行预处理。

图2-31 多模板定义预处理

在右侧“选择预处理逻辑”区域勾选对应操作，当前仅支持“自动旋转”和“去印章”操作。

(33)

● “自动旋转”：系统自动旋转文字方向不正确的图片，保持图片中的文字方向正确。

● “去印章”：系统自动去除印章，避免印章妨碍文字识别。

单击预处理区域左上方的操作图标，调整模板图片的大小、方向等。

：单击图标重置图片为初始状态，即未进行任何处理的状态。

：单击图标，在“图片裁剪”窗口调整图片裁剪范围，然后单击“裁剪”，调整图片的大小。

：单击图标，在“图片旋转”窗口，鼠标选中调整图片的方向，然后单击“确认”，调整图片的方向。

：单击图标，向左旋转图片90°。

：单击图标，向右旋转图片90°。

：单击图标，缩小图片大小。

：单击图标，放大图片大小。

：单击选择图片放大比例。

处理完后，单击“下一步”，进入框选参照字段步骤。

2.4.4 框选参照字段

在文字识别过程中，需要确定所识别图片的方向是否正确，这就需要在图片模板中框选参照字段。通过识别框选参照字段确定图片的方向，进而在正确的方向上，识别图片中的结构化信息。

参照字段指为了确定所识别的图片的方向，需要和模板图片做对照的字段。所有需要识别的图片中都会包含参照字段，且位置固定不变。

前提条件

已在文字识别套件控制台选择“多模板分类工作流”新建应用，并对上传的模板图片进行预处理，详情请见定义预处理。

操作步骤

图2-32 多模板框选参照字段

1. 在“应用开发>框选参照字段”页面上方选择模板，对每个模板图片框选参照字段。

2. 单击左上方操作图标，调整当前模板图片到合适大小和位置。

(34)

3. 单击框选操作图标，单击参照字段左上角，移动鼠标，使得矩形框覆盖参照字段。

– 参照字段是文字内容、位置固定不变的文本框区域。

– 建议选取图片中不会重复出现的文字作为参照字段，否则影响模板匹配效果。

– 参照字段为单行文本框，不可以框选竖版文字或跨行框选。

– 框选参照字段个数须不少于4个，并尽量分散在图片的四周。

– 参考字段尽量框选独立文本块，避免框选某一个文本块的一部分，有利于识别精度提升。

4. 核对右侧“框选参照字段”中的参照字段是否与框选的参照字段一致。

5. 框选并核对完所有模板图片的参照字段后，单击“下一步”，进入框选识别区步骤。

2.4.5 框选识别区

在文字识别过程中，需要确定图片中识别的文字位置，这就需要在图片模板中框选识别区。所有需要识别的图片中都会包含此识别区的字段，且位置固定不变，因此模型可以通过识别区找到需要识别内容的位置。

识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段，且位置固定不变，因此模型可以通过识别区找到需要识别内容的位置。

前提条件

已在文字识别套件控制台选择“多模板分类工作流”新建应用，并框选参照字段，详情请见框选参照字段。

操作步骤

图2-33 多模板框选识别区

1. 在“应用开发>框选参照字段”页面上方选择模板，对每个模板图片框选识别区。

2. 单击左上方操作图标，调整当前模板图片到合适大小。

3. 单击框选操作图标，单击待识别文字的左上角，移动鼠标框选识别区，使得矩形框覆盖待识别的文字。

框选识别区应尽量扩大识别区范围，使所框选识别区覆盖字段值可能出现的区域。

(35)

4. 在右侧“框选识别区”中填写“框选字段”，选择“字段类型”。

“字段类型”指待识别文字的内容，您可以在默认字段类型中选择，当前可选择的默认字段类型包括“姓名”、“数字”、“常规”、“电话号码”、“地址”、“金额”、“长数字”、“长字段”，每个识别区可选择多个字段类型。

如果“默认字段类型”不能满足您的业务需求，您可以在字段类型下拉框单击

“创建新字段类型”，创建新字段类型。

5. 框选并核对完所有模板图片的识别区后，单击“下一步”，进入上传训练集步骤。

创建新字段类型

如果鼠标框选识别区后，在“框选识别区”选择字段类型时，“默认字段类型”不能满足您的业务需求，您可以创建新的字段类型。

1. 在“应用开发>框选识别区”页面单击框选操作图标，单击待识别文字的左上角，移动鼠标框选识别区。

2. 在右侧“框选识别区”中的“字段类型”下拉框中，单击“创建新字段类型”。

(36)

自定义字典

取值范围

例如：

“城市”

“Shenzhen”、

“Beijing”、

“Xi'an”

“Beijing”、

自定义正则提取

例如：

“出生日期”

“预过滤”：“”/

“”

“.”、“月”/

“.”、

“日”/“”

“2020年1月1日”，

“2020.1.1”。

(37)

2.4.6 上传训练集

确定模板图片的参照字段和识别区后，多模板分类工作流在模板数量较多，或版式相似度较高的情况下，建议针对不同的模板上传对应的训练集数据，用于训练模板分类模型，使服务能够精准地分类多个模板图片，然后对多个模板图片进行文字识别和结构化提取。

说明

当模板数量不多且模板的版式相似度不高的情况下，可以不需要上传训练集，直接单击“上传训练集”页面的“开始训练”，训练模型，此时算法会直接利用模板图片进行训练生成分类器。

前提条件

● 已在文字识别套件控制台选择“多模板分类工作流”新建应用，并框选添加的多个模板的识别区，详情请见框选识别区。

● 提前准备训练分类器的数据集。训练分类器的数据集要求将图片放在一个目录里，并压缩成zip文件，文件大小不应大于10M。

添加已有模板

针对已经发布的模板，您可以添加至当前“多模板分类工作流”中，参与模板分类的模型训练。

1. 在“应用开发>上传训练集”页面，单击“添加已有模板”。

弹出添加已有模板对话框。

2. 勾选模板，确认模板信息后，单击确定。

“应用开发>上传训练集”页面会显示新添加的模板。

准备训练集

针对当前“多模板分类工作流”中参与模板分类模型训练的模板，您需要在本地准备好训练集，把测试图片打包成一个文件夹并压缩成“zip”包上传至当前工作流，

“zip”包文件大小不超过10M。

上传训练集

图2-35 上传训练集

1. 在“应用开发>上传训练集”页面，选择模板，单击操作列的“上传训练集”。

弹出上传文件对话框。

2. 单击上传文件对话框，在本地选择已经准备好的“zip”包文件。

上传成功后页面右上方会提示“文件上传成功”。

3. 确定每个模板上传训练集后，单击“开始训练”。

服务进入“应用开发>评估”页面，开始训练模型。

(38)

模型训练完成后，可在“应用开发>评估”页面评估分类器和模板，详情请见评估应用。

删除训练集

在“应用开发>上传训练集”页面，选择模板，单击操作列的“删除”，弹出“确认删除”对话框，单击“确认”，删除模板。

2.4.7 评估应用

训练模板分类模型后，需要对模板分类器和模板图片进行评估和考察。您可以通过上传测试图片，在线评估模板分类情况和模板的文字识别情况，保证能在多个模板情况下正确分类测试图片的模板，并且能正确识别测试图片中的识别区文字。

前提条件

已在文字识别套件控制台选择“多模板分类工作流”新建应用，并上传各个模板的训练集，详情请见上传训练集。

进入评估应用页面

登录“ModelArts Pro>文字识别套件”控制台，默认进入“应用开发>工作台”页面。

在“我的应用”页签下，选择应用并单击操作列的“查看”，进入应用详情页，可从

“应用资产”和“应用开发”两个页签进入评估模板页面。

● 在“应用资产”页面，默认进入“分类器列表”页签，单击已有模板操作列的

“评估”。进入“评估”页面。

图2-36 评估应用

● 在“应用开发”页面，依次完成“上传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”、“上传训练集”步骤，单击“下一步”，进入“评估”页面。

图2-37 评估应用

评估分类器

通过上传测试图片，在线评估模型训练的模板分类器是否能正确分类模板。

在“应用开发>评估”页面，您可以选择本地上传测试图片，也可以上传在线图片。

(39)

图2-38 评估分类器

● 本地上传图片

默认进入“本地上传”页签，根据自身需要选择打开“分类模式”和“动态识别”开关，单击“上传图片”，或者拖拽测试图片至虚线框内上传图片区域，上传本地的图片作为测试图片。

“分类模式”：打开“分类模式”开关时，单独对分类器的准确度进行评估。上传图片后，右侧会显示模板自动分类的结果，包括“模板ID”、“模板名”、

“置信度”。关闭“分类模式”开关时，默认评估状态为端到端地对待识别图片自动分类并进行结构化识别。

上传测试图片后，右侧会显示评估结果。

● 上传在线图片

单击“在线URL”，切换至“在线URL”页签。在“开始识别”左侧输出框中输入待测试的图片URL地址，或者拖拽测试图片至虚线框内上传图片区域，上传在线图片作为测试图片。

上传图片后，右侧会显示模板识别结果，包括“模板ID”、“模板名”、“置信度”。

上传图片后，您可以核对识别结果是否正确。

如果不正确，单击“上一步”，对当前模板进行修改。

如果识别结果正确，可对模板作进一步评估，详情请见评估模板。

评估模板

通过上传测试图片，在线评估模板识别并提取结构化文字的能力。

首先在“应用开发>评估”页面右侧选择与待评估模板对应的原模板，然后选择本地上传测试图片或者上传在线图片，评估模板。

(40)

图2-39 评估模板

● 本地上传图片

默认进入“本地上传”页签，根据自身需要选择打开“动态识别”开关，单击

“上传图片”，或者拖拽测试图片至虚线框内上传图片区域，上传本地的图片作为测试图片。

上传图片后，右侧会显示文字识别结果，包括“识别区”和对应的“识别结果”。

● 上传在线图片

单击“在线URL”，切换至“在线URL”页签。在“开始识别”左侧输出框中输入待测试的图片URL地址，或者拖拽测试图片至虚线框内上传图片区域，上传在线图片作为测试图片。

上传图片后，右侧会显示文字识别结果，包括“识别区”和对应的“识别结果”。

上传图片后，您可以核对识别结果是否正确。

如果不正确，单击“上一步”，对当前模板进行修改。

后续操作

评估分类器和模板之后，如果识别结果正确，可单击“下一步”，部署服务。

2.4.8 部署服务

评估模板应用后，就可以部署多模板应用至文字识别开发套件中，开发属于自己的文字识别应用，此应用用于识别自己所上传的图片属于哪种模板以及识别图片中的文字。

前提条件

已在文字识别套件控制台选择“多模板分类工作流”新建应用，并完成评估模板步骤，详情请见评估应用。

(41)

操作步骤

在“应用开发>部署”页面完成模板评估后，单击“下一步”，进入“创建模板>部署”页面直接发布模板，页面显示“恭喜您，已发布成功”。

图2-40 部署模板

发布模板后，在“应用开发>部署”页面，您可以进行如下操作。

“评估”：单击“评估”，继续上传测试图片评估模板。

“继续编辑”：单击“继续编辑”，返回“应用开发>上传模板图片”页面，重新创建模板。

“返回列表”：单击“返回列表”，返回至应用详情页。

“调用API和SDK”：下方调用指南区域，可直接调用API或SDK轻松调用当前模板服务。

调用 API 和 SDK

“应用开发>部署”页面下方的调用指南，显示“API调用”和“SDK调用”页签，您可以通过调用API和SDK调用当前模板服务。

● 调用API

服务自动生成“API URI”，您可以单击URI右边的“复制”，复制API URI，调用当前模板服务。调用方式请见API调用指南。错误码请参见错误码。

● 调用SDK

文字识别服务（OCR）提供服务软件开发工具包（SDK），是对文字识别服务的 REST API进行封装。

服务提供SDK工具包，包括“JavaSDK”、“PythonSDK”、“IOSSDK”、

“AndroidSDK”、“Node.jsSDK”，您可以单击下载您所需要的SDK调用模板服务。

使用方式请参见SDK使用指南。

2.4.9 编辑应用

对于已经创建的模板应用，您可以修改模板的配置信息以匹配业务变化。

前提条件

已存在创建的模板应用。

(42)

编辑模板配置信息

3. 在“模板列表”页签，选择模板名称，单击操作列的“编辑”。

图2-42 编辑模板

进入“应用开发”页面，您可以依次修改“上传模板图片”、“定义预处理”、

“框选参照字段”、“框选识别区”、“上传训练集”、“评估”步骤的信息，

重新部署模板。操作指引如下：

– 上传模板图片

– 定义预处理

– 框选参照字段

– 框选识别区

– 上传训练集

– 评估应用 – 部署服务

2.4.10 自定义字段类型

在应用开发过程中“框选识别区”时会选择“字段类型”，如您框选的文字内容是数字，可选择默认字段类型“数字”。

如果“默认字段类型”不能满足您的业务需求，您可以创建新的字段类型。

前提条件

已在文字识别套件控制台选择“多模板分类工作流”新建应用，详情请见新建应用。

(43)

操作步骤

3. 单击“自定义字段类型”，进入“自定义字段类型”页签。

图2-44 自定义字段类型

4. 单击“创建字段类型”。

(44)

自定义字典

取值范围

例如：

“城市”

“Shenzhen”、

“Beijing”、

“Xi'an”

“Beijing”、

自定义正则提取

例如：

“出生日期”

“预过滤”：“”/

“”

“.”、“月”/

“.”、

“日”/“”

“2020年1月1日”，

“2020.1.1”。

(45)

字段属性参数参数说明举例后处理根据实际情况，对经过“提

取”后的文字进行“后处理”。

您也可以在“应用开发>框选识别区”过程中创建新的字段类型，详情请见创建新字段类型。

2.4.11 删除应用

操作步骤

3. 在“模板列表”页签，选择模板名称，单击操作列的“删除”。

弹出“确认删除”对话框。

图2-47 删除模板

4. 单击“确认”，删除模板。

2.5 查看应用详情

新建应用后，您可以在ModelArts Pro控制台查看应用详情，包括应用开发的配置信息和应用资产。

前提条件

已在文字识别套件控制台选择预置工作流新建应用，详情请见新建应用。

(46)

进入应用详情页

1. 登录ModelArts Pro管理控制台，单击“文字识别”套件卡片的“进入套件”。

3. 在“我的应用”页签下，选择已创建的应用，单击操作列的“查看”。

进入应用详情页，默认进入“应用资产”页面，查看应用资产。

您也可以单击“应用开发”，切换至“应用开发”页面，查看应用开发配置。

图2-48 进入应用详情

查看应用资产

在“应用资产”页面下，可以查看当前应用的资产信息。

使用预置工作流开发应用，“应用资产”可查看“模板列表”和“自定义字段类型”。

图2-49 应用资产

在“应用资产>模板列表”页面下可以查看已创建的模板列表，操作列可执行如下操作：

● “评估”：单击“评估”，进入“应用开发>评估”页面，对当前模板进行评估，

详情请见评估应用。

● “编辑”：单击编辑，进入应用开发页面，对当前模板开发的配置信息进行编辑，通用单模板工作流操作指引请见工作流介绍，多模板工作流操作指引请见工作流介绍。

● “删除”：单击“删除”，弹出“确认删除”对话框，单击“确认”，删除当前模板。

在“应用资产>自定义字段类型”页面下，可以查看自己定义的字段类型，也可单击

“创建字段类型”，在此处创建新的字段类型，详情请见2.4.8-自定义字段类型（通用单模板分类工作流）、自定义字段类型（多模板分类工作流）。

查看应用开发配置

在“应用开发”页面，您可以查看应用开发过程中各个步骤的配置信息。

(47)

您也可以对工作流开发的配置信息进行编辑，通用单模板工作流操作指引请见工作流介绍，多模板工作流操作指引请见工作流介绍。

您也可以在“应用开发”页签下，重新编辑应用开发的配置信息，并单击左上角版本号右侧的“更新版本”，将当前的应用设置成新的版本。

2.6 删除应用

如果已创建的应用不再使用，您可以删除应用释放资源。

操作步骤

1. 登录ModelArts Pro管理控制台，单击“文字识别”套件卡片的“进入套件”。

3. 在“我的应用”页签下，选择已创建的应用，单击操作列的“删除”。

弹出“确定删除应用”对话框。

图2-50 删除应用

4. 在对话框中单击“确认”，删除应用。

图2-51 删除应用

可训练技能模板介绍_企业级AI应用开发专业套件 ModelArts Pro_用户指南_HiLens套件_HiLens安全帽检测技能_华为云

用户指南

华为技术有限公司

目 录

1 如何使用 ModelArts Pro... 1

2 文字识别套件... 5

3 自然语言处理套件... 42

4 视觉套件...91

5 HiLens 套件...186

1 如何使用 ModelArts Pro

1.1 使用流程

1.2 注册华为云帐号

1.3 申请行业套件

申请套件

进入套件

1.4 配置访问授权

授权配置

▪

▪

▪

2 文字识别套件

2.1 行业套件介绍

预置工作流

使用预置工作流开发应用流程

2.2 新建应用

前提条件

操作步骤

后续操作

2.3 通用单模板工作流

2.3.1 工作流介绍

工作流简介

工作流流程

2.3.2 上传模板图片

前提条件

图片要求

进入应用开发页面

上传模板图片

2.3.3 定义预处理

前提条件

定义预处理

2.3.4 框选参照字段

前提条件

操作步骤

2.3.5 框选识别区

前提条件

操作步骤

创建新字段类型

2.3.6 评估应用

前提条件

进入评估页面

本地上传图片

上传在线图片

2.3.7 部署服务

前提条件

操作步骤

调用 API 和 SDK

2.3.8 自定义字段类型

前提条件

操作步骤

2.3.9 编辑应用

前提条件

编辑模板配置信息

2.3.10 删除应用

操作步骤

2.4 多模板分类工作流

2.4.1 工作流介绍

工作流简介

工作流流程

2.4.2 上传模板图片

前提条件

数据要求

进入应用开发页面

填写基本信息

新增模板配置

添加已有模板

2.4.3 定义预处理

前提条件

定义预处理

2.4.4 框选参照字段

前提条件

目录

2 ^{文字识别套件}