2.4 多模板分类工作流
2.4.6 上传训练集
确定模板图片的参照字段和识别区后,多模板分类工作流在模板数量较多,或版式相 似度较高的情况下,建议针对不同的模板上传对应的训练集数据,用于训练模板分类 模型,使服务能够精准地分类多个模板图片,然后对多个模板图片进行文字识别和结 构化提取。
说明
当模板数量不多且模板的版式相似度不高的情况下,可以不需要上传训练集,直接单击“上传训 练集”页面的“开始训练”,训练模型,此时算法会直接利用模板图片进行训练生成分类器。
前提条件
● 已在文字识别套件控制台选择“多模板分类工作流”新建应用,并框选添加的多 个模板的识别区,详情请见框选识别区。
● 提前准备训练分类器的数据集。训练分类器的数据集要求将图片放在一个目录 里,并压缩成zip文件,文件大小不应大于10M。
添加已有模板
针对已经发布的模板,您可以添加至当前“多模板分类工作流”中,参与模板分类的 模型训练。
1. 在“应用开发>上传训练集”页面,单击“添加已有模板”。
弹出添加已有模板对话框。
2. 勾选模板,确认模板信息后,单击确定。
“应用开发>上传训练集”页面会显示新添加的模板。
准备训练集
针对当前“多模板分类工作流”中参与模板分类模型训练的模板,您需要在本地准备 好训练集,把测试图片打包成一个文件夹并压缩成“zip”包上传至当前工作流,
“zip”包文件大小不超过10M。
上传训练集
图2-35 上传训练集
1. 在“应用开发>上传训练集”页面,选择模板,单击操作列的“上传训练集”。
弹出上传文件对话框。
2. 单击上传文件对话框,在本地选择已经准备好的“zip”包文件。
上传成功后页面右上方会提示“文件上传成功”。
3. 确定每个模板上传训练集后,单击“开始训练”。
服务进入“应用开发>评估”页面,开始训练模型。
模型训练完成后,可在“应用开发>评估”页面评估分类器和模板,详情请见评估 应用。
删除训练集
如果已创建的模板应用不再使用,您可以删除模板释放资源。
在“应用开发>上传训练集”页面,选择模板,单击操作列的“删除”,弹出“确认删 除”对话框,单击“确认”,删除模板。
2.4.7 评估应用
训练模板分类模型后,需要对模板分类器和模板图片进行评估和考察。您可以通过上 传测试图片,在线评估模板分类情况和模板的文字识别情况,保证能在多个模板情况 下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。
前提条件
已在文字识别套件控制台选择“多模板分类工作流”新建应用,并上传各个模板的训 练集,详情请见上传训练集。
进入评估应用页面
登录“ModelArts Pro>文字识别套件”控制台,默认进入“应用开发>工作台”页面。
在“我的应用”页签下,选择应用并单击操作列的“查看”,进入应用详情页,可从
“应用资产”和“应用开发”两个页签进入评估模板页面。
● 在“应用资产”页面,默认进入“分类器列表”页签,单击已有模板操作列的
“评估”。进入“评估”页面。
图2-36 评估应用
● 在“应用开发”页面,依次完成“上传模板图片”、“定义预处理”、“框选参 照字段”、“框选识别区”、“上传训练集”步骤,单击“下一步”,进入“评 估”页面。
图2-37 评估应用
评估分类器
通过上传测试图片,在线评估模型训练的模板分类器是否能正确分类模板。
在“应用开发>评估”页面,您可以选择本地上传测试图片,也可以上传在线图片。
图2-38 评估分类器
● 本地上传图片
默认进入“本地上传”页签,根据自身需要选择打开“分类模式”和“动态识 别”开关,单击“上传图片”,或者拖拽测试图片至虚线框内上传图片区域,上 传本地的图片作为测试图片。
“分类模式”:打开“分类模式”开关时,单独对分类器的准确度进行评估。上 传图片后,右侧会显示模板自动分类的结果,包括“模板ID”、“模板名”、
“置信度”。关闭“分类模式”开关时,默认评估状态为端到端地对待识别图片 自动分类并进行结构化识别。
“动态识别”:如果待识别图片与模板图片的版式相似但是并不完全一致,如识 别区域在样本上的相对位置存在 上下浮动的位置变化,建议打开“动态识别”开 关进行评估。如果是固定版式的模板评估,建议关闭“动态识别”开关。
上传测试图片后,右侧会显示评估结果。
● 上传在线图片
单击“在线URL”,切换至“在线URL”页签。在“开始识别”左侧输出框中输入 待测试的图片URL地址,或者拖拽测试图片至虚线框内上传图片区域,上传在线 图片作为测试图片。
上传图片后,右侧会显示模板识别结果,包括“模板ID”、“模板名”、“置信 度”。
上传图片后,您可以核对识别结果是否正确。
如果不正确,单击“上一步”,对当前模板进行修改。
如果识别结果正确,可对模板作进一步评估,详情请见评估模板。
评估模板
通过上传测试图片,在线评估模板识别并提取结构化文字的能力。
首先在“应用开发>评估”页面右侧选择与待评估模板对应的原模板,然后选择本地上 传测试图片或者上传在线图片,评估模板。
图2-39 评估模板
● 本地上传图片
默认进入“本地上传”页签,根据自身需要选择打开“动态识别”开关,单击
“上传图片”,或者拖拽测试图片至虚线框内上传图片区域,上传本地的图片作 为测试图片。
“动态识别”:如果待识别图片与模板图片的版式相似但是并不完全一致,如识 别区域在样本上的相对位置存在 上下浮动的位置变化,建议打开“动态识别”开 关进行评估。如果是固定版式的模板评估,建议关闭“动态识别”开关。
上传图片后,右侧会显示文字识别结果,包括“识别区”和对应的“识别结 果”。
● 上传在线图片
单击“在线URL”,切换至“在线URL”页签。在“开始识别”左侧输出框中输入 待测试的图片URL地址,或者拖拽测试图片至虚线框内上传图片区域,上传在线 图片作为测试图片。
上传图片后,右侧会显示文字识别结果,包括“识别区”和对应的“识别结 果”。
上传图片后,您可以核对识别结果是否正确。
如果不正确,单击“上一步”,对当前模板进行修改。
如果识别结果正确,可单击“下一步”,部署模板。
后续操作
评估分类器和模板之后,如果识别结果正确,可单击“下一步”,部署服务。
2.4.8 部署服务
评估模板应用后,就可以部署多模板应用至文字识别开发套件中,开发属于自己的文 字识别应用,此应用用于识别自己所上传的图片属于哪种模板以及识别图片中的文 字。
前提条件
已在文字识别套件控制台选择“多模板分类工作流”新建应用,并完成评估模板步 骤,详情请见评估应用。
操作步骤
在“应用开发>部署”页面完成模板评估后,单击“下一步”,进入“创建模板>部 署”页面直接发布模板,页面显示“恭喜您,已发布成功”。
图2-40 部署模板
发布模板后,在“应用开发>部署”页面,您可以进行如下操作。
“评估”:单击“评估”,继续上传测试图片评估模板。
“继续编辑”:单击“继续编辑”,返回“应用开发>上传模板图片”页面,重新创建 模板。
“返回列表”:单击“返回列表”,返回至应用详情页。
“调用API和SDK”:下方调用指南区域,可直接调用API或SDK轻松调用当前模板服 务。
调用 API 和 SDK
“应用开发>部署”页面下方的调用指南,显示“API调用”和“SDK调用”页签,您 可以通过调用API和SDK调用当前模板服务。
● 调用API
服务自动生成“API URI”,您可以单击URI右边的“复制”,复制API URI,调用 当前模板服务。调用方式请见API调用指南。错误码请参见错误码。
● 调用SDK
文字识别服务(OCR)提供服务软件开发工具包(SDK),是对文字识别服务的 REST API进行封装。
服务提供SDK工具包,包括“JavaSDK”、“PythonSDK”、“IOSSDK”、
“AndroidSDK”、“Node.jsSDK”,您可以单击下载您所需要的SDK调用模板服 务。
使用方式请参见SDK使用指南。
2.4.9 编辑应用
对于已经创建的模板应用,您可以修改模板的配置信息以匹配业务变化。
前提条件
已存在创建的模板应用。
编辑模板配置信息
1. 登录“ModelArts Pro>文字识别套件”控制台。
默认进入“应用开发>工作台”页面。
2. 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。
进入“应用资产”页面。
图2-41 进入应用资产
3. 在“模板列表”页签,选择模板名称,单击操作列的“编辑”。
图2-42 编辑模板
进入“应用开发”页面,您可以依次修改“上传模板图片”、“定义预处理”、
“框选参照字段”、“框选识别区”、“上传训练集”、“评估”步骤的信息,
重新部署模板。操作指引如下:
– 上传模板图片
– 定义预处理
– 框选参照字段
– 框选识别区
– 上传训练集
– 评估应用 – 部署服务
2.4.10 自定义字段类型
在应用开发过程中“框选识别区”时会选择“字段类型”,如您框选的文字内容是数 字,可选择默认字段类型“数字”。
如果“默认字段类型”不能满足您的业务需求,您可以创建新的字段类型。
前提条件
已在文字识别套件控制台选择“多模板分类工作流”新建应用,详情请见新建应用。
操作步骤
1. 登录“ModelArts Pro>文字识别套件”控制台。
默认进入“应用开发>工作台”页面。
2. 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。
进入“应用资产”页面。
图2-43 进入应用资产
3. 单击“自定义字段类型”,进入“自定义字段类型”页签。
图2-44 自定义字段类型
4. 单击“创建字段类型”。
弹出“创建字段类型”对话框。
5. 填写字段类型信息。
图2-45 创建字段类型
“字段类型名称”:填写待创建的字段类型名称,如识别身份证照片,可新增字
“Shenzhen”、
“Beijing”、
“Xi'an”
在识别“字段类型”
为“城市”的文字 时,从“Shenzhen”、
“Beijing”、
“Xi'an”中找出与待 识别文字最相似的取 生日期的文字“2020 年1月1日出生”时,
首先不做预过滤,然 后提取关键字符
“2020年1月1日”,
最后做后处理,最终
最后做后处理,最终