ModelArts Pro的文字识别套件提供了通用单模板工作流,通过工作流指引可构建文字 识别模板,识别单个板式图片中的文字,快速实现文档、票证等场景的文字识别。
本章节提供一个身份证样例,帮助您快速熟悉使用文字识别套件中的通用单模板工作 流开发应用的过程。通过上传模板图片、框选参照字段和识别区,自动训练并生成文 字识别模型,并将生成的模型部署为在线服务。部署完成后,用户可通过在线服务识 别身份证模板中的文字。
首先,请仔细阅读准备工作罗列的要求,提前完成准备工作。使用通用单模板工作流 开发应用的步骤如下所示:
● 步骤1:准备数据
● 步骤2:新建应用
● 步骤3:上传模板图片
● 步骤4:定义预处理
● 步骤5:框选参照字段
● 步骤6:框选识别区
● 步骤7:评估模板
● 步骤8:部署模板
准备工作
注册华为云帐号,并完成套件申请、访问授权配置等准备工作,详情请见准备工作。
步骤 1:准备数据
在本地准备好两张身份证图片,一张用于制作模板,一张用于评估模板。图片要求如 下:
● 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
● 图像各边的像素大小在100px到4096px之间。
● 图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。
● 支持图像任意角度的水平旋转。
● 目前不支持复杂背景(如户外自然场景、防伪水印等)和文字扭曲图像的文字识 别。
步骤 2:新建应用
1. 登录ModelArts Pro控制台,单击“文字识别”套件卡片的“进入套件”。
默认进入“应用开发>工作台”页面的“我的应用”页签。
图1-1 进入套件
2. 在“我的应用”页签下,单击“新建应用”。
进入“新建应用”页面。
图1-2 新建应用
3. 根据业务需求填写“应用名称”、“应用负责人”和“应用描述”,仅支持英 文、中文、数字、下划线、中划线。选择“所属行业”及工作流。
本样例“工作流”选择“通用单模板工作流”。
图1-3 新建应用
4. 确认信息后,单击右下角的“确定”。
成功新建应用,进入“应用资产”页面。
步骤 3:上传模板图片
1. 在“应用资产”页面单击模板列表下方的“创建模板”。
进入“应用开发>上传模板图片”页面。
图1-4 创建模板
2. 输入“模板名称”,并选择“模板类型”。
本样例“模板类型”选择“票证”。
3. 单击“上传图片”区域,上传提前在本地准备好的一张身份证图片作为模板。
图1-5 上传模板图片
4. 单击右下角的“下一步”。
进入“应用开发>定义预处理”页面。
步骤 4:定义预处理
1. 在“应用开发>定义预处理”页面,单击“选择预处理逻辑”的自动旋转,快速处 理图片的方向。
也可以按左上角操作指标手动调整图片。详情请见定义预处理。
图1-6 定义预处理
2. 单击右下角的“下一步”。
进入“应用开发>框选参照字段”页面。
图1-7 框选参照字段
步骤 5:框选参照字段
1. 在“应用开发>框选参照字段”页面,通过单击左上方操作图标,调整模板图片到 合适大小。
2. 单击框选操作图标 ,单击参照字段左上角,移动鼠标,使得矩形框覆盖参照字 段。
– 参照字段是文字内容、位置固定不变的文本框区域。
– 建议选取图片中不会重复出现的文字作为参照字段,否则影响模板匹配效 果。
– 参照字段为单行文本框,不可以框选竖版文字或跨行框选。
– 框选参照字段个数须不少于4个,并尽量分散在图片的四周。
– 参考字段尽量框选独立文本块,避免框选某一个文本块的一部分,有利于识 别精度提升。
本样例框选的参照字段如图1-8所示。
图1-8 框选参照字段
3. 单击右下角的“下一步”。
进入“应用开发>框选识别区”页面。
图1-9 框选识别区页面
步骤 6:框选识别区
1. 在“应用开发>框选识别区”页面,通过单击左上方操作图标,调整模板图片到合 适大小。
2. 单击框选操作图标 ,单击待识别文字的左上角,移动鼠标框选识别区,使得矩 形框覆盖待识别的文字。
识别区是对应字段内容所在区域。在框选时,建议尽量扩大识别区的框选范围使 其覆盖对应字段内容可能出现的区域,防止在不同图片识别时出现漏字。
本样例框选的识别区如图1-10所示。
图1-10 框选识别区
3. 在右侧“框选识别区”中填写“框选字段”,选择“字段类型”。
本样例的框选字段可按框选内容自己定义,字段类型均可选择“常规”。
如果“默认字段类型”不能满足您的业务需求,您可以在字段类型下拉框单击
“创建新字段类型”,创建新字段类型。
图1-11 选择字段类型
4. 框选并核对完所有识别区后,单击“下一步”。
进入“应用开发>评估”页面。
图1-12 评估页面
步骤 7:评估模板
1. 在“应用开发>评估”页面,默认进入“本地上传”页签。
2. 单击“上传图片”,上传在本地提前准备好的用于评估模型的身份证图片。
3. 图片上传成功后,右侧会显示识别结果。
图1-13 评估
步骤 8:部署模板
如果评估模板时,评估结果正确,在“应用开发>评估”页面的右下角单击“下一 步”,部署模板。
在“应用开发>部署”页面会显示“恭喜您,已发布成功”。
部署模板后,您可以通过调用API和SDK使用当前模板服务,详情请见API调用指南和 SDK使用指南。
图1-14 部署服务