• 沒有找到結果。

2.3 通用单模板工作流

2.3.5 框选识别区

在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识 别区。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型 可以通过识别区找到需要识别内容的位置。

识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字 段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。

前提条件

已在文字识别套件控制台选择“通用单模板工作流”新建应用,并框选参照字段,详 情请见框选参照字段。

操作步骤

2-11 框选识别区

1. 在“应用开发>框选识别区”页面,通过单击左上方操作图标,调整模板图片到合 适大小。

2. 单击框选操作图标 ,单击待识别文字的左上角,移动鼠标框选识别区,使得矩 形框覆盖待识别的文字。

框选识别区应尽量扩大识别区范围,使所框选识别区覆盖字段值可能出现的区 域。

3. 在右侧“框选识别区”中填写“框选字段”,选择“字段类型”。

“字段类型”指待识别文字的内容,您可以在默认字段类型中选择,当前可选择 的默认字段类型包括“姓名”、“数字”、“常规”、“电话号码”、“地 址”、“金额”、“长数字”、“长字段”,每个识别区可选择多个字段类型。

如果“默认字段类型”不能满足您的业务需求,您可以在字段类型下拉框单击

“创建新字段类型”,创建新字段类型。

4. 框选并核对完所有识别区后,单击“下一步”,进入评估应用步骤。

创建新字段类型

如果鼠标框选识别区后,在“框选识别区”选择字段类型时,“默认字段类型”不能 满足您的业务需求,您可以创建新的字段类型。

1. 在“应用开发>框选识别区”页面单击框选操作图标 ,单击待识别文字的左上 角,移动鼠标框选识别区。

2. 在右侧“框选识别区”中的“字段类型”下拉框中,单击“创建新字段类型”。

弹出“创建字段类型”对话框。

3. 填写字段类型信息。

2-12 创建字段类型

“字段类型名称”:填写待创建的字段类型名称,如识别身份证照片,可新增字 段类型“出生日期”。

“字段属性”:选择字段属性,可选择“自定义正则提取”和“自定义字典”,

然后按表2-3填写相关信息。

2-3 字段属性参数说明

字段属性 参数 参数说明 举例

自定义字 典

取值范 围

在识别当前字段类型的文字 时,选择字典的取值范围中最 相似的取值为最后识别结果。

例如:

“字段类型名称”:

“城市”

“字段属性”:“自 定义字典”

“取值范围”:

“Shenzhen”、

“Beijing”、

“Xi'an”

在识别“字段类型”

为“城市”的文字 时,从“Shenzhen”、

“Beijing”、

“Xi'an”中找出与待 识别文字最相似的取 值,作为识别结果。

字段属性 参数 参数说明 举例 生日期的文字“2020 年1月1日出生”时,

首先不做预过滤,然 后提取关键字符

“2020年1月1日”,

最后做后处理,最终 提取内容为

“2020.1.1”。

提取 对经过“预处理”的文字进行

登录“ModelArts Pro>文字识别套件”控制台,默认进入“应用开发>工作台”页面。

选择应用并单击“操作”列的查看,进入“应用资产”页面。

2-13 进入评估页面