• 沒有找到結果。

5.1 视频 OCR

5.1.1 创建视频 OCR 作业

功能介绍

该API用于创建视频OCR的作业,通过自动分析视频中出现的文字内容,可以识别并提 取违规或者关键信息。

说明

● 支持扩展名为avi、wmv、mpg、mpeg、mp4、mov、m4v、mkv的视频文件。

● 不支持OBS桶上经过KMS加密后的视频。

● 单个视频大小不能超过4GB。

● 从指定的URL地址中读取视频数据时,视频大小不能超过1GB。

● 支持识别数字、中文简体文字、中文繁体文字、英文字幕等。

● 能够识别场景较为清晰的水平文字、以及部分竖直文字和艺术字体,不能很好的处理环形文 字、倾斜角度较大等场景。

● 视频分辨率不低于300*300。

● 视频帧率必须大于1。

● 支持的区域:北京一、北京四。

URI

● URI格式

POST /v2/{project_id}/services/video-ocr/tasks

● 参数说明

名称 是否必选 类型 说明

project_id 是 String 服务所在区域对应的项目 ID,获取方法请参见获取

项目ID。

API 参考 5 视频内容分析 API

请求消息

● 请求示例

POST /v2/6204a5bd270343b5885144cf9c8c158d/services/video-ocr/tasks {

"name": "task-est", "description": "description", "input": {

"service_version":"1.0"

}

● 参数说明

参数名称 是否为必选 类型 描述信息

name 是 String 作业名称,只能由中文、字母(a~zA~

Z)、数字(0~9)、中划线(-)、下划 线(_)组成,长度范围为[1,100]。

descripti

on 否 String 作业描述信息,最大长度为500字符长 度。

input 是 Object 视频数据的输入列表,目前视频OCR支持 以下输入类型:

参数名称 是否为必选 类型 描述信息

output 是 Object 结果数据的输出列表,目前视频OCR支持 以下输出类型:

● obs:将结果输出到您指定的OBS桶 中。

● hosting:结果将托管到服务侧的 OBS,该OBS路径由服务指定,您可 以通过调用查询单个作业API获取该路 径。

详细参数定义见task.output(任务输出

参数)。

service_c

onfig 否 Object 服务算法配置,字段结构跟服务相关,参 数定义见serviceConfig字段结构说明。

service_v

ersion 是 String 功能版本填为“1.0”。

● service_config字段结构说明

参数名称 是否为必选 类型 描述信息

area 否 String 选择文字识别的区间,以“;”作为 不同区域的分割符号,每一个区域 的前两个数值,代表区域左上角

(x,y)的百分比坐标;后两个数 值代表所选区域宽、高占图片百分 比数值。取值范围为[0,1],无默 认值。

threshold 否 Float 控制输出文字的置信度,值越高,

文字的精准度就越高,对应的召回 率会降低。取值范围为[0,1.00],

默认值为0.50。

响应消息

● 响应示例

[ { "id": "f18320e61e4c4dc685aa2dfc22a28dc5" } ]

● 返回作业ID列表

参数名称 类型 描述信息

id String 作业ID。

识别结果

视频识别结果在用户输入的output路径下,以json文件的方式保存。

API 参考 5 视频内容分析 API

● 结果文件内容示例

{ "name": "obs-wxh/demo.mp4", "fps": 15,

400 Bad Request 请求错误,具体返回错误码请参考错误

码。

401 Unauthorized 鉴权失败。

API 参考 5 视频内容分析 API

返回值 说明

403 Forbidden 没有操作权限。

404 Not Found 找不到资源。

500 Internal Server Error 服务内部错误。

503 Service Unavailable 服务不可用。

相關文件