5.1 视频 OCR
5.1.1 创建视频 OCR 作业
功能介绍
该API用于创建视频OCR的作业,通过自动分析视频中出现的文字内容,可以识别并提 取违规或者关键信息。
说明
● 支持扩展名为avi、wmv、mpg、mpeg、mp4、mov、m4v、mkv的视频文件。
● 不支持OBS桶上经过KMS加密后的视频。
● 单个视频大小不能超过4GB。
● 从指定的URL地址中读取视频数据时,视频大小不能超过1GB。
● 支持识别数字、中文简体文字、中文繁体文字、英文字幕等。
● 能够识别场景较为清晰的水平文字、以及部分竖直文字和艺术字体,不能很好的处理环形文 字、倾斜角度较大等场景。
● 视频分辨率不低于300*300。
● 视频帧率必须大于1。
● 支持的区域:北京一、北京四。
URI
● URI格式
POST /v2/{project_id}/services/video-ocr/tasks
● 参数说明
名称 是否必选 类型 说明
project_id 是 String 服务所在区域对应的项目 ID,获取方法请参见获取
项目ID。
API 参考 5 视频内容分析 API
请求消息
● 请求示例
POST /v2/6204a5bd270343b5885144cf9c8c158d/services/video-ocr/tasks {
"name": "task-est", "description": "description", "input": {
"service_version":"1.0"
}
● 参数说明
参数名称 是否为必选 类型 描述信息
name 是 String 作业名称,只能由中文、字母(a~zA~
Z)、数字(0~9)、中划线(-)、下划 线(_)组成,长度范围为[1,100]。
descripti
on 否 String 作业描述信息,最大长度为500字符长 度。
input 是 Object 视频数据的输入列表,目前视频OCR支持 以下输入类型:
参数名称 是否为必选 类型 描述信息
output 是 Object 结果数据的输出列表,目前视频OCR支持 以下输出类型:
● obs:将结果输出到您指定的OBS桶 中。
● hosting:结果将托管到服务侧的 OBS,该OBS路径由服务指定,您可 以通过调用查询单个作业API获取该路 径。
详细参数定义见task.output(任务输出
参数)。
service_c
onfig 否 Object 服务算法配置,字段结构跟服务相关,参 数定义见serviceConfig字段结构说明。
service_v
ersion 是 String 功能版本填为“1.0”。
● service_config字段结构说明
参数名称 是否为必选 类型 描述信息
area 否 String 选择文字识别的区间,以“;”作为 不同区域的分割符号,每一个区域 的前两个数值,代表区域左上角
(x,y)的百分比坐标;后两个数 值代表所选区域宽、高占图片百分 比数值。取值范围为[0,1],无默 认值。
threshold 否 Float 控制输出文字的置信度,值越高,
文字的精准度就越高,对应的召回 率会降低。取值范围为[0,1.00],
默认值为0.50。
响应消息
● 响应示例
[ { "id": "f18320e61e4c4dc685aa2dfc22a28dc5" } ]
● 返回作业ID列表
参数名称 类型 描述信息
id String 作业ID。
识别结果
视频识别结果在用户输入的output路径下,以json文件的方式保存。
API 参考 5 视频内容分析 API
● 结果文件内容示例
{ "name": "obs-wxh/demo.mp4", "fps": 15,
400 Bad Request 请求错误,具体返回错误码请参考错误
码。
401 Unauthorized 鉴权失败。
API 参考 5 视频内容分析 API
返回值 说明
403 Forbidden 没有操作权限。
404 Not Found 找不到资源。
500 Internal Server Error 服务内部错误。
503 Service Unavailable 服务不可用。