• 沒有找到結果。

错误码

4.4 样本管理

4.4.2 批量添加样本

"sample_time" : 1589190552106,

"sample_status" : "MANUAL_ANNOTATION", "annotated_by" : "human/test_123/test_123", "labelers" : [ {

"email" : "[email protected]",

"worker_id" : "5d8d4033b428fed5ac158942c33940a2", "role" : 0

} ] }, {

"sample_id" : "0192f3acfb000666033a0f85c21577c7", "sample_type" : 0,

"source" : "https://test-obs.obs.xxx.com:443/image/aifood/%E5%86%B0%E6%BF%80%E5%87%8C/

36139.jpg?AccessKeyId=RciyO7RHmhNTfOZVryUH&Expires=1606296688&x-image-process=image%2Fresize

%2Cm_lfit%2Ch_200&Signature=RRr9r2cghLCXk%2B0%2BfHtYJi8eZ4k%3D", "metadata" : {

"@modelarts:import_origin" : 0 },

"sample_time" : 1589190543327,

"sample_status" : "MANUAL_ANNOTATION", "annotated_by" : "human/test_123/test_123", "labelers" : [ {

"email" : "[email protected]",

"worker_id" : "a2abd3f27b4e92c593c15282f8b6bd29", "role" : 0

401 Unauthorized 403 Forbidden 404 Not Found

错误码

您可以在API Explorer中调试该接口。

URI

POST /v2/{project_id}/datasets/{dataset_id}/data-annotations/samples

4-108 路径参数

参数 是否必选 参数类型 描述

dataset_id 是 String 数据集ID。

project_id 是 String 用户项目ID。获取方法请参见获 取项目ID。

请求参数

4-109 请求 Body 参数

参数 是否必选 参数类型 描述

final_annotati

on 否 Boolean 是否直接导入到最终结果。可选

值如下:

● true:标签导入到已标注

(默认值)

● false:标签导入到待确认,

导入到待确认状态目前仅支 持的数据集类型为图像分类 和物体检测。

label_format 否 LabelFormat

object 标签格式,此参数仅文本类数据 集使用。

samples 否 Array of Sample objects

样本列表。

4-110 LabelFormat

参数 是否必选 参数类型 描述

label_type 否 String 文本分类的标签类型。可选值如 下:

● 0:标签和文本分离,以固定 后缀“_result”区分。如:

文本文件是“abc.txt”,标 签文件是“abc_result.txt”。

● 1:默认值,标签和文本在一

arator 否 String 标签与标签之间的分隔符,默认

为逗号分隔,分隔符需转义。分

eparator 否 String 文本与标签之间的分隔符,默认 为Tab键分隔,分隔符需转义。

分隔符仅支持一个字符,必须为 大小写字母,数字和“!@#$

%^&*_=|?/':.;,”其中的某一字 符。

4-111 Sample

参数 是否必选 参数类型 描述

data 否 Object 样本文件的字节数据。类型为

java.nio.ByteBuffer,前台调用 时传字节数据转换后的字符串。

data_source 否 DataSource

object 数据来源。

encoding 否 String 样本文件的编码类型,用于文本 类型(txt/csv)的文件上传。取 值有UTF-8、GBK、GB2312 等,默认为UTF-8编码。

labels 否 Array of SampleLabel objects

样本标签列表。

参数 是否必选 参数类型 描述 metadata 否 SampleMeta

data object 样本metadata属性键值对。

name 否 String 样本文件名称,名称不能包含!

<>=&"'特殊字符,长度为 0-1024位。

sample_type 否 Integer 样本类型。可选值如下:

● 0:图像

● 1:文本

● 2:语音

● 4:表格

● 6:视频

● 9:自由格式

4-112 DataSource

参数 是否必选 参数类型 描述

data_path 否 String 数据源所在路径。

data_type 否 Integer 数据类型。可选值如下:

● 0:OBS桶(默认值)

● 1:GaussDB(DWS)服务

● 2:DLI服务

● 3:RDS服务

● 4:MRS服务

● 5:AI Gallery

● 6:推理服务 schema_maps 否 Array of

SchemaMap objects

表格数据对应的schema映射信 息。

source_info 否 SourceInfo

object 导入表格数据源所需的信息。

with_column_

header 否 Boolean 文件中首行是否是列名,用于表

格数据集。可选值如下:

● true:文件首行为列名

● false:文件首行不为列名

4-113 SchemaMap

参数 是否必选 参数类型 描述

dest_name 否 String 目的方的列名。

src_name 否 String 来源方的列名。

4-114 SourceInfo

参数 是否必选 参数类型 描述

cluster_id 否 String MRS集群ID。

cluster_mode 否 String MRS集群运行模式。可选值如 下:

● 0:普通集群

● 1:安全集群 cluster_name 否 String MRS集群名称。

database_na

me 否 String 导入表格数据集,数据库名字。

input 否 String 表格数据集,HDFS路径。

ip 否 String 用户GaussDB(DWS)集群的IP地 址。

port 否 String 用户GaussDB(DWS)集群的端 口。

queue_name 否 String 表格数据集,DLI队列名。

subnet_id 否 String MRS集群的子网ID。

table_name 否 String 导入表格数据集,表名。

user_name 否 String 用户名,GaussDB(DWS)数据需 提供此参数。

user_passwor

d 否 String 用户密码,GaussDB(DWS)数据

需提供此参数。

vpc_id 否 String MRS集群所在的vpc的ID。

4-115 SampleLabel

参数 是否必选 参数类型 描述

annotated_by 否 String 视频标注途径,用于区分标签是 人工标注的还是自动标注的。可 选值如下:

● human:人工标注

● auto:自动标注

id 否 String 标签ID。

name 否 String 标签名。

property 否 SampleLabel Property object

样本标签的属性键值对,如物体 形状、形状特征等。

score 否 Float 置信度。

type 否 Integer 标签类型。可选值如下:

● 0:图像分类

● 1:物体检测

● 3: 图像分割

● 100:文本分类

● 101:命名实体

● 102:文本三元组关系标签

● 103:文本三元组实体标签

● 200:语音分类

● 201:语音内容

● 202:语音分割

● 600:视频标注

4-116 SampleLabelProperty

参数 是否必选 参数类型 描述

@modelarts:c

ontent 否 String 语音标签(包含语音内容和语音

起止点)专用内置属性:语音文 本内容。

参数 是否必选 参数类型 描述

@modelarts:e

nd_index 否 Integer 命名实体标签专用内置属性:文 本的结束位置,但不包括 end_index所指的字符。例如:

● 文本内容为“Barack Hussein Obama II (born August 4, 1961) is an American attorney and politician.”,则其中人名

“Barack Hussein Obama II”的start_index为0,

end_index为23。

● 文本内容为“截止到2018年 底,本公司人员规模已经超 过100”,则其中时间

“2018年底”的start_index 为3,end_index为9。

@modelarts:e

nd_time 否 String 语音起止点标签专用内置属性:

语音的结束时间,格式

“hh:mm:ss.SSS”(其中hh表示 小时,mm表示分钟,ss表示 秒,SSS表示毫秒)。

参数 是否必选 参数类型 描述

@modelarts:f

eature 否 Object 物体检测标签专用内置属性:形

状特征,类型为List。以图片的 左上角为坐标原点[0, 0],每个 坐标点的表示方法为[x, y],x表 示横坐标,y表示纵坐标(x和y均

>=0)。每种形状的格式如下:

● bndbox [[0,10],[50,95]] 两 个点组成,矩形的左上角为

● polygon [[0,100],[50,95], [10,60],[500,400]] 多个点组 成,按顺序连接成一个多边 形。

● circle [[100,100],[50]] 一个 圆心点和半径组成。

● line [[0,100],[50,95]] 两个 点组成,第一个点起始点,

第二个点为终止点。

● dashed [[0,100],[50,95]] 两 个点组成,第一个点起始 点,第二个点为终止点。

● point [[0,100]] 一个点组 成。

● polyline [[0,100],[50,95], [10,60],[500,400]] 折线,多 个点组成。

● 0/false:非难例

● 1/true:难例

参数 是否必选 参数类型 描述

@modelarts:h

ard_reasons 否 String 内置属性:标签级别难例原因。

通过中划线间隔单个难例原因

参数 是否必选 参数类型 描述

● 16:图像中目标框的亮度与 训练数据集的特征分布存在 较大偏移。

● 17:图像中目标框的清晰度 与训练数据集的特征分布存 在较大偏移。

● 18:图像中目标框的堆叠程 度与训练数据集的特征分布 存在较大偏移。

● 19:基于gaussianblur的数 据增强与原图预测结果不一 致。

● 20:基于fliplr的数据增强与 原图预测结果不一致。

● 21:基于crop的数据增强与 原图预测结果不一致。

● 22:基于flipud的数据增强与 原图预测结果不一致。

● 23:基于scale的数据增强与 原图预测结果不一致。

● 24:基于translate的数据增 强与原图预测结果不一致。

● 25:基于shear的数据增强与 原图预测结果不一致。

● 26:基于superpixels的数据 增强与原图预测结果不一 致。

● 27:基于sharpen的数据增强 与原图预测结果不一致。

● 28:基于add的数据增强与 原图预测结果不一致。

● 29:基于invert的数据增强与 原图预测结果不一致。

● 30:数据被预测为异常点。

参数 是否必选 参数类型 描述

@modelarts:s

hape 否 String 物体检测标签专用内置属性:物

体形状,默认为空。可选值如 下:

● bndbox:矩形。

● polygon:多边形。

● circle:圆形。

● line:直线。

● dashed:虚线。

● point:点。

● polyline:折线。

@modelarts:s

ource 否 String 语音起止点标签专用内置属性:

语音来源(例如说话人/旁白 等)。

@modelarts:st

art_index 否 Integer 命名实体标签专用内置属性:文 本的起始位置,值从0开始,包 括start_index所指的字符。

@modelarts:st

art_time 否 String 语音起止点标签专用内置属性:

语音的起始时间,格式

4-117 SampleMetadata

参数 是否必选 参数类型 描述

参数 是否必选 参数类型 描述

@modelarts:h

ard_reasons 否 Array of

integers 内置属性:样本级别难例原因ID 列表。。难例原因ID可选值如

参数 是否必选 参数类型 描述

● 19:基于gaussianblur的数 据增强与原图预测结果不一 致。

● 20:基于fliplr的数据增强与 原图预测结果不一致。

● 21:基于crop的数据增强与 原图预测结果不一致。

● 22:基于flipud的数据增强与 原图预测结果不一致。

● 23:基于scale的数据增强与 原图预测结果不一致。

● 24:基于translate的数据增 强与原图预测结果不一致。

● 25:基于shear的数据增强与 原图预测结果不一致。

● 26:基于superpixels的数据 增强与原图预测结果不一 致。

● 27:基于sharpen的数据增强 与原图预测结果不一致。

● 28:基于add的数据增强与 原图预测结果不一致。

● 29:基于invert的数据增强与 原图预测结果不一致。

● 30:数据被预测为异常点。

@modelarts:si

ze 否 Array of

objects 内置属性:图像尺寸(图像的宽 度、高度、深度),类型为

响应参数

状态码: 200

4-118 响应 Body 参数

参数 参数类型 描述

error_code String 操作失败的错误码。

error_msg String 操作失败的错误信息。

results Array of UploadSampl eResp objects

批量添加样本的响应列表。

success Boolean 操作是否执行成功。可选值如下:

● true:执行成功

● false:执行失败

4-119 UploadSampleResp

参数 参数类型 描述

error_code String 操作失败的错误码。

error_msg String 操作失败的错误信息。

info String 描述信息。

name String 样本文件名。

success Boolean 操作是否执行成功。可选值如下:

● true:执行成功

● false:执行失败

请求示例

批量添加样本

{ "samples" : [ { "name" : "2.jpg",

"data" : "/9j/4AAQSkZJRgABAQAAAQABAAD/

2wBDAAgGBgcGBQgHBwcJCQgKDBQNDAsLDBkSEw8UHRofHh0aHBwgJC4nICIsIxwcKDcpLDAxNDQ0Hyc5PT gyPC4zNDL/

2wBDAQkJCQwLDBgNDRgyIRwhMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjL/

wAARCAA1AJUDASIAAhEBAxEB/8QAHwAAAQUBAQEBAQEAAAAAAAAAAAECAwQFBgcICQoL/

8QAtRAAAgEDAwIEAwUFBAQAAAF9AQIDAAQRBRIhMUEGE1FhByJxFDKBkaEII0KxwRVS0fAkM2JyggkKFhcYG RolJicoKSo0NTY3ODk6Q0RFRkdISUpTVFVWV1hZWmNkZWZnaGlqc3R1dnd4eXqDhIWGh4iJipKTlJWWl5iZmq KjpKWmp6ipqrKztLW2t7i5usLDxMXGx8jJytLT1NXW19jZ2uHi4+Tl5ufo6erx8vP09fb3+Pn6/8QAHwEAAwEBAQE

BAQEBAQAAAAAAAAECAwQFBgcICQoL"

} ] }

响应示例

状态码: 200 OK

{ "success" : true, "results" : [ { "success" : true,

"name" : "/test-obs/classify/input/cat-dog/2.jpg", "info" : "960585877c92d63911ba555ab3129d36"

} ] }

状态码

状态码 描述

200 OK

401 Unauthorized 403 Forbidden 404 Not Found

错误码

请参见错误码。