错误码
4.4 样本管理
4.4.2 批量添加样本
"sample_time" : 1589190552106,
"sample_status" : "MANUAL_ANNOTATION", "annotated_by" : "human/test_123/test_123", "labelers" : [ {
"email" : "[email protected]",
"worker_id" : "5d8d4033b428fed5ac158942c33940a2", "role" : 0
} ] }, {
"sample_id" : "0192f3acfb000666033a0f85c21577c7", "sample_type" : 0,
"source" : "https://test-obs.obs.xxx.com:443/image/aifood/%E5%86%B0%E6%BF%80%E5%87%8C/
36139.jpg?AccessKeyId=RciyO7RHmhNTfOZVryUH&Expires=1606296688&x-image-process=image%2Fresize
%2Cm_lfit%2Ch_200&Signature=RRr9r2cghLCXk%2B0%2BfHtYJi8eZ4k%3D", "metadata" : {
"@modelarts:import_origin" : 0 },
"sample_time" : 1589190543327,
"sample_status" : "MANUAL_ANNOTATION", "annotated_by" : "human/test_123/test_123", "labelers" : [ {
"email" : "[email protected]",
"worker_id" : "a2abd3f27b4e92c593c15282f8b6bd29", "role" : 0
401 Unauthorized 403 Forbidden 404 Not Found
错误码
您可以在API Explorer中调试该接口。
URI
POST /v2/{project_id}/datasets/{dataset_id}/data-annotations/samples
表4-108 路径参数
参数 是否必选 参数类型 描述
dataset_id 是 String 数据集ID。
project_id 是 String 用户项目ID。获取方法请参见获 取项目ID。
请求参数
表4-109 请求 Body 参数
参数 是否必选 参数类型 描述
final_annotati
on 否 Boolean 是否直接导入到最终结果。可选
值如下:
● true:标签导入到已标注
(默认值)
● false:标签导入到待确认,
导入到待确认状态目前仅支 持的数据集类型为图像分类 和物体检测。
label_format 否 LabelFormat
object 标签格式,此参数仅文本类数据 集使用。
samples 否 Array of Sample objects
样本列表。
表4-110 LabelFormat
参数 是否必选 参数类型 描述
label_type 否 String 文本分类的标签类型。可选值如 下:
● 0:标签和文本分离,以固定 后缀“_result”区分。如:
文本文件是“abc.txt”,标 签文件是“abc_result.txt”。
● 1:默认值,标签和文本在一
arator 否 String 标签与标签之间的分隔符,默认
为逗号分隔,分隔符需转义。分
eparator 否 String 文本与标签之间的分隔符,默认 为Tab键分隔,分隔符需转义。
分隔符仅支持一个字符,必须为 大小写字母,数字和“!@#$
%^&*_=|?/':.;,”其中的某一字 符。
表4-111 Sample
参数 是否必选 参数类型 描述
data 否 Object 样本文件的字节数据。类型为
java.nio.ByteBuffer,前台调用 时传字节数据转换后的字符串。
data_source 否 DataSource
object 数据来源。
encoding 否 String 样本文件的编码类型,用于文本 类型(txt/csv)的文件上传。取 值有UTF-8、GBK、GB2312 等,默认为UTF-8编码。
labels 否 Array of SampleLabel objects
样本标签列表。
参数 是否必选 参数类型 描述 metadata 否 SampleMeta
data object 样本metadata属性键值对。
name 否 String 样本文件名称,名称不能包含!
<>=&"'特殊字符,长度为 0-1024位。
sample_type 否 Integer 样本类型。可选值如下:
● 0:图像
● 1:文本
● 2:语音
● 4:表格
● 6:视频
● 9:自由格式
表4-112 DataSource
参数 是否必选 参数类型 描述
data_path 否 String 数据源所在路径。
data_type 否 Integer 数据类型。可选值如下:
● 0:OBS桶(默认值)
● 1:GaussDB(DWS)服务
● 2:DLI服务
● 3:RDS服务
● 4:MRS服务
● 5:AI Gallery
● 6:推理服务 schema_maps 否 Array of
SchemaMap objects
表格数据对应的schema映射信 息。
source_info 否 SourceInfo
object 导入表格数据源所需的信息。
with_column_
header 否 Boolean 文件中首行是否是列名,用于表
格数据集。可选值如下:
● true:文件首行为列名
● false:文件首行不为列名
表4-113 SchemaMap
参数 是否必选 参数类型 描述
dest_name 否 String 目的方的列名。
src_name 否 String 来源方的列名。
表4-114 SourceInfo
参数 是否必选 参数类型 描述
cluster_id 否 String MRS集群ID。
cluster_mode 否 String MRS集群运行模式。可选值如 下:
● 0:普通集群
● 1:安全集群 cluster_name 否 String MRS集群名称。
database_na
me 否 String 导入表格数据集,数据库名字。
input 否 String 表格数据集,HDFS路径。
ip 否 String 用户GaussDB(DWS)集群的IP地 址。
port 否 String 用户GaussDB(DWS)集群的端 口。
queue_name 否 String 表格数据集,DLI队列名。
subnet_id 否 String MRS集群的子网ID。
table_name 否 String 导入表格数据集,表名。
user_name 否 String 用户名,GaussDB(DWS)数据需 提供此参数。
user_passwor
d 否 String 用户密码,GaussDB(DWS)数据
需提供此参数。
vpc_id 否 String MRS集群所在的vpc的ID。
表4-115 SampleLabel
参数 是否必选 参数类型 描述
annotated_by 否 String 视频标注途径,用于区分标签是 人工标注的还是自动标注的。可 选值如下:
● human:人工标注
● auto:自动标注
id 否 String 标签ID。
name 否 String 标签名。
property 否 SampleLabel Property object
样本标签的属性键值对,如物体 形状、形状特征等。
score 否 Float 置信度。
type 否 Integer 标签类型。可选值如下:
● 0:图像分类
● 1:物体检测
● 3: 图像分割
● 100:文本分类
● 101:命名实体
● 102:文本三元组关系标签
● 103:文本三元组实体标签
● 200:语音分类
● 201:语音内容
● 202:语音分割
● 600:视频标注
表4-116 SampleLabelProperty
参数 是否必选 参数类型 描述
@modelarts:c
ontent 否 String 语音标签(包含语音内容和语音
起止点)专用内置属性:语音文 本内容。
参数 是否必选 参数类型 描述
@modelarts:e
nd_index 否 Integer 命名实体标签专用内置属性:文 本的结束位置,但不包括 end_index所指的字符。例如:
● 文本内容为“Barack Hussein Obama II (born August 4, 1961) is an American attorney and politician.”,则其中人名
“Barack Hussein Obama II”的start_index为0,
end_index为23。
● 文本内容为“截止到2018年 底,本公司人员规模已经超 过100”,则其中时间
“2018年底”的start_index 为3,end_index为9。
@modelarts:e
nd_time 否 String 语音起止点标签专用内置属性:
语音的结束时间,格式
“hh:mm:ss.SSS”(其中hh表示 小时,mm表示分钟,ss表示 秒,SSS表示毫秒)。
参数 是否必选 参数类型 描述
@modelarts:f
eature 否 Object 物体检测标签专用内置属性:形
状特征,类型为List。以图片的 左上角为坐标原点[0, 0],每个 坐标点的表示方法为[x, y],x表 示横坐标,y表示纵坐标(x和y均
>=0)。每种形状的格式如下:
● bndbox [[0,10],[50,95]] 两 个点组成,矩形的左上角为
● polygon [[0,100],[50,95], [10,60],[500,400]] 多个点组 成,按顺序连接成一个多边 形。
● circle [[100,100],[50]] 一个 圆心点和半径组成。
● line [[0,100],[50,95]] 两个 点组成,第一个点起始点,
第二个点为终止点。
● dashed [[0,100],[50,95]] 两 个点组成,第一个点起始 点,第二个点为终止点。
● point [[0,100]] 一个点组 成。
● polyline [[0,100],[50,95], [10,60],[500,400]] 折线,多 个点组成。
● 0/false:非难例
● 1/true:难例
参数 是否必选 参数类型 描述
@modelarts:h
ard_reasons 否 String 内置属性:标签级别难例原因。
通过中划线间隔单个难例原因
参数 是否必选 参数类型 描述
● 16:图像中目标框的亮度与 训练数据集的特征分布存在 较大偏移。
● 17:图像中目标框的清晰度 与训练数据集的特征分布存 在较大偏移。
● 18:图像中目标框的堆叠程 度与训练数据集的特征分布 存在较大偏移。
● 19:基于gaussianblur的数 据增强与原图预测结果不一 致。
● 20:基于fliplr的数据增强与 原图预测结果不一致。
● 21:基于crop的数据增强与 原图预测结果不一致。
● 22:基于flipud的数据增强与 原图预测结果不一致。
● 23:基于scale的数据增强与 原图预测结果不一致。
● 24:基于translate的数据增 强与原图预测结果不一致。
● 25:基于shear的数据增强与 原图预测结果不一致。
● 26:基于superpixels的数据 增强与原图预测结果不一 致。
● 27:基于sharpen的数据增强 与原图预测结果不一致。
● 28:基于add的数据增强与 原图预测结果不一致。
● 29:基于invert的数据增强与 原图预测结果不一致。
● 30:数据被预测为异常点。
参数 是否必选 参数类型 描述
@modelarts:s
hape 否 String 物体检测标签专用内置属性:物
体形状,默认为空。可选值如 下:
● bndbox:矩形。
● polygon:多边形。
● circle:圆形。
● line:直线。
● dashed:虚线。
● point:点。
● polyline:折线。
@modelarts:s
ource 否 String 语音起止点标签专用内置属性:
语音来源(例如说话人/旁白 等)。
@modelarts:st
art_index 否 Integer 命名实体标签专用内置属性:文 本的起始位置,值从0开始,包 括start_index所指的字符。
@modelarts:st
art_time 否 String 语音起止点标签专用内置属性:
语音的起始时间,格式
表4-117 SampleMetadata
参数 是否必选 参数类型 描述
参数 是否必选 参数类型 描述
@modelarts:h
ard_reasons 否 Array of
integers 内置属性:样本级别难例原因ID 列表。。难例原因ID可选值如
参数 是否必选 参数类型 描述
● 19:基于gaussianblur的数 据增强与原图预测结果不一 致。
● 20:基于fliplr的数据增强与 原图预测结果不一致。
● 21:基于crop的数据增强与 原图预测结果不一致。
● 22:基于flipud的数据增强与 原图预测结果不一致。
● 23:基于scale的数据增强与 原图预测结果不一致。
● 24:基于translate的数据增 强与原图预测结果不一致。
● 25:基于shear的数据增强与 原图预测结果不一致。
● 26:基于superpixels的数据 增强与原图预测结果不一 致。
● 27:基于sharpen的数据增强 与原图预测结果不一致。
● 28:基于add的数据增强与 原图预测结果不一致。
● 29:基于invert的数据增强与 原图预测结果不一致。
● 30:数据被预测为异常点。
@modelarts:si
ze 否 Array of
objects 内置属性:图像尺寸(图像的宽 度、高度、深度),类型为
响应参数
状态码: 200
表4-118 响应 Body 参数
参数 参数类型 描述
error_code String 操作失败的错误码。
error_msg String 操作失败的错误信息。
results Array of UploadSampl eResp objects
批量添加样本的响应列表。
success Boolean 操作是否执行成功。可选值如下:
● true:执行成功
● false:执行失败
表4-119 UploadSampleResp
参数 参数类型 描述
error_code String 操作失败的错误码。
error_msg String 操作失败的错误信息。
info String 描述信息。
name String 样本文件名。
success Boolean 操作是否执行成功。可选值如下:
● true:执行成功
● false:执行失败
请求示例
批量添加样本
{ "samples" : [ { "name" : "2.jpg",
"data" : "/9j/4AAQSkZJRgABAQAAAQABAAD/
2wBDAAgGBgcGBQgHBwcJCQgKDBQNDAsLDBkSEw8UHRofHh0aHBwgJC4nICIsIxwcKDcpLDAxNDQ0Hyc5PT gyPC4zNDL/
2wBDAQkJCQwLDBgNDRgyIRwhMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjL/
wAARCAA1AJUDASIAAhEBAxEB/8QAHwAAAQUBAQEBAQEAAAAAAAAAAAECAwQFBgcICQoL/
8QAtRAAAgEDAwIEAwUFBAQAAAF9AQIDAAQRBRIhMUEGE1FhByJxFDKBkaEII0KxwRVS0fAkM2JyggkKFhcYG RolJicoKSo0NTY3ODk6Q0RFRkdISUpTVFVWV1hZWmNkZWZnaGlqc3R1dnd4eXqDhIWGh4iJipKTlJWWl5iZmq KjpKWmp6ipqrKztLW2t7i5usLDxMXGx8jJytLT1NXW19jZ2uHi4+Tl5ufo6erx8vP09fb3+Pn6/8QAHwEAAwEBAQE
BAQEBAQAAAAAAAAECAwQFBgcICQoL"
} ] }
响应示例
状态码: 200 OK
{ "success" : true, "results" : [ { "success" : true,
"name" : "/test-obs/classify/input/cat-dog/2.jpg", "info" : "960585877c92d63911ba555ab3129d36"
} ] }
状态码
状态码 描述
200 OK
401 Unauthorized 403 Forbidden 404 Not Found
错误码
请参见错误码。