错误码
4.4 样本管理
4.4.4 查询单个样本信息
响应示例
状态码: 200 OK
{ "success" : true }
状态码
状态码 描述
200 OK
401 Unauthorized 403 Forbidden 404 Not Found
错误码
请参见错误码。
4.4.4 查询单个样本信息
功能介绍
查询单个样本信息。
调试
您可以在API Explorer中调试该接口。
URI
GET /v2/{project_id}/datasets/{dataset_id}/data-annotations/samples/{sample_id}
表4-124 路径参数
参数 是否必选 参数类型 描述
dataset_id 是 String 数据集ID。
project_id 是 String 用户项目ID。获取方法请参见获 取项目ID。
sample_id 是 String 样本ID。
表4-125 Query 参数
参数 是否必选 参数类型 描述
locale 否 String 语言。可选值如下:
● en-us:英文(默认值)
● zh-cn:中文
sample_state 否 String 样本状态。可选样本状态如下:
● __ALL__:已标注
● __NONE__:未标注
● __UNCHECK__:待验收
● __ACCEPTED__:验收通过
● __REJECTED__:已驳回
● __UNREVIEWED__:待审核
● __REVIEWED__:已审核
● __WORKFORCE_SAMPLED_
_:已验收采样
● __WORKFORCE_SAMPLED_
UNCHECK__:采样待验收
● __WORKFORCE_SAMPLED_
CHECKED__:采样已验收
● __WORKFORCE_SAMPLED_
ACCEPTED__:采样已通过
● __WORKFORCE_SAMPLED_
REJECTED__:采样已驳回
● __AUTO_ANNOTATION__:
待确认
参数 是否必选 参数类型 描述
worker_id 否 String 标注成员ID。
请求参数
无
响应参数
状态码: 200
表4-126 响应 Body 参数
参数 参数类型 描述
check_accept Boolean 是否验收通过,用于团队标注。可选值如下:
● true:验收通过
● false:验收不通过 check_comme
nt String 验收意见,用于团队标注。
check_score String 验收评分,用于团队标注。
deletion_reas
ons Array of
strings 样本的删除原因,用于医疗。
hard_details Map<String,H
ardDetail> 疑难详情,包括:疑难描述,疑难原因,疑难建 议。
labelers Array of Worker objects
样本分配的标注人列表,记录这张样本分给了哪 些团队成员,用于团队标注。
labels Array of SampleLabel objects
样本标签列表。
metadata SampleMeta
data object 样本metadata属性键值对。
review_accept Boolean 是否审核通过,用于团队标注。可选值如下:
● true:审核通过
● false:审核不通过 review_comm
ent String 审核意见,用于团队标注。
review_score String 审核评分,用于团队标注。
参数 参数类型 描述 sample_data Array of
strings 样本数据列表。
sample_dir String 样本所在路径。
sample_id String 样本ID。
sample_name String 样本名称。
sample_size Long 样本大小或文本长度,单位是字节。
sample_status String 样本状态。可选样本状态如下:
● __ALL__:已标注
● __NONE__:未标注
● __UNCHECK__:待验收
● __ACCEPTED__:验收通过
● __REJECTED__:已驳回
● __UNREVIEWED__:待审核
● __REVIEWED__:已审核
● __WORKFORCE_SAMPLED__:已验收采样
● __WORKFORCE_SAMPLED_UNCHECK__:采 样待验收
● __WORKFORCE_SAMPLED_CHECKED__:采 样已验收
● __WORKFORCE_SAMPLED_ACCEPTED__:采 样已通过
● __WORKFORCE_SAMPLED_REJECTED__:采 样已驳回
● __AUTO_ANNOTATION__:待确认 sample_time Long 样本时间,OBS最后修改时间。
sample_type Integer 样本类型。可选值如下:
● 0:图像
● 1:文本
● 2:语音
● 4:表格
● 6:视频
● 9:自由格式
score String 综合评分,用于团队标注。
source String 样本数据源地址。
sub_sample_u
rl String 子样本URL,用于医疗。
参数 参数类型 描述
worker_id String 团队标注人员的ID,用于团队标注。
表4-127 HardDetail
参数 参数类型 描述
alo_name String 别名。
id Integer 原因ID。
reason String 原因描述。
suggestion String 处理建议。
表4-128 Worker
参数 参数类型 描述
create_time Long 创建时间。
description String 标注成员描述,长度为0-256位,不能包含^!
<>=&"'特殊字符。
email String 标注成员邮箱。
role Integer 角色。可选值如下:
● 0:打标者
● 1:审核者
● 2:团队管理者
● 3:数据集拥有者
status Integer 标注成员的当前登录状态。可选值如下:
● 0:未发送邀请邮件
● 1:已发送邀请邮件但未登录
● 2:已登录
● 3:标注成员已删除 update_time Long 更新时间。
worker_id String 标注成员ID。
workforce_id String 所属标注团队ID。
表4-129 SampleLabel
参数 参数类型 描述
annotated_by String 视频标注途径,用于区分标签是人工标注的还是 自动标注的。可选值如下:
● human:人工标注
● auto:自动标注
id String 标签ID。
name String 标签名。
property SampleLabel Property object
样本标签的属性键值对,如物体形状、形状特征 等。
score Float 置信度。
type Integer 标签类型。可选值如下:
● 0:图像分类
● 1:物体检测
● 3: 图像分割
● 100:文本分类
● 101:命名实体
● 102:文本三元组关系标签
● 103:文本三元组实体标签
● 200:语音分类
● 201:语音内容
● 202:语音分割
● 600:视频标注
表4-130 SampleLabelProperty
参数 参数类型 描述
@modelarts:c
ontent String 语音标签(包含语音内容和语音起止点)专用内 置属性:语音文本内容。
参数 参数类型 描述
@modelarts:e
nd_index Integer 命名实体标签专用内置属性:文本的结束位置,
但不包括end_index所指的字符。例如:
● 文本内容为“Barack Hussein Obama II (born August 4, 1961) is an American attorney and politician.”,则其中人名
“Barack Hussein Obama II”的start_index 为0,end_index为23。
● 文本内容为“截止到2018年底,本公司人员规 模已经超过100”,则其中时间“2018年底”
的start_index为3,end_index为9。
@modelarts:e
nd_time String 语音起止点标签专用内置属性:语音的结束时 间,格式“hh:mm:ss.SSS”(其中hh表示小时,
mm表示分钟,ss表示秒,SSS表示毫秒)。
@modelarts:f
eature Object 物体检测标签专用内置属性:形状特征,类型为 List。以图片的左上角为坐标原点[0, 0],每个坐 标点的表示方法为[x, y],x表示横坐标,y表示纵 坐标(x和y均>=0)。每种形状的格式如下:
● bndbox [[0,10],[50,95]] 两个点组成,矩形的 左上角为第一个点,矩形的右下角为第二个点 (即第一个点x坐标一定小于第二个点的x坐 标,第一个点y坐标一定小于第二个点的y坐 标)。
● polygon [[0,100],[50,95],[10,60],[500,400]]
多个点组成,按顺序连接成一个多边形。
● circle [[100,100],[50]] 一个圆心点和半径组 成。
● line [[0,100],[50,95]] 两个点组成,第一个点 起始点,第二个点为终止点。
● dashed [[0,100],[50,95]] 两个点组成,第一 个点起始点,第二个点为终止点。
● point [[0,100]] 一个点组成。
● polyline [[0,100],[50,95],[10,60],[500,400]]
折线,多个点组成。
@modelarts:fr
om String 三元组关系标签专用内置属性:三元组关系标签
的起始实体ID。
@modelarts:h
ard String 内置属性:标签级别是否难例。可选值为:
● 0/false:非难例
● 1/true:难例
@modelarts:h ard_coefficien t
String 内置属性:标签级别难度系数。范围为[0,1]。
参数 参数类型 描述
@modelarts:h
ard_reasons String 内置属性:标签级别难例原因。通过中划线间隔 单个难例原因ID,例如:“3-20-21-19”。难例
● 19:基于gaussianblur的数据增强与原图预测 结果不一致。
● 20:基于fliplr的数据增强与原图预测结果不一 致。
参数 参数类型 描述
● 21:基于crop的数据增强与原图预测结果不一 致。
● 22:基于flipud的数据增强与原图预测结果不 一致。
● 23:基于scale的数据增强与原图预测结果不 一致。
● 24:基于translate的数据增强与原图预测结果 不一致。
● 25:基于shear的数据增强与原图预测结果不 一致。
● 26:基于superpixels的数据增强与原图预测结 果不一致。
● 27:基于sharpen的数据增强与原图预测结果 不一致。
● 28:基于add的数据增强与原图预测结果不一 致。
● 29:基于invert的数据增强与原图预测结果不 一致。
● 30:数据被预测为异常点。
@modelarts:s
hape String 物体检测标签专用内置属性:物体形状,默认为 空。可选值如下:
● bndbox:矩形。
● polygon:多边形。
● circle:圆形。
● line:直线。
● dashed:虚线。
● point:点。
● polyline:折线。
@modelarts:s
ource String 语音起止点标签专用内置属性:语音来源(例如说 话人/旁白等)。
@modelarts:st
art_index Integer 命名实体标签专用内置属性:文本的起始位置,
值从0开始,包括start_index所指的字符。
@modelarts:st
art_time String 语音起止点标签专用内置属性:语音的起始时 间,格式“hh:mm:ss.SSS”(其中hh表示小时,
mm表示分钟,ss表示秒,SSS表示毫秒)。
@modelarts:t
o String 三元组关系标签专用内置属性:三元组关系标签
的指向实体ID。
表4-131 SampleMetadata
参数 参数类型 描述
@modelarts:h
ard Double 内置属性:样本级别是否难例。可选值为:
● 0:非难例
● 1:难例
@modelarts:h ard_coefficien t
Double 内置属性:样本级别难度系数。范围为[0,1]。
参数 参数类型 描述
@modelarts:h
ard_reasons Array of
integers 内置属性:样本级别难例原因ID列表。。难例原 因ID可选值如下:
● 19:基于gaussianblur的数据增强与原图预测 结果不一致。
● 20:基于fliplr的数据增强与原图预测结果不一 致。
● 21:基于crop的数据增强与原图预测结果不一 致。
参数 参数类型 描述
● 22:基于flipud的数据增强与原图预测结果不 一致。
● 23:基于scale的数据增强与原图预测结果不 一致。
● 24:基于translate的数据增强与原图预测结果 不一致。
● 25:基于shear的数据增强与原图预测结果不 一致。
● 26:基于superpixels的数据增强与原图预测结 果不一致。
● 27:基于sharpen的数据增强与原图预测结果 不一致。
● 28:基于add的数据增强与原图预测结果不一 致。
● 29:基于invert的数据增强与原图预测结果不 一致。
● 30:数据被预测为异常点。
@modelarts:si
ze Array of
objects 内置属性:图像尺寸(图像的宽度、高度、深 度),类型为List。列表中的第一个数字为宽度 (像素),第二个数字为高度(像素),第三个数字为 深度(深度可以没有,默认为3),如[100,200,3]和 [100,200]均合法。 说明:只有当样本的标签列 表包含物体检测标签时,此字段必选。
请求示例
查询单个样本信息
GET https://{endpoint}/v2/{project_id}/datasets/{dataset_id}/data-annotations/samples/{sample_id}
响应示例
状态码: 200 OK
{ "sample_id" : "012f99f3cf405860130b6ed2350c2228", "sample_type" : 0,
"labels" : [ { "name" : "car", "type" : 0, "property" : { } } ],
"source" : "https://test-obs.obs.xxx.com:443/image/aifood/%E5%86%B0%E6%BF%80%E5%87%8C/
36502.jpg?AccessKeyId=RciyO7RHmhNTfOZVryUH&Expires=1606297079&Signature=Ju4FYpEu973ii
%2FAdUVLTfpLCTbg%3D", "metadata" : {
"@modelarts:import_origin" : 0 },
"sample_time" : 1589190552106,
"sample_status" : "MANUAL_ANNOTATION", "annotated_by" : "human/test_123/test_123", "labelers" : [ {
"email" : "[email protected]",
"worker_id" : "5d8d4033b428fed5ac158942c33940a2", "role" : 0
} ] }
状态码
状态码 描述
200 OK
401 Unauthorized 403 Forbidden 404 Not Found
错误码
请参见错误码。