请求参数
4.4 数据源
4.4.3 查询数据源详情
},
"datasource_name" : "test-cyz",
"workspace_id" : "06a7c49afc00d4972ff1c0113d8c49ba", "datasource_id" : "aa6d657026de42a2927a50400ae69a4b", "status" : "Succeed",
"created_at" : 1587953962684, "update_at" : 1587953962684,
"structure" : "{\"user_attrs\":[{\"name\":\"age\",\"data_type\":\"long\"},{\"name\":\"extend_float\",
\"data_type\":\"float\"},{\"name\":\"extend_long\",\"data_type\":\"long\"},{\"name\":\"extend_strArray\",
GET /v2.0/{project_id}/workspaces/{workspace_id}/data-sources/{datasource_id}
表4-319 路径参数
参数 是否必选 参数类型 描述
datasource_id 是 String 数据源id。
project_id 是 String 项目id,获取方式请参见获取项
目ID。
workspace_id 是 String 工作空间id。
请求参数
表4-320 请求 Header 参数
参数 是否必选 参数类型 描述
Content-Type 是 String 内容类型,取值为application/
json。
X-Auth-Token 是 String 用户token,获取方式请参见获
取用户Token。
响应参数
状态码: 200
表4-321 响应 Body 参数
参数 参数类型 描述
datasource datasources
object 数据源详情。
jobs Array of jobs
objects 数据源相关任务详情。
is_success Boolean 是否成功。
message String 返回消息(请求成功时,不返回此字段)。
error_code String 错误码(请求成功时,不返回此字段)。
表4-322 datasources
参数 参数类型 描述
datasource_id String 数据源id。
datasource_n
ame String 名称。
status String 状态。
structure String 结构。
workspace_id String 工作空间编号。
data_config DataConfig
object 数据配置。
参数 参数类型 描述 specs_config SpecsConfig
object 计算规格配置。
created_at String 创建时间。
update_at Long 更新时间。
表4-323 DataConfig
参数 参数类型 描述
offline Offline object 离线计算规格。
nearline Nearline
object 近线数据源。
表4-324 Offline
参数 参数类型 描述
user_url String 用户数据url。
item_url String 物品数据url。
behavior_url String 行为数据url。
表4-325 Nearline
参数 参数类型 描述
item_topic Topic object 物品topic。
user_topic Topic object 用户topic。
behavior_topi
c Topic object 行为topic。
表4-326 Topic
参数 参数类型 描述
name String 名称。
id String id。
表4-327 SpecsConfig
参数 参数类型 描述
offline String 离线计算规格。
nearline String 实时计算规格。
rank String 深度学习计算规格。
online_tps Integer 在线服务最大并发数。
表4-328 jobs
参数 参数类型 描述
category String 类别。
config_info String 配置信息。
description String 描述。
job_id String 作业id。
job_name String 作业名称。
job_type String 作业类型。
next_schedule
_time Integer 下次调度时间。
platform String 平台。
resource_id String 资源id。
schedule String 调度参数。
status String 状态。
workspace_id String 工作空间id。
job_config jobConfig
object 作业配置。
表4-329 jobConfig
参数 参数类型 描述
nearline_recal
l_param NearLineRec allParam object
近线召回作业参数(近线召回作业需要提供此参 数)。
参数 参数类型 描述 max_recomm
ended_num Integer 最大候选集个数(所有召回作业需提供此参 数)。
最小值:1 最大值:200 match_featur
e_pairs Array of MatchFeatur ePair objects
匹配特征对(属性匹配召回作业需要提供此参 数)。
striping Striping
object 行条化策略(属性匹配召回作业、物品协同过滤 召回作业、用户协同过滤召回作业需要提供此参 数)。
match_type String 匹配类型(属性匹配召回作业需提供此参数):
● UI,基于用户推荐物品
● UU,基于用户推荐用户
● II,基于物品推荐物品
● IU,基于物品推荐用户 matrix_factori
zation MatrixFactori
zation object 矩阵分解参数配置(交替最小二乘协同过滤作业
需提供此参数)。
behavior_freq
uencys Array of BehaviorFreq uency objects
行为频率信息(历史行为记忆召回作业、历史行 为过滤作业需提供此参数)。
file_path String 文件路径(人工配置候选集作业需要提供此参 数)。
ucb_param UcbParam
object UCB作业参数(UCB召回作业需要提供此参 数)。
behavior_grav
ity BehaviorGrav
ity object 重力衰减因子(综合行为热度召回作业需要提供
此参数)。
category Category
object 类别(综合行为热度召回作业需要提供此参 数)。
behavior_logic String 行为逻辑过滤(历史行为过滤作业需提供此参 数):
● AND,同时满足则过滤
● OR, 满足一个则过滤 features_engi
neering EtlBasicPara
meter object 特征参数(离线特征工程作业需要提供此参
数)。
sample_para
m SamplePara
m object 样本参数(离线特征工程作业需要提供此参
数)。
deep_learning
_parameters DeepLearing
Param object 排序作业通用参数(LR、DEEPFM、AutoGroup 需要提供此参数)。
参数 参数类型 描述 ers object
排序算法特定参数(LR、DEEPFM、AutoGroup 需要提供此参数)。
load_widetabl
e Boolean 导入宽表(离线数据导入作业需要提供此参
数)。
load_profile Boolean 导入画像(离线数据导入作业需要提供此参 数)。
save_mode String 保留已有宽表(离线数据导入作业需要提供此参 数):
● append,是
● new,否
● overwirte,覆盖 indicators Array of
Indicator objects
统计指标(效果评估作业需要提供此参数)。
offline_rank_j
ob_name String 离线排序作业名称(在线训练任务需要提供此参 数)。
update_interv
al Integer 更新周期(在线训练任务需要提供此参数)。
optimizer Optimizer
object 优化器(在线训练任务需要提供此参数)。
flows Flow object 在线流程(在线训练任务需要提供此参数)。
表4-330 NearLineRecallParam
参数 参数类型 描述
time_limit Boolean 时间过滤。
timeFeature String 时间特征。
retainDays Integer 保留期(天)。
recall_fileds Array of RecallFiled objects
召回字段。
itemCF_job_n
ame String 物品协同过滤作业名称。
表4-331 RecallFiled
参数 参数类型 描述
name String 字段名称。
value Integer 使用字段值的个数。
最小值:1 最大值:10 缺省值:1
表4-332 MatchFeaturePair
参数 参数类型 描述
user_feature_
name String 用户特征。
item_feature_
name String 物品特征。
weight Double 权重。
match_count Boolean 匹配个数度量。
表4-333 Striping
参数 参数类型 描述
nearest_neigh
borhood Integer 最近领域个数。
band Integer 相似程度。
最小值:1 最大值:20
row Integer 相似距离。
最小值:1 最大值:10
表4-334 MatrixFactorization
参数 参数类型 描述
implicit_vecto
r_rank Integer 隐向量维度。
最小值:1 最大值:100
参数 参数类型 描述 regular_para
m Double 优化正则化系数。
最小值:1.0E-8 最大值:1 max_iterator_
num Integer 迭代次数。
最小值:1 最大值:50
表4-335 BehaviorFrequency
参数 参数类型 描述
behavior_type String 行为类型:
● view,曝光
● click,点击
● collect,收藏
● uncollect,取消收藏
● search_click,搜索后点击
● comment,评论
● share,分享
● like,点赞
● dislike,点衰
● grade,评分
● consume,消费
● use,观看视频/听音乐/阅读
● download,下载
● tip,打赏
● subscribe,关注 lower_limit Integer 最小次数。
最小值:1 upper_limit Integer 最大次数。
最小值:1 time_interval Integer 时间区间。
最小值:1
表4-336 UcbParam
参数 参数类型 描述
alpha Double 折中参数。
最小值:0 最大值:1 min_used_nu
m Integer 最小行为次数。
最小值:30 最大值:1000
表4-337 BehaviorGravity
参数 参数类型 描述
weaken_facto
r Double 衰减因子。
最小值:0.1 最大值:5
view_type String 行为次数统计方法:
● pv,访问量
● uv,独立访客 algo_type String 算法类型:
● normal,通用
● time,时间
表4-338 Category
参数 参数类型 描述
user_meta_list Array of
strings 用户特征。
item_meta_lis
t Array of
strings 物品特征。
表4-339 EtlBasicParameter
参数 参数类型 描述
user_features Array of FeatureTrans formation objects
用户特征。
参数 参数类型 描述 item_features Array of
FeatureTrans formation objects
物品特征。
rank_etl_filter RankETLFilte
r object 过滤参数。
表4-340 FeatureTransformation
参数 参数类型 描述
attr Attribute
object 特征。
discrete_meth
od String 离散方法:
● equal_distance_discrete,等距离散
● user_define_discrete,自定义离散
● normalize,归一化
● null,不离散 params Object 具体处理参数。
表4-341 Attribute
参数 参数类型 描述
name String 名称。
data_type String 数据类型。
other_uses Array of
strings 其他用途。
表4-342 RankETLFilter
参数 参数类型 描述
filter_type String 行为去重方式:
● abs_weight,权重绝对值
● date,日期
参数 参数类型 描述 time_type String 时间类型:
● day,天
● week,周
● month,月 is_monday_fir
st Boolean 周一是否是第一天。
表4-343 SampleParam
参数 参数类型 描述
divide_type String 训练集测试集划分方式:
● TIME,时间比例
● RAMDOM,个数比例 train_rate Double 训练数据占比。
最小值:0.01 最大值:1 test_rate Double 测试数据占比。
最小值:0.01 最大值:1
表4-344 DeepLearingParam
参数 参数类型 描述
initial_parame
ters Initial object 初始化参数。
optimize_para
meters Optimizer
object 优化参数。
regular_para
meters Regular
object 正则化参数。
max_iteration
s Integer 最大迭代轮数。
最小值:1 最大值:1000 early_stop_ite
rations Integer 提前终止训练轮数。
最小值:1 最大值:1000
参数 参数类型 描述 batch_size Integer 批量大小。
最小值:1 dataset_split_
parts Integer 训练数据集切分数量。
最小值:1 最大值:10 restart_train Boolean 重新训练。
表4-345 Initial
参数 参数类型 描述
initial_metho
d String 初始化方法。
枚举值:
● normal
● uniform
● xavier mean_value Double 平均值。
最小值:-1 最大值:1 standard_devi
ation Double 标准差。
最小值:0 最大值:1 min_value Double 最小值。
最小值:-1 最大值:0 max_value Double 最大值。
最小值:0 最大值:1
表4-346 Optimizer
参数 参数类型 描述
type String 优化器类型。
枚举值:
● adam
● adagrad
● ftrl learning_rate Integer 学习率。
最小值:0 最大值:1 initial_accum
ulator_value Double 初始梯度累加和。
最小值:0 最大值:1 lambda1 Double L1正则项系数。
最小值:0 最大值:1 lambda2 Double L2正则项系数。
最小值:0 最大值:1 epsilon Double 数值稳定常量。
最小值:0 最大值:1 decay_rate Double 衰减因子。
最小值:0 最大值:1 decay_steps Double 衰减步长。
最小值:1
表4-347 Regular
参数 参数类型 描述
l2_regularizati
on Double L2正则项系数。
最小值:0 最大值:1
参数 参数类型 描述 regular_loss_c
ompute_mod e
String 正则损失计算方式。
枚举值:
● full
● batch embed_l2_reg
ularization Double 隐向量层L2正则化系数。
最小值:0 最大值:1 wide_l2_regul
arization Double wide部分L2正则化系数。
最小值:0 最大值:1 structure_l2_r
egularization Double 结构化部分L2正则化系数。
最小值:0 最大值:1
表4-348 AlgorithmSpecifyParameters
参数 参数类型 描述
latent_vector_
length Integer 隐向量长度(DEEPFM需要提供此参数)。
最小值:1 最大值:100 architecture Array of
integers 神经网络结构(DEEPFM需要提供此参数)。
active_functio
n String 激活函数(DEEPFM需要提供此参数,AutoGroup需 要提供此参数)。
枚举值:
● relu
● sigmoid
● tanh value_keep_pr
obability Double 神经元值保留概率(DEEPFM需要提供此参 数,AutoGroup需要提供此参数)。
最小值:0 最大值:1 embed_size Array of
integers 各阶隐向量长度(AutoGroup需要提供此参数)。
mlp_architect
ure Array of
integers 神经网络结构(AutoGroup需要提供此参数)。
参数 参数类型 描述
max_order Integer 最大交互阶数(AutoGroup需要提供此参数)。
hash_sizes Array of
integers 哈希长度(AutoGroup需要提供此参数)。
hash_compen
sation Array of
numbers 特征交互层惩罚项系数(AutoGroup需要提供此参 数)。
use_wide_part Boolean 使用线性部分(AutoGroup需要提供此参数)。
structure_opti
mizer Optimizer
object 优化器参数(AutoGroup需要提供此参数)。
merge_multi_
hot Boolean 融合多值特征(AutoGroup需要提供此参数)。
fix_structure Boolean 固定哈希结构(AutoGroup需要提供此参数)。
表4-349 Indicator
参数 参数类型 描述
indicator_nam
e String 指标名称:
● clickPVRate,点击PV率
● clickUVRate,点击UV率
● customize,自定义 indicator_para
ms IndicatorPara
m object 指标参数(自定义指标需要提供)。
表4-350 IndicatorParam
参数 参数类型 描述
customize_par
ameter CustomizePa rameter object
自定义参数。
customize_for
mula CustomizeFor
mula object 自定义公式。
表4-351 CustomizeParameter
参数 参数类型 描述
alias String 别名。
参数 参数类型 描述 behavior_type String 行为类型。
threshold Double 阈值。
最小值:0 最大值:1 deduplication String 去重。
表4-352 CustomizeFormula
参数 参数类型 描述
alias String 别名。
formula String 公式。
表4-353 Flow
参数 参数类型 描述
flow_id String 流程id。
attr_pair_rules
_filter Array of AttrPairRules objects
属性对过滤。
attr_pair_rules
_reserve Array of AttrPairRules objects
属性对保留。
deduplication
_list Array of Deduplicatio n objects
属性去重。
attribute_info AttributeInfo
object 综合排序信息。
bloom_filter_c
onf BloomFilterC
onf object 布隆过滤器配置。
group_attr String 分组打散属性。
pre_deal Boolean 在排序前去重。
rank_setting String 排序配置信息。
rules Rule object 候选集融合。
filter_sets Array of
strings 过滤配置信息。
参数 参数类型 描述 attr_value_rul
es_filter Array of AttrValueRul es objects
属性值过滤。
attr_value_rul
es_reserve Array of AttrValueRul es objects
属性值保留。
ctr_job String 排序作业(使用点击率预估时需要提供此参 数)。
ratio Integer 流量占比。
最小值:1 最大值:100 toppings Array of
strings 需要置顶的候选集列表。
表4-354 AttrPairRules
参数 参数类型 描述
attr_pairs Array of AttrPair objects
属性对。
表4-355 AttrPair
参数 参数类型 描述
party_a String 被推荐对象的属性名。
party_b String 被推荐对象的属性名。
表4-356 Deduplication
参数 参数类型 描述
参数 参数类型 描述