• 沒有找到結果。

在使用RES创建数据源时,您需要准备以下的3种基础数据包并上传至OBS。若使用近 线流程,需先将业务系统埋点日志转换成推荐系统指定格式,并实时写入DIS相应通 道。本章节介绍了RES当前离线数据源和近线数据源的数据格式,您可以参考本章节说 明,准备相应的数据。

说明

目前数据源只支持JSON格式。

● 用户数据

● 物品数据

● 行为数据

用户数据

3-2 用户数据字段描述

字段名 类型 描述 是否必选

userId String 全局唯一用户ID。可输入的字符范围为1

~64个字符。只能包含字母、数字、中划 线、下划线和特殊字符(: . / # )并且不

字段名 类型 描述 是否必选 gender String 性别。取值为:

● male

● female

● unknown

location Json 根据业务而设定的用户关注的地理位置信 息。如常驻地,精度维度格式:{"lat":

latitude, "lon": longitude }。例如:

"location": {"lat": 41.12, "lon":

-71.34}。

tags List[String

] 描述用户的标签,每个标签为独立的一个 元素。如[“篮球”, “家庭”]。 否 interest_t

ags List[String

] 兴趣标签,由系统自动更新,默认保留字 段。

extend Json 扩展字段,由用户指定扩展字段的key和 value。其中:

● key,您可以按照业务需求自行命名。

无需按照示例以“extend_”开头,

key不能为中文。

● value,支持long/float/String/

strArray/location格式的数据。

物品数据

3-3 物品数据字段描述

字段名 类型 描述 是否必选

itemId String 全局唯一物品ID。 是 itemType String 物品的类型,可用于对推荐结果

集的多样性控制。包含:

● item

● article

● video

● audio

● image

category String 物品的类别,如“课程”、“零 食”,可用于类别之间的打散。

字段名 类型 描述 是否必选 status Long 物品是否可推荐、是否置顶、是

否注销,默认值为0。 score Long 物品的权重,权重越高,被优先

推荐的概率越高,取值范围:

1-100。如不设置,默认值为1。

publishTime Long 发布时间,采用UTC标准时间,

单位以秒计。对物品有实时性要 求的则必填。

expireTime Long 失效时间,采用UTC标准时间,

单位以秒计。当前服务器的时间 大于该时间时,此物品将不会被 推荐。如不设置,代表永不失 效。

author List[String] 作者,一个作者一个元素,信息 流推荐场景建议填写。

content String 物品的内容描述信息,例如简介/

摘要/正文关键片段,最长支持 5000个中英文字符,超过则截断 处理。

tags List[String] 描述物品的标签,每个标签为独

立的一个元素。 否

location Json 物品的地理位置信息,精度维度 格式:{"lat": latitude, "lon":

longitude }。例如:"location":

{"lat": 41.12, "lon": -71.34}。

extend Json 扩展字段,由用户指定扩展字段 的key和value。

● value,支持long/float/

String/strArray/location格式 否

行为数据

3-4 行为数据字段描述

字段名 类型 描述 是否必选

userId String 用户ID。 是

itemType String 物品的类型。 是

itemId String 对应行为发生的对象的值。如果是和物 品发生关系,则是物品的id(itemId)的 值。

actionType String 行为类型,包括正向行为和负向行为。

下面为预制的行为类型和对应的权重,

字段名 类型 描述 是否必选 actionTime Long 行为发生的时间,采用UTC标准时间,

单位以秒计。

actionLocatio

n Json 行为发生的位置,精度维度格式:{"lat":

latitude, "lon": longitude }。例如:

"location": {"lat": 41.12, "lon":

-71.34}。

sceneId String 推荐场景 ID,用于场景维度的区分。 否 traceId String 用于追踪每个被推荐物品的唯一ID。用

于推荐效果的计算。

flowId String 用于计算每一个在线服务的效果。flowId 由推荐系统的API返回给用户,用户需把 flowId写到用户行为日志中。

数据示例

单击下载样例数据,将样例数据下载至本地