在使用RES创建数据源时,您需要准备以下的3种基础数据包并上传至OBS。若使用近 线流程,需先将业务系统埋点日志转换成推荐系统指定格式,并实时写入DIS相应通 道。本章节介绍了RES当前离线数据源和近线数据源的数据格式,您可以参考本章节说 明,准备相应的数据。
说明
目前数据源只支持JSON格式。
● 用户数据
● 物品数据
● 行为数据
用户数据
表3-2 用户数据字段描述
字段名 类型 描述 是否必选
userId String 全局唯一用户ID。可输入的字符范围为1
~64个字符。只能包含字母、数字、中划 线、下划线和特殊字符(: . / # )并且不
是
字段名 类型 描述 是否必选 gender String 性别。取值为:
● male
● female
● unknown
否
location Json 根据业务而设定的用户关注的地理位置信 息。如常驻地,精度维度格式:{"lat":
latitude, "lon": longitude }。例如:
"location": {"lat": 41.12, "lon":
-71.34}。
否
tags List[String
] 描述用户的标签,每个标签为独立的一个 元素。如[“篮球”, “家庭”]。 否 interest_t
ags List[String
] 兴趣标签,由系统自动更新,默认保留字 段。
否
extend Json 扩展字段,由用户指定扩展字段的key和 value。其中:
● key,您可以按照业务需求自行命名。
无需按照示例以“extend_”开头,
key不能为中文。
● value,支持long/float/String/
strArray/location格式的数据。
否
物品数据
表3-3 物品数据字段描述
字段名 类型 描述 是否必选
itemId String 全局唯一物品ID。 是 itemType String 物品的类型,可用于对推荐结果
集的多样性控制。包含:
● item
● article
● video
● audio
● image
是
category String 物品的类别,如“课程”、“零 食”,可用于类别之间的打散。
否
字段名 类型 描述 是否必选 status Long 物品是否可推荐、是否置顶、是
否注销,默认值为0。 score Long 物品的权重,权重越高,被优先
推荐的概率越高,取值范围:
1-100。如不设置,默认值为1。
否
publishTime Long 发布时间,采用UTC标准时间,
单位以秒计。对物品有实时性要 求的则必填。
否
expireTime Long 失效时间,采用UTC标准时间,
单位以秒计。当前服务器的时间 大于该时间时,此物品将不会被 推荐。如不设置,代表永不失 效。
否
author List[String] 作者,一个作者一个元素,信息 流推荐场景建议填写。
否
content String 物品的内容描述信息,例如简介/
摘要/正文关键片段,最长支持 5000个中英文字符,超过则截断 处理。
否
tags List[String] 描述物品的标签,每个标签为独
立的一个元素。 否
location Json 物品的地理位置信息,精度维度 格式:{"lat": latitude, "lon":
longitude }。例如:"location":
{"lat": 41.12, "lon": -71.34}。
否
extend Json 扩展字段,由用户指定扩展字段 的key和value。
● value,支持long/float/
String/strArray/location格式 否
行为数据
表3-4 行为数据字段描述
字段名 类型 描述 是否必选
userId String 用户ID。 是
itemType String 物品的类型。 是
itemId String 对应行为发生的对象的值。如果是和物 品发生关系,则是物品的id(itemId)的 值。
是
actionType String 行为类型,包括正向行为和负向行为。
下面为预制的行为类型和对应的权重,
字段名 类型 描述 是否必选 actionTime Long 行为发生的时间,采用UTC标准时间,
单位以秒计。
是
actionLocatio
n Json 行为发生的位置,精度维度格式:{"lat":
latitude, "lon": longitude }。例如:
"location": {"lat": 41.12, "lon":
-71.34}。
否
sceneId String 推荐场景 ID,用于场景维度的区分。 否 traceId String 用于追踪每个被推荐物品的唯一ID。用
于推荐效果的计算。
否
flowId String 用于计算每一个在线服务的效果。flowId 由推荐系统的API返回给用户,用户需把 flowId写到用户行为日志中。
否
数据示例
单击下载样例数据,将样例数据下载至本地