• 沒有找到結果。

5.3 算法介绍及参数说明

5.3.2 过滤规则

过滤规则用于配置候选集的过滤方式,使之不进入候选集。对于每个需要过滤的行 为,生成用户具有该行为的物品的列表。再对同用户的每种行为的物品列表进行

“与”或者“或”的关系,最终生成用户-物品过滤表。

5-16 过滤规则参数说明 参数名称 说明

名称 自定义过滤规则名称。由中文、英文、数字、下划线、空格或者中划线 组成,并且不能以空格开始和结束,长度为1~64个字符。

描述 过滤规则的相关描述信息。

频次 指定与用户个性化的物品候选集过滤准则。例如对于用户过去3天内有 过view行为的物品(如新闻)过滤,使之不进入候选集。单击 增加 历史行为过滤,单击后方的 删除过滤行为。相关参数解释如下:

● 相对时间间隔:与数据源内的行为数据记录最后的一条时间相差天 数。

● 最小次数:某用户对某物品产生某行为的最小次数。

● 行为类型:指定行为类型。

● 绝对时间间隔:与当前时间相差天数。

● 最大次数:某用户对某物品产生某行为的最大次数。

系统默认行为类型包括:

● view:物品曝光

● click:用户点击物品

● collect:用户收藏了某个物品

● uncollect:用户取消收藏某个物品

● search_click:用户点击搜索结果中的物品

● comment:用户对物品的评论

● share:分享

● like:点赞

● dislike:点衰

● grade:评分

● consume:消费

● use:观看视频/听音乐/阅读

● download:下载

● tip:打赏

● subscribe:关注 行为过滤

逻辑

各个频次之间的逻辑。

● “AND”逻辑为在7天内点赞超过3次且在7天内消费超过3次的物 品。

● “OR”逻辑为在7天内点赞超过3次或在7天内消费超过3次的物品。

参数名称 说明 龄会按照0-3、3-9、9-15进行散;单击 添加离散点。

● “不离散”:(默认)不做归一化,不对数据做处理。

参数名称 说明

参数名称 说明 训练集测试集划

分方式

数据划分方式按时间比例或个数比例划分训练集测试集。

● “时间比例”:将全部数据的时间跨度按照时间比例划分成 两段数据,训练数据为前一段时间中的数据,测试数据为后 一段时间的数据,取值TIME。

● “个数比例”:个数比例是将全部数据按个数比例随机划分 成训练集和测试集传入值。取值RAMDOM。

训练数据占比 生成的结果中,训练集占整个训练集和测试集的比例,默认 0.7。

测试数据占比 生成的结果中,训练集占整个训练集和测试集的比例,默认 0.3。

开启调度 开启调度,按照指定的调度策略定期执行作业。

● “调度周期”:调度周期可选“天”或“周”。

● “选择时间”:当 调度周期选择为“周”时,可在此下拉框 中勾选星期一到星期天的任一天进行调度。

● “具体时间”:选择具体的调度时间。