8.5 离线作业
8.5.6 排序策略
排序策略简介
排序策略用于训练排序模型,该模型将被用于对召回策略召回的候选集进行排序,以 将推荐物品顺序调整到最优。排序模型可对LR、FM、FFM、DeepFM和PIN等模型进 行训练,具体包括如下内容:
● 逻辑斯蒂回归-LR
● 因子分解机-FM
● 域感知因子分解机-FFM
● 深度网络因子分解机-DeepFM
● 核函数特征交互神经网络-PIN
创建排序策略
创建排序策略操作步骤详情请参见排序策略。
作业一般需要运行一段时间,根据您的数据量和资源不同,训练时间将耗时几分钟到 几十分钟不等。
您可以前往排序策略列表,查看作业的基本情况。在作业列表中,刚创建的作业“状 态”为“计算中”,当作业“状态”变为“计算成功”时,表示作业运行结束,生成 的候选集ID将使用于在线服务,为用户生成推荐列表。当作业“状态”变为“计算失 败”时,您可以单击作业的名称,进入详情页面,通过查看日志等手段处理问题。
逻辑斯蒂回归-LR
逻辑斯蒂回归算法是一种广义的线性回归分析模型,常用于数据挖掘、疾病自动诊
活函数将输出值映射到[0,1]之间,是机器学习领域里常用的二分类算法。单击查看逻 辑斯蒂回归详情信息。
表8-33 逻辑斯蒂回归参数说明 参数名称 说明
计算节点信息 用户可使用的计算资源种类。包括“8核|16GiB”、“8核|
32GiB”、“8核|64GiB”、“16核|128GiB”。
● normal:正态分布 平均值:默认0 标准差:0.001
● uniform :均匀分布
最小值:默认-0.001,均匀分布的最小值,必须小于最大值。
最大值:默认0.001,均匀分布的最大值,必须大于最小值。
● xavier:
初始化初始值为 均值为0,方差为 Var(wi)=1/nin 的均匀分布
(高斯或者随机分布)。其中 nin 是该神经元的输入数目。
参数名称 说明 估计(First Moment Estimation,即梯度的均值)和二阶矩估 计(Second Moment Estimation,即梯度的未中心化的方差)
进行综合考虑,依次计算出更新步长。
– 学习率:优化算法的参数,决定优化器在最优方向上前进步 长的参数。默认0.001。
– 数值稳定常量:为保证数值稳定而设置的一个微小常量。默 认1e-8。
● adagrad:自适应梯度算法
对每个不同的参数调整不同的学习率,对频繁变化的参数以更小 的步长进行更新,而稀疏的参数以更大的步长进行更新。
– 学习率:优化算法的参数,决定优化器在最优方向上前进步 长的参数。默认0.001。
– 初始梯度累加和:梯度累加和用来调整学习步长。默认0.1。
● ftrl:Follow The Regularized Leader
适用于处理超大规模数据的,含大量稀疏特征的在线学习的常见 说明batch模式计算速度快于full模式。
保存根路径 单击 选择训练结果在OBS中的保存根路径,训练完成后,会将模 型和日志文件保存在该路径下。该路径不能包含中文。
因子分解机-FM
计算节点信息 用户可使用的计算资源种类。“8核|16GiB”、“8核|
32GiB”、“8核|64GiB”、“16核|128GiB”。
训练数据的obs路径 特征工程排序样本预处理生成的训练数据所在的OBS路 径。
即特征工程“排序样本预处理”结果保存路径下具体的训 练文件路径。
测试数据的obs路径 特征工程排序样本预处理生成的测试数据所在的OBS路 径。
● normal:正态分布 平均值:默认0
● xavier:
初始化初始值为 均值为0,方差为 Var(wi)=1/nin 的均 匀分布(高斯或者随机分布)。其中 nin 是该神经元的 输入数目。
参数名称 说明 的一阶矩估计(First Moment Estimation,即梯度的均 值)和二阶矩估计(Second Moment Estimation,即 梯度的未中心化的方差)进行综合考虑,依次计算出更
● adagrad:自适应梯度算法
对每个不同的参数调整不同的学习率,对频繁变化的参
● ftrl:Follow The Regularized Leader
适用于处理超大规模数据的,含大量稀疏特征的在线学习 说明batch模式计算速度快于full模式。
隐向量长度 分解后的特征向量的长度。默认10。
参数名称 说明
保存根路径 单击 选择训练结果在OBS中的保存根路径,训练完成 后,会将模型和日志文件保存在该路径下。该路径不能包 含中文。
域感知因子分解机-FFM
域感知因子分解机是因子分解机的改进版本,因子分解机每个特征对其他域的隐向量 都一致,而域感知因子分解机每个特征对其他每个域都会学习一个隐向量,能够达到 更高的精度,但也更容易出现过拟合。单击查看域感知因子分解机详细信息。
表8-35 域感知因子分解机参数说明
参数名称 说明
计算节点信息 用户可使用的计算资源种类。“8核|16GiB”、“8核|
32GiB”、“8核|64GiB”、“16核|128GiB”。
训练数据的obs路
径 特征工程排序样本预处理生成的训练数据所在的OBS路径。
即特征工程“排序样本预处理”结果保存路径下具体的训练文 件路径。
测试数据的obs路
径 特征工程排序样本预处理生成的测试数据所在的OBS路径。
即特征工程“排序样本预处理”结果保存路径下具体的测试文 件路径。
特征值数量统计文 件
该文件标识了每一个域下的特征数量,排序数据处理接口会生 成这个文件,需要用户提供此文件完整路径。文件路径为特征 工程中排序样本预处理作业输出数据的结果保存路径的
“fields_feature_size”目录下文件名称是part-00000开头的文 件,需要用户提供文件的OBS路径。
最大迭代轮数 模型训练的最大迭代轮数,默认50。
提前终止训练轮数 在测试集上连续N轮迭代AUC无提高时,迭代停止,训练提前 结束,默认5。
参数名称 说明
初始化方法 模型参数的初始化方法。
● normal:正态分布 平均值:默认0
● xavier:
初始化初始值为 均值为0,方差为 Var(wi)=1/nin 的均匀分 阶矩估计(First Moment Estimation,即梯度的均值)和二 阶矩估计(Second Moment Estimation,即梯度的未中心 化的方差)进行综合考虑,依次计算出更新步长。
– 学习率:优化算法的参数,决定优化器在最优方向上前进 步长的参数。默认0.001。
– 数值稳定常量:为保证数值稳定而设置的一个微小常量。
默认1e-8。
● adagrad:自适应梯度算法
对每个不同的参数调整不同的学习率,对频繁变化的参数以
● ftrl:Follow The Regularized Leader
适用于处理超大规模数据的,含大量稀疏特征的在线学习的常
参数名称 说明
L2正则项系数 叠加在模型的2范数之上,用来对模型值进行限制防止过拟合。
默认0。
正则损失计算方式 正则损失计算当前有两种方式。
● full:指针对全量参数计算。
● batch:则仅针对当前批数据中出现的参数计算 说明batch模式计算速度快于full模式。
隐向量长度 分解后的表示特征的向量的长度。默认10。
保存根路径 单击 选择训练结果在OBS中的保存根路径,训练完成后,会 将模型和日志文件保存在该路径下。该路径不能包含中文。
深度网络因子分解机-DeepFM
深度网络因子分解机,结合了因子分解机和深度神经网络对于特征表达的学习,同时 学习高阶和低阶特征组合,从而达到准确地特征组合学习,进行精准推荐。单击查看 深度网络因子分解机详细信息。
表8-36 深度网络因子分解机参数说明
参数名称 说明
计算节点信息 用户可使用的计算资源种类。“8核|16GiB”、“8核|
32GiB”、“8核|64GiB”、“16核|128GiB”。
训练数据的obs路径 特征工程排序样本预处理生成的训练数据所在的OBS路 径。
即特征工程“排序样本预处理”结果保存路径下具体的训 练文件路径。
测试数据的obs路径 特征工程排序样本预处理生成的测试数据所在的OBS路 径。
即特征工程“排序样本预处理”结果保存路径下具体的测 试文件路径。
特征值数量统计文件 该文件标识了每一个域下的特征数量,排序数据处理接口 会生成这个文件,需要用户提供此文件完整路径。文件路 径为特征工程中排序样本预处理作业输出数据的结果保存 路径的“fields_feature_size”目录下文件名称是
part-00000开头的文件,需要用户提供文件的OBS路径。
最大迭代轮数 模型训练的最大迭代轮数,默认50。
提前终止训练轮数 在测试集上连续N轮迭代AUC无提高时,迭代停止,训练 提前结束,默认5。
参数名称 说明
初始化方法 模型参数的初始化方法。
● normal:正态分布 平均值:默认0 标准差:0.001
● uniform :均匀分布
最小值:默认-0.001,均匀分布的最小值,必须小于 最大值。
最大值:默认0.001,均匀分布的最大值,必须大于最 小值。
● xavier:
初始化初始值为 均值为0,方差为 Var(wi)=1/nin 的 均匀分布(高斯或者随机分布)。其中 nin 是该神经 元的输入数目。
参数名称 说明 度的一阶矩估计(First Moment Estimation,即梯度 的均值)和二阶矩估计(Second Moment
Estimation,即梯度的未中心化的方差)进行综合考
● adagrad:自适应梯度算法
对每个不同的参数调整不同的学习率,对频繁变化的
● ftrl:Follow The Regularized Leader
适用于处理超大规模数据的,含大量稀疏特征的在线学 说明batch模式计算速度快于full模式。
隐向量长度 分解后的表示特征的向量的长度。默认10。
参数名称 说明
激活函数 神经网络中的激活函数,将一个(或一组)神经元的值映 射为一个输出值。
● relu
● tanh
● sigmoid
神经元值保留概率 神经网络前向传播过程中以该概率保留神经元的值。默认
计算节点信息 用户可使用的计算资源种类。“8核|16GiB”、“8核|
32GiB”、“8核|64GiB”、“16核|128GiB”。
参数名称 说明
初始化方法 模型参数的初始化方法。
● normal:正态分布 平均值:默认0
● xavier:
初始化初始值为 均值为0,方差为 Var(wi)=1/nin 的均匀分 一阶矩估计(First Moment Estimation,即梯度的均值)
和二阶矩估计(Second Moment Estimation,即梯度的未 中心化的方差)进行综合考虑,依次计算出更新步长。
– 学习率:优化算法的参数,决定优化器在最优方向上前 进步长的参数。默认0.001。
– 数值稳定常量:为保证数值稳定而设置的一个微小常 量。默认1e-8。
● adagrad:自适应梯度算法
对每个不同的参数调整不同的学习率,对频繁变化的参数
● ftrl:Follow The Regularized Leader
● ftrl:Follow The Regularized Leader