学 报
5 个性化广告推荐存在的问题及研究 方向
个性化广告推荐使得广告更加符合用户的兴
趣,在研究和应用方面都取得不错的进展.然而,广 告推荐中同时存在传统推荐的问题和广告推荐特有 的问题.这部分主要讨论个性化广告推荐中存在的 重点问题,并分析未来个性化广告推荐研究的方向, 主要包括以下几个方面:
(1)广告推荐的时效性问题
广告推荐的时效性需要考虑到用户需求的变化 和时间上下文之间的联系,即广告的时效性由用户 需求的时效性决定,用户的需求和偏好在一定时间 内是允许存在变化的.例如,用户上周经常搜索计算 机的商品信息,并在这周购买了一台计算机.但是购 买后的一段时间后,购物平台或者网站依旧为其推 荐计算机的相关广告,这种情况就是忽视用户需求 的时效性,导致用户对该商品甚至该商品所属企业 产生反感或抵触的情绪.
广告推荐的时效性不同于其它领域的时效性, 例如,新闻推荐中的时效性是以时间为节点,新闻推 荐区别于其它推荐的最大特点就是和时间上下文关 联性很强,超过一定时间发布的新闻对用户来讲是 没有意义的[7].而广告推荐的目的是引起用户产生 购买行为,可以在用户角度和广告产品角度对广告 推荐的时效性进行把握.从用户角度来讲,可以将用 户行为的变化作为参考.获取用户偏好的变化,并做 出实时响应.从广告产品的角度来讲,根据产品推出 的时间、广告发布的时间等,考虑广告效用随时间的 衰减情况即产品是否还能满足当前用户需求.
因此,为给用户提供新颖的、及时的推荐结果, 个性化广告推荐系统同时考虑用户偏好变化和广告 效用的衰减,这是未来的研究重点之一.除了对用户 动态偏好获取外,还应在系统设计上进行改进.对 此,可借助Hadoop等建立分布式推荐系统,利用 MapReduce等编程模型及MongoDB等NoSQL数 据库技术,提高数据处理的能力和效率,进一步增强 个性化广告推荐系统的可扩展性、灵活性、多样性, 在保证性能的同时减少延迟.
(2)用户的隐私保护问题
个性化广告在消费者隐私和数据安全方面引起 广泛的关注[26],存在发展也引起争议.近几年,用户 在门户网站和金融公司的个人信息被大量暴露并被 滥用[70],许多国家已经制定有关该问题的法律[26]. 最近,IAS发布的“2019广告行业脉动”的报告中指 出,55.8%的受访者首要关注数据隐私问题,并且 93.3%的受访者认为数据隐私条例需要在全球范围
3 5 3期 张玉洁等:个性化广告推荐系统及其应用研究 5
《 计
算 机
学 报
》
内得到完善
①
.在推荐技术的角度来讲,当前大多数广告推荐 技术需要调用并分析用户的历史信息(如协同过滤 技术、上下文信息等),即使例如基于社会化网络的 推荐系统[58]或基于位置时间的推荐系统[17]这些不 依赖历史信息的推荐方式,也需要访问并分析某些 用户的其它资料,如用户的社会关系、地理位置等 等.而这些信息在一定程度上属于用户的个人隐私. 另外,数据隐私处理会使得可以利用的数据量减 少[43],导致对推荐效果产生影响.
所以在具有隐私保护的广告推荐系统中存在两 个个方面的挑战,一方面是需要推荐系统有效保护 用户的这些隐私信息,保证这些隐私不被他人过度 访问.例如当用户共享智能设备时,先前用户的行为 或偏好会通过广告透露给后续用户,进而造成隐私 泄露.为解决类似挑战,除了减少对用户隐私信息的 获取外,还可以进行用户切换检测.具体来讲,可以 通过cookie等信息跟踪用户行为,根据用户经常使 用的应用程序和网站等,进行用户的行为特征匹配. 除此之外,可以在更细的粒度上进行研究,通过对用 户浏览的图片或者关键词进行精确分析,发现用户 之间的差异,防止个人偏好隐私泄露给他人.
另一方面的挑战是需要缓解因数据隐私处理对 推荐产生的影响.为应对挑战,可以考虑在用户给项 目进行评分时,用假名保护隐私[136],而不是直接将 相关内容直接删除.同时,将隐私信息对推荐的影响 程度进行评级,对不具备代表性和说明性的用户属 性或信息进行筛选.尽量减少对用户直接信息的过 度访问,或者根据影响程度将信息进行脱敏.
因此,权衡上述两个方面的挑战,提出有效的隐 私保护机制(如用户切换检测等)是今后研究的重点.
(3)广告推荐中的冷启动问题
广告推荐中的冷启动问题产生的原因多由于产 生了新用户或者新广告,并且新用户没有访问过广 告,新广告也没有被用户访问.冷启动问题是推荐系 统中的重要挑战[80],解决冷启动问题也成为推荐系 统中的关键任务.在广告推荐领域,已经存在很多研 究用于应对冷启动问题.文献[12,27]根据用户行为 种类产生用户对广告的评分信息.文献[17,41]不依 赖用户信息,利用位置或时间上下文信息缓解冷启 动问题.文献[12,62]将不同推荐技术按照一定组合 规则混合使用,使得推荐技术之间能够优势互补,提 升推荐效果.目前存在的冷启动解决方法中,主要是
创造数据、利用其它辅助数据以及改进传统推荐技 术等,属于比较常见的冷启动解决方法.
冷启动问题产生的根源在于相关数据不存在或 者相当稀少,根据广告推荐系统中数据缺失的情况, 将冷启动问题分为用户冷启动、广告冷启动以及系 统冷启动问题,系统冷启动指既存在用户冷启动,又 存在广告冷启动的情况.针对上述三种冷启动问题, 可以考虑如下几种方法.
针对用户冷启动问题,一方面可利用迁移学习 的方式,使用其它相关领域的数据,弥补本研究领域 数据不足的劣势,例如将新闻数据集和广告数据集 混合[80].通过该方式,交叉学习用户行为特征,改善 各自领域数据集不丰富的情况,还能提高模型或算 法的泛化能力.目前,迁移学习在个性化广告推荐领 域的研究较少,但是为解决广告推荐中的冷启动问 题提供了新的思路.另一方面可引导用户通过社交 账号登录,在降低注册成本的同时,获取用户的社交 网络信息,提高新用户变老用户的转化率.尽可能扩 展用户画像,增加更多维度的信息.
针对广告冷启动问题,主要通过新增广告的内 容属性进行挖掘,包括广告的主题、主题类别、关键 字等.例如可将广告转化为关键字向量,通过计算向 量的相似度,实现广告聚类,并将其推荐给对类似广 告感兴趣的用户.此外,利用深度学习等技术,舍去 对一些广告的交互或评级信息,减少神经网络对类 似信息的依赖,使其对新项目具有鲁棒性.
针对系统冷启动问题,主要通过专家标注的方 式,引入专家知识.由于用户的兴趣可能性较多,需 要对用户提供具有代表性、区分性、多样性的广告, 保证广告具有很高的覆盖率,可以较快地收集用户 的反馈信息,并构建用户画像.类似于老虎机问题, 即推荐系统并不明确哪些广告受用户喜欢,也不清 楚用户喜欢特定广告的概率.此时可对用户随机推 荐不同主题或内容的广告,根据用户的反馈再做 判断.
(4)广告推荐的内容敏感性问题
广告推荐的内容要符合在满足用户偏好的同 时,也需要注意于当前上下文的匹配程度.广告推荐 的内容敏感性问题主要体现在广告推荐当前的内容 是否合理,会对用户的体验和感受以及商家的信誉 产生很大的影响[137].例如,用户在手机应用中浏览
4 5
5 计 算 机 学 报 2021年
①
IAS:2019年广告行业发展趋势报告.http://www.199it. com/archives/847084.html《 计
算 机
学 报
》
一条事故新闻时,新闻中提到某景区设备发生事故, 这时推荐系统可能根据该景区信息推荐该景区的广 告,此时该广告的内容就涉及到推荐内容敏感性问 题.而且,一些涉及违法犯罪内容的广告也会经常出 现,对用户产生极大的误导与消极影响.
目前,针对广告推荐的敏感性问题的研究比较 少,主要是通过构建分类器发现敏感内容.例如,Jin 等人[138]设计一种独特的网页敏感内容分类标准. 然后,构建一种分级分类器,在不需要太多人工标记 的情况下,形成具有良好精度的敏感内容分类器. Peng等人[139]在移动广告环境下提出一种基于两阶
段的敏感性校核方法,包括广告分类和敏感性检测 两个阶段,分别用于判断广告分类和审核文本内容 中是否有敏感信息.上述方法均构建层次分类器,获 取敏感内容,但是敏感性的确定过程存在主观因素, 对敏感标准的确定和衡量是一个有趣的研究内容.
另外,深度学习技术的应用有助于确定广告中 是否存在敏感性内容.Sanzgiri等人[137]利用预先训 练的卷积神经网络处理广告图像素材,将图像内容 与目标网页中的信息结合,以确定广告素材中是否 存在敏感内容.但是其实验环境为离线实验,能否应 对在线环境中实时改变的场景还需要进一步验证. 因此,广告推荐内容敏感性分析中确定一个统 一的敏感性标准,在减少主观因素干扰的同时,实现 敏感内容的在线自动检测是未来值得研究的方向. 同时,不能仅仅对广告的文本内容进行分析,还应该
另外,深度学习技术的应用有助于确定广告中 是否存在敏感性内容.Sanzgiri等人[137]利用预先训 练的卷积神经网络处理广告图像素材,将图像内容 与目标网页中的信息结合,以确定广告素材中是否 存在敏感内容.但是其实验环境为离线实验,能否应 对在线环境中实时改变的场景还需要进一步验证. 因此,广告推荐内容敏感性分析中确定一个统 一的敏感性标准,在减少主观因素干扰的同时,实现 敏感内容的在线自动检测是未来值得研究的方向. 同时,不能仅仅对广告的文本内容进行分析,还应该