书 书 书
第44卷 第3期
2021年3月 计 算 机 学 报
CHINESEJOURNALOFCOMPUTERS Vol.4M4Nar.2o0.231
收稿日期:20190413;在线发布日期:20200207.张玉洁,硕士,副教授,主要研究方向为推荐系统、用户偏好获取.Email:zhangyj@bupt. edu.cn.董 政,博士研究生,主要研究方向为推荐系统、智能信息处理.孟祥武,博士,教授,博士生导师,主要研究领域为推荐算法、用户
偏好获取、上下文推荐.
个性化广告推荐系统及其应用研究
张玉洁 董 政 孟祥武
(北京邮电大学智能通信软件与多媒体北京市重点实验室 北京 100876)
(北京邮电大学计算机学院(国家示范性软件学院) 北京 100876)
摘 要 近年来,随着互联网及智能移动设备的发展和普及,丰富了广告的推送方式和投放平台.但是传统的广告 推送无法满足用户对个性化广告的需求,导致用户对广告产生抵触情绪,给广告推送带来极大的挑战.个性化广告 推荐系统作为应对这些挑战的有效手段,成为个性化服务领域的研究热点之一.个性化广告推荐系统获取用户兴 趣偏好,利用多种个性化广告推荐技术,通过PC端、移动终端等多平台为用户提供个性化广告,并且已经在一些应 用系统中取得不错的效果.本文对个性化广告推荐系统的研究进展进行系统地综述,从个性化广告推荐的概述 出发,对近年来个性化广告推荐的关键技术进行深入分析,包括数据采集与预处理、用户偏好获取、个性化广告 推荐技术等.统计分析了个性化广告推荐中使用的多种数据集和评价指标,总结当前个性化广告推荐在传统互 联网、移动服务、数字标牌、IPTV等场景下的应用.最后对个性化广告推荐系统存在问题和未来深入研究的方向 进行讨论和展望.
关键词 个性化广告;推荐系统;用户偏好获取;上下文推荐;应用领域;数据挖掘 中图法分类号TP391 犇犗犐号10.11897/SP.J.1016.2021.00531
犚 犲 狊 犲 犪 狉 犮 犺 狅 狀 犘 犲 狉 狊 狅 狀 犪 犾 犻 狕 犲 犱 犃 犱 狏 犲 狉 狋 犻 狊 犻 狀 犵 犚 犲 犮 狅 犿 犿 犲 狀 犱 犪 狋 犻 狅 狀 犛 狔 狊 狋 犲 犿 狊 犪 狀 犱 犜 犺 犲 犻 狉 犃 狆 狆 犾 犻 犮 犪 狋 犻 狅 狀 狊
ZHANGYuJie DONGZheng MENGXiangWu
(犅犲犻犼犻狀犵犓犲狔犔犪犫狅狉犪狋狅狉狔狅犳犐狀狋犲犾犾犻犵犲狀狋犜犲犾犲犮狅犿犿狌狀犻犮犪狋犻狅狀狊犛狅犳狋狑犪狉犲犪狀犱犕狌犾狋犻犿犲犱犻犪, 犅犲犻犼犻狀犵犝狀犻狏犲狉狊犻狋狔狅犳犘狅狊狋狊犪狀犱犜犲犾犲犮狅犿犿狌狀犻犮犪狋犻狅狀狊,犅犲犻犼犻狀犵 100876)
(犛犮犺狅狅犾狅犳犆狅犿狆狌狋犲狉犛犮犻犲狀犮犲(犖犪狋犻狅狀犪犾犘犻犾狅狋犛狅犳狋狑犪狉犲犈狀犵犻狀犲犲狉犻狀犵犛犮犺狅狅犾),犅犲犻犼犻狀犵犝狀犻狏犲狉狊犻狋狔狅犳犘狅狊狋狊犪狀犱犜犲犾犲犮狅犿犿狌狀犻犮犪狋犻狅狀狊,犅犲犻犼犻狀犵 100876)
犃犫狊狋狉犪犮狋 Inrecentyears,withthedevelopmentandpopularizationoftheInternetandsmart mobiledevices,thepromotionmethodsanddeliveryplatformsofadvertisementshaveenriched. However,thetraditionaladvertisingpushcan’tmeettheneedsofusersforpersonalizedadvertising, resultinginusers’resistancetoadvertising,whichbringsgreatchallengestoadvertisingpush. Asaneffectivemeanstodealwiththesechallenges,personalizedadvertisingrecommendation systemhasbecomeoneofthehottestresearchtopicsinthefieldofpersonalizedservices.Personalized advertisingrecommendationsystemobtainsusers’interestsandpreferences,usesavarietyof personalizedadvertisingrecommendationtechnologies,providespersonalizedadvertisingforusers throughPCside,mobileterminalsandotherplatforms,andhasachievedgoodresultsinsome applicationsystems.Therefore,personalizedadvertisingrecommendationsystemcanalleviatethe influenceonuserscausedbythecontentofadvertisementsdoesnotmeettheneedsofusers,or thetimeorlocationofadvertisementsisnotappropriate.Atthesametime,personalizedadvertising recommendationsystemcaneffectivelydealwiththechallengesbroughtbyadvertisement recommendationduetothenegativeemotionsofusersandthedecreaseofadvertisingprofits,and reduceusers’resistancetoadvertisementsandenhanceuserexperience,whichnotonlymeets
《 计
算 机
学 报
》
users’personalizedneeds,butalsoconsiderstheeconomicbenefitsgeneratedbyadvertisements. Thispapersummarizestheresearchprogressofpersonalizedadvertisingrecommendationsystem. Startingfromtheintroductionofpersonalizedadvertisingrecommendation,thispaperexpounds thedifferencesbetweenthispaperandthereviewoftheexistingadvertisingrecommendation system,andleadstothewritingmotivationofthispaper.Itpointsoutthesimilaritiesanddifferences betweenpersonalizedadvertisingandnonpersonalizedadvertisingsuchasotherformsofadvertising andtraditionaladvertising,analyzesthedifferencesbetweenpersonalizedadvertisingrecommendation andotherpersonalizedrecommendation,highlightstheuniquenessofthisfield.Then,thispaper deeplyanalysesthekeytechnologiesofpersonalizedadvertisingrecommendation,includingdata acquisitionandpreprocessing,acquisitiontechniquesforexplicitandpotentialuserpreferences, collaborativefiltering,context,hybridrecommendation,clickratepredictionandotherpersonalized advertisingrecommendationtechnologies,andclassifiesthesekeytechnologiesindetail,finds theiradvantagesanddisadvantages,anddrawsthedirectionofimprovement.Subsequently,this papermakesastatisticalanalysisoftheinternaldataset,theopendatasetandthedataset capturedbysomeresearchersinpersonalizedadvertisingrecommendation.Afterthat,itsummarizes thetraditionalevaluationindicatorsandspecificevaluationindicatorscommonlyusedinadvertising recommendation,andmakesacomparativeanalysisandexplanationofsomestudiescombining withthemaindatasetsandevaluationindicators.Thenitorganizesthecurrentapplicationof personalizedadvertisingrecommendationintraditionalInternet,mobileservice,digitalsignage, IPTVandotherscenarios,andfindsoutthefuturedevelopmentdirectionofeachscenario,and sometypicalapplicationsarelistedandanalyzed.Inaddition,advertisingrecommendationneeds tobeimprovedintheaspectsofthetimelinessofadvertisingrecommendation,privacyprotection ofusers,coldstartinadvertisingrecommendation,contentsensitivityofadvertisingrecommendation, dynamicpreferenceacquisitionofusers,extensionofcontentbasedadvertisingcontextrecommendation, localizationofmobileadvertisingrecommendationsystem,andutilizationofmultisourcedata. Finally,inordertodevelopthepersonalizedadvertisingrecommendationsystem,thispaper discussesandprospectstheproblemsandthefurtherresearchinthefutureintheaboveaspectsof advertisingrecommendation.
犓犲狔狑狅狉犱狊 personalizedadvertising;recommendationsystem;userpreferenceacquisition;context recommendation;applicationdomain;datamining
1 引 言
在当今时代,互联网已经成为人们信息传递的 最迅速、最便捷、最有效的媒介.相对于传统媒体,互 联网的优势在于其有较强的交互性和生动性[1].并 且伴随着智能移动终端的兴起和普及,为广告推送 带来极大的便利.当用户浏览网页或者浏览社交 软件动态时,会出现各种形式的广告,为用户提供多 种信息,一定程度上丰富了用户的生活.但是由于每 位用户的背景差异,大范围无差别的广告投放方式 难以满足所有用户的个性化需求,因此也难以为 广告公司带来可观的经济效益.正是基于满足用户 需求和最大化广告经济效益的考虑,个性化广告推
荐系统(PersonalizedAdvertisingRecommendation system,PAR)[2]应运而生.
近年来,互联网的发展对广告行业的帮助卓有 成效,使得广告在人们生活中无处不在,在线广告变 得越来越受欢迎.中国广告市场回顾报告中指出, 2018年中国广告市场中互联网媒体所占比例增长
稳定,为7.3%
①
.IAB的报告中指出,2018年全年 美国的互联网广告收入达到1075亿美元,相比 2017年总体增长21.8%,其中2018年全年移动终 端广告收入占总体广告收入的53.8%②
.在一个成2 3
5 计 算 机 学 报 2021年
①
②
CTR:2018年中国广告市场回顾报告.http://www.199it. com/archives/831411.html
IABInternetAdvertisingRevenueReport2018FullYear Results.https://www.iab.com/wpcontent/uploads/2019/05/ FullYear2018IABInternetAdvertisingRevenueReport.pdf
《 计
算 机
学 报
》
功的广告活动中,用户和商家都会从中获益,用户会 获得满足其潜在兴趣的产品.商家会通过广告掩盖 其弱点,并强调其优势来打败竞争者[3].同时,一个 成功的广告推送,必须要满足5个合适原则,即在合 适的时间,在合适的场合,通过合适的方法,将合适的 广告展示到合适的用户面前.个性化的广告推荐根 据上述原则并结合用户的偏好和兴趣,吸引用户的 注意力[4].因此,个性化广告推荐系统对于Google、 百度等大多数专业技术公司来讲是一项内在要求.
在过去几年内,已经出现许多推荐系统相关的 综述.例如,Burke[5]对混合推荐系统进行综述,Su 等人[6]对协同过滤技术进行综述,Meng等人[7]对 移动新闻推荐技术进行综述,Zhang等人[8]对基于 深度学习的推荐系统进行综述等.虽然上述文章对 推荐系统的一些子领域及其方法技术进行较为全面 的综述,但是这类文章多具有较强的针对性和专业 性,即针对某一领域、某一技术归纳分析并进行论 述.类似文章可以为个性化广告推荐系统的综述提 供参考和帮助,但是其中的方法或技术不能完全适 应个性化广告推荐系统.具体原因如下:
一是涉及的推荐对象及数据不同.不同于其它 自然内容推荐(如新闻、电影等),个性化广告推荐系 统为用户推荐的是可能感兴趣的广告.推荐对象的 不同导致其它综述中涉及广告推荐的内容较少且不 全面,也造成了数据集的差异.例如,个性化广告推 荐系统借助广告领域相关数据开展研究,新闻推荐 则借助新闻相关数据进行研究,而且在对不同推荐 对象的研究中对数据的利用方式和程度也不同.
二是研究的方法、技术的覆盖面不同.许多综述 文章针对某一特定推荐方法、技术进行总结论述,例 如协同过滤等.而个性化广告推荐系统中涵盖上下 文推荐、混合推荐等多种方法、技术,并且拥有点击 率、转化率等专用评价指标.
三是存在的问题和未来研究方向不同.相对于 其它推荐对象,广告具有规模大、传播广、更新快、易 交互等特性,因此广告推荐在应用中面临着时效性、 隐私保护、冷启动、用户偏好变化等方面的挑战.为 应对广告推荐领域的这些挑战,可以从获取用户动 态偏好、扩展上下文推荐技术、发展移动广告推荐系 统、利用多源数据等方面进行研究.
在个性化广告推荐领域已经存在大量研究,许 多研究希望通过个性化广告推荐系统解决实际问 题,并尝试使该领域能够形成体系.然而,近10年内
缺少对该领域进行系统研究并全面总结该领域研究 进展的综述文章.并且很少有人对该领域当前的研 究方法、技术进行深入分析并指出该领域的应用现 状和存在的问题.根据调研,目前只有2个相关的简 短综述文章[1,9]正式出版,Zhang[1]针对网络广告的 个性化进行简单总结,并将推荐技术分为:基于内 容、协同过滤、基于人口统计、基于效用、基于知识的 推荐.Li[9]分析基于用户偏好的网络广告中的重要 技术,并将个性化推荐技术分为:基于内容、协同过 滤、基于知识和基于情景感知的推荐.但是这两篇文 章中介绍的技术相对久远,技术分类方法比较传统 且没有涉及到新兴的研究,对广告推荐中存在的问 题和未来的研究方向没有深入讨论.随着新的研究 工作不断出现,上述推荐分类方法不再适用.因此, 需要一个更新的具有包容性的框架帮助理解该领 域.本文从多种角度对个性化广告推荐领域中的关 键技术、应用现状进行全面总结,并通过对比分析, 指出当前限制个性化广告推荐系统发展的问题,点 明该研究领域未来的研究方向.鉴于个性化广告推 荐系统不断发展和普及的趋势,对其进行系统综述 将更加具有理论和实践意义.
通过个性化广告推荐系统,广告由原来的大范 围投放转变为个性化推荐.个性化广告推荐的最终 目的,就是削弱用户对广告的反感态度,同时增大广 告商经济效益,使广告的投放更具针对性[10].本文 对个性化广告推荐系统及其应用研究进行综述,文 章结构如图1所示.
图1 个性化广告推荐系统及其应用研究综述框架 3 3 3期 张玉洁等:个性化广告推荐系统及其应用研究 5
《 计
算 机
学 报
》
本文结构上主要分为4个部分.本文第2节为 个性化广告推荐系统概述,主要概括个性化广告推 荐的现状、常用技术及应用以及分析个性化广告与 非个性化广告之间的异同点,分析个性化广告推荐 与其它个性化推荐的区别;第3节重点介绍个性化 广告推荐的关键技术,包括用户偏好获取、个性化广 告推荐技术,以及个性化广告推荐的效用评价,包括 介绍部分个性化广告数据集以及评价指标;第4节 对个性化广告推荐的应用领域以及代表应用进行总 结分析;第5节对当前存在的问题和未来研究方向 进行讨论和展望;最后是结束语.
2 个性化广告推荐系统概述
21 个性化广告推荐
个性化广告推荐系统是推荐系统典型应用之 一,是当前互联网广告的重要表现形式,众多电子商 务网站利用个性化广告推广自己的产品.在这方面, Alibaba、Amazon等公司将数据挖掘与程序算法发 展到一个新的高度,其通过算法挖掘用户的历史数 据和比较用户的消费偏好,预测和推荐用户可能感 兴趣并触发购买行为的商品.
所谓个性化广告推荐系统,大的方面来讲是利 用技术手段进行广告交易和管理的一种广告形态. 小的方面来讲,是利用算法和技术精准地确定目标 受众,为正确的用户做出广告推荐,是一种有效提取 网络有用信息的方法[11].个性化广告推荐系统能够 有效利用用户行为记录[12]、点击[13]、评分[11]等信 息,预测每位用户对各种商品的可能需求和偏好,并 结合用户的位置[14]、时间[15]上下文等信息,利用个 性化广告推荐技术为用户推荐其最有可能浏览的广 告,以实现广告投放产生效益的最大化的目标.
早期的广告推荐系统的推荐技术过于单一,主 要通过比较用户相似度的方式实现推荐的协同过滤 技术[10].同时这些技术的应用过程中存在着如冷启 动[1617]、用户反馈矩阵稀疏[18]、维度过高[19]等问 题.因此不足以满足用户之间需求和偏好的差异,然 而对广告精准投放的需求依旧是互联网广告不断演 进的根本动力.为了解决这些问题,近年来个性化广 告推荐系统中采用多种关键技术,例如用户偏好获 取技术[3,20]、个性化广告推荐技术[2123]等.这些新的 技术从一定程度上解决了上文提到的个性化广告推 荐的现实问题,并分别在各自的对比测试中展现出 良好的推荐效果,反映出个性化广告推荐的良好发 展现状和其积极的未来发展趋势.
最终将这些关键技术应用于传统互联网[2425]、 移动服务[2627]、数字标牌[2829]和IPTV[3031]广告推 荐当中,提高广告推荐的个性化程度,满足用户需 求,同时增加广告盈利.
22 个性化广告与非个性化广告之间的异同点 通过判断广告是否根据用户偏好精准投放,将 广告分为个性化广告与非个性化广告.为阐述二者 的异同点,先对搜索广告、展示广告与个性化广告进 行比较,随后将传统广告推送与个性化广告推荐进 行对比.
首先,个性化广告与搜索广告、展示广告等其它 形式的广告有着明显不同.搜索广告是竞价广告中 最典型的系统之一,与一般网络广告的区别在于其 注重上下文信息,并且用户标签的作用受到很大限 制,一般不考虑用户的影响,用户在查询过程的实时 输入为上下文信息,其重点在于查询扩展[32].展示 广告是按照展示次数计费的视觉广告形式,一般投 放在第三方网站,展示广告是基于用户行为和人口 统计等因素[33],以个人或群体为目标.表1中通过 几个评测标准对搜索广告、展示广告和个性化广告 进行对比.
表1 个性化广告与其它广告形式的对比 搜索广告 展示广告 个性化广告 检索规模 可达千万级 可达百万级 可达亿级 驱动原则 利润驱动 利润驱动 用户兴趣驱动 达成目标 提高广告质量 提高广告质量 多样化、新颖化 个性化需求 需求较少 需求较大 需求较大
除了上述对比内容外,搜索广告、展示广告与个 性化广告之间有一定的联系.例如,广告在某种意义 上接近用户查询[16],搜索广告中查询的重要性极 高,粒度非常细,因此需要进行查询扩展,以获得更 多的匹配结果.而查询扩展的技术又包含个性化广 告中的技术,例如基于协同过滤[34]等方法.展示广 告需要满足用户的需求,对用户行为进行分析,利用 基于人口统计学的方法进行推荐.所以,为了使得广 告能够满足用户的真正需求,并符合用户兴趣和个 性化行为习惯,借助个性化广告推荐的相关技术是 不错的选择.
其次,传统广告通常指的是没有涉及到个性化 精准推荐的广告,通过竞价等传统方式对广告进行 推送,与个性化广告推荐不同.此外,推荐也属于一 种推送,不同的是,推荐常与个性化联系起来,推送 过程中常常不以个性化为主要目标.目前,广告的投 放模式从传统粗放型的广告广播模式向集约型的精 准传播模式转变.这里通过RTB(RealTimeBidding)
4 3
5 计 算 机 学 报 2021年
《 计
算 机
学 报
》
实时竞价广告为例,如图2、图3,对传统广告推送和 个性化广告推荐的异同进行说明.
图2 传统网络广告系统
图3 基于用户兴趣的网络广告推荐系统
图2展示的是传统RTB广告系统,当用户访问 具有广告空间的网站时,供应方平台SSP(SellSide Platform)发送竞价请求,需求方平台DSP(Demand SidePlatform)分析从SSP发来的请求,根据用户历
史判断是否要显示广告.随后通过DSP之间的竞价 拍卖,将竞价结果返回到SSP,并将胜出DSP中广 告进行分配.如图2中DSP1、DSP2、DSP3分别出价 50、100、150,DSP4不参与竞价,出价最高的DSP3
胜出,SSP将DSP3的广告分配到具有广告空间的 网站.
图3展示的是基于用户兴趣的网络广告推荐系 统,图3与图2相比,主要不同在于DSP中存在广 告推荐系统及其决策模块.该决策模块根据用户浏 览历史关键字(假如为手机)确定用户兴趣,判断用
户浏览历史关键字与目标网址内容的关键字是否相 同,若网址关键字也为手机,则申请目标网址广告并 将满足用户兴趣的广告推荐给用户.
综上所述,个性化广告推荐为广告主和媒体带 来营销效率和效果的双方面的提升.同时,个性化广 告推荐又更加贴合每个用户的需求,因此易提升用 户体验.
23 个性化广告推荐与其它个性化推荐的区别 用户利用互联网进行的活动多种多样,主要包 括接收推广(广告、推送等)、时事(新闻、比赛等)、交 流(微信、QQ等社交网络)、购物(Taobao、Amazon 等)、娱乐(音乐、电影、游戏)、出行、应用程序下载等. 针对用户不同的活动,能够产生对应领域的推荐系 统,例如表2中列举的广告推荐系统、新闻推荐系统、 购物推荐系统、音乐推荐系统、兴趣点推荐等,表2还 对列举推荐系统应用的推荐方法进行简单说明.
表2 一些典型的推荐系统
推荐领域 典型系统 推荐方法 广告推荐 SARSIS[22] 混合推荐 新闻推荐 DRN[3536] 深度学习、混合推荐 购物推荐 ConTagNet[37] 上下文推荐 音乐推荐 CoFoSIM[38] 协同过滤 兴趣点推荐 VPOI[39] 深度学习
虽然广告推荐与一些自然内容推荐均追求推荐 结果的准确,提高用户的满意程度,但是广告推荐与 不同推荐之间仍有不同的侧重点,导致存在一定的 区别.例如,在新闻推荐中需特别关注推荐结果的时 效性,因为新鲜感是新闻存在的价值之一.但是在广 告推荐中不存在这样的禁忌,尤其是对于目前快节 奏的视听媒体而言,广告的多次出现能够引起消费 者注意,加深印象.且两者之间的时效性不同,新闻 推荐的时效性多侧重于内容的新颖,广告推荐的时 效性多侧重于对用户响应的及时性、准确性.购物推 荐与广告推荐类似,均是以期达到收益目的的信息 传播活动,二者最主要的不同在于,购物推荐的应用 多局限于购物平台,而广告推荐可以不受平台的局 限.因此,当消费者浏览其它类型的平台时,购物推 荐就无能为力,但是广告推荐可以跨不同平台为消 费者展示可能感兴趣的商品.同理,音乐推荐也受到 平台的限制.兴趣点推荐多考虑用户位置的变化,推 荐的内容也与位置相关,其与广告推荐最大的区别 在于数据的获取方式.兴趣点推荐的数据集是用户 亲自访问现实中某一地点并留下的签到记录,而广 告推荐的数据则多为用户与广告的线上交互记录, 拥有各自的交互场景.广告推荐与其它自然内容推
5 3 3期 张玉洁等:个性化广告推荐系统及其应用研究 5
《 计
算 机
学 报
》
荐之间的区别体现了个性化广告推荐系统与其它领 域的个性化推荐系统之间的差异性.
由于互联网上的广告本身具有数量巨大、交互 性强、更新灵活以及传播高效等特点,个性化广告推 荐系统与其它领域的个性化推荐系统之间的差异性 除了推荐对象的不同外,还主要表现在这几个方面: 偏好获取来源的灵活性、推荐技术的全面性、应用场 景的多样性.
(1)偏好获取来源的灵活性
用户偏好获取是推荐过程中非常关键的一步. 其它推荐领域的偏好获取来源通常相对固定.例如, 电影推荐中通常根据用户对电影的评分等,新闻推 荐通常根据用户浏览的内容信息,兴趣点推荐根据 用户的签到记录等.相对于其它推荐领域,个性化广 告推荐领域中的用户偏好获取来源非常灵活.可以 通过用户的评论、评分、点击、浏览记录、应用安装使 用情况、IP地址、社交网络等信息,以及将不同信息 之间的组合作为偏好获取来源,甚至通过使用其它 领域的数据完善用户偏好.
(2)推荐技术的全面性
个性化广告推荐中涉及到多种方面的推荐技 术.这些技术既包括传统的协同过滤、基于内容的推 荐技术,又包含较新的多种上下文推荐技术、混合推 荐技术、点击率预测技术及其它技术.其中点击率预 测技术对于广告推荐来讲是一个非常特殊的技术. 点击率一方面作为评价指标,另一方面又作为预测 结果,这属于广告推荐领域的特色之一.不同于对电 影推荐和音乐推荐等,广告的种类多种多样,例如视
频广告、音频广告、文本广告等.不仅仅需要对文本 内容进行处理,还需要对视频、音频等内容进行处 理,需要多方面的技术加以实现.
(3)应用场景的多样性
个性化广告推荐系统与其它领域的个性化推荐 系统相比最大的不同在于其应用场景的多样性.其 它领域的推荐系统,比如新闻推荐系统或者音乐推 荐系统等,通常在可以支持浏览新闻或听音乐的设 备中,使用特定的新闻或者音乐应用平台实现推荐, 经常在传播途径或平台上受到限制.而广告推荐系 统突破传播途径的限制,可以在PC、移动端、IPTV 等多终端使用.还突破了领域和平台的限制,例如在 新闻、音乐等应用平台中推荐广告,广告推荐与新 闻、音乐推荐在同一应用平台中并不冲突.应用场景 的多样性使得人们感觉广告无处不在.
3 个性化广告推荐的关键技术
个性化广告根据特定的用户和特定的场景,通 过个性化算法或技术确定与之匹配的广告,并实现 个性化创意、制作和精准化投放、传播以及人性化互 动的广告业态.通过算法集合自动寻找广告、情景与 用户三者之间的最佳匹配是个性化推荐的主要目 的,而在实现该目标的过程中,个性化推荐技术和广 告相关数据无疑是两个重要的推动因素.而数据的 挖掘和处理能力则成为个性化广告区别于传统广告 的核心能力.目前通用的个性化广告推荐整体框架 如图4所示.
图4 个性化广告推荐整体框架 6
3
5 计 算 机 学 报 2021年
《 计
算 机
学 报
》
在图4中,根据服务对象的不同,分为客户端与 服务端.根据功能模块的不同分为输出模块、输入模 块和个性化推荐模块.输出模块属于客户端,由广告 展示设备和目标用户组成,一方面通过广告展示设 备将目标用户信息、行为历史等交互内容记录并输 出到服务端的输入模块中,在RTB广告中通常通过 竞价请求的方式将上述信息传递到推荐模块中[40]. 另一方面将推荐生成的广告展示给用户并生成用户 反馈.输入模块属于服务端,负责接收输出模块传来 的信息和从广告源采集的广告数据等相关信息,其 主要功能是将这些信息输入到个性化推荐模块.整 个框架最关键的部分在于个性化推荐模块,通过对 输入模块传来的目标用户相关信息进行提取并预处 理,将处理好的数据输入个性化推荐模块.然后利用 用户偏好获取技术得到用户的显性偏好或者潜在偏 好.随后结合用户偏好,利用协同过滤、上下文推荐、 混合推荐、点击率预测、深度学习及其它技术,生成 推荐方法或模型,这部分是个性化广告推荐的核心 部分.接着,将推荐方法结合输入模块传来的广告数 据,生成广告推荐器.最后,广告推荐器为目标用户 推送产生的推荐广告,并通过目标用户对被推荐广 告的效用评价反馈,达到衡量广告推荐器性能并对 广告推荐器进行优化调整的目的.本节根据上述流 程,重点对数据采集与预处理、用户偏好获取技术、 个性化广告推荐技术以及个性化广告推荐效用评价 进行分析总结:
(1)数据采集与预处理.该部分主要对应图4 中的“广告采集”、“记录并传递”、“提取、预处理”过 程,说明广告数据和用户数据的主要来源,并指出原 始数据中存在数据噪声、数据缺失等情况.随后,为 减小上述情况的影响,需要对数据进行浅层和深层 预处理.
(2)用户偏好获取技术.该部分根据用户信息、 评分信息得到用户显性偏好[11].根据行为信息,包 括对广告的点击、浏览以及应用使用情况等,获取用 户潜在偏好[3].在用户潜在偏好中又可以通过构建 用户画像[41],或对用户进行建模[40],达到获取用户 兴趣以及对用户偏好进行预测的目的.
(3)个性化广告推荐技术.利用传统的协同过 滤推荐技术[4243];利用广告关键词[4445]、内容[46]、分 类[4748]等信息的基于上下文的推荐技术;将多种推 荐技术按照一定组合方式进行混合的混合推荐技 术[4950];广告点击率预测[23,51];其它推荐技术等.其中 又包括一些深度学习相关方法,例如卷积神经网络
(ConvolutionalNeuralNetworks,CNN)[52]、循环
神经网络(RecurrentNeuralNetwork,RNN)[53]等.
(4)个性化广告推荐效用评价.对不同来源的 广告推荐数据集进行整理,并对个性化广告推荐中 常用的传统评价指标和专用评价指标进行汇总,举 例评估个性化广告推荐的性能.
31 数据采集与预处理
个性化广告推荐系统整个过程从数据采集开 始,需要采集的相关数据主要包括用户基本信息、广 告数据、时间位置等上下文信息、用户评论等交互行 为信息、用户浏览历史等信息.其中用户基本信息主 要来自用户注册以及相关平台系统中的信息完善功 能.广告数据可以通过一些公司机构公开的数据集 获取,也可以通过自行抓取的方式获取,但是多数研 究中的数据集并没有公开或者使用的是内部数据. 时间位置等上下文信息由设备时间、GPS等获取.
用户评论等交互信息以及用户浏览历史等需要从系 统的cookies等相关日志中获取[40].
上述数据采集阶段获取的数据可能存在数据噪 声、数据缺失等情况,对用户偏好获取以及后续的推 荐过程的效果产生影响.因此,为了规范化个性化广 告推荐系统的输入数据,需要进一步对获取的数据 进行预处理,例如计算、量化等[7].根据数据处理的 复杂程度和处理结果的直观程度,分为浅层处理和 深层处理.浅层处理多利用用户直观数据,通过相对 简单的标准和方法,得到量化程度较高的结果.例 如,根据用户对项目的行为模式(搜索、浏览等),对 用户的兴趣进行等级化(1~5级)表示[22],或者自行 规定对项目的评分[12],缓解数据缺失影响;对用户 浏览历史进行分布式表示,进而得到用户的向量表 示[40];通过与设定的阈值进行比较,达到筛选数据 噪声的目的[24];为不同的时间段设置不同的量化值 进行区分,例如将工作日和休息日赋予不同的值进 行表示;将数据集中的旧状态整合为单个历史状态, 保留有限数量的最新状态[54]等.另外,为了能够对 研究成果有一个全面的评价,可以改变数据集的划 分标准,例如修改用于筛选数据集的阈值,或者修改 训练集与测试集的划分比例等.
上述内容通过对浅层方式进行数据处理或扩 展,对推荐过程的帮助有限,难以应对复杂场景,需 要考虑对数据进行深度处理.而深层处理多针对用 户复杂数据,利用相关挖掘或获取技术,得到潜在的 可扩展的数据特征或表示等.例如,使用主题获取或 挖掘技术,将用户历史发文、转发等行为映射到潜在 主题空间当中,帮助获取用户偏好[55];根据点击等 行为数据和广告信息,参数化潜在空间[56];通过用
7 3 3期 张玉洁等:个性化广告推荐系统及其应用研究 5