书 书 书
第44卷 第8期
2021年8月 计 算 机 学 报
CHINESEJOURNALOFCOMPUTERS Vol.A44Nug.2o0.281
收稿日期:20200520;在线发布日期:20210122.本课题得到浙江省自然科学基金项目(LQ20F020014)、浙江省重点研发计划项目
(2018C01080)、国家自然科学基金项目(61472366,61379077)资助.王丽萍,博士,教授,中国计算机学会(CCF)会员,主要研究领域为计 算智能、决策优化.Email:wlp@zjut.edu.cn.任 宇,硕士研究生,主要研究方向为计算智能、决策优化.邱启仓,硕士,主要研究方向为 智能控制.邱飞岳(通信作者),博士,教授,主要研究领域为智能控制、深度学习.Email:qfy@zjut.edu.cn.
多目标进化算法性能评价指标研究综述
王丽萍
1) 1)任 宇
1)邱启仓
2)邱飞岳
3)(浙江工业大学计算机科学与技术学院 杭州 310023)
2)(之江实验室 杭州 311121)
3)(浙江工业大学教育科学与技术学院 杭州 310023)
摘 要 多目标进化算法根据性能评价指标衡量其优劣,主要从算法所求解集的质量、算法求解效率以及算法鲁 棒性三方面来评价,并侧重于解集的质量,现有的相关工作缺乏对评价指标数学性质的分析.本文将评价指标按性 能标准分为四类:计数指标、收敛性指标、多样性指标、综合性指标,其中计数指标统计符合指标要求的解个数或比 例,收敛性指标衡量解集与参考集的贴近程度,多样性指标衡量解集分布的均匀程度与求解极端值的能力,并按性 质类型分为分布性指标、延展性指标和同时衡量前两者的指标,综合性指标同时衡量收敛性和多样性,并按适用范 围分为通用指标和专用指标.本文对比分析了77种指标的参考集、比较函数以及时间复杂度,并从高维目标适应 性、离群点敏感性、参考集合理性、指标值最优性四个方面对部分指标进行了分析,为研究者们选择合适的指标提 供方法,以应对不同环境下的复杂问题.最后展望了多目标进化算法性能评价有待进一步研究的方向.
关键词 多目标优化;进化算法;评价指标;收敛性;多样性
中图法分类号TP391 犇犗犐号10.11897/SP.J.1016.2021.01590
犛 狌 狉 狏 犲 狔 狅 狀 犘 犲 狉 犳 狅 狉 犿 犪 狀 犮 犲 犐 狀 犱 犻 犮 犪 狋 狅 狉 狊 犳 狅 狉 犕 狌 犾 狋 犻 犗 犫 犼 犲 犮 狋 犻 狏 犲 犈 狏 狅 犾 狌 狋 犻 狅 狀 犪 狉 狔 犃 犾 犵 狅 狉 犻 狋 犺 犿 狊
WANGLiPing1) RENYu1) QIUQiCang2) QIUFeiYue3)
1)(犆狅犾犾犲犵犲狅犳犆狅犿狆狌狋犲狉犛犮犻犲狀犮犲犪狀犱犜犲犮犺狀狅犾狅犵狔,犣犺犲犼犻犪狀犵犝狀犻狏犲狉狊犻狋狔狅犳犜犲犮犺狀狅犾狅犵狔,犎犪狀犵狕犺狅狌 310023)
2)(犣犺犲犼犻犪狀犵犔犪犫,犎犪狀犵狕犺狅狌 311121)
3)(犆狅犾犾犲犵犲狅犳犈犱狌犮犪狋犻狅狀,犣犺犲犼犻犪狀犵犝狀犻狏犲狉狊犻狋狔狅犳犜犲犮犺狀狅犾狅犵狔,犎犪狀犵狕犺狅狌 310023)
犃犫狊狋狉犪犮狋 Theperformanceofmultiobjectivealgorithmsisevaluatedbyindicators,whichmainly takethreeaspectsintoconsideringandfocusesonthefirstaspect:thequalityofthesolutionset obtainedbythealgorithms,theefficiencyofthealgorithms,andtherobustnessofthe algorithms.Existingrelatedworklacksmathematicalanalysisforindicators.Inthispaper,we categorizetheindicatorsintofourgroupsbasedonperformancecriteria:countingindicators, convergenceindicators,diversityindicators,andcomprehensiveindicators.Thecountingindicators tallytheamountortheratioofnondominatedsolutionsorelitesolutionsthatsatisfythecriterion ofthemetrics,therearetwomaindifferencesofcountingindictorsandnoncountingindicators, oneiswhethertherangeofindicatorsisdiscrete,theotheriswhetherthevaluesofallobjectives areonlyusedforcomparisonbutnotdirectlyparticipateinthecalculation.Theconvergenceindicators evaluatetheconvergencyofthesolutionsetmainlybycalculatingthedistanceofthesolutionset totheapproximationofParetoFrontorthereferenceset,univariateconvergenceindicators evaluatetheclosenessbetweenthesolutionsetandParetoFront,andbinaryconvergencemetrics evaluatetheclosenessbetweentwodifferentsolutionsets.Accordingtoproperty,thediversity
《 计
算
机
学
报
》
indicatorsarefurtherdividedintodistributionindicators,spreadindicators,andindicatorsmeasuring bothdistributionsandspread,thedistributionofthesolutionsetconsiderstheuniformityinthe objectivespace,andthespreadofthesolutionsetmeasuresthecapabilitytoobtainextreme solutions.Thecomprehensiveindicatorsevaluatetheconvergenceandthediversityofthesolution setatthesametime,whicharefurtherdividedintogeneralindicatorsandspecialindicatorsby scopeofapplication,what’smore,specialindicatorsincludethatusedforuserbasedevolutionary algorithms,dynamicevolutionalgorithms,andmultimodalevolutionaryalgorithms.Wealso illustratethereferenceset,thecomparisonfunction,andthetimecomplexityof77indicators.
Specifically,thereferencesetisusedtoassistinthecalculationoftheperformanceindicators value,thecomparisonfunctioncantellresearcherswhetherthevalueofindicatorsbiggerisbetter orsmaller,andthetimecomplexityreflectsthedifficultytocalculatetheindicators.Thenwe analyzesomeindicatorsfromfouraspects:(1)manyobjectiveadaptability,whethertheindicators areapplicativeinhighdimensionalobjectivespace,(2)outliersensitivity,assessingwhetherthe valuesoftheindicatorsareaffectedbadlybyoutliers,(3)referencesetrationality,discussingthe reasonablerangeofvaluesforthereferencesite,(4)valueoptimality,somemathematicalwork fortheoptimalvaluetheindicatorscanreach.Throughtheseanalyses,weofferapproachesfor researcherstochoosetherightindicatorstodealwithcomplexproblemsunderdifferentcircumstances.
Finally,weendupwithdiscussingsomedirectionsaboutperformanceindicatorsthatshow potentialfromninedifferentaspects:comprehensiveindicatorswithoutanypriorinformation,a newtypeofmultivariateindicatorsforevaluatingtheperformanceofmultitaskingoptimization, indicatorsusedformanyobjectiveevolutionaryalgorithms,performancemeasurementinlargescale optimization,theevaluationoftherobustnessofalgorithms,novelindicatorsusedforuserbased, dynamicandmultimodalevolutionaryalgorithmstoovercomethedeficiencyoftheexistingindicators, andlastbutnotleast,researchonthemathematicalpropertiesofperformanceindicators.
犓犲狔狑狅狉犱狊 multiobjectiveoptimization;evolutionaryalgorithms;performanceindicators; convergence;diversity
1 引 言
多目标优化问题(MultiobjectiveOptimization Problems,MOPs)是指同时优化多个目标的问题,这
些目标相互矛盾,一个目标性能的提升意味着另一个 或多个目标性能的下降.近几十年来,研究者们提出 了许多求解MOPs的方法,其中主要方法是多目标进 化算法[13](MultiobjectiveEvolutionaryAlgorithms, MOEAs),这是一类基于种群的启发式搜索方法,模 拟了生物的选择与进化过程,采用随机搜索的策略, 无需知道MOPs的先验性知识即可进行求解,代表 性的MOEAs有:(1)基于支配关系的NSGAII[4]
(NondominatedSortingGeneticAlgorithmII)、 SPEA2[5](StrengthParetoEvolutionaryAlgorithm2) 以及PESAII[6](ParetoEnvelopbasedSelection AlgorithmII);(2)基于分解的MOEA/D[7](Multi
objectiveEvolutionaryBasedonDecomposition)、 MOEA/DM2M[8](DecompositionofaMultiobjective NumberofSimpleMultiobjectiveSubproblems)以及 RVEA[9](ReferenceVectorguidedEvolutionary Algorithms);(3)基于性能评价指标的IBEA[10]
(IndicatorBasedEvolutionaryAlgorithm)、SMS EMOA[11](SMetricSelectionbasedEvolutionary MultiobjectiveAlgorithm)以及HypE[12](Hyper volumebasedEvolutionaryalgorithm).这些算法在
众多实际领域中均有应用,如物流工程[13]、能源与 动力工程[14]、自动化控制[15]等.
为了更好地选择算法求解不同类型的MOPs, 如何衡量这些不同MOEAs的性能成为了一大热门 课题,但是求解MOPs不同于求解单目标优化问题
(SingleobjectiveOptimizationProblem,SOP),后 者只需寻找出所求得解集中的最小值或是最大值即 可来比较算法性能优劣,而前者由于多个目标之间的
1 9 5 8期 王丽萍等:多目标进化算法性能评价指标研究综述 1
《 计
算
机
学
报
》
矛盾性,所得最优解并非单个解,而是由一组非支配 解构成的集合,以最小化MOPs为例,如算法求得一 组解犛1={(0.1,0.9),(0.4,0.6),(0.9,0.1)},另 一算法求得犛2={(0.2,0.8),(0.6,0.4),(0.8, 0.2)},此时无法通过直接比较两组解集来判断算法
性能优劣,所以设计一种适用于MOPs的性能评价 指标变得十分重要.
比较不同MOEAs的性能优劣可以考虑以下三 个方面[16]:算法所求解集的质量、算法的求解效率 以及算法的鲁棒性.
(1)MOEAs所求解集的质量,主要衡量解集 的非支配解数量、收敛性(Convergence)和多样性
(Diversity).收敛性衡量的是算法所求得的Pareto 近似最优解集犛到真实Pareto前沿[17]的贴近程 度;多样性衡量的是解集犛的分布性与延展性[18]
(DistributionandSpread).
(2)MOEAs的求解效率,包括分析算法的时间 复杂度,统计算法运行的实际时间开销,以及评估 评价指标的数值与迭代次数的关系.当多种不同算 法所求解集质量相近时,比较算法的求解效率会更 有意义.此外,算法的求解效率在动态相关的实际问 题[1921]中较为关注.
(3)MOEAs的鲁棒性,算法的强鲁棒性是指对 更多具有不同特征的问题具有良好的求解能力,对于 算法参数以及随机的初始种群具有较低的敏感性,并 且算法所求得解集比较稳定.针对某一MOEAs进 行多次独立的实验,其鲁棒性可以从评价指标的方 差得到体现.
MOEAs的评价指标主要通过衡量解集的质量 来比较其性能优劣.不少学者针对MOEAs所求得 解集质量的某一或某些性能进行了相关研究,提出 了一系列的评价指标.
VanVeldhuizen等人[22]提出了一系列用于统计 非支配解的数量或是比例的计数指标,这些指标并 未考虑真实Pareto前沿的信息,故VanVeldhuizen 等人[23]提出了错误率(ErrorRatio,ER),与Pareto 近似前沿犘(ApproximationofParetoFront)的 信息进行了交互.Zitzler等人[24]提出了覆盖率
(Coverage,C),用于比较两个解集之间的相互关系 而非衡量解集与真实Pareto前沿的关系,适用于真 实Pareto前沿信息未知的情况下算法性能的比较.
VanVeldhuizen等人[25]提出了经典的收敛性 指标世代距离(GenerationalDistance,GD),GD计
算的是解到相距最近参考点的平均距离,其中参考 集由真实Pareto前沿均匀采样而得.类似地有收敛 性指标γ[26](theConvergenceMetric)和犕1[27],它 们与GD的区别在于计算的距离类型不同.Schott 提出了收敛性指标七点平均距离[28](SevenPoints AverageDistance,SPAD),Schott认为在实际问题
中难以获取真实Pareto前沿的准确信息,故用参考 集犚取代了Pareto近似前沿犘来对解集的收敛性 进行评价.
Deb等人[26]提出了多样性指标Δ′,计算的是连 续解之间的距离与其平均值之差,Schott[28]提出了 类似的多样性指标空间指标(Spacing,SP),计算的 是相距最近的两个解与其平均值之差的平方,但Δ′ 与SP均只针对解集的分布性而未考虑延展性,故 Deb等人[4]提出了多样性指标Δ,Δ在Δ′的基础上 将Pareto前沿边界点对算法性能的影响纳入考虑, 因此能够同时衡量解集的分布性与延展性,但Δ只 在2维的MOPs中适用,为了应对更高维度的目标 空间,Zhou等人[29]提出了多样性指标Δ,计算的是 在某一目标上相距最近的解与边界点的距离.
CoelloCoello等人[30]提出了综合性指标反世 代距离(InvertedGenerationalDistance,IGD),IGD 计算的是参考点到相距最近的解的平均距离,距 离所有解都较远的参考点具有较大的IGD值,因 此在反映解集收敛性的同时也能反映解集的多样 性.Schutze等人[31]则结合了GD与IGD提出了综 合性指标Δ狆,修改GD与IGD为GD狆与IGD狆以减 弱解集犛中解的数量对指标值的影响,Δ狆计算的是 GD狆与IGD狆之间的豪斯多夫距离[32](Hausdorff Distance).Zitzler等人[33]提出了著名的综合性指标
超体积指标(Hypervolume,HV),计算的是由所有 非支配解与最低点(NadirPoint)构成的超立方体的 超体积之和.
上述综合性指标能够很好地反映MOEAs求解 静态非多模态的全局MOPs时所得解集的质量,但 是对于偏好多目标优化问题[34](PreferenceBased MOPs,PMOPs),动态多目标优化问题[35](Dynamic MOPs,DMOPs)以及多模态多目标优化问题[36]
(MultimodalMOPs,MMOPs),这些综合性指标均 不再适用.这是因为在PMOPs中只需求解决策者 感兴趣的局部解,解集的质量与全局解的多样性存 在矛盾[37];DMOPs不再是静态的多目标优化问题, 上述综合性指标均难以应对Pareto前沿的动态变
2 9 5
1 计 算 机 学 报 2021年
《 计
算
机
学
报
》
化[38];求解MMOEAs时不仅需要在目标空间中求 得优质解集,更要在决策空间中求得最佳分布[39].
针对PMOPs,Wickramasinghe等人[40]提出了综 合性指标HVUM(HVforUserpreferenceEMO Algorithms),通过人为划定偏好区域(Regionof Interest,ROI)以计算区域内的HV值.Mohammadi 等人[41]针对HVUM受参考点影响较大的问题提 出了基于复合Pareto前沿(CompositeFront,CF) 的综合性指标IGDCF,通过合成Pareto前沿来代 替真实Pareto前沿以评估落在局部Pareto前沿上 的解集质量.喻果[42]则提出了无需人为划定偏好区 域的综合性指标PMDA.
针对DMOEAs,Zhou等人[43]提出了综合性指 标平均反世代距离(MeanIGD,MIGD),将基于代 数的时间变量狋纳入了评价指标的计算.类似地有 综合性指标平均超体积[44](MeanHV,MHV).Zou 等人[45]则提出了综合性指标平均超体积差异
(MeanHVD,MHVD).
针对MMOEAs,Zhou等人[46]提出了新的反世 代距离IGDX,计算的是决策空间中的IGD值.Yue 等人[47]提出了综合性指标Pareto集合逼近(Pareto SetProximity,PSP),计算的是决策空间中的覆盖
率比率(CoverRate,CR)与IGDX的比值,CR[47]由 多样性指标最大延展度[48](MaximumSpread,MS) 改进而得.
随着评价指标的不断提出,一些关于评价指标 的综述也相继发表.如Knowles等人[49]根据解集的 优胜关系对评价指标进行分析与比较.Zitzler等 人[50]分析了不用类型评价指标的限制,并使用数学 框架对评价指标进行了分类.Yen等人[51]通过双重 淘汰锦标赛选择组合评价指标,以集成的方式评价 MOEAs.Okabe等人[52]将评价指标分类为计数、距 离、体积、分布性和延展性指标.Laszczyk等人[53]在 Okabe等人[52]的分类基础上又新增了支配、目标 值、密度、统计、分区这5个类别,并试图统一评价指 标的命名方式.Jiang等人[18]将评价指标分为了计 数、收敛性、多样性和综合性指标,并研究了部分具 有代表性的评价指标在不同凹凸性的Pareto前沿 上的一致性与矛盾性.Li等人[54]和本文延用了 Jiang等人[18]的分类标准,文献[54]中将多样性中 的分布性命名为均匀性,本文则增加了针对特定问 题的综合性指标.文献[50,55]分别在文中提出了新 的评价指标.上述这些文献在某些方面缺乏对指标
的数学性质探讨.
本文的贡献主要如下:(1)对具有代表性的 MOEAs评价指标进行了整理与归纳,给出了它们 的参考集、比较函数与时间复杂度;(2)从高维目标 适应性、离群点敏感性、参考集合理性、指标值最优 性四个方面对部分指标进行了分析与比较;(3)提 出了一些关于评价指标的性质与定理,并对文中涉 及的所有定理进行了数学证明.
本文第1节引言部分简要介绍MOEAs评价指 标的研究现状;第2节背景详细介绍多目标优化的 相关概念;第3节着重介绍各个指标的相关概念与 计算方式,根据计数、收敛性、多样性、综合性这四种 类型划分评价指标,并探讨它们的优势与不足;第4 节选取一些具有代表性的指标,分析目标维度、离群 点、参考集、指标值四个方面对这些评价指标的影 响,给出并证明一些关于评价指标的定理;第5节结 语,提出MOEAs评价指标有待进一步研究的方向.
2 多目标优化相关概念
不失一般性地以最小化MOPs为例,定义MOPs 的相关概念如下:
定义1. 多目标优化问题.对于一个具有狀维 决策变量,犿(犿2)维目标的MOPs,其数学模 型[16]的定义为
min犉(狓)=(犳1(狓),犳2(狓),…,犳犿(狓))T 犌犻(狓)0,犻∈{1,2,…,狆}
犎犼(狓)=0,犻∈{1,2,…,狇 烅烄
烆 } (1) 其中,狓=(狓1,狓2,…,狓狀)∈Ω,狓为决策变量,Ω为 决策空间,Ω=犻
∏
狀=1[犔犻,犝犻],犔犻和犝犻分别为狓犻的上下 边界.!犿为犿维的目标空间,犉(狓)为目标向量,代 表Ω→!犿的映射关系,犌犻(狓)和犎犼(狓)分别为问题 的约束条件.定义2. Pareto支配.设狓1=(狓11,狓12,…,狓狀1) 和狓2=(狓21,狓22,…,狓2狀)是目标空间中满足约束条件 的两个决策向量,狓1Pareto弱支配狓2,记作狓1狓2, 满足:
(犻)犳犻(狓1)犳犻(狓2),犻∈{1,…,犿} (2) 狓1Pareto支配狓2,记作狓1狓2,满足:
(犻)犳犻(狓1)犳犻(狓2)∧(犼)犳犼(狓1)<犳犼(狓2)(3) 其中犻∈{1,…,犿},犼∈{1,…,犿}.
狓1Pareto强支配狓2,记作狓1狓2,满足:
3 9 5 8期 王丽萍等:多目标进化算法性能评价指标研究综述 1
《 计
算
机
学
报
》
(犻)犳犻(狓1)<犳犻(狓2),犻∈{1,…,犿} (4) 定义3. Pareto最优解.若在可行域Ω中的解 狓满足约束条件且不被任何其他解支配,则称狓
为Pareto最优解:
狓∈Ω∧
/
狓∈Ω:狓狓 (5) 定义4. Pareto最优解集.所有Pareto最优解 构成的集合称为Pareto最优解集(ParetoOptimal SolutionSet,PS).犘犛={狓|狓∈Ω∧
/
狓∈Ω:狓狓} (6) 定义5. Pareto近似最优解集.由MOEAs在 某次求解过程中所求得的最优解集称为Pareto 近似最优解集(ApproximationofParetoOptimal SolutionSet,S),简称解集.犛={狓犻},犻∈{1,…,犖} (7) 其中犖为人为设定的参数.
定义6. 非支配解.若解集犛中的解狓,不被 解集犛中的其他解Pareto支配,则称狓为解集犛中 的非支配解.
狓∈犛∧
/
狔∈犛:狔狓 (8) 定义7. Pareto近似最优非支配解集.Pareto 近似最优解集犛中所有非支配解所构成的集合称 为Pareto近似最优非支配解集(Approximationof ParetoOptimalNondominatedSolutionSet,NS),简称非支配解集,记为犖犛.
犖犛={狓|狓∈犛∧
/
狔∈犛:狔狓} (9) 定义8. Pareto前沿.Pareto最优解集犘犛中 的所有Pareto最优解狓在目标空间!犿上的映射, 称为Pareto前沿(ParetoFront,PF),或称真实 Pareto前沿.犘犉={犳(狓)∈!犿|狓∈犘犛} (10) 定义9. 参考集.人为设定的参考点的集合称 为参考集(ReferenceSet,R),其中外部参考集不包 括其它解集.
定义10. Pareto近似前沿.在真实Pareto前 沿上均匀采样得到一组参考点的集合称为Pareto 近似前沿(ApproximationofParetoFront,P).
定义11. Pareto极端点.在Pareto最优解集 犘犛中的某个目标上不存在比解狓更优的解,则称 解狓为Pareto极端点(ParetoExtremePoint),记 为狓犲狓狋.所有Pareto极端点构成的集合称为Pareto 极端点集,记为犘犅犛.
犘犅犛={狓犲狓狋|狓犲狓狋∈Ω|犽∈{1,…,犿}∧
/
狓∈Ω:犳犽(狓)<犳犽(狓犲狓狋)} (11) 定义12. Pareto前沿边界.Pareto极端点集 PBS在目标空间!犿上的映射称为Pareto前沿边界(ParetoFrontBoundary,PFB),简称边界.
犘犉犅={犳(狓犲狓狋)∈!犿|狓犲狓狋∈犘犅犛}(12) 定义13. 边界点.在解集犛中的某个目标上不 存在比解狓更优的解,则称解狓为边界点(Boundary Point),或称为极端点(ExtremePoint),记为狓犲狓狋, 所有边界(极端)点构成的集合称为边界(极端)点 集,记为犅犛.
犅犛={狓犲狓狋|狓犲狓狋∈犛|犽∈{1,…,犿}∧
/
狓∈犛:犳犽(狓)<犳犽(狓犲狓狋)} (13) 定义14. 理想点.取解集犛中各个目标上的 最小值组成一个新的点,称为理想点(IdealPoint), 记为狕.狕犻=min犳犻(狓),狓∈犛,犻∈{1,…,犿}(14) 定义15. 最低点.取Pareto最优解集犘犛中 各个目标上的最大值组成一个新的点,称为最低点
(NadirPoint),记为狕狀犪犱.
狕狀犻犪犱=max犳犻(狓),狓∈犘犛,犻∈{1,…,犿}(15) 假定表达式犃犅代表定义犅以定义犃为基 础,则上述15个定义存在如下的关系:1{2,9}、 2{3,5}、34、{2,5}6、67、48、{8,9}10、 411、1112、5{13,14,15}.
根据上述定义,给出本文涉及的一些相关性质、 定理及其数学证明:
性质1. Pareto近似最优解集是算法运行到 最大进化代数时所求得解的有穷集合.
性质2. 当Pareto前沿非离散时,Pareto最优 解集是实际问题所能求得的全部解的无穷集合.
性质3. Pareto前沿唯一性.一个MOPs问题 有且只有唯一的Pareto前沿(分段或不分段).
证明. 即证一个MOP只存在唯一的Pareto 最优解集,假设存在两个在目标空间上的映射不尽 相同的Pareto最优解集,分别为犘犛1,犘犛2,则必然
狓1∈犘犛1,狓2∈犘犛2使得狓1,狓2互不支配,而犘犛 中包含了所有非支配解,故有犘犛=犘犛1∪犘犛2,即 犘犛1与犘犛2都不是Pareto最优解集,与假设矛盾,假 设不成立,原命题得证.当涉及多模态多目标优化问 题时,该证明依然成立. 证毕.
性质3的存在为定义10的Pareto近似前沿提 供了人为采样的可行性.
性质4. 一个MOPs问题可以存在多个Pareto
4 9 5
1 计 算 机 学 报 2021年