对评价指标进行数学分析能够帮助判断一个策 略的提出是否真的提升了MOEAs的求解性能,如 当3维空间中的Pareto前沿为凹曲面时,通过修改 权重向量分布的方式以获得更大的HV值,并不意 味着解集的多样性得到了提升,而是更加迎合了 HV的计算方式[18].
此外,使用不同的评价指标得出了不一致的结 论时,更需要对评价指标进行深入分析.假设存在一 个MOPs,两种算法分别求得解集犛1和犛2,使得 IGD(犛1)<IGD(犛2)的同时存在HV(犛1)<HV(犛2),
此时仅使用一种评价指标对比算法优劣是不够严谨 的,但这并不意味着两种算法无法比较.
本节从高维目标适应性、离群点敏感性、参考集 合理性、指标值最优性四个方面对部分具有代表性 的评价指标进行分析与比较.
41 高维目标适应性
高维的目标空间中解集会变得非常稀疏[110], 有限的解集难以覆盖整个Pareto前沿[79].本文划分 高维适应性指标的标准是:若一个评价指标只适用 于某些维度的目标空间,则称为非适应性指标;若一 个评价指标适用于任何维度的目标空间,但在高维 目标空间上的表现偏差较大,则称为弱适应性指标; 若一个评价指标在高维目标空间上仍有较好的表 现,则称为强适应性指标.如表2所示.
表2 评价指标高维目标适应性表
强适应性指标 弱适应性指标 非适应性指标 计数指标 无 全部计数指标 无 收敛性指标 GD,ME 犐ε,犐ε+ SPAD 分布性指标 PD SP,Δ Δ′,Δ 综合性指标 IGD,Δ狆 HV 无
SPAD是非适应性指标是因为参考点数量太 少;Δ′、Δ则是因为计算了连续解之间的距离,而在 高维目标空间之中难以定义两个解之间的连续关 系.计数指标是弱适应性指标是因为随着目标维度 的增加,非支配解的比例将大幅增加,但这并不代表 解集的质量也因此提升;γ、犕1、SP、Δ是弱适应性 指标是因为欧式距离在高维的空间中存在维数灾 难[111],即解之间的距离趋向于相等.GD、ME、IGD、 Δ狆均存在参数可以控制距离的类型,故为强适应性
指标;HV是弱适应性指标是因为在高维空间中,仅 有极少部分非支配解参与指标值的运算,难以如实
地反映整个解集的优劣.
随着目标维度的增加,评价指标的计算代价会 随之提高,但除了HV系列指标等部分指标外,其 他指标无需过多考虑计算代价,因为这些评价指标 与算法的计算复杂度均随着目标维度线性增长,如 IGD的计算复杂度为犗(犿|犛|·|犘|),NSGAII的
计算复杂度为犗(犿|犛|2).
此外,HV在MaOPs上计算方差时会出现一定 的误导性,HV的方差存在随着目标维度的增加先 增大后减小的可能,因为解集的收敛性随着目标维 度的增加而变差,导致HV的值急剧缩小,因此HV 的方差也随之变小,但这实际上并不代表所求得的 解集更加稳定.在WFG系列测试问题[112]上不存在 这种情形,因为随着目标维度的增加其Pareto边界 点距离原点的距离也在增加,其他Pareto边界点与 原点的距离随着目标维度发生变动的可扩展系列测 试问题也不存在这种情形.
因此在应对MaOPs时,尤其是维数较高的 MaOPs,建议使用IGD、GD等强适应性指标.在高 维的目标空间中综合性指标会更侧重解集的收敛 性,因为当一个解集收敛性较差时其多样性对指标 值的影响甚微[106].又因为维数灾难的存在,传统的 多样性指标也难以在高维的目标空间中准确地衡量 多样性,所以如何在高维目标空间中更好地衡量解 集的多样性是评价指标的一个挑战.
42 离群点敏感性
MOPs的离群点尚未有精确的定义,一般认为 距离真实Pareto前沿较远的点都可以算作离群 点[28].本文给出关于离群点的相关定义如下:
定义19. 离群点.解集犛中的解狓在某个目标 上的值较大,则称该解为离群点(Outliers),记为狓狅.
犳犻(狓狅)>犕,犻∈{1,…,犿} (121) 其中犕是一个人为给定的大正数.
定义20. 离群点敏感性.向解集犛中加入一 个离群点狓狅′,若评价指标的数值犐与犕存在关系
lim
犕→+∞犐(犛)=+∞(该评价指标的数值犐越小则表明 MOEAs性能越好,反之则极限为0),则称该评价指 标具有离群点敏感性,简称敏感性.
其中离群点狓狅′为人为定义的特殊离群点,并 非算法实际求解获得的离群点狓狅,即存在犕使得 狓狅′Ω,犳犻(狓狅′)!犿的情况.引入特殊离群点狓狅′是 为了说明评价指标的离群点敏感性,因此去寻找狓狅′ 对应的决策空间是没有意义的.
通俗地理解评价指标的敏感性即为指标值犐受
0 1 6
1 计 算 机 学 报 2021年
《 计
算
机
学
报
》
离群点狓狅的影响程度.根据评价指标对离群点的敏 感性对部分评价指标进行划分,如表3所示.
表3 评价指标离群点敏感性表 非敏感性指标 敏感性指标 计数指标 全部计数指标 无 收敛性指标 SPAD GD,犐ε,犐ε+,ME 分布性指标 无 SP,Δ′,Δ,Δ,PD 综合性指标 IGD,HV Δ狆
计数指标均为非敏感性指标,因为计数指标 的计算方式与解狓在目标空间对应的犉(狓)无关. HV为非敏感性指标,因为离群点狓狅在各个目标上 都大于最低点狕狀犪犱,故离群点狓狅不参与HV的计 算.IGD为非敏感性指标,因为Pareto近似前沿中 存在参考点狆与解狓的距离小于参考点狆与离群 点狓狅的距离,故离群点狓狅也不参与IGD的计算.收 敛性指标中除了SPAD均为敏感性指标,这是因为 SPAD的计算方式与IGD相似,故SPAD也为非敏
感性指标.
性质8. 若一个非计数指标是敏感性指标,则 解集犛中的所有解都参与指标运算.
通常情况下,若一个评价指标不具有敏感性,则 该评价指标具有更好的稳定性(评价指标的稳定性并 非MOEAs的鲁棒性),但这并不意味着一个评价指 标具有敏感性就是不好的,比如对于WFG系列问 题[112]容易出现解集犛中大部分解收敛性较好,而 部分边界点狓犲狓狋收敛性极差的情况,此时使用敏感 性指标更容易区分出解集的优劣,以反映MOEAs 的性能差异.
对于IGD(犘,犛,狇),其离群点敏感性可以通过 改变距离类型控制,即设定不同的狇值,狇越大离群 点敏感性越高,反之越低.当狇→∞时,IGD的值仅 取决于离群点.GD等其他可以通过参数控制距离 类型的评价指标也有类似结论.
对于一个给定的MOPs,是否选择敏感性指 标对比MOEAs的性能优劣应从两个方面考虑:
(1)MOEAs求解完成后是否需要关注离群点,对于 某些实际问题决策者并不关心离群点,此时建议使用 非敏感性指标避免离群点的影响;(2)求解MOPs时 是否容易出现离群点,针对本身难以优化或部分边 界点难以收敛的MOPs,建议使用敏感性指标加大 MOEAs的区分度.
43 参考集合理性
参考集合理性分析评价指标的参考集取值范 围,主要讨论HV、IGD和GD.
对于Pareto前沿为犳1+犳2=1的测试函数,显 然我们希望所得解集犛中包含Pareto边界点集 犘犅犛={(1,0),(0,1)},即有最优解集犛为
犛=狓|狓=犻-1 犖-1,犖-犻
(
犖-1)
,犻∈{1,…,犖{
}(}
122)将HV的参考点狕狉犲犳设为狕狀犪犱的最大问题在 于无法衡量解集犛中边界点狓犲狓狋的HV值,即有 HV(狓犲狓狋,狕狀犪犱)=0,故HV的最优解集犛HV为 犛HV=
{
狓|狓=犻( )
犖,犖犖-犻,犻∈{1,…,犖}(}
123)显然犛HV中不包含犘犅犛.故需要设置HV的参 考点狕狉犲犳略劣于狕狀犪犱.则令:
狕犻狉犲犳=δ狕狀犻犪犱,δ∈(1,+∞) (124) 有lδ→+∞im犞犪狉(HV(犛,狕狉犲犳))=0,即当δ较大时 HV的方差为零,故建议δ10.
解集犛中的解狓所支配且不被其他解支配的 空间大小为犛狓= 1
( )
犖-12,显然我们希望被边界点 狓犲狓狋支配且仅被狓犲狓狋支配的空间大小至少也为犛狓,故建议δ1+1犖-1.若难以求解一个MOPs的 Pareto最优解,建议增大δ,反之建议减小δ.
对于IGD,为了保证计算的准确性,Pareto近似 前沿犘中参考点数量不能太少.由于在维度大于等 于2的空间中至少需要两个点才能够确定一个点, 使这个点到那两个点欧式距离的平方和最小,故在 计算每一个非边界点的IGD值时至少需要两个参 考点,计算每个狓犲狓狋只需要一个参考点.因此得到
|犘|的下限2犖-犿.MOEAs实际运行时,IGD的参 考点数量越多越好,但不能影响MOEAs的运行时 间,故认为|犘|的上限以犖犿为宜.
对于GD,与IGD的不同之处在于当MOPs的 目标数量增大时,|犘|的下限不能太小,这是因为当 解狓落在两个参考点之间与正好落在参考点上时, 对IGD数值的影响不大,对GD影响较大.故建议
|犘|的下限为2犿犖,因为参考点的数量与目标维度 的幂次方有关,上限同为犖犿.
给出参考集的建议表如表4所示.
表4 参考集的建议表
指标 建议选取的参考集范围 HV 狕犻狉犲犳=δ狕犻狀犪犱,δ∈1
[ ]
+1犖-1,10 IGD |犘|∈[2犖-犿,犖犿]GD |犘|∈[2犿犖,犖犿]
1 1 6 8期 王丽萍等:多目标进化算法性能评价指标研究综述 1
《 计
算
机
学
报
》
通过对参考集合理性的分析可以发现,在设置 HV的参考点时,为了确保边界点x犲狓狋的HV值不 为0,建议δ1+1犖-1如在PlatEMO[93]中设置了 δ=1.1;设置GD、IGD的参考集时,在不影响MOEAs
运行时间的前提下,设置更多的参考点能得到更精 确的结果.
44 指标值最优性
本节讨论的是关于部分评价指标数值的一些数 学定理,以及Pareto最优解集犘犛与有穷的解集犛 在计算指标值犐时所能达到最优值.通过对指标值 最优性的分析,能够对指标数值上的极限有更深入 的认识,增强对指标数值的分析能力.
定义21. 指标值最优解集.当一个解集犛使 得某个评价指标在给定MOPs上取到最优值犐,称 该解集为指标值最优解集,简称最优解集,记为犛.
对于两个不同的指标,其指标值最优解集不一 定相同,比如在凹曲面上存在犛IGD≠犛HV,但在直线 或平面上存在犛IGD=犛HV.
定理4. C(犛1,犛2)和C(犛2,犛1)存在如下关系:
定理4. C(犛1,犛2)和C(犛2,犛1)存在如下关系: