改善分群結果

第三章基於均值移動之自適應共變異數矩陣演算法

3.5 改善分群結果

經由實驗觀察，有時候距離太遠的離群樣本即使適應值很低也會被分成另一群，成為下一代的新組件。這不是本論文想要的結果，因為這個處在適應值低區域的新組件又會產生適應值低的樣本，浪費搜尋資源。

適應值倒數第二名的樣本點

適應值最後一名的樣本點

圖 3.7 實驗結果裡有不理想的分群。在一個橢圓形適應值函式的等高線背景下，

中間是最佳解位置，黑色橢圓虛線是第一代的取樣分佈，組件數量為一，黑色十字是下一代的平均值位置，組件數量為二。共有二十的樣本點，其中一個被右上十字擋住。右上方的群是只由一個排行倒數第二的樣本所產生，黃色線是相對應

的等高線位置。

原因猜測有兩個。一個是重點性取樣由於常態分佈有短尾巴分佈(short tail distribution)，因此在外圍低密度區變的非常敏感，與真實分佈在尾巴部份差太多，常態分佈，和長尾巴的真實分佈在外圍部分相差太多導致重點性取樣在外圍的不正確結果[30]。另一個是由於核密度估計的缺陷，固定帶寬常會導致外圍不

正確的峰群[27]。

平均值更新公式和原本CMA-ES 不同的是多了個^{z k i}

( )

^, ^用來區別^{x 屬於哪一群，}

圖3.9 共變異數矩陣更新示意圖。群數 k=2，橘色一群；藍色一群，顏色越深權

( ) ( )

第四章實驗結果與分析

在本章中將會解釋與說明實驗衡量的標準，並將對於所要處理的測試函式針對其特性做說明，應用本論文所提出的 MS-CMAES 演算法在一系列測試函式上，並在相同的條件下與相關的演算法做比較。本研究實驗用的設備是中央處理器為 AMD Opterom(tm) Processor 148 2.22GHz，且記憶體為 2GB 的個人桌上型電腦，使用 Matlab 2008a 的軟體來編寫程式並進行實驗的模擬。在 4.1 節解釋本論文所設計的實驗；在第 4.2 節介紹最佳化實驗方法與測試函式，最後為測試函式實驗結果。

4.1 全域搜尋能力實驗

本節介紹本論文所設計的一項實驗，目的是為了驗證本論文方法較傳統 CMA-ES 是否有提升全域搜尋能力。所使用的測試函式是多漏斗函式[1]。本段對這種函式做個簡介，許多人造測試函式都有大山谷型的全域結構型態，越好的適應值代表越接近全域最佳解，即使此測試函式的山谷區域充滿了區域最佳解。

但是這些區域最佳解之間還是存在著一種趨勢使適應方向指向全域最佳解，這種特性的測試函式稱做單漏斗型函式(single-funnel problem)。真實世界存在著許多最佳化問題並非如上述簡單，如[3]認為在許多計算生物學領域裡的問題非常困難，起因為區域最佳解間距離遠離且沒有相關聯，不存在著趨勢會指向全域最佳解。這種問題稱做多重漏斗式問題(multi-funnel problem)，有著難以預測的全域結構特性。本文將使用這種函式做為本節實驗用的測試函式。本節分成兩個小節，第一小節講解本節測試使用的適應性函式公式；第二小節說明本論文所設計的實驗並呈現實驗比較結果。

4.1.1 多重漏斗型函式

如果使用小於零會使的函式變成更具有欺騙(deceptive function)的效果。

所謂的欺騙型函式指的是，其函式表現出來或演算法預測的全域最佳解位置資訊通常與事實相反，引誘演算法往相反於全域解的方向搜尋，1990 年初期已有許多的文獻在研究此類函式的效果[13]。

圖 4.1 雙拉斯齊金函式示意圖。圖片是函式的側面照片。參數為 =-10， =0。

3， =25，Q =80。右邊是區域最佳解，左邊是全域最佳解，位置處於圖片外面。

從圖可以看出，區域最佳解的坡度比較陡，從山嶺線開始的貪婪搜尋性質(greedy search)演算法容易落入右邊垂手可得的區域最佳解。

d s

4.1.2 實驗設計與結果

本實驗要比較的是 MS-CMAES 相較傳統 CMA-ES 對全域搜尋能力的提升程度。本論文所用的指標是，在每一點落入全域最佳解的機率的平均。當然，在同初始位置但不同演算法上，全域搜尋能力越強的，其落入全域解機率越高，所以指標分數越高。本實驗方法流程如下：

定義離散化座標位置集合X ={ ,x x₁ ₂,",x_n}，定義實驗次數，定義終止條件為，大於最大計算次數 T 或小於最佳適應值門檻 F。

1. 在某適應性函數之下，對於離散化座標位置集合內每一點x：

1.1 設x為初始點執行演算法N 次，紀錄由小於最佳適應值門檻終止 (代表進入全域最佳解)的次數為成功次數N_s(X)，計算位置x的成

功率P X ： _s ( )

( ) ( )

s s

P X =N X N. (4-3) 2. 計算平均成功率E ： _s

( )

s s i

E P x

∑

^{n .} ^(4-4)

(a)

(b) (c)

圖 4.2 成功率實驗圖。以雙拉斯齊金函式為背景，測試收斂至黑色同心圓點的成功機率。黑色同心圓點代表全域最小解位置，適應值為-10；黑色點代表區域最小解位置，適應值為 0。參數為 N=20，最大計算次數 400，最佳適應值門檻等於-8，d=-10，s=0.3，Q=50，以 4x4 的離散化大小對每一位置做測試，由白色

漸深到黑色代表成功機率分別由 1 到 0。(a)雙拉斯齊金函式的等高線細節。一個全域最佳解、一個區域最佳解、和散佈在兩解上面的雜訊型區域最佳解。

(b)CMA-ES 的成功率。(c)MS-CMAES 的成功率。白色區域比 CMA-ES 多，說明本論文方法比傳統方法更容易找到全域最佳解，不會短視近利地進入比較近的

區域最佳解。

s ( ) P X

最後平均成功率的比較是由 MS-CMA-ES 的 0.54571 優於 CMA-ES 的 0.52055。主要差別發現是在山嶺線部分 MS-CAM-ES 有較佳的成功率，因此收斂到全域最佳解的白色吸引域比較大，而且對於抵抗全域最佳解附近的雜訊型區域最佳解能力也較好。

4.2 測試函式實驗

演化計算領域近三十年的發展過程中，至今已有許多不同型式的演算法被設計出來以求解實數的最佳化問題。在這些最佳化的演算法中，大部分的比較方式，通常是考慮一些較常使用的測試函式以及一些相關變形。然對於所挑選的測試函式與評量標準往往沒有固定的標準，變成各說各話的情況。為了公平地比較演算法之間的差異性，本論文參考一般文獻常見的測試函式和評量標準做為測試的平台[37, 38]，根據這些文獻在衡量演算法的測試函式上明確定義出條件的設定，譬如終止條件的判斷，初始條件的限制等。基於相同環境設定下所做的比較結果，我們將可更客觀地對於演算法的效能上做分析與探討。

4.2.1 測試函式介紹

本論文的測試函式總共包含了八個測試函式，涵蓋各種類型。依其性質可區分成兩大部分，前二個為單峰函數，後面六個多峰函數，其中多峰函數裡面又分三個簡單全域架構的(單漏斗型)和三個複雜全域架構(多漏斗型)的。對於對這些函數的種類整理如表 4.1 所述，詳細的測試函式定義放置於附錄一。這些測試函式皆為實數參數最小化問題，實驗問題維度 5，所有函式最佳解都已經調整到 0，

也有固定的起始搜尋範圍，和最大適應值計算次數，整理於表 4.2。其中起始範的一半為 CMA-ES 的初始標準差，起始位置為 CMA-ES 的初始平均值，而 PSO 初始粒子則是均勻分布在初始範圍內。初始範圍和初始點的選擇參考[38]並以不直接接觸最佳解位置為原則[20]。

表 4.1 測試函式種類與名稱。

單峰函式 F1:Sphere Function

F₂: High Conditioned Ellipsoidal Function

單漏斗型多峰函式 F3:Rosenbrock Function

F4:Rastrigin Function F₅: Griewank Function

多漏斗型多峰函式 F6:Schwefel Function

F7:Double-Rastrigin Function F8: Weierstrass Function

表 4.2 測試函式相關參數。

適應值最大計算次數起始搜尋範圍起始位置最小值門檻 F₁ 10000 x∈[0,100]^d x=[50]^d 1e-6

F2 10000 x∈ [0,100]^d x= [50]^d 1e-6

F3 10000 x∈ [0,100]^d x= [50]^d 1e-2

F₄ 3000 x∈ [0, 5]^d x= [2.5]^d 1e-2

F₅ 8000 x∈ [0,600]^d x= [300]^d 1e-2

F6 4000 x∈ [0,3]^d x= [1.5]^d 1e-2

F7 2000 x∈ [-20,20]^d x= [0]^d 1e-2

F8 4000 x∈ [0,0.5]^d x= [0.25]^d _1e-2

4.2.2 實驗結果與討論

本文所提的方法為基於傳統 CMA-ES 作改良，因此比較的對象包括傳統 CMA-ES 與 MS-CMAES 在搜尋效能上的差異，並與同是著重於全域搜尋的粒子群演算法做比較，此部分的觀察重點著重在觀察 MS-CMAES 相對於其他演算法

CMA-ES，PSO 和本論文所提 MS-CMAES 基於這八組測試函式下的完整實驗數據包跨排名整理於表 4.4 到表 4.6。實驗的適應值與計算次數關係圖放在圖 4.3 到圖 4.10。

圖 4.3 測試函式 F₁的適應值變化結果。其中 CMA-ES 是收斂速度最快的演算法。

圖 4.4 測試函式 F₂的適應值變化結果。PSO 前期領先，但收斂速度慢於 CMA-ES，所以後期被 CMA-ES 超越。

圖 4.5 測試函式 F₃的適應值變化結果。其中 MS-CMA-ES 表現最好。

圖 4.6 測試函式 F₄的適應值變化結果。後期是 MS-CMA-ES 的表現最好。

圖 4.7 測試函式 F₅的適應值變化結果。後期是 MS-CMA-ES 的表現最好。

圖 4.8 測試函式 F₆的適應值變化結果。三個演算法表現差不多，CMA-ES 稍差。

圖 4.9 測試函式 F₇的適應值變化結果。後期是 MS-CMA-ES 的表現最好。

圖 4.10 測試函式 F₈的適應值變化結果。PSO 表現最差，CMA-ES 表現最好。

表 4.4 第(0.2×最大適應值計算次數)次的適應值平均值，括號內容為適應值好壞的排名。

2 CMA-ES MS-CMAES PSO

F1 1.380e-021(1)* 1.918e-009(3) 8.443e-017(2) F2 0.004611(2) 1145(3) 1.66e-010(1)*

F3 51.02(1)* 202.8(3) 82.45(2) F4 13.27(1)* 21.64(3) 15.09(2) F5 0.06198(1)* 0.01962(2) 0.3861(3) F₆ 171 (2) 516.2 (3) 139.9(1)*

F7 13.95(1)* 65.54(2) 102.4(3) F8 0.2643(1)* 0.7184(2) 0.7444(3)

表 4.5 第(0.5×最大適應值計算次數)次的適應值平均值，括號內容為適應值好壞的排名。

5 CMA-ES MS-CMAES PSO

F1 1.512e-058(1)* 1.335e-028(3) 5.908e-049(2) F2 2.716e-040(2) 6.94e-013(3) 2.407e+044 (1)*

F₃ 0.9815(2) 2.643(2) 25.66(3) F4 9.754(1) 8.649(1)* 11.9(3) F5 0.06198(2) 0.04725(1)* 0.3771(3) F₆ 169.9(3) 144.2(2) 96.72(1)*

F₇ 12.57(2) 10.17(1)* 95.03(3) F8 0.1188(1)* 0.134(2) 0.7343(3)

表 4.6 第(1×最大適應值計算次數)次的適應值平均值，括號內容為適應值好壞的排名。

9 CMA-ES MS-CMAES PSO

F1 1.311e-120(1)* 2.632e+062(3) 7.854e-105(2) F2 4.489e-103(1)* 3.478e-046(3) 2.043e-097(2) F3 0.9434 (2) 0.7862 (1)* 18.85 (3)

F4 9.751(2) 7.721(1)* 11.86(2) F5 0.06198(2) 0.03893(1)* 0.3769(3) F₆ 169.9(3) 144.2(2) 87.36(1)*

F7 12.57(2) 6.652(1)* 95.03(3) F8 0.1055(1)* 0.1199(2) 0.7343(3)

本論文在這邊依照函式類型分三部分對實驗數據做討論：

一、單峰函式

由實驗結果可以知道，在球形函式下的測試，CMA-ES 表現最好，顯現出 CMA-ES 的快速區域解收斂能力。至於橢圓形函式在第一次平均值統計結果，PSO 稍微優於 CMA-ES 和 MS-CMAES，之後到第三次統計時 CMA-ES 最優， PSO 次之。其原因可能是根據[8]所說的，如果 CMA-ES 適應完共變異數矩陣，收斂速度才是最快的時候。CMA-ES 需要時間適應共變異數矩陣，所以這段時間內比 CMA-ES 較具有隨機搜尋性質的 PSO 演算法已經快速找到好的解。

關於 MS-CMA-ES 在球形函式效能如此差的原因，本論文認為其中之一是因為取樣數量太多；之二是因為分群突變方法造成搜尋能力無法集中的關係，即使在球型函數組件數量也會有不規則的波動，並不會一定保持在一個組件，依照 CMA-ES 的啟發式原則，單一個組件是最適合球形函式的個

在文檔中基於均值移動之自適應共變異數矩陣演化策略 (頁 44-0)

第三章 基於均值移動之自適應共變異數矩陣演算法

3.5 改善分群結果

( )

( ) ( )

第四章 實驗結果與分析

4.1 全域搜尋能力實驗

∑

4.2 測試函式實驗

第三章基於均值移動之自適應共變異數矩陣演算法

第四章實驗結果與分析