• 沒有找到結果。

加入反差指數值之其它 ACO 模式的測試

在文檔中 中 華 大 學 (頁 44-51)

第三章 反差指數全域更新法的構建

3.1 反差指數全域更新法

3.1.2 加入反差指數值之其它 ACO 模式的測試

第 二 階 段 的 研 究 測 試 , 主 要 從 文 獻 中 取 得 以 蟻 拓 尋 優 法 求 解 TSP 之最佳更新模 式,並 根據此較佳的 更新原 理與精神,將 本論文 所提出 的 反 差 指 數 值 加 入 一 同 作 費 洛 蒙 的 更 新 , 並 使 用 較 大 執 行 數 據 KroA100 與 KroA200 來驗證加入權重後的其它更新模型,同樣可提升 求 解 最 短 路 徑 的 效 果 。

表 3.1 是由學者 Bernd Bullnheimer 將蟻拓尋優法與模擬退火法

(simulated annealing,簡稱 SA)、基因演算法( genetic algorithms,

簡 稱 GA)共三種啟發式演算法,針對數目為 30、57、80、96、132 五 組 城 市 數 據 求 解 TSP 所得到的結果【35】,其中蟻拓尋優法之演算 模 型 又 以 其 更 新 方 式 的 不 同 , 分 為 以 全 域 性 (global update) 更新作 依 據 的 螞 蟻 系 統 ( 簡 稱 AS)、精英螞蟻更新法(ASelitise) 及 螞 蟻 排 序 較 優 更 新 法( 簡 稱ASrank)共三種同時驗 證彼此 執行後的差異。模 擬 退 火 法 亦 以 初 始 值 的 不 同 分 為 原 始 模 擬 退 火 法 ( 簡 稱 SA)與 隨 機產生 初 始 值 的 模 擬 退 火 法(SAnn)兩 種 一 同 驗 證 比 較 彼 此 執 行 後 的 差 異 性。

由 表 3.1 可知,在城市數目為 30 時,SAnn所 求 出 的 平 均 值 為 424.26,

相 較 SA 與蟻拓尋優法根據其更新方式的不同所求算出的平均值都來 得 低 ; 在 城 市 數 目 為 57 時,SA 與 SAnn所 求 出 的 平 均 值 為 924.62 與 925.79,亦比蟻 拓尋 優法所求算出的平均 值低一些,但隨著 城 市數目 的 增 加,在 城 市 數 目 為 80 時,則可看出依據蟻拓尋優法所求解出的最 短 路 徑 有 逐 漸 轉 好 的 跡 象 , 其 中 尤 以 ASrank 所 求 算 出 的 平 均 值 為 373.74,明顯較其它演算法所求出的平均值低許多;在城市數目為 96 與 132 時,則更可明顯看出 AS、ASelite、ASrank所 求 出 的 平 均 值 , 相 較 於 其 它 啟 發 式 演 算 法 SA、SAnn、GA 所求出的平均路徑要來得好。

根 據 3.1 表所呈現的數據,Bernd Bullnheimer 得到了一個結論,隨著 城 市 數 目 增 加,以 蟻 拓 尋 優 法 來 求 解 TSP 問題是可以提高求解最短路 徑 的 的 成 效,特 別 是 以ASrank的 更 新 方 式 所 求 出 的 最 短 平 均 路 徑 值,明 顯優於其它依 據不同 更新法之蟻拓 尋優法 所求算出的結 果,因 此,本 論 文 將 根 據ASrank的 更 新 方 式 , 即 依 螞 蟻 行 走 距 離 長 短 作 一 優 劣 排 序 後 , 再 取 行 走 途 徑 較 短 的 優 秀 螞 蟻 來 更 新 費 洛 蒙 素 的 原 則 , 納 入 第 二 次 的 對 大 型 TSP 的測試驗證上。

表 3.1 啟發式演算法執行 TSP 結果一覽表【35】

Method Avg. sol Dev. Best sol. Dev. Worst

sol. Dev.

n=30, Lopt=423.74, runtime=30s

SA 424.52 0.00 423.74 0.00 447.01 0.05 SAnn 424.26 0.00 423.74 0.00 438.38 0.03 GA 424.42 0.00 423.74 0.00 425.27 0.00 AS 426.24 0.01 423.91 0.00 431.29 0.02

ASelite 426.08 0.01 423.74 0.00 438.38 0.03

ASrank 425.72 0.00 423.74 0.00 431.29 0.02 n=57, Lopt=920.08, runtime=50s

SA 924.62 0.00 920.08 0.00 937.31 0.02 SAnn 925.79 0.01 920.08 0.00 930.50 0.01 GA 927.13 0.01 920.08 0.00 931.67 0.01 AS 930.86 0.01 924.20 0.00 932.85 0.01

ASelite 928.00 0.01 920.08 0.00 934.68 0.02

ASrank 926.91 0.01 920.08 0.00 934.70 0.02 n=80, Lopt=370.97, runtime=60s

SA 382.41 0.03 370.97 0.00 407.43 0.10 SAnn 380.49 0.03 370.97 0.00 398.01 0.07 GA 380.23 0.03 373.51 0.01 393.38 0.06 AS 380.19 0.02 370.36 0.01 383.03 0.03

ASelite 374.44 0.01 370.97 0.00 381.85 0.03

ASrank 373.74 0.01 370.97 0.00 376.84 0.02 n=96, Lopt=1041.67, runtime=80s

SA 1101.78 5.77% 1049.98 0.80% 1157.24 11.09%

SAnn 1079.89 3.67% 1043.70 0.19% 1110.47 6.61%

GA 1074.93 3.18% 1056.67 1.44% 1105.81 6.16%

AS 1068.85 2.61% 1053.26 1.11% 1080.66 3.74%

ASelite 1055.14 1.29% 1045.98 0.41% 1067.93 2.52%

ASrank 1055.00 1.28% 1043.70 0.19% 1065.20 2.26%

表 3.1 啟發式演算法執行 TSP 結果一覽表(續)【35】

n=132, Lopt=1528.78, runtime=120s

SA 1596.09 0.04 1558.53 0.02 1663.28 0.09 SAnn 1577.69 0.03 1537.23 0.01 1620.84 0.06

GA 1588.99 0.04 1543.14 0.01 1642.49 0.07 AS 1568.02 0.03 1544.30 0.01 1587.63 0.04

ASelite 1558.15 0.02 1537.73 0.01 1587.27 0.04

ASrank 1556.65 0.02 1533.54 0.00 1587.67 0.04

表 3.2 和表 3.3 所表示的是 Gambardella 和 M. Dorigo 將具有學習 效 果(Ant Q-Learning,簡稱 Ant-Q)的螞蟻更新演算法與基本螞蟻演 算 模 式(ant system,簡稱 AS),在使用同樣的參數設定下所作的驗證 比 較 。 在 蟻 群 執 行 600 次循環的搜尋後,由表 3.2 可看出,在城市數 為 Oliver30 的 Ant-Q 之平均值為 424.44 略優於 Ant Systme 平均值 425.46,在城市數為 ry48 的執行結果則無論在在平均值與最短路徑求 解 上,Ant-Q 明顯優於 Ant System 的方法,此顯示隨著城市數目越大,

Ant-Q 的演算模式將有可能越好。由此表可看出,Ant-Q 的演算法相 較 於 Ant system 的演算方式所求出的最短路徑解是要好一些的。

為 了 驗 證 在 Ant-Q 這種狀態轉移規則下,取不同的費洛蒙更新方 式 , 也 會 影 響 到 後 續 蟻 群 的 選 擇 而 產 生 求 解 最 短 路 徑 的 差 異 , Gambardella 和 M. Dorigo 提出兩種費洛蒙素的更新方式,一種是以從 開 始 到 目 前 為 止 的 蟻 群 搜 尋 過 程 中 , 依 所 行 走 最 短 路 徑 的 第 k 隻 螞 蟻 所留下的費洛 蒙素作 更新的全域性 較佳更 新方式(global-best),另一 種 則 是 以 螞 蟻 循 環 搜 尋 路 徑 的 過 程 中 , 由 行 走 最 短 路 徑 的 第 k 隻 螞 蟻 所 留 下 的 費 洛 蒙 作 更 新 的 螞 蟻 循 環 較佳 模 式 (iteration-best),在使用 Ant-Q 的 狀 態 轉 移 規 則 來 決 定 螞 蟻 行 走 下 一 個 城 市 的 依 據 後 , Gambardella 和 M. Dorigo 再依兩種不同的費洛蒙更新方式,比較兩者 執 行 後 的 差 異 。

表 3.2 Q-Learning 螞蟻演算法與基本螞蟻演算法執行比較表【35】

Ant-Q Ant system

對 照 值

TSP 題 庫 平均值 標準差 最佳值 平均值 標準差 最佳值

6x6 grid 360 0 360 360 0 360 Oliver30 424.44 0.46 423.74 425.46 0.51 423.74 ry48p 14690 157 14422 14889 223 14803

表 3.3 Ant-Q 全域最佳更新與循環最佳更新比較表【 35】

Ant-Q Gobal best Ant-Q Iteration-best 對 照 值

城 市 集 合 平均值 標準差 最佳值 平均值 標準差 最佳值

城 市 集 合 1 5.90 0.08 5.84 5.87 0.05 5.84 城 市 集 合 2 6.05 0.04 5.99 6.06 0.05 5.99 城 市 集 合 3 5.58 0.01 5.57 5.57 0.00 5.57 城 市 集 合 4 5.76 0.03 5.70 5.76 0.03 5.70 城 市 集 合 5 6.20 0.03 5.17 6.18 0.01 5.17 Oliver 30 424.37 0.43 423.74 424.44 0.46 423.74 ry48p 14697 157 14442 14690 157 14422

如 表 3.3 所示,在城市數為 30 時,以全域性較佳(global-best)

作 更 新 所 求 出 的 平 均 值 424.37,略低於以螞蟻循環較佳(iteration-best)

所 作 更 新 平 均 值 424.44,當城市數目為 48 時(Oliver30 與 ry48p 同為 取 至 TSPLIP 題庫數據),以螞蟻循環較佳(iteration-best)作費洛蒙 更 新 後 , 所 求 出 的 平 均 值 14690 則較全域性較佳( global-best)所得 出 的 平 均 值 14697 低,此表示,隨著城市數目越大,以螞蟻循環較佳

(iteration-best)作為費洛蒙更新的模式,將可能求出較好的最短路徑 解 。 本 論 文 根 據 Bernd Bullnheimer 提出螞蟻排序更新演算法(簡稱 ASrank)求 解 大 型 TSP 的驗證(表 3.1)與 Gambardella、M. Dorigo 在 對 照 不 同 更 新 法,得 知 螞 蟻 週 期 最 佳 模 式(iteration-best)在城市數目 稍 大 時 會 有 最 短 路 徑 解 的 結 果( 表 3.2、3.3),依據此兩種更新方式模 型 , 加 入 本 論 文 所 提 出 依 蟻 群 行 走 路 徑 的 重 要 性 與 距 離 長 短 , 設 定 一 可控制之反差 指數權 重值,驗證執 行結果,並 從 TSPLB 國際題庫中選 出 KroA100 與 KroA200 稍大型題庫數據來加以驗證求解效果。

3.2 加入反差指數之 ACO 模型

本論文以螞蟻 循環較 佳更新法之蟻 群搜尋 路徑的方式, 並參考 螞 蟻 排 序 較 前 更 新 法 (ASrank) 之 取 其 前 ω 隻 行 走 較 短 路 徑 的 螞 蟻 , 加 入 本 論 文 所 提 出 之 全 域 反 差 指 數 更 新 法 之 指 數 值 , 測 試 其 執 行 的 成 效 , 主 要 目 的 是 驗 證 本 論 文 所 提 出 之 反 差 指 數 值 , 同 樣 可 應 用 在 其 它 ACO 的更新模式上,並提高求解最短路徑的效果。對於取出行走路徑 較短的螞蟻數 ,本論 文將依照歷年 文獻的 建議與參考後 續學者 的驗證 數 據【31】,取 其 行 走 路 徑 最 短 之 前 6 隻優秀螞蟻所留下的費洛蒙素來 作 更 新 , 對 於 反 差 指 數 值 與 值 的 設 定 範 圍 , 則 依 第 一 階 段 對 St70 的測試後結果 ,決定 其反差指數的 設定值 。執行後的結 果將與 螞蟻排 序 較 前 更 新 法(ASrank)的執行結果作一 對照比 較,驗證本論 文所提 出 之 將 反 差 指 數 的 權 重 值 加 入 其 它 ACO 更新模式是可以提升求解最短 路 徑 的 效 果 的 。

一 、 螞 蟻 循 環 較 佳 更 新 法 (Iteration-best);截至目前為止,以螞蟻循 環搜尋較短路 徑過程 中,由行走最 短路徑 的 第k 隻螞蟻所留下的 費 洛 蒙 素。Q 表費洛蒙素累積量。 ij表 示 由 城 市r 到城市 s 所沿途 所 釋 放 的 費 洛 蒙 素 。

0 其它

ij ib

Lk

Q (3.2)

二 、 螞 蟻 排 序 較 前 更 新 法 (ASrank):將所有螞 蟻依照行走路 徑的長 短 在 名 次 的 排 序,u 表名次, 指要更新的螞蟻總數再加 1,此表示 費洛蒙的更新 是依照 名次的順序作 為更新 的依據。

0 其它 u

ij

Lu

Q ) u

( (3.3)

三、加入全域 反差指 數後之更新方 法;以 循環方式作為 螞蟻搜 尋的方 式 , 並 由 行 走 路 徑 較 短 之 第u 隻優秀的螞蟻作為費洛蒙更新的依 據 。

0 其它 d L

W

ij v

ij k (3.3)

3.3 重要參數值的設定

在螞蟻理論中 對於各 參數值的設定 當中,尤以控制 ijij及 控 制 路 徑 間 重 要 關 係 程 度 之 指 數 值 與 值 , 在 歷 年 的 文 獻 中 均 被 告 知 其 重 要 性 , 若 設 置 不 適 當 將 使 求 解 過 程 可 能 產 生 停 滯 不 前 或 無 解 的 現 象,本 論 文 將 根 據 Colorni、Dorigo 等學者,在 Distributed Optimization by Ant Colonies 【34】文中的建議,把 與 兩個參數值設定在建議 的 最 佳 組 合 狀 態,即 值 與 值 設 定 在(0.5,5)、(1,1)、(1,2)、(1,5)

及(1,1)的範圍內(如圖 3.2 所示),本論文將 與 兩 參 數 值 各 設 定 為 1 和 5 以驗證執行的效果。

圖 3.2 α 與 β 的參數設定參考圖【34】

將參數值設定 在非最 佳組合狀態範 圍內, 將可能產生;

一 、8 符 號 : 此 表 示 若 將 與 值 設 定 在 此 範 圍 , 運 算 結 果 將 無 法 找 到 最 佳 解 , 但 螞 蟻 群 在 運 算 過 程 當 中 不 會 發 生 停 滯 不 前 的 現 象 。 二 、 符 號 : 表 示 若 將 與 值 設 定 在 此 範 圍 , 運 算 結 果 亦 無 法 找 到

最佳解,螞蟻 群的運 算過程也將會 產生停 滯不前的情形 。

三、 符號: 表示將 參數設於此範 圍乃最 佳之組合,演 算的過 程將不 會 產 生 停 滯 不 前 與 過 早 收 斂 的 情 形 , 是 屬 於 最 佳 組 合 的 狀 態 。

除 此 之 外 , 對 於 其 它 蟻 群 演 算 法 中 的 參 數 值 , 除 依 據 文 獻 建 議 須 設定在可求解 的範圍 內外,亦須視 求解問 題的屬性;

一、代 表 費 洛 蒙 蒸 發 的 系 數 值 設 定 在0 1之 間, 的 設 定 值 若 傾 向 於 0 則易發生費洛蒙過早蒸發的現象,螞蟻群將因無法參考到 其它同伴所留 下的軌 跡密度值,增 加了探 索新路徑的時 間;若 將 的 設 置 於 1 則螞蟻易過早發生群聚行為。本論文在此設定為 0.9,

目的是為了使 蟻群能 快速找到最短 路徑, 避免產生停滯 現象。

二、代 表 費 洛 蒙 累 積 量 的 Q 為一常數值,一般均設定在 10、100、1000…

等 整 數 值 以 方 便 計 算 出 結 果 , 在 此 , 本 論 文 將 Q 值設定為 100。

三、本 論 文 以 20 隻螞蟻來進行整個模式的演練,每隻螞蟻依據所設定 的 參 數 值 各 自 循 環 走 1000 週期,每組作 20 次,因為蟻拓尋優法 會因搜尋途程 的不同 而產生不同的 求解結 果,故本論文 將同一 反 差 指 數 設 定 20 次,並取其平均值評比客觀的結果。

四 、 在 每 一 種 反 差 指 數 組 態 設 定 下 ,20 隻螞蟻將對所有城市(ST70、

Kro100、KroA200)各走 400,000 次。

為 能 對 照 出 更 新 方 法 的 不 同 , 在 執 行 相 同 數 據 之 後 所 顯 現 出 來 的 差異性,第二 階段的 測試驗證中, 本論文 亦將使用以上 所設定 的參數 值,根 據 螞 蟻 循 環 較 佳 更 新 法(iteration-best)與螞蟻排序較前更新法

(ASrank)的原則,加 入 本 論文所提出反 差指數 全域更新法之 反差指 數 值後,再一次 測試對 照比較執行後 的差異 。

在文檔中 中 華 大 學 (頁 44-51)

相關文件