簡化的蟻群最佳演算法與其在模糊類神經網路之應用

全文

(1)國立台灣師範大學工業教育學系碩士論文指導教授: 洪欽銘博士王偉彥博士. 簡化的蟻群最佳演算法與其在模糊類神經網路之應用 Compact Ant Colony Optimization Algorithms and Its Applications in Fuzzy-Neural Networks. 研究生: 陳俊堯撰中華民國九十八年七月.

(2)

(3)

(4) 簡化的蟻群最佳演算法與其在模糊類神經網路之應用學生: 陳俊堯. 指導教授: 洪欽銘博士王偉彥博士國立臺灣師範大學工業教育學系碩士班. 摘要在本論文中，提出一個簡化的蟻群最佳演算法與其在模糊類神經網路之應用。傳統上螞蟻群聚最佳演算法屬於在解離散組合最佳化問題，其需要複雜的演算流程。因此，在本篇論文中提出一個連續最佳化的方法。並將此方法與模糊類神經網路做結合，應用於函數近似、非線性系統的模組化、以及非線性系統的控制。針對函數近似與非線性系統的模組化的應用，模糊類神經網路的權重值因子能透過離線學習的程序來做調整。於非線性系統控制應用上，分別考慮多輸入多輸出、狀態與輸出回授之非線性系統，藉由即時調整模糊類神經網路的參數以完成控制目的。在多輸入多輸出非線性系統控制設計中，其控制觀點結合了倒階的設計技術與模糊類神經網路。根據其控制的技術，其模糊類神經倒階控制器經由蟻群最佳演算法的方法來做參數的即時調整。針對狀態或輸出回授控制設計，藉著使用直接型控制器的設計概念，與在本篇論文中所提出的簡化的蟻群最佳演算法為基礎的 B-spline 模糊類神經控制器來控制非線性系統。為了要線上調整這些參數與評估閉迴路系統穩定性的目的，我們提出一個能量適應函數於簡化的蟻群最佳演算法中。並藉著 Lyapunov 函數來做閉迴路系統的穩定度分析。另外，為了保證閉迴路系統的穩定度，監督式控制器會被利用來與簡化的蟻群最佳演算法為基礎的 B-spline 模糊類神經控制做結合。最後從模擬結果驗證其所提出方法的可行性與適用性。. i.

(5) 關鍵詞: 簡化的蟻群最佳演算法、函數近似、模糊神經網路、能量適應函數。. ii.

(6) Compact Ant Colony Optimization Algorithms and Its Applications in Fuzzy-Neural Networks Student: Chun-Yao Chen. Advisors: Dr. Chin-Ming Hong Dr. Wei-Yen Wang. Department of Industrial Education National Taiwan Normal University. ABSTRACT In this thesis, a compact ant colony optimization algorithm (CACOA) of fuzzy-neural networks is proposed. Traditionally, ant colony optimization algorithms solve discrete combinatorial optimization problems, and always need complicated operation procedures. Therefore, a continuous ant colony optimization algorithm is proposed for function approximation, nonlinear system modeling, and nonlinear system control. For function approximation and nonlinear system modeling, the weighting factors of the fuzzy-neural networks can be tuned through off-line learning procedure. For a class of multiple-input multiple-output (MIMO) nonlinear systems, the control scheme incorporates backstepping technique with the fuzzy neural networks, and the adjusted parameters of the fuzzy neural networks are tuned on-line via the CACOA approach. For state-feedback and output-feedback control, based on the direct adaptive control approach, a B-spline fuzzy-neural controller using CACOA is proposed to control a class of nonlinear systems. For the purpose of on-line tuning these parameters and evaluating the stability of the closed-loop system, an energy fitness function is included in the CACOA. iii.

(7) approach. The stability of the closed-loop system is analyzed by means of Lyapunov functions. In addition, in order to guarantee the stability of the closed-loop nonlinear system, a supervisory controller is incorporated into the CACOA-based B-spline fuzzy neural controller. Finally, the simulation results demonstrate the feasibility and applicability of the proposed method.. Keywords:. compact. ant. colony. optimization. algorithm,. approximation, fuzzy-neural networks, energy fitness function.. iv. function.

(8) 誌謝首先，非常由衷感謝指導教授洪欽銘老師、王偉彥老師與呂藝光老師，在我碩士班期間學業上辛苦的指導與生活上的教誨與幫助，也讓我們學習處理承辦國際研討會事項，使得在碩士班兩年的求學過程中，學習到很多寶貴的經驗與知識，對於老師們的辛苦栽培，學生將謹記於心。亦誠摯的感謝口試委員：吳政郎教授、陶金旺教授、以及呂藝光教授，的蒞臨指導，提供本論文寶貴的意見以及不同的思考方向與問題，使得論文內容能更臻完善。除此之外，也非常感謝我親愛的家人，你們的支持、照顧、容忍和深切的期盼是我完成碩士學位的精神支柱，謹將這一份榮譽與你們同賀。在碩士班的求學過程中，感謝兩年來一起努力的同學們與學長的教導，建宏、建佑、建豪、正皓、名峰、伯楷及宏建學長、銘滄學長，一起做研究、讀書、出遊，在生活與學業上互相砥礪，很高興能在碩士班這兩年裡跟你們一起成長茁壯。最後，感謝所有直接或是間接幫助過我的朋友們，有你(妳)們的協助，才能讓我完成這本碩士論文，順利取得碩士學位。. v.

(9) 目錄中文摘要…………………………………………………………………. i. 英文摘要…………………………………………………………………. iii. 誌謝………………………………………………………………………. v. 目錄………………………………………………………………………. vi. 表目錄……………………………………………………………………. viii. 圖目錄……………………………………………………………………. ix. 第一章. 緒論……………………………………………………………. 1. 第一節. 研究背景與動機……………………………………………. 1. 第二節. 研究目的……………………………………………………. 3. 第三節. 論文概要……………………………………………………. 4. 第二章. 簡化的蟻群最佳演算法於其在模糊神經網路的進化學習之應用…………………………………………………………. 6. 第一節. 模糊神經網路………………………………………………. 6. 第二節. 簡化的蟻群最佳演算法……………………………………. 8. 第三節. 模擬結果……………………………………………………. 16. 第三章. 簡化的蟻群最佳演算法為基礎的模糊神經倒階控制應用於多輸入多輸出非線性系統…………………………………. 24. 第一節. 問題描述與倒階控制設計…………………………………. 24. 第二節. 模糊神經倒階控制的線上學習利用其簡化的蟻群最佳. 第三節. 演算法………………………………………………………. 28. 模擬結果……………………………………………………. 31. vi.

(10) 第四章. 即時 CACOA 為基礎的輸出回授利用 B-spline 模糊神經網路控制器以控制非線性系統…………………………………. 37. 第一節. B-spline 歸屬函數…………………………………………. 37. 第二節. CACOA 為基礎的輸出回授 B-spline 模糊神經控制……. 38. 第三節. 模擬結果……………………………………………………. 47. 第五章. 觀察器為基礎的 B-spline 模糊神經控制利用 CACOA 以控制非典型的非線性系統……………………………………. 53. 第一節. 問題描述……………………………………………………. 53. 第二節. 觀察器為基礎的 B-spline 模糊神經控制器設計利用. 第三節. 第六章. CACOA 與誤差觀察器……………………………………. 55. 模擬結果……………………………………………………. 61. 結論……………………………………………………………. 68. 參考文獻…………………………………………………………………. vii. 69.

(11) 表目錄表 2-1. 範例一誤差對應其代數表……………………………………. 18. 表 2-2 顯示其訓練資料以及經過 300 代學習的近似資料…………. 20. 表 2-3. 22. 範例二誤差對應其代數表……………………………………. viii.

(12) 圖目錄圖 2-1. 模糊神經網路結構圖……………………………………………. 6. 圖 2-2. 期望近似的曲面圖……………………………………………… 16. 圖 2-3 簡化的蟻群最佳演算法在 300 代學習之後的模糊神經網路輸出所近似的曲面圖……………………………………… 17 圖 2-4 簡化的蟻群最佳演算法在 300 代學習後的誤差曲線圖……… 圖 2-5. 17. 平行的鑑別模組………………………………………………… 19. 圖 2-6 顯示於表 2-2 中 21 個訓練資料所構成的實際曲線圖 g (u ) …… 20 圖 2-7 方程式 g (u ) 與在 300 代學習後簡化的蟻群最佳演算法及梯度下降法的近似結果……………………………………… 21 圖 2-8 300 代的學習之後簡化的蟻群最佳演算法與梯度下降法近似 fˆ [u ( k )] 的誤差曲線圖…………………………………… 22 圖 2-9 非線性系統的輸出與利用簡化的蟻群最佳演算法所鑑別模組的輸出……………………………………………………… 23 圖 2-10 在圖 2-9 中近似的模組的鑑別誤差…………………………… 23 圖 3-1 整體 CACOA 為基礎的模糊神經倒階控制器結構圖………… 30 圖 3-2. 系統輸出 x11 與有界的參考命令 y1d (t ) (case 1)………………… 33. 圖 3-3. 系統輸出 x21 與有界的參考命令 y2 d (t ) (case 1)………………… 33. 圖 3-4 控制輸入 u1 (t ) 與 u2 (t ) (case 1)…………………………………… 34 圖 3-5. 追蹤誤差 z11 (t ) 與 z21 (t ) (case 1)………………………………… 34. 圖 3-6. 系統輸出 x11 與有界的參考命令 y1d (t ) (case 2)………………… 35. 圖 3-7. 系統輸出 x21 與有界的參考命令 y2 d (t ) (case 2)………………… 35. 圖 3-8 控制輸入 u1 (t ) 與 u2 (t ) (case 2)…………………………………… 36 圖 3-9. 追蹤誤差 z11 (t ) 與 z21 (t ) (case 2)………………………………… 36. 圖 4-1 整體 CACOA 為基礎的 B-spline 輸出回授控制器設計結構… 46. ix.

(13) 圖 4-2 範例一系統輸出 x1 與有界的參考訊號 yd (t ) …………………… 48 圖 4-3 範例一狀態 x1 與 xˆ1 的軌跡(0-20sec)…………………………… 48 圖 4-4. 範例一狀態 x1 與 xˆ1 的軌跡(0-0.8sec)…………………………… 49. 圖 4-5. 範例一控制輸入 u (t ) …………………………………………… 49. 圖 4-6 範例二系統輸出 x1 與有界的參考訊號 yd (t ) …………………… 51 圖 4-7 範例二狀態 x1 與 xˆ1 的軌跡(0-20sec)…………………………… 51 圖 4-8. 範例二狀態 x1 與 xˆ1 的軌跡(0-0.8sec)…………………………… 52. 圖 4-9. 範例二控制輸入 u (t ) …………………………………………… 52. 圖 5-1 範例一系統輸出 x1 與有界的參考訊號 yd (t ) …………………… 62 圖 5-2 範例一狀態 x1 與 xˆ1 的軌跡(0-20sec)…………………………… 63 圖 5-3. 範例一狀態 x1 與 xˆ1 的軌跡(0-0.8sec)…………………………… 63. 圖 5-4. 範例一控制輸入 u (t ) …………………………………………… 64. 圖 5-5 範例二系統輸出 x1 與有界的參考訊號 yd (t ) …………………… 65 圖 5-6 範例二狀態 x1 與 xˆ1 的軌跡(0-20sec)…………………………… 66 圖 5-7. 範例二狀態 x1 與 xˆ1 的軌跡(0-0.8sec)…………………………… 66. 圖 5-8. 範例二控制輸入 u (t ) …………………………………………… 67. x.

(14) 第一章緒論第一節研究背景與動機近年來，普遍藉著如類神經網路[1]，模糊邏輯系統[2]等等來做整體近似器，非線性方程式的模組化也因此普遍的經由這些方法的發展於很多實際的應用上[3-7]。此外，模糊邏輯與類神經網路的結合已普遍被發展以改善方程式近似的效能與控制系統的模組化。因此在模糊邏輯系統上，歸屬函數的建構在模糊集合理論的實際應用上是很重要的。從很多論文文獻 [3] [8] [9]也就可以發現歸屬函數及其應用相繼的被提出。如文獻[3]，其模糊 B-spline 歸屬函數(B-spline membership function, BMF)，其擁有局部控制的特性，在本論文中將其成功地應用於建構模糊神經控制上。普遍上來說，這些整體近似器如上所述傳統上都會經由梯度的方法來做訓練，其在學習過程中僅能搜尋局部最佳解。不幸地，這樣的技術方法也有其困難點，例如，初始猜測的選擇與收斂。此外，因為代價函數普遍上擁有多個局部最小值，因此透過這些非線性的最佳化技術來達到整體最佳解是有困難的[10]。為了要搜尋整體最佳解，很多啟發式的學習演算法相繼的被發表出來。例如基因演算法(Genetic Algorithm, GA)、微粒子群最佳化(Particle Swarm Optimization, PSO)、與模擬退火演算法(Simulated Annealing, SA)。近年來一個新的啟發式最佳演算法被發表出來，螞蟻群聚最佳化演算法(Ant Colony Optimization, ACO)，其主要透過實際蟻群所觀察到的行為。在 ACO 啟發式的學習過程中，人工螞蟻透過合作的方式以求得最佳解並解決困難的最佳化問題[11]。每隻螞蟻個別的互相傳遞訊息，主要透過一種會揮發的化學物質，每隻螞蟻都會遺留其物質在所走過的路線上，其稱為費洛蒙，以求得最佳的路線到達食物源的目的。當之後的螞蟻接觸到其費洛蒙，螞蟻不僅能偵測到之前螞蟻所遺留的物質殘餘. 1.

(15) 量，而且能引導螞蟻根據費洛蒙的強弱以選擇方向。同時費洛蒙在一段的時間內將逐漸的揮發，因此螞蟻在此路線經過的數量將深刻的影響其路線上的費洛蒙殘餘量。如上所述，之後螞蟻的行為也就將根據其費洛蒙的殘餘量大小而被引導[12]。ACO 已經有意義的延伸到各種領域，如數據分佈、網路繞送、與機器學習[13-15]。然而，在傳統上蟻群最佳演算法屬於離散組合最佳化問題，其需要複雜的演算流程。因此，在本篇論文中提出一個連續最佳化的方法，一個簡化的蟻群最佳演算法(Compact Ant Colony Optimization, CACOA)以解決上述問題。並將此方法與模糊神經網路做結合，以應用於函數近似、非線性系統的模組化、以及非線性系統的控制。一個簡化的蟻群最佳演算法為基礎的模糊神經網路在本篇論文裡提出以自動地調整可調整的參數於方程式近似上。其演算法能改善網路的準確性與訓練速度。與回授線性化的方法比較[16]，倒階技術在設計處理中擁有避免有用的非線性項相消的優點[17-18]。如此，在過去十年中，倒階技術已普遍的被利用於控制非線性系統。它主要的設計步驟是在每個較小的子系統中，選擇適合的狀態和虛擬控制器，並根據這些選擇重新修改狀態方程式。最後在各個子系統中，選擇適當的 Lyapunov 函數，並藉由真實的控制器結合各個子系統，以便保證整體系統的穩定性。近年來，由於智慧型控制方法的發展，例如模糊邏輯控制，類神經網路控制等等很多智慧型倒階方法 [19-24]已經被相繼的提出以控制非線性系統以及未知的系統動態，藉著結合智慧型的控制方法與倒階設計。因此，在本篇論文中我們利用此控制技術來設計控制器。模糊神經倒階控制器根據簡化的蟻群最佳演算法的提出以控制多輸入多輸出的非線性系統其將會在第三章詳細介紹。在過去十年，經由回授線性化的方法，在非線性系統的控制設計上已經有很重大的研究成果[25-28]。其回授線性化基本的概念就是將非線性系統轉換成線性系統。因此，線性控制的技術能被利用來獲得想要的效能。. 2.

(16) 其中一些初步的研究成果顯示於文獻[25]。在文獻[2]中理論上其模糊控制器的使用，假如所有的系統狀態皆是可利用於量測的，則利用狀態回授的方法是合理的。然而實際上，狀態回授控制並不是總是適用的，因為系統狀態並不是都可被利用的。因此，模糊神經控制器在輸出回授控制設計上，從系統輸出估測其狀態是必要的。也因此，在第四章中，我們提出根據簡化的蟻群最佳演算法於 B-spline 模糊神經輸出回授控制器以控制未知的非線性系統。然而，有時候對於控制器而言在非典型的非線性系統 (nonaffine nonlinear system) 中非線性方程式是個隱函數 (implicit functions)，其利用模糊神經網路來估測非線性方程式，並不適用於非典型的非線性系統。換句話說，利用直接型的模糊神經控制器的概念，將模糊神經網路的輸出直接的被利用來當成控制器而不是當成非線性方程式，如此才適合於非典型的非線性系統。因此，在第五章，我們提出一個觀察器為基礎的 B-spline 模糊神經控制利用其簡化的蟻群最佳演算法於非典型的非線性系統上且僅系統輸出為可量測的條件下。. 第二節研究目的因為在模糊邏輯系統或者類神經網路上複雜的數學形式[29-32]，如更新律與對於系統穩定性的 Lyapunov 條件必須被解決。為了這個因素，其很難將控制演算法實現時於實際控制器中。因此在研究中我們先將簡化的蟻群最佳演算法應用於處理離線學習的程序。接著將控制器的設計結合蟻群最佳演算法以即時的控制一個受控體之研究做發展。如此，在本篇論文中為了避免解決複雜的數學方程式，我們提出一個 CACOA 為基礎的模糊神經控制以避免離線學習的程序於未知的非線性系統的控制，且能保證閉迴路系統的穩定性。更確切的來說，我們提出一個 CACOA 為基礎的模糊神經控制器以控制未知的非線性系統。其控制觀點在於模糊神經控制器能經由. 3.

(17) CACOA 的方法以即時的調整其權重值，以代替解決複雜的數學方程式 [33]。為了要即時的調整這些參數的目的與評估閉迴路系統的穩定性，於 CACOA 方法中我們提出一個能量適應函數 (Energy Fitness Function, EFF)。根據其能量適應函數，CACOA 能即時的調整模糊神經網路的參數以控制未知的非線性系統。另外，為了要保證閉迴路系統的穩定性，監督式控制的概念將會與 CACOA 為基礎的模糊控制器做結合。在最後的章節中，我們的目的是將所提出的 CACOA 為基礎的 B-spline 輸出回授控制的方法於非典型的非線性系統上僅系統輸出為可量測的條件下。其所提出的方法主要包含了誤差觀察器以估測其追蹤誤差透過輸出為可量測的訊息，並且依照隱函數與均值定理以獲得 B-spline 模糊神經網路以近似未知的控制輸入。其未知的控制輸入能限制系統輸出能追蹤給定有界的參考訊號。並根據嚴格正的為真 SPR-Lyapunov 方法，即時的調整這些參數與評估閉迴路系統的穩定性。最後，我們從模擬例子中驗證其所提出方法的可行性與應用性。. 第三節論文概要在此論文的組織架構如下所述。第二章描述簡化型式的蟻群最佳演算法於其在模糊神經網路的進化學習之應用。透過使用 CACOA，考慮其在模糊神經網路的離線學習。從模擬結果中，顯示其提供一個適合的方法於模糊神經網路上學習。在第三章提出 CACOA 為基礎的模糊神經倒階控制多輸入多輸出非線性系統。其控制設計結合了倒階設計技術與模糊神經網路。其控制觀點經由 CACOA 方法以即時的調整模糊神經控制器的權重值。B-spline 模糊神經輸出回授控制器根據 CACOA 的提出以控制未知的非線性系統於第四章。在第五章中提出一個觀察器為基礎的 B-spline 模糊神經控制利用其所提出的 CACOA 以控制非典型的非線性系統且僅在系. 4.

(18) 統輸出為可量測的情形下。其控制器合併了一個誤差觀察器與 CACOA 為基礎的 B-spline 模糊神經網路於控制設計上。而未知的控制輸入能限制系統輸出能追蹤到一個期望的參考訊號且其能夠依照隱函數與均值定理而被推導。最後，結論包含於第六章。. 5.

(19) 第二章簡化的蟻群最佳演算法於其在模糊神經網路的進化學習之應用本章節提出一個新的方法，利用簡化的蟻群最佳演算法(compact ant colony optimization algorithm, CACOA)來調整模糊神經網路的權重值。此方法能被用來搜尋最佳參數。在此章節，我們利用簡化型式的蟻群最佳演算法來做離線學習(offline learning)。從模擬結果中可以顯示，簡化型式的蟻群最佳演算法在模糊神經網路學習上的可行性。. 第一節模糊神經網路模糊神經網路一般來說是個模糊推論系統，其主要由類神經網路的架構所構成。其學習演算法常被用來調整模糊推論系統的權重值 [2] [3]。圖 2-1 顯示其模糊神經網路的結構圖。系統結構總共有四層，第一層的節點表示所輸入的語意變數，第二層的節點表示整體語意變數所對應的歸屬函數值，在第三層表示其模糊的基底向量 ξ ，第三層的每一個節點即代表一個模糊規則，第三層與第四層透過權重值完全的連接，. θ T = wp = [ w1p w2p L whp ]T 代表可以調整的參數，第四層是輸出層 y (x) 。. 圖 2-1 模糊神經網路結構圖. 6.

(20) 模糊推論引擎透過利用模糊 IF-THEN 規則來做映射，從訓練的輸入數據. xq ， q = 1, 2,L, n ， xT = [ x1 x2 L xn ] ∈ ℜ n 到輸出數據 y p ， p = 1,2,K, m ， y ∈ℜm 。第 i 條模糊規則如下所示: R ( i ) : if x1 is A1i and L and xn is Ani then y is B i. (2-1). 其中 i 表示模糊規則數，而 Aqi 與 B i 是模糊集合，藉著使用乘積推論引擎、單點糢糊化、以及中心平均值解模糊化，其模糊神經網路的輸出值表示成下列形式: n. h. y (x | wp ) =. ∑ w (∏ μ i p. i =1. q =1. Aqi. ( xq )). n. h. ∑ (∏ μ A ( xq )) i =1. (2-2). i q. q =1. = θ ξ ( x) T. 其中 μ A ( xq ) 表示其模糊變數 xq 的歸屬函數值， h 表示整體 IF-THEN 規則 i q. 的規則數，wip 屬於其點時則歸屬函數 μ B ( wip ) = 1，θ T = w p = [ w1p w2p L whp ]T i. 是個權重向量， ξ T = [ξ 1 ξ 2 L ξ h ] 是模糊基底向量， ξ i 定義如下所示: n. ξ (x) = i. ( ∏ μ A ( xq ) ). q =1 h n. i q. ∑ (∏ μ i =1. q =1. Aqi. (2-3). ( xq )). 藉著調整模糊神經網路的權重值 wip ，其學習演算法的目的就是企圖使得誤差方程式越小越好，誤差方程式表示如下: e p ( w p ) = ( y p − y *p ) 2. 使用於單輸出系統. (2-4). 使用於多輸出系統. (2-5). 或 E ( w) = Y − Y *. 2. 其中 Y = [ y1 y2 L ym ] 是 m 維度的模糊神經網路實際輸出向量， Y * = [ y1* y2* L ym* ] 是 m 維度的期望的輸出向量， w = [ w1T w2T L wmT ]T 是 m 個. 7.

(21) 輸出的模糊神經網路權重值向量[34]。. 第二節簡化的蟻群最佳演算法壹、螞蟻演算法之回顧. 螞蟻演算法的概念最早是由 Marco Dorigo 於 1991 年所提出，當時稱為螞蟻系統(Ant System, AS) [35]，其基本概念主要在於模仿真實螞蟻在其生活環境裡覓食所依循最短路徑的行為，透過群體合作的方式以尋找食物所建立的一套處理最佳化問題的演算法。蟻群從巢穴到食物所行徑的路徑上所依循的即是一種被稱為費洛蒙(pheromone)的化學物質，而後續出發的螞蟻即會根據費洛蒙的濃度決定是否依循此路線前進，以尋求最短的覓食路徑[11]。每一隻螞蟻於移動時皆會留下費洛蒙在其走過的路徑上，當其他的螞蟻也選擇依循著先前螞蟻走過的路徑，此時會使此條路徑所遺留下來的費洛蒙逐漸的累積且變得更濃，也就是說這條路徑會被後來經過的螞蟻所選擇之機率也會逐漸的增加。然而較少被螞蟻通過的路徑上所遺留的費洛蒙將會隨著時間逐漸蒸發掉，在此情況下被選擇的機率也就大幅的下降。. Dorigo在1997年將螞蟻系統做延伸，稱為螞蟻群聚最佳化（Ant Colony Optimization），並且使用在旅行銷售員的問題上[36]。在1999年Dorigo and Caro提到蟻群最佳化重要的部分是靠螞蟻之間的協力合作，以尋求品質較佳的解，並且求解困難的離散組合最佳化問題。而為了將自然界的螞蟻轉化進入電腦模擬中，該如何保留某些特性，使得人工螞蟻能像自然界的螞蟻擁有群體尋優的功能。Dorigo在1997年提出自然界螞蟻行為的三大特性. [36]: 1. 螞蟻傾向選擇費洛蒙濃度較高的路徑。. 8.

(22) 2. 在較短的路徑上，費洛蒙累積的速度較為快速。 3. 螞蟻間藉由費洛蒙間接達到溝通效果。這些特性都以費洛蒙為核心，如同人類的經驗傳承，自然界中的螞蟻，透過費洛蒙來引導後面的螞蟻是否選擇該路徑。然而人工螞蟻的特性仍然與自然界的螞蟻有不同之處[37]: 1. 人工螞蟻有部分的記憶空間。 2. 人工螞蟻並不是全盲的。 3. 人工螞蟻所存在的環境是屬於離散的時間。. 貮、旅行銷售員問題(Traveling Salesman Problem, TSP). Dorigo在1997年將蟻群最佳化，使用在旅行銷售員的問題上[36]。此問題說明，一個地區中有若干個城市，城市之間有道路彼此相連，而且彼此之間的道路距離不一定相等；銷售員在其地區中任一個城市出發，途中必須經過所有城市而且不能重複經過，旅行完各個城市之後在回到原出發城市。此過程即為追求旅行銷售員的最短路程。在Dorigo的研究中所提到的旅行銷售員問題的方程式描述如下：在 t 次執行回合中，第 k 隻螞蟻在城市 i 到城市 j 間的轉換機率函數： ⎧ ⎡τ (t ) ⎤α ⎡η ⎤ β ⎪ ⎣ ij ⎦ ⎣ αij ⎦ β if j ∈ allowed k ⎪ Pijk (t ) = ⎨ ∑ [τ ik (t )] [ηik ] ⎪ k∈allowedk ⎪⎩ 0 otherwise. 其中 τ ij (t ) 代表在 t 次執行回合中，城市 ij 間的費洛蒙濃度;ηij 稱為啟發函數，在不同的問題中啟發函數會因問題的特性而有所不同，在旅行銷售員的問題中啟發函數則為城市 ij 距離的倒數; allowed k 代表尚未走過的城市，記錄著螞蟻 k 尚未走過的城市，因此若是以走過的城市，被選擇的機. 9.

(23) 率則為零; α 與 β 值分別代表決定費洛蒙與距離間相對重要性的參數，通常α > 0 、 β > 0 。每隻螞蟻都有殘留費洛蒙的能力，路徑上費洛蒙的濃度越高越容易吸引螞蟻依循前進，近而累積更多的費洛蒙，以凸顯出不同路徑間的優劣差異。其費洛蒙更新方式如下所示：. τ ij (t + n ) = ρτ ij (t ) + Δτ ij 費洛蒙的變化量如下所示： m. Δτ ij = ∑ Δτ ijk k =1. 其中 Δτ ij 表示第 k 隻螞蟻從城市 i 到城市 j 之間所有費洛蒙量的總和。每隻螞蟻走過路徑 ij 時所留下的費洛蒙量可以用下列的方式表達： ⎧Q / Lk , if the kth ant uses edge(i, j ) in its tour (between t and t + n ) Δτ ijk = ⎨ 0 , otherwise ⎩. Q是個常數，一般為整數值， Lk （目標函數）為螞蟻歷程的總距離長度。將上述的步驟重複直到找到最佳解。然而其他費洛蒙的更新演算法如下所示：. (1) 局部更新法局部更新法是指螞蟻在進行費洛蒙更新時，依據前一次螞蟻殘留的費洛蒙來進行修改，局部更新法有兩種，如下所示： ⎧Q , if the kth ant goes from i to j (between t and t + 1) Δτ ijk = ⎨ otherwise ⎩0,. 上式稱為螞蟻密度演算法。其意義是說，第 k 隻螞蟻在選擇下一個城市時費洛蒙會以之前有多少螞蟻走過為根據。 ⎧Q / d ij ,if the kth ant goes from i to j (between t and t + 1) Δτ ijk = ⎨ otherwise ⎩0 ,. 上式稱為螞蟻質量演算法。其意義是說，第 k 隻螞蟻在選擇下一個城市時. 10.

(24) 會以城市 i 與城市 j 之間距離的倒數做為費洛蒙的根據。. (2) 全域更新法 ⎧Q / Lk ,if the kth ant uses edge(i, j ) in its tour (between t and t + 1) Δτ ij = ⎨ otherwise ⎩0,. 全域更新法指的是對第 k 隻螞蟻而言，螞蟻會經由上一次所走過的路徑總和來做為費洛蒙的依據。全域更新法與局部更新法其差異在於，全域更新法考慮到螞蟻的整體經驗，而不是上一隻螞蟻的個別經驗。而在系統模擬上，全域更新法是在執行完一個步驟後，全部的螞蟻ㄧ起更改費洛蒙值。. 參、螞蟻演算法相關發展與應用. 螞蟻演算法發展至今，常被用來求解不同領域當中的組合最佳化的問題，從螞蟻演算法應用的文獻中能得知，其為一種求解有效率的啟發式演算法，以下針對螞蟻演算法之應用的相關文獻做一列舉說明： 1. Dorigo 於 1996-1997 年採用螞蟻演算法分別求解在不同組合下的最佳化問題以即對稱與不對稱情形下的旅行銷售員問題 (Traveling. Salesman Problem) [36]。 2. Bullnheimer 於 1999 年運用螞蟻演算法求解車輛路線指派問題 (vehicle. routing problem) [38]。 3. Maniezzo 於 2000 年運用螞蟻演算法來求解頻率分配問題 (frequency. assignment problem) [39]。 4. Talbi 於 2001 年透過螞蟻演算法來求解二次分配問題 (quadratic. assignment problem) [40]。 5. Shelokar於2004年利用螞蟻演算法來求解聚類問題(clustering problem). [41]。. 11.

(25) 肆、簡化的蟻群演算法之演化過程. 傳統上螞蟻群聚最佳演算法屬於離散組合最佳化問題常使用於不同領域中，如上述中其需要複雜的運算流程及考慮距離的路線長度。因此，在本篇論文中提出一個連續最佳化的方法，並以費洛蒙濃度當成評估主軸，一個簡化的蟻群最佳演算法以解決上述問題。並將此方法與模糊類神經網路做結合，應用於函數近似、非線性系統的模組化、以及非線性系統的控制。為了透過演化來調整模糊神經網路的參數，顯示於部分壹，我們定義其路徑即表示我們問題中的一組解，而每一條路線的效能其評估方式，我們根據其適應函數(fitness function)。我們期望在幾代的演化處理過後，其簡化的蟻群演算法能收斂，且一條最佳的路徑即表示最大的適應函數或者最小的誤差，以得到問題的最佳解。其適應函數的定義如下所示: fitness =. 1 1 + ep. (2-6). 其中 e p 是個要判斷的誤差方程式，其定義於(2-4)式[34]。簡化的蟻群最佳演算法的細節設計步驟在之後會被詳細的探討，首先，我們定義一條路徑如下所示:. φ l = [ w Tp ] = [φ1l φ2l L φml ] ∈ℜm. (2-7). 其中 w p 表示一組權重值組合。因此不同的權重值組合便能達到計算誤差最小的情形，來判定系統是否收歛。因此，權重值的組合便等同於路徑，較佳的權重值組合便是較短的路徑。每一條路徑包含 m 個節點，而且每一個節點表示模糊神經網路可以調整的參數。在學習過程中我們定義 r 條可能的路徑解，其初始路徑定義在一個合理的範圍內隨機的產生，其定義如下所示:. 12.

(26) ⎡φ1p ⎤ ⎢ 2⎥ φ Φ = ⎢ p⎥ ⎢ M ⎥ ⎢ r⎥ ⎢⎣φ p ⎥⎦. (2-8). 其中 φ lp 表示第 l 條路徑，而且其權重值因子在內部 D = [−qmin , qmax ] 區間中， q > 0 。期望在執行演算法之後，其中一組選擇解 φ lp 能被獲得，且是模糊神經網路的最佳參數。. 簡化型式的蟻群最佳演算法其演算法設計步驟如下所示:. 步驟1. 初始化設定 n = 0. { n 代表想要的輸入與輸出對資料}. 設定 g = 0. { g 代表代數的計數器}. 設定 G. { G 代表迭代次數上限}. 對每一條路徑設定其初始費洛蒙τ l (0) = fitness，代表其路徑上費洛蒙的強度，初始的費洛蒙變化量 Δτ l = 0 ， Δτ lk 表示第 k 隻螞蟻在第 l 條路徑上，區間 i 與 i + 1 中所殘留的費洛蒙量。設定螞蟻的總數為 M 。. 步驟2. 設定 n = n + 1 設定 g = g + 1 直到到達迭代次數上限設定 k = 1 到 M 直到到達螞蟻總數每一隻螞蟻 k 會選擇第 l 條路徑移動，主要根據其轉換機率 P (τ lk ) ，其轉換機率表示如下: P (τ lk ) =. τl. r. ∑τ l =1. 13. l.

(27) 當螞蟻選定路徑移動時，將對其路徑做費洛蒙的更新，其費洛蒙的更新方式，更新規則如下所示:. τ l (i + 1) = ρτ l (i ) + Δτ l Δτ l = Δτ l + Δτ lk ⎧Q /(1 + el ) ,if the k ant choose lth path at this circle Δτ lk = ⎨ , else ⎩ 0. 其中 ρ ∈ [0,1] 代表費洛蒙的蒸發係數， Q 是一個常數。其中 el 是指每條路徑其實際輸出與期望輸出的誤差值，定義於(2-4)式。. 步驟3. 對於所定義的路徑做內部參數更新，將矩陣 Φ 中的每一行隨機選擇一個元素做改變，其矩陣表示如下所示: ⎡φ1p ⎤ ⎡φ11 φ21 ⎢ 2⎥ ⎢ 2 φ p ⎥ ⎢φ1 φ22 ⎢ Φ= = ⎢ M ⎥ ⎢M M ⎢ r⎥ ⎢ r r ⎣⎢φ p ⎦⎥ ⎣φ1 φ2. L φm1 ⎤ ⎥ L φm2 ⎥ O M⎥ ⎥ L φmr ⎦. 然而，在每一直行隨機選擇一個元素做改變時，須考量其每一條路徑做內部元素變換的機率值，其機率方程式表示如下: 1 P (τ lk ) Γl = r 1 ∑ k l=1 P (τ l ) 根據其上式的機率公式，即可得知每條路徑變換其內部元素的可能性，當所選擇的元素，屬於較佳的權重值組合時，我們僅對其元素做小幅度的變化。然而，假如其所選中的元素不是屬於其較佳的權重值組合，即對其元素作較大範圍的隨機變換。因此，所構成的新矩陣將會被帶入到下一次迭代做訓練。設定 p = 1,2,K, m ，代表每一行隨機選擇一個元素。 14.

(28) 設定一個隨機值 ς 其值介於0到1之間，υ 是一個隨機值介於-1到1之間，設定 κ = 1 。假如其機率值 0 < ς < min( Γ l ) ，對其上述機率方程式取最小值在於較佳的權重值組合變換其內部元素的機率相對較低，因此假如所選的元素屬於較佳的權重值組合，且機率值在範圍內，則我們對此元素更新方式如下: ⎧φ pl + sign(υ ) × (κ ) , if 0 < ς < min(Γ l ) ⎪ φˆpl = ⎨ D else ⎪ , D = [ −qmin qmax ] ⎩ 2. 當元素更新完，所構成的新矩陣帶入到下一次做訓練。. 步驟4. 判斷其路徑費洛蒙強弱比較。假如舊的路徑費洛蒙濃度大於新的路徑費洛蒙濃度，即 pheromone(φ l ) > pheromone(φˆl )。則將其舊的權重值組合儲存起來， φ l = φ l 。否則 φ l = φˆl 。設定 k = k + 1 ，換下一隻螞蟻進入執行，回到步驟2.。. 步驟5. 重新設定每一條路徑的費洛蒙累積量 Δτ l = 0 。假如尚未到達迭代次數上限( g < G )，則回到步驟2.。否則求出最後最佳的權重值參數。. 15.

(29) 第三節模擬結果在這個部份，提出兩個例子，從模擬圖中顯示所提出的簡化的蟻群最佳演算法在模糊神經網路的訓練以近似非線性函數的效果。在範例一、範例二中，其模糊神經網路的每一個輸入都對應7個歸屬函數。在範例二中，會將其模擬結果與傳統的梯度下降法做比較。在此研究中，將從模擬結果驗證所提出的方法在其應用上的可行性。. 範例一: (Offline Learning，離線學習) 兩個輸入變數與一個輸出變數將被用來近似其想要的曲面，其圖顯示於圖 2-2。給予49個訓練數據。假定整體路線總數 r = 4 ， Q = 0.1 ，蒸發係數 ρ = 0.01，調整的參數在內部區間 D = [−qmin , qmax ] = [−5,5] ，在模糊神經網路中其權重值的個數是49， w = [w11 w12 L w149 ] 。圖 2-3顯示其簡化的蟻群最佳演算法在300代學習之後的模擬結果。從模擬結果中可以確定簡化的蟻群最佳演算法的有效性，其模糊神經網路在較少的代數中能近似其想要的曲面。圖 2-4顯示簡化的蟻群最佳演算法在300代學習後的誤差曲線圖。誤差對應其代數表，顯示於表 2-1。. 2. 1.5. 1. 0.5. 0 10 5. 10 5. 0 0. -5 x2. -5 -10. -10. x1. 圖 2-2 期望近似的曲面圖 16.

(30) 2. 1.5. 1. 0.5. 0 10 5. 10 5. 0 0. -5. -5 -10. x2. -10. x1. 圖 2-3 簡化的蟻群最佳演算法在300代學習之後的模糊神經網路輸出所近似的曲面圖. 1.4. 1.2. 1. 0.8. 0.6. 0.4. 0.2. 0. 0. 50. 100. 150 iterations. 200. 250. 300. 圖 2-4 簡化的蟻群最佳演算法在300代學習後的誤差曲線圖. 17.

(31) 表 2-1 誤差對應其代數表誤差迭代次數 1 代 1.3637547 代 6.8080825e-001 2 代 5.3527103e-001 3 代 4.6603514e-001 4 代 3.3921179e-001 5 2.0987035e-002 20 代 1.1116169e-002 50 代 3.3913090e-003 100 代 6.5106837e-004 200 代 1.5501972e-004 300 代. 範例二: (離線學習與即時測試) 在此例中，一個非線性系統經由簡化的蟻群最佳演算法學習，透過模糊神經網路以近似其中未知的非線性方程式。首先，在簡化的蟻群最佳演算法的模糊神經網路學習過程中，從未知的方程式中收集訓練資料，以用於離線初始時的學習處理上。在離線學習過後，將其所訓練好的模糊神經網路應用於非線性系統上取代未知的非線性方程式做即時測試。考慮一個非線性系統其微分方程式表示如下[2]: y ( k + 1) = 0.3 y ( k ) + 0.6 y ( k − 1) + g[u ( k )]. 我們假設其系統上未知的非線性方程式如下所示: g (u ) = 0.6sin(π u ) + 0.3sin(3π u ) + 0.1sin(5π u ). 為了離線學習，21個訓練資料(u, g(u))，一致的從 u = -1到1作收集，如表. 2-2。21個訓練資料點的離線學習結構圖顯示於圖 2-5(a)。為了要去顯示其未知的非線性方程式 g (u ) 的近似效果，一個平行的模組顯示於圖. 2-5(b)，其微分方程式的定義如下所示: yˆ(k + 1) = 0.3 y (k ) + 0.6 y (k − 1) + fˆ [u (k )]. 其中 fˆ [u (k )] 代表模糊神經網路要去近似的方程式 g (u ) ， α 0 = 0.3 、. 18.

(32) α1 = 0.6 。假設整體的路線總數 r = 4 ，其中所調整的參數在內部區間 D = [−qmin , qmax ] = [−5, 5] 。在模糊神經網路中，其權重值個數是 7 ， w = [ w11 w12 L w17 ]。圖 2-6顯示在表 2-2中21個訓練資料所構成的實際曲線. 圖 g (u ) 。. g (u ) u. e fˆ (u ). (a) 表 2-2 中 21 個訓練資料離線學習. y (k + 1). g. α0. u (k ). α1. z −1 z −1. fˆ α0. z −1 z −1. α1. (b) 即時測試 u (k ) = sin(2π k / 250) 圖 2-5 平行的鑑別模組. 19. e. yˆ(k + 1).

(33) 0.8 0.6 0.4. g(u). 0.2 0 -0.2 -0.4 -0.6 -0.8 -1. -0.8. -0.6. -0.4. -0.2. 0 u. 0.2. 0.4. 0.6. 0.8. 1. 圖 2-6顯示於表 2-2中21個訓練資料所構成的實際曲線圖 g (u ) 表 2-2 顯示其訓練資料以及經過300代學習的近似資料 u -1.0000 -0.9000 -0.8000 -0.7000 -0.6000 -0.5000 -0.4000 -0.3000 -0.2000 -0.1000 0 0.1000 0.2000 0.3000 0.4000 0.5000 0.6000 0.7000 0.8000 0.9000 1.0000. ˆ f(u). g(u) -0.0000 -0.5281 -0.6380 -0.4781 -0.3943 -0.4000 -0.3943 -0.4781 -0.6380 -0.5281 0 0.5281 0.6380 0.4781 0.3943 0.4000 0.3943 0.4781 0.6380 0.5281 0.0000. 20. 5.7157122e-005 -5.2937733e-001 -6.3527588e-001 -4.7839632e-001 -3.8486260e-001 -3.9534209e-001 -4.0243080e-001 -4.7924332e-001 -6.5070849e-001 -5.2738470e-001 2.0213478e-003 5.2748680e-001 6.4571560e-001 4.7860408e-001 4.0047663e-001 3.9861247e-001 3.9792439e-001 4.7744539e-001 6.3603770e-001 5.2318577e-001 -2.7545616e-004.

(34) 另外，其倒傳遞梯度下降法將會被建構來學習模糊神經網路的權重值. [3]。而其初始的權重值在一個內部區間-5到5之間隨機的產生，如同簡化的蟻群演算法，學習率設定0.01。在300代的學習之後，如圖 2-7經由簡化的蟻群演算法所近似的方程式 fˆ (u ) 比梯度下降法要來的接近期確切的方程式 g (u ) 。誤差對應於代數曲線圖顯示於圖 2-8。從圖 2-8中可以明顯得看出其簡化的蟻群最佳演算法其收斂速度比梯度下降法要來的快。圖 2-8中的誤差曲線其計算方式定義於(2-4)式。誤差對應其代數表，如表 2-3。. 0.8 0.6 0.4 0.2 0 -0.2 -0.4 -0.6 -0.8 -1. -0.8. -0.6. -0.4. -0.2. 0 u. 0.2. 0.4. 0.6. 0.8. 1. 圖 2-7 方程式 g (u ) (實線)與在300代學習後簡化的蟻群最佳演算法(星線) 及梯度下降法(虛線)的近似結果. 21.

(35) 10 9 8 7 6 5 4 3 2 1 0. 0. 50. 100. 150 iterations. 200. 250. 300. 圖 2-8 300代的學習之後簡化的蟻群最佳演算法與梯度下降法近似 fˆ [u ( k )] 的誤差曲線圖. 表 2-3 蟻群最佳演算法與梯度下降法的誤差對應其代數表迭代次數誤差梯度下降法簡化的蟻群演算法 1 代 9.8760526e+000 1.9993103e+000 代 9.2628228e+000 1.2701372e+000 2 代 8.3504147e+000 9.1200856e-001 3 5.0829194e+000 4.0627736e-001 10 代 3.5331021e+000 1.6736991e-001 20 代 1.7364929e+000 5.4969583e-002 50 代 5.4892687e-001 3.2795530e-002 100 代 3.2719916e-001 1.8984616e-002 200 代 2.1230010e-001 1.0142980e-002 300 代. 22.

(36) 為了即時測試，我們假設其平行的串列模組如圖 2-5(b) 其 u ( k ) = sin(2π k / 250)。如圖 2-9顯示簡化的蟻群最佳演算法經過300代的離. 線學習之後其非線性系統的響應圖，模糊神經網路近似其非線性系統中的 g [u ( k )] 。圖 2-10顯示其誤差曲線圖。從圖 2-9與圖 2-10中可以證明模糊. 神經網路其利用所提出的簡化的蟻群最佳演算法可以成功地近似未知的非線性方程式 g[u ( k )] 。 6. 4. 2. 0. -2. -4. -6. 0. 100. 200. 300. 400. 500 Time. 600. 700. 800. 900. 1000. 圖 2-9 非線性系統的輸出(點線)與利用簡化的蟻群最佳演算法所鑑別模組的輸出(實線) 0.05. 0. -0.05. -0.1. -0.15. -0.2. -0.25. -0.3. 0. 100. 200. 300. 400. 500 Time. 600. 700. 800. 900. 1000. 圖 2-10 在圖 2-9中近似的模組的鑑別誤差. 23.

(37) 第三章簡化的蟻群最佳演算法為基礎的模糊神經倒階控制應用於多輸入多輸出非線性系統在本章節中，提出了一個將簡化的蟻群最佳演算法為基礎的模糊神經倒階控制結構應用於多輸入多輸出非線性系統。其控制結構結合了倒階. (backstepping)的設計技術與模糊神經網路。為了要即刻的產生合適的控制策略，簡化的蟻群最佳演算法其被利用來調整模糊神經網路的參數。提出簡化的蟻群最佳演算法的能量適應函數(Energy Fitness Function, EFF)的簡化程序用來評估閉迴路系統以即時的穩定。另外，為了要保證其系統狀態能限制在一個穩定的範圍，將一個監督式的控制項，結合進控制結構中。為了要說明其所提出方法的可行性與應用性。最後，從模擬結果驗證其所提出的方法。. 第一節問題描述與倒階控制設計在這個部分，我們將描述多輸入多輸出非線性系統的控制問題，接著描述如何設計倒階控制器。首先，考慮一個多輸入多輸出的非線性系統 x& p1 = x p 2 x& p 2 = x p 3. ,. M. p = 1,2,K, m. (3-1). x& pn p = f p ( x1 , x 2 ,..., x m ) + bp u p. 其中 f p 是第 p 個子系統未知的系統動態，u p 是第 p 個子系統的輸入，bp 是個正的未知常數， x = [x1 , x 2 ,...x m ]T 是狀態向量，而 x p = [ x p1 , x p 2 ,...x pn p ]T 第. p 個子系統的狀態向量。我們的控制目的在於發展倒階控制器以至於狀態軌跡 x p1 能漸進的追蹤倒有界的參考命令 y pd 。 24.

(38) 其次，當假設系統動態 f p 在已知的情況下，其倒階控制器細節描述設計程序如下所示:. 步驟 1) 定義一個追蹤誤差 z p1 = x p1 − y pd. (3-2). z& p1 = x& p1 − y& pd. (3-3). 然後，對 z p1 微分能被表示成. 定義一個虛擬控制器如下所示. α p1 = y& pd − c p1 z p1. (3-4). 其中， c p1 > 0 是一個設計參數。從(3-3)與(3-4)式中，假如 α p1 = x& p1 ，表示 lim z p1 → 0 ，也就是說狀態軌跡 x p1 能漸進的追蹤到有界的參考命令 y pd 。 t →∞. 如此，定義一個誤差狀態表示成 z p 2 = x& p1 − α p1 = x p 2 − α p1 。如此，我們下一個目標就是使誤差狀態 z p 2 能趨近於零。藉著使用 (3-4) 式與 x& p1 = z p 2 + α p1 的事實，(3-3)式能被重新改寫成如下所示. z& p1 = z p 2 − c p1 z p1. (3-5). z& p 2 = x& p 2 − α& p1 = x p 3 − (−c p1 z& p1 + &y&pd ). (3-6). 步驟 2) 接著對 z p 2 微分能被表示成為. 同樣的，可以定義一個虛擬控制器如下所示. α p 2 = &&y pd − c p1 z& p1 − c p 2 z p 2 − z p1. (3-7). 其中， c p 2 > 0 是一個設計參數。此外，可以定義一個誤差狀態表示成. z p 3 = x p 3 − α p 2 。然後，藉著使用(3-7)式與 x& p 2 = z p 3 + α p 2 的事實，(3-6)式能被重新改寫成如下所示. 25.

(39) z& p 2 = z p 3 − c p 2 z p 2 − z p1. (3-8). 步驟 3) 假設 k 是個正整數。誤差狀態能被定義成 z pk = x pk − α p ( k −1) 。然後，對 z pk 微分，其中 3 ≤ k ≤ n p − 1 ，能被表示成. z& pk = x& pk − α& p ( k −1). (3-9). 虛擬控制器能被定義成如下所示 k. k −1. i =1. j =1. α pk = y (pdk ) − ∑ c pi z (pik −i ) − ∑ z (pjk −1− j ). (3-10). 其中， c pi > 0 是一個設計參數。此外，可以定義一個誤差狀態表示成 z p ( k +1) = x p ( k +1) − α pk 。然後，藉著使用(3-10)式與 x& pk = z p ( k +1) + α pk 的事實，. (3-9)式能被重新改寫成如下所示 z& pk = z p ( k +1) − c pk z pk − z p ( k −1). (3-11). 步驟 4) 對 z pn p 微分能被表示成為 z& pn p = x& pn p − α& p ( n p −1) = f p + bp u p − α& p ( n p −1). (3-12). 接著即可定義出控制律 up = −. 1 ( f p − α& p ( n p −1) ) − c pn p z pn p − z p ( n p −1) bp. (3-13). = − f p − c pn p z pn p − z p ( n p −1). 其中， f p =. 1 ( f p − α& p ( n p −1) ) 且 c pn p > 0 是一個設計參數。然後，從(3-13)中， bp. (3-12)式能被重新改寫成如下所示 z& pn p = bp (−c pn p z pn p − z p ( n p −1) ). 步驟 5) 考慮 Lyapunov 方程式如下所示. 26. (3-14).

(40) n −1. m 1 m p 2 1 2 z pn p V = ∑ ∑ z pi + ∑ 2 p =1 i =1 p =1 2b p. (3-15). 藉著微分(3-15)式與利用(3-5)、(3-8)、(3-11)與(3-14)式，將得到 n −1. n. p m p m m 1 V& = ∑ ∑ z pi z& pi + ∑ z pn p z& pn p = −∑∑ c pi z 2pi p =1 i =1 p =1 b p p =1 i =1. m. (3-16). ≤ −∑ c p1 z 2p1 p =1. 從(3-15)與(3-16)式，我們可以得到一個結論 z pi 是有界的。此外，從(3-5) 式中也可得知 z& p1 也是有界的。接著對(3-16)式積分能表示成如下 m. ∑c ∫ p =1. ∞. p1 0. z 2p1 (τ )dτ ≤ −V (∞) + V (0). (3-17). 因為(3-17)式右半邊是有界的事實，我們將得知 z p1 ∈ L2 。而根據貝氏定理. (Barbalat’s Lemma) [42]， lim z p1 = 0 ，也就是說狀態軌跡 x p1 能漸進的追蹤 t →∞. 到有界的參考命令 y pd 。根據上述的描述，其 n 階非線性系統的倒階控制器能被總結成以下的定理。定理 : 考慮其 n 階的非線性系統如 (3-1) 式。令 z p1 = x p1 − y pd 與. z pi = x pi − α p (i −1). 2 ≤ i ≤ np. 當. k. k −1. i =1. j =1. ，. 其. 中. α p1 = y& pd − c p1 z p1. ，. α pk = y (pdk ) − ∑ c pi z (pik −i ) − ∑ z (pjk −1− j ) 當 2 ≤ k ≤ n p − 1 。假設其控制律給定如下 n. n −1. p p 1 (n ) ( n −i ) ( n −1− j ) ) ，其中 c pi > 0。則狀態軌跡 x p1 u p = (− f p + y pdp − ∑ c pi z pi p − ∑ z pj p bp i =1 j =1. 能漸進的追蹤到有界的參考命令 y pd 。. 27.

(41) 第二節模糊神經倒階控制的線上學習利用其簡化的蟻群最佳演算法在這個部份，根據前述所提及的簡化的蟻群最佳演算法，本章節提出一個線上的倒階模糊類神經控制器。在實際應用中，系統動態 f p 與 bp 是未知的，所以前述所提的定理中其倒階控制器不能獲得。因此，在前面章節所提及的模糊神經網路近似器將與倒階控制器做結合，並且利用來近似系統動態。首先，在(3-13)式中其未知的連續方程式 f p 將被模糊神經網路 fˆp (x, y& pd | φ p ) 所取代。控制律的結果如下所示: u pc = − fˆp − c pn p z pn p − z p ( n p −1). (3-18). 假設 u p = u pc 。然後，將(3-18)式帶入到(3-1)式且經過一些數學操作後，我們會獲得誤差方程式如下 z& pn p = bp ( f p (x, y& pd ) − fˆp (x, y& pd | φ p ) − c pn p z pn p − z p ( n p −1) ) (3-19). 為了要考慮閉迴路系統的穩定性分析，考慮 Lyapunov 方程式 n −1. m 1 m p 2 1 2 V = ∑ ∑ z pi + ∑ z pn p 。藉著利用(3-19)式，我們會得到 2 p =1 i =1 2 b p =1 p n −1. m p m 1 V& = ∑ ∑ z pi z& pi + ∑ z pn p z& pn p p =1 i =1 p =1 b p m. n p −1. p =1. i =2. = ∑ [ z p1 ( z p 2 − c p1 z p1 ) + ∑ z pi ( z p (i +1) − c pi z pi − z p (i −1) ) + z pn p ( f p (x, y& pd ) − fˆp (x, y& pd | φ p ) − c pn p z pn p − z p ( n p −1) )] m. (3-20). np. = ∑ [∑ −c pi z 2pi + z pn p ( f p (x, y& pd ) − fˆp (x, y& pd | φ p ))] p =1 i =1 m. np. p =1. i =1. ≤ ∑ [−∑ c pi z 2pi + z pn p f pU (x, y& pd ) − z pn p fˆp (x, y& pd | φ p )]. 其中， f p (x, y& pd ) ≤ f pU (x, y& pd ) < ∞ 。藉著利用假如 V& < 0 其 V 狀態必須朝更 28.

(42) 小值的方向移動的事實。我們定義一個能量適應函數 (energy fitness. function)且用於線上調整，為了要即刻的評估閉迴路系統的穩定，定義第. p 個子系統的第 p 個能量適應函數如下所示: EFFp = − z pn p fˆp ( x, y& pd | φ p ). (3-21). 其中， fˆp (x, y& pd | φ p ) 代表其估測的未知狀態 f p 。在(3-21)式中，我們希望第 p 個子系統的第 p 個能量適應函數 EFFp 能愈負愈好。接著，我們對其 EFFp 作正規化轉換，越負的值代表經過正規化轉換之後取絕對值，其值. 越大。藉以區別每個子系統(或每條路徑)的初始費洛蒙強弱。最後，在經過學習演算法的學習過後，最大的費洛蒙值代表其最短路徑即最佳解。因為系統狀態可能走向不穩定的範圍，假如簡化的蟻群最佳演算法操作在模糊神經網路的某些區間中不能同時的產生適當的權重值，則會將如文獻 [2][32]中監督式控制器的概念結合進簡化的蟻群最佳演算法為基礎的倒階模糊神經控制器以保證其系統狀態能限制於穩定的範圍。藉著結合監督控制項 u ps 到 u pc 中，則控制律變成如下所示: u p = u pc + u ps. (3-22). 其監督控制項 u ps 的加入，主要當方程式 V 大於一個正的界限值 V u 。反之假如 V ≤ V u ，則監督控制項 u ps 則不會加入其中。這也就是說，假如系統傾向進入不穩定的範圍( V > V u )，則 u ps 的加入將強制將系統拉回到穩定的範圍。將(3-22)式帶進(3-1)式，其方程式變成 z& pn p = bp ( f p (x) − fˆp (x | φ p ) − c pn p z pn p − z p ( n p −1) ) + bp u ps (3-23). 利用(3-22)式與(3-23)式，我們可以推得 m. np. p =1. i =1. m. np. p =1. i =1. V& = ∑ [−∑ c pi z 2pi + z pn p ( f p (x) − fˆp (x | φ p ) + u ps )]. (3-24). ≤ ∑ [−∑ c pi z 2pi + z pn p ( f p (x) + fˆp ( x | φ p ) ) + z pn p u ps ]. 29.

(43) 假設其監督的控制項 u ps 給定如下所示: ⎧ − sgn( z )[ f U (x) + fˆ (x | φ ) ] if V > V u ⎪ pn p p p u ps = ⎨ ⎪⎩0 if V ≤ V u. (3-25). 其中，V u 是個設計參數且假如 z pn ≥ 0(< 0) 則 sgn( z pn ) = 1(−1)。接著，將(3-25) 式帶入(3-24)式，我們可以得到 np. m. V& ≤ ∑ [ −∑ c pi z 2pi + z pn p [ f p (x) + fˆp (x | φ p ) − ( f pU (x) + fˆp (x | φ p ) )] p =1. m. i =1. (3-26). np. ≤ −∑∑ c pi z 2pi ≤ 0 p =1 i =1. 從(3-26)式我們可以得知，對於(3-1)式中非線性系統的閉迴路系統的穩定性是能被保證的。總結，在本章節裡所提出的整體 CACOA 為基礎的模糊神經控制器設計顯示於圖 3-1。. 圖 3-1 整體 CACOA 為基礎的模糊神經倒階控制器結構圖. 30.

(44) 本章節中所提出的方法其設計演算法如下所示: 步驟 1: 建構模糊神經網路 fˆp ( x | φ p ) ，包含模糊集合 x 與權重值向量 φ p 。步驟 2: 藉著利用簡化的蟻群最佳演算法與本章節所提出的能量適應函數. (3-21)式調整其權重值向量。步驟 3: 計算模糊神經網路的輸出 fˆp ( x | φ p )，然後推得其控制律(3-18)式。. 第三節模擬結果這個部分將顯示其所提出方法的模擬結果，以利用於控制多輸入多輸出的非線性系統，並且可以說明閉迴路系統的穩定性是可以被保證的。. 範例: 考慮以下一個彈簧連接的雙倒單擺平衡問題[43]，描述如下所示: x&11 = x12 x&12 =. m1 gl k u k sin( x11 ) − x11 + 1 + x21 J1 J1 J 1 J1. x&21 = x22 x&22 =. (3-26). m2 gl k u k sin( x21 ) − x21 + 2 + x11 J2 J2 J2 J2. 其中， xi1 代表第 i 個單擺從垂直的參考來看的角度位置， ui 代表其力矩的輸入。假設 xi1 與 x&i1 都是可以量測的。雙倒單擺的參數設定選擇如下 m1 = 0.5 kg，m2 = 0.5 kg， J 1 = 0.5 kg， J 2 = 0.5 kg，k = 2 N ⋅ m/rad 與 l = 1 m。. 我們的目的就是要控制系統狀態 x p1 能去追蹤參考軌跡 y pd 。很明顯的，從. (3-26)式與(3-1)式，其所提出的方法適合控制於此系統。簡化的蟻群最佳演算法的設計參數給定費洛蒙的蒸發係數 ρ = 0.7 與路徑總數 r = 4 。而 fˆp ( x | φ p ) 所調整的權重值參數 φ p 在區間 D =[-1,1] 。參考訊號設定為 y1d (t ) = (2.5π /12)sin(t ) 與 y2 d (t ) = (3.75π /12) cos(t ) 。對 x pi ，i=1,2，歸屬函. 數給定如下所示. 31.

(45) μ A ( x pi ) = exp[ −( x + 1) 2 ] 1 i. μ A ( x pi ) = exp[ −( x + 0.5) 2 ] 2 i. μ A ( x pi ) = exp[ − x 2 ] 3 i. (3-27). μ A ( x pi ) = exp[ −( x − 0.5) 2 ] 4 i. μ A ( x pi ) = exp[−( x − 1) 2 ] 5 i. 為了要將所提出的方法用於系統上，有界的 f pU ，p=1,2，必須被獲得為如下所示: f1 ( x1 , x2 , x3 , x4 ) =. m1 gr k k sin( x11 ) − x11 + x21 ≤ 9.8 + 4 x11 + 4 x21 J1 J1 J1. ≡ f1U ( x1 , x2 , x3 , x4 ) f1U =. (3-28). 1 1 ( f1U + α&11 ) = ( f1U + c11 z&11 + && y1d ) b1L b1L. f 2 ( x1 , x2 , x3 , x4 ) =. m2 gr k k sin( x21 ) − x21 + x11 ≤ 9.8 + 4 x21 + 4 x11 J2 J2 J2. ≡ f 2U ( x1 , x2 , x3 , x4 ) f 2U =. (3-29). 1 1 ( f 2U + α& 21 ) = ( f 2U + c21 z&21 + && y2 d ) b2 L b2 L. 其中， bpL 是未知常數 bp 的下限值，在此給定 b1L = b2 L = 1.5 。初始狀態設定為 x (0) = [0.5,0,-0.3, 0] 。設計參數的選擇如下 c11 =8, c12 =10, c21 =8, c22 =10, V u = 0.5 (case 1) 與 V u = 0.025 (case 2) 。模擬結果顯示於圖. 3-2~3-9。從 case 1 中，圖 3-2~3-5 顯示其所提出的控制演算法能控制多輸入多輸出未知的非線性系統以追蹤想要的軌跡，在期追蹤誤差還沒到穩定的限制時(V ≤ V u = 0.5 )。在 case 2 中，圖 3-6~3-9 顯示系統的輸出 x11 與 x21 能相對的追蹤到其參考訊號 y1d (t ) 與 y2d (t ) 且效果良好。而與 case 1 的. 模擬結果相比較，case 2 當其控制輸入在某些區間震盪抖動影響發生時，能完成較好的追蹤效果，如圖 3-8 所示。而震盪抖動影響的發生由於加入了穩定的控制項 u ps ，當追蹤誤差超過於穩定界線( V > V u = 0.025 )。. 32.

(46) 0.8 0.6 0.4 0.2 0 -0.2 -0.4 -0.6 -0.8. 0. 1. 2. 3. 4. 5 6 Time(sec). 7. 8. 9. 10. 圖 3-2 系統輸出 x11 與有界的參考命令 y1d (t ) (虛線) (case 1). 1.5. 1. 0.5. 0. -0.5. -1. -1.5. 0. 1. 2. 3. 4. 5 6 Time(sec). 7. 8. 9. 10. 圖 3-3 系統輸出 x21 與有界的參考命令 y2 d (t ) (虛線) (case 1). 33.

(47) 150. 100. 50. 0. -50. -100. 0. 1. 2. 3. 4. 5 6 Time(sec). 7. 8. 9. 10. 圖 3-4 控制輸入 u1 (t ) (虛線)與 u2 (t ) (點線) (case 1). 0.6 0.4 0.2 0 -0.2 -0.4 -0.6 -0.8 -1 -1.2 -1.4. 0. 1. 2. 3. 4. 5 6 Time(sec). 7. 8. 9. 10. 圖 3-5 追蹤誤差 z11 (t ) (虛線)與 z21 (t ) (點線) (case 1). 34.

(48) 1 0.8 0.6 0.4 0.2 0 -0.2 -0.4 -0.6 -0.8 -1. 0. 1. 2. 3. 4. 5 6 Time(sec). 7. 8. 9. 10. 圖 3-6 系統輸出 x11 與有界的參考命令 y1d (t ) (虛線) (case 2). 1.5. 1. 0.5. 0. -0.5. -1. -1.5. 0. 1. 2. 3. 4. 5 6 Time(sec). 7. 8. 9. 10. 圖 3-7 系統輸出 x21 與有界的參考命令 y2 d (t ) (虛線) (case 2). 35.

(49) 150. 100. 50. 0. -50. -100. 0. 1. 2. 3. 4. 5 6 Time(sec). 7. 8. 9. 10. 圖 3-8 控制輸入 u1 (t ) (虛線)與 u2 (t ) (點線) (case 2). 0.6 0.4 0.2 0 -0.2 -0.4 -0.6 -0.8 -1 -1.2 -1.4. 0. 1. 2. 3. 4. 5 6 Time(sec). 7. 8. 9. 10. 圖 3-9 追蹤誤差 z11 (t ) (虛線)與 z21 (t ) (點線) (case 2). 36.

(50) 第四章即時 CACOA 為基礎的輸出回授利用 B-spline 模糊神經網路控制器以控制非線性系統在本章節中，B-spline 模糊神經輸出回授控制器根據簡化的蟻群最佳演算法的提出以控制未知的非線性系統。其控制觀點主要在模糊神經控制器的權重值經由簡化的蟻群最佳演算法(Compact Ant Colony Optimization,. CACOA)即時的調整。在本章節，控制系統的穩定性會透過模擬例子做說明。. 第一節 B-spline 歸屬函數(B-splin membership functions, BMFs) 首先，定義其任一階的 B-spline 函數能被描述成如下所示。對 p+1 個控制點 {c0 , c1 ,..., c p } 而言，B-spline 函數 B(λ ) 能被定義成如下所示[34]: p. B (λ ) = ∑ ci N i ,s (λ ). (4-1). i =0. 其中 N i , s (λ ) =. (λ − λi ) N i , s −1 (λ ). λi + s −1 − λi. +. (λi + s − λ ) N i +1, s −1 (λ ). λi + s − λi +1. ⎧ 1 if λi ≤ λ < λi +1 N i ,1 (λ ) = ⎨ ⎩ 0 otherwise. , λi ≤ λ < λi + s. (4-2). 其中 N i , s (λ ) 表示 s 階第 i 個 B-spline 混合方程式。而節點是我們從一連串的實數中所選出來的整數， {λ0 , λ1 ,...} 稱為節點向量 T ， T = {λ0 , λ1 , λ2 ...} 。方程式(4-2)式是一個遞迴的定義以具體說明如何從兩個 s − 1 階的混合方程式來建構 s 階的方程式。根據以上的描述，B-spline 歸屬函數(B-splin. membership function ,BMF) μ A ( xq ) 能被表示成 37.

(51) p. μ A ( xq ) = ∑ ci N i ,s ( xq ). (4-3). i =0. 其中 xq 是輸入數據，而 A 是個模糊集合。在本章節中，我們採取 BMFs 為模糊歸屬函數且利用 CACOA 來獲得一組最佳的權重值因子。. 第二節 CACOA 為基礎的輸出回授 B-spline 模糊神經控制在這個部份，僅在系統輸出可量測且可利用的限制之下，將所發展的. CACOA 為基礎的輸出回授 B-spline 模糊神經控制器以控制未知的非線性系統。我們利用簡化的蟻群最佳演算法(CACOA)以即時的調整 CACOA 為基礎的輸出回授 B-spline 模糊神經控制器的權重值。藉著利用監督式控制(supervisory control) [2] [30]，CACOA 為基礎的輸出回授 B-spline 模糊神經控制的補償能保證閉迴路系統的穩定。此外，其所提出的整體控制系統能保證所有的訊號在閉迴路系統中皆是有界的，且閉迴路系統的輸出能有效的追蹤到期望的軌跡。. 壹、問題描述. 考慮 n 階的非線性動態系統格式如下所示: x&1 = x2 x&2 = x3 M x&n = f ( x1 , x2 ,K, xn ) + g ( x1 , x2 ,K, xn )u + d. (4-6). y = x1. 其中， x = [ x1 , x2 ,..., xn ]T = [ x, x& ,..., x ( n−1) ]T ∈ R n 代表狀態向量， d 是個有界的外部干擾， f 與 g 是未知的方程式，且 g 不失其一般性， g 是個嚴格正的方程式， u ∈ R 與 y ∈ R 相對地代表系統的控制輸入與輸出。另外，假設 38.

(52) 僅有系統的輸出 y 是可量測的。其控制目的主要設計一個 CACOA 為基礎的輸出回授 B-spline 模糊神經控制器使得這樣的系統輸出能追蹤到有界的參考命令 yd 。首先，我們將追蹤問題轉換成一個一般的問題。(4-6)式能被重新改寫成如下所示: x& = Ax + B( f ( x ) + g ( x )u + d ). y = CT x. (4-7). 其中 ⎡0 1 0 L 0⎤ ⎡0⎤ ⎡1 ⎤ ⎢0 0 1 L 0⎥ ⎢0⎥ ⎢0⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ A = ⎢L L L L L⎥ , B = ⎢ M ⎥ , C = ⎢ M ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢0 0 0 L 1⎥ ⎢0⎥ ⎢0⎥ ⎢⎣ 0 0 0 0 0 ⎥⎦ ⎢⎣1 ⎥⎦ ⎢⎣0⎥⎦. 定義輸出的追蹤誤差 z = yd − y ，參考訊號向量 y d = [ yd , y& d ,K, yd ( n −1) ] ，與追蹤的誤差向量 z = [ z, z&,K z ( n −1) ]T = [ z1 , z2 ,K zn ]T 。根據其實際的等效方法，理想的控制律如下所示: 1 [ − f ( x ) + yd ( n ) + K Tc zˆ ] u= g (x ). (4-8). 其中， K c = [k cn , kcn−1 ,K kc1 ]T 代表回授增益向量，選擇這樣的 A - BK Tc 為特徵多項式且是 Hurwitz，因為 ( A, B) 是可控制的。因為僅有系統輸出是假設可以被量測的，且 f ( x ) 與 g ( x ) 為未知的，因此(4-8)式的理想控制律並不能被推得。為了要征服這個問題，假設控制輸入為 u = ubs + ud. (4-9). 其中， ubs 是 B-spline 模糊神經控制器的設計以近似(4-8)式理想控制律，而控制項 ud 被利用來補償外部干擾與模組化誤差。如此，為了要控制 z1 為零，設計狀態估測器以估測狀態向量 z ，使得追蹤問題能轉換成一般的問題。. 39.

(53) 另外，模糊推論引擎透過利用模糊 IF-THEN 規則來做映射，從輸入的語意向量 z = [ z1 , z2 ,K zn ] ∈ R n 到輸出的語意變數 ubs ∈ R 。第 i 條模糊. IF-THEN 規則如下所示: R ( i ) : if z1 is A1i and L and zn is Ani then ubs is B i. (4-10). 其中， A1i , A2i , K, Ani 與 B i 是模糊集合。藉著使用乘法推論引擎、單點模糊化、以及中心平均值解模糊化，其 B-spline 模糊神經網路的輸出值表示成如下所示:. ubs ( z | w) =. h. n. i =1 h. j =1. ∑ wi (∏ μ Ai ( z j )) n. ∑ (∏ μ i =1. j. j =1. Aij. = wT ξ ( z ). (4-11). ( z j )). 其中 μ Ai ( z j ) 表示其模糊變數的歸屬函數值， h 表示整體 IF-THEN 規則的 j. 規則數， wi 屬於其點時歸屬函數 μ Bi ( wi ) = 1， w = [ w1 w2 L wh ]T 是個透過. CACOA 調整可調整的權重值向量，而 ξ 是一個基底函數。. 貮、 CACOA 為基礎的輸出回授 B-spline 模糊神經控制器設計與誤差觀察器. 首先，我們改寫(4-11)式模糊神經網路的輸出如下所示: ubs ( zˆ | w) = wT ξ ( zˆ ). (4-12). 其中， zˆ 表示估測 z 。現在，設計其誤差觀察器以估測追蹤的誤差向量 z ，從(4-7)~(4-9)式，我們可以得到 z& = Az − Bk Tc zˆ + B( g (x)u − g (x)ubs − g (x)ud − d ) z1 = CT z 40. (4-13).

(54) 其中 zˆ = r - xˆ ， zˆ 與 xˆ 相對的表示估測 z 與 x 。下一步，考慮以下的誤差觀察器以估測其(4-13)式中所追蹤的誤差向量 z z&ˆ = Azˆ − Bk Tc zˆ + B( gv − gud ) + K o ( z1 − zˆ1 ) zˆ1 = CT zˆ. (4-14). 其中 K o = [kon , kon −1 ,L, ko1 ]T 是觀察器的增益向量，選擇 A − K o CT 如此的特徵多項式且是嚴格地 Hurwitz。而控制項 v 被利用來補償外部干擾 d 與模組化的誤差。接著，定義其觀察的誤差為 z% = z − zˆ 與 z%1 = z1 − zˆ1 。將(4-13)式與(4-14)式相減，我們可以得到 z&% = ( A − K o CT ) z% + B [ gu − gubs ( zˆ | w) − gv − d ] z%1 = CT z%. (4-15). 因此，(4-15)式其輸出的動態能被表示成如下所示: z%1 = W ( s ) [ gu − gubs ( zˆ | w) − gv − d ]. (4-16). 其中 s 是 Laplace 變數，而 W ( s ) = CT ( sI − ( A − K o CT )) −1 B 是個已知穩定的轉移方程式。為了要去採用 CACOA 我們假設最佳的權重值因子 w 存在。. 假設 1 [44] : 令 z 與 zˆ 相對的屬於 U z = {z ∈ ℜn : z ≤ mz < ∞} 與 U zˆ = {zˆ ∈ ℜn : zˆ ≤ mzˆ < ∞} 小型的集合。而且可以知道其最佳的參數向量 w = arg min w∈M w [sup z∈U z , zˆ∈U zˆ | u − ubs |] 位於某些凸面的範圍 M w = {w ∈ ℜn : w ≤ mw } ，其中範圍 mw 是個常數。. 根據假設 1，(4-15)式能被重新改寫成如下 z&% = ( A − k o CT ) z% + B [ gubs ( zˆ | w) − gubs ( zˆ | w) − gv + δ − d ] z%1 = CT z%. (4-17). 其中 δ = gu − gubs ( zˆ | w) 是近似的誤差，根據(4-12)式，(4-17)式能被重新改寫成. 41.

(55) z&% = ( A − k o CT ) z% + B ⎡⎣ gw% T ξ ( zˆ ) − gv + δ − d ⎤⎦ z%1 = CT z%. (4-18). 其中 w% = w − w 。因為僅有 (4-18) 式中輸出 z%1 可以被量測的，我們利用. SPR-Lyapunov 設計方法[45]以分析(4-18)式穩定性。方程式(4-18)式能被重新改寫為 z%1 = W ( s ) ⎡⎣ gw% T ξ ( zˆ ) − gv + δ − d ⎤⎦. (4-19). 其中 W ( s ) = CT ( sI − ( A − K o CT )) −1 B 是個已知的轉移方程式。為了要利用. SPR-Lyapunov 設計方法，(4-19)式能被寫成如下 z%1 = W ( s ) L( s ) ⎡⎣ w% T ξ ( zˆ ) − v f + δ f ⎤⎦. (4-20). 其中 v f = L−1 ( s )[ gv ]，δ f = L−1 ( s )[δ − d + gw% T ξ ( zˆ )] − w% T ξ ( zˆ ) ，且 L( s ) 被選擇以至於 L−1 ( s ) 是個真的穩定的轉移函數，且 W ( s ) L( s ) 是個真的 SPR 轉移方程式。假定 L( s ) = s n −1 + bn −2 s n−2 + L b0 ，這樣 W ( s ) L( s ) 就是一個真的 SPR 轉移方程式。然後，其(4-20)式實際的狀態空間能被寫成如下 z&% = A c z% + B c ⎡⎣ w% T ξ ( zˆ ) − v f + δ f ⎤⎦ z%1 = CTc z%. (4-21). 其中 A c = ( A − k o CT ) ∈ℜn×n , BTc = [1 bn−2 Lb0 ] ∈ℜn 且 CTc = [1 0 L 0] ∈ℜn 。為了要完成 CACOA 為基礎的 B-spline 輸出回授控制器穩定性的目的，以下的假設與輔助定理式必須的。. 假設 2 : 未知的非線性方程式 g (x) 是有界的 β1 ≤ g ( x ) ≤ β 2. (4-22). 其中 gl = β1 、 g u = β 2 給定為正的常數。未知的非線性方程式 f ( x ) 是有界的 f ( x ) ≤ f u ( xˆ ) 。. 假設 3 : δ f 假設為滿足如下所示 δf ≤ε 其中 ε 是個正的常數。. 42. (4-23).

(56) 證明(a) : 考慮 Lyapunov 方程式如下 V=. 1 T z% Pz% 2. (4-24). 其中 P = PT > 0 。對於(4-24)式時間微分且將(4-21)式帶入到以上的方程式則可以推得 1 V& = z% T ( A Tc P + PA c ) z% + z% T PB c ⎡⎣ w% T ξ ( zˆ ) − v f + δ f ⎤⎦ 2. (4-25). 因為 W ( s ) L( s ) 是 SPR，且 P = PT > 0 存在，如此可以得到. ATc P + PA c = −Q. (4-26). PB c = Cc 其中 Q = QT > 0 。藉著利用(4-26)式，(4-25)式變成 1 V& = − z% T Qz% + z%1 ⎡⎣ w% T ξ ( zˆ ) − v f + δ f ⎤⎦ 2. (4-27). 令 v 給定如下 ⎧ σ if z%1 ≥ 0 v=⎨ ⎩ −σ if z%1 < 0. (4-28). 其中 σ ≥ (ε / β1 )。藉著利用假設 2 與 3，(4-28)式與 λmin ( Q ) z% ≥ λmin ( Q ) z%1 2. 的事實，其中 λmin ( Q ) > 0 ，我們可以得到 1 2 V& ≤ − λmin ( Q ) z%1 + z%1w% T ξ 2. 2. (4-29). 因為 w% = w − w ，我們可以得到 1 2 V& ≤ − λmin ( Q ) z%1 + z%1wξ − z%1wξ 2 1 2 ≤ − λmin ( Q ) z%1 + z%1u − z%1ubs 2. (4-30). 然而，從(4-30)式中，我們可以發現其要讓(4-30)式中最後一項 ubs 小於零是很困難的。要如何解決這個問題呢? 首先，我們利用 CACOA 來調整 ubs 的權重值主要希望(4-30)式的最後一項能小於零。因為 u 是未知的且傳統的適應函數僅適合於離線學習，因. 43.