• 沒有找到結果。

輻狀基底函數類神經網路(RBFNN)

第三章 理論概述

3.1 類神經網路

3.1.2 輻狀基底函數類神經網路(RBFNN)

輻狀基底函數類神經網路(Radial Basis Function Neural Network, RBFNN),或稱半徑式類神經網路,其特質主要在於模擬大腦皮質層軸 突的局部調整功能,具備相當良好的映射能力;其架構與多層感知器 相同,具有輸入層、一層隱藏層與輸出層,是屬於基本前饋式類神經 網路的組合,其優點在於可大量減少學習時間;但不同於其他的類神 經網路型態,RBFNN 是以函數逼近(curve fitting)的方式來建構網路,

最早衍生於解決多變數的內插(interpolation)問題,並由 Powell(1987)針 對這個問題作了一些探討,以不規則位置的資料點,求得相對應的輻 狀基底函數,之後陸續有許多學者也提出類似的架構(Broomhead and Lowe, 1988),解決內插與近似的理論。RBFNN 主要概念是建構許多輻 狀基底函數 (‖ − ‖),以函數逼近法(curve fitting)找出輸入/輸出間的 映射關係,也就是在隱藏層的各神經元中建立相對應的輻狀基底函數。

在此以 N 個維度的輸入值、M 個神經元的隱藏層與一個輸出值作為 RBFNN 架構與演算法說明,其架構如圖 3-9 所示。

在 RBFNN 中每一層所扮演的角色各有不同,輸入層是輸入資料與 網路連結的介面層,再將輸入資料經過非線性活化函數轉換到隱藏層,

也 就 是 將 輸 入 空 間X(X ∈ ℜ × ) 進 行 非 線 性 映 射 到 隱 藏 空 間 Z(Z ∈ ℜ × ),輸出層則是將隱藏層的輸出進行線性組合(或線性映射)獲得 輸出值。

‧‧‧ ‧‧‧ ‧‧‧

圖 3-9 輻狀基底函數類神經網路架構圖

RBFNN 演算方法:

當訓練範例資料輸入網路後,直接由輸入層將輸入向量傳給隱藏 層中的每個輻狀基底函數,也就是計算輸入向量與隱藏層各神經元中 心點的距離後,經函數轉換獲得隱藏層各神經元的輸出如( 3-5)式:

( ) = ∅( − ) j = 1, 2, …, M ( 3-5)

式中∅(∙)表輻狀基底函數, 表隱藏層第 j 個神經元中心點,

− 表示 x 與 間之歐氏距離;將隱藏層的輸出值經加權傳至輸出 層,即可求得網路輸出值如( 3-6)式:

y = ∙ ( ) ( 3-6)

式中 y 為輸出層的輸出值, 為隱藏層第 j 個神經元至輸出層的權 重值, 為隱藏層第 j 個神經元的輸出值。將( 3-5)式代入( 3-6)式可寫 成( 3-7)式:

y = ∙ ∅( − ) + ( 3-7)

一般來說,隱藏層中的輻狀基底函數,其型式有:線性函數、三 次函數、薄平面曲線函數、高斯函數等,如圖 3-10 所示,在本研究選 擇以高斯函數為輻狀基底函數,如( 3-8)式所示。

∅(‖ − ‖) = exp −‖ − ‖

2 ( 3-8)

式中 為控制輻狀基底函數平緩度之參數。

圖 (摘自張斐

圖 3-10 各 斐章、張麗

各形式之輻狀 麗秋,2010

狀基底函數

,類神經網 數

網路導論)

由於自組特徵映射網路(SOM)演算法為非監督式的學習演算法,因 此在其訓練階段完成後,任一輸入向量皆可獲得其相對應的聚類中心 層之神經元,但整個網路架構沒有輸出向量,因此針對聚類中心層所 產生的結果再加以架構一層網路輸出層如圖 3-11 使得自組特徵映射 網路得以擷取輸入向量的統計聚類特性而獲得輸出值(Chang and Chang, 2010);本研究以接輻狀基底函數類神經網路來架構網路輸出 層。

圖 3-11 架構自組特徵映射網路輸出層

3.1.3 倒傳遞類神經網路(BPNN)

倒 傳 遞 類 神 經 網 路 的 架 構 為 多 層 感 知 器 (Multilayer Perceptron,MLP),如圖 3-12 所示,其架構為多層前饋式類神經網路,

採用監督式學習法(supervised learning),一般使用的學習演算法為誤差 倒傳遞演算法(Error Back Propagation, EBP),簡稱為 BP 演算法。結合 MLP 與 EBP 的類神經網路即稱之為倒傳遞類神經網路(BPNN)。一般 常用的倒傳遞類神經網路架構由三層所構成,包含輸入層、隱藏層 (hidden layer)及輸出層,隱藏層是在輸入層與輸出層之間,與外界資訊 隔離,實際上輸入層如同單層感知器的輸入層,並不對輸入資訊作處 理,只是當外界輸入訊息的傳遞介面,將輸入訊息直接往後傳遞,因 此實際有作用的神經元只有隱藏層及輸出層兩層。隱藏層的層數可依 問題複雜度由一層增加到數層,但一般來說不需超過兩層以上。至於 神經元數目則依問題的型式而定,隱藏層神經元數目若過少則無法有 效描述問題的型態,過多則可能造成過度描述(Over-fitting)而無法有效 應用,且會使得網路歸納推演的能力降低並徒增訓練的時間。至於選 取多少神經元數目並無一定標準,一般皆依問題的形式而定,本研究 則以多數專家建議之試誤法(trial-and-error)來決定網路神經元個數。

圖 3-12 倒傳遞類神經網路架構圖

網路中靠相關權重連結各層間之神經元,輸入值由輸入層直接傳 入隱藏層,經加權累加後再透過活化函數轉換可得一輸出值,同理再 傳入輸出層。常使用的活化函數型式相當多,包括線性轉移函數、對 數雙彎曲轉移函數、正切雙彎曲轉移函數及線性轉移函數等。

倒傳遞演算法的學習過程,其學習過程是由正向傳遞與負向傳遞 所組成,在正向傳遞過程中,輸入訊息從輸入層經由隱藏層加權運算、

透過轉換函數處理後,再傳向輸出層運算後輸出,每一層神經元的狀 態只影響下一層神經元的狀態;若網路輸出值與目標輸出值誤差範圍 不在容忍範圍內,則轉為反向傳播,將誤差訊號沿原來的連接通路回

傳,透過修改各層神經元的權重與偏權值,期能使誤差值達到容忍誤 二階梯度法,一階梯度法包括梯度下降法(gradient method)、最陡坡降

) ( nj

n

j f net

y

的技巧加以改善,如可變學習速率(Variable Learning Rate)或有彈性的 可用微積分學的連鎖律(chain rule)得

ji

(1) 若第 n 層為最終層,即網路的輸出層:

  

1

1 項與目標輸出值 input-output pair),各連結的權重即可依此方式,加以 調整。

交叉驗證法(cross validation)應用於資料過少或資料變異性大時,

計特性無法正確表現出資料的真實情況,在架構類神經網路時,將顯

得到平均訓練及驗證之誤差值,本誤差可客觀表示本網路架構之 誤差值。

6. 完成第 1 組資料集合之交叉訓練工作後,接續第 2 組資料集合之 交叉驗證工作,直至所有水質模式均完成交叉驗證工作,即可優 選出一組最佳的網路參數。

整體交叉驗證過程,資料充份混合及重新排序,可得到整體網路 較穩定之參數值,比較交叉驗證時,訓練與驗證之誤差,即可瞭解模 式之穩定性及可靠性。

3.3 評估指標

本研究採用兩種評估指標,評估水質推估模式之準確性與適用性 針對此兩種評估指標之定義與公式,說明如下:

相關文件