互動式學習倒傳遞類神經網路

第二章文獻探討

2.2 研究方法

2.2.3 互動式學習倒傳遞類神經網路

第二期研究計畫是針對學習績效的改善為主要目的，冀以改善 BPNN 之輸入值推論值正確率。由於早期建立模擬現實複雜系統以線性(Linear)方程式為主，近期則發展出多種複雜結構序列、平行以處理非線性模式現實狀況。Qin[17]指出多層前饋式網路（MFNN）網路結構接受學習方法彈性高，因此現行非線性模式相關研究多使用 MFNN 為方法論。倒傳遞類神經網路(Back-Propagation)即為應用最廣泛之 MFNN 網路結構。

BPNN 誤差平面(Error Surface)為多維曲面，學習機制乃 BPNN 網路依據推論值與案例期望值差距回饋遞迴得到最佳之權重組合。而傳統 BPNN 權重調整幅度為定值，對於多維權重空間內各維間尺度相對於輸出誤差比例的不一致，及權重調整方向等問題，若使用傳統線性搜尋最佳解經常會因權重變化能量過小，導致推論正確率無法提升；此現象相關文獻稱偽局部最小化(False Local Minima，FLM)。

一般 BPNN 相關研究對學習績效表現，均以收斂速度與推論正確率兩項作為評估準則。但因 BPNN 對收斂速度與推論正確性需求各有獨特學習方法論導至無法兼顧，而營建管理領域中使用 BPNN 大部分於分析複雜系統之預測、分類、最佳化等類型問題，此 FLM 分析結果應用於營建管理實務將造成不確定性增加，進而影響決策品質。故第二期計畫將提出全新 BPNN 推論正確率學習績效方法論，

以避免 FLM 現象發生，並增進第一期計畫所建立之信用評等模式之準確性。

為提昇 BPNN 推論正確率及使推論整體誤差最小化（Error Gobal Minimum），相關研究多由誤差函數變化觸發權重調整機制及固定常數調整幅度進行探討。首先以誤差函數一次微分作為權重調整幅度依據，如結合斜率法 (Conjugate Gradient)[18]、最陡坡降法 (Steepest Descent ) [18]。進一步牛頓法(Newton’s Method) [18]增加在多維空間中，將誤差方程式二次微分作為權重調整方向判斷機制。另有將權重調整機制以退火理論[19]機率值取代確定值，模擬能量遞減狀態進而控制權重調整。

前述各方法論中以 Newton’s Method 提昇推論正確率成效最佳 [20]，但其計算二階導數矩陣時較傳統 BPNN 所需之記憶空間呈現二次級數增加[21]。因此實際應用上有其限制性，如高階計算器、大量計算時間，故有必要發展較簡捷且具備訓練正確率之 BPNN 學習方法論。

傳統上 BPNN 受學習係數、訓練案例品質及網路結構彈性差異等因素影響，造成其推論值正確率有待提升，由前言中得知 Newton’s Method[20]能有效提昇訓練正確率，因此重點在於如何獲得適當學習係數。此外由於 BPNN 權重調整機制中，其權重調整幅度決定於差距斜率δ與學習係數η兩項變數，欲利用此二項變數於多維錯誤空間中搜尋錯誤最小點，達成良好訓練正確率，仍有以下問題尚待改善：

(1) 調整權重之學習係數之設定為一常數，且以試誤求得。此常數於不同之權重空間時其學習係數應進行調整。

(2) 調整權重僅考慮錯誤方程式斜率（即權重調整量）不考慮方向（即權重維度差異），因此流於線性搜尋，不符多維度錯誤曲面需求。

(3) 學習係數因權重空間中各維尺度比例有所差異，未必適用所有結

點權重。

以上問題均使得 BPNN 之正確率無法有進一步提昇，因此無法建立模式可信度。近年來有許多相關研究以調整學習係數提升訓練正確率作為主要課題，如下所述。

傳統 BPNN 在各學習循環學習係數上之設定為相同常數，使得誤差函數變化無法適時調整。進而發展 Delta-bar-delta 法，由 Jacobs[22]提出：學習係數藉由前一學習循環階段與本學習循環階段之能量方程式中，根據權重斜率值乘積之正負值決定增減係數。此外 Yamada 發展 STELA 法，將隱藏層單元飽和狀態定義為學習停頓狀態，如發生飽和情況時則重複降低權重調整斜率過程，直至跳出學習停頓狀態，然後進行調整權重且將權重調整斜率調回原值。綜合以上所述，學習係數值訂定仍以人工試誤判斷，無法得到通解。Etinne 提出推論式學習係數調整法，以線性搜尋法進行學習係數調整，學習係數於不同之學習循環之數值應隨之調整，學習係數調整機制將學習績效良好學習階段之權重組合轉化成特性長度基準 L，若後續學習循環學習正確率低於基準學習循環正確率，則將目前特性長度定義為 l，

以決定線性方程式調整學習係數η=L/l。如後續學習循環學習績效更佳，則將疊代特性長度基準定義為 L；重複此過程直到誤差值低於收斂門檻值停止學習過程，此時基準學習循環權重組合所得推論輸出值可得最佳訓練績效。

經由上述文獻探討可知，BPNN 最佳化方法論發展至誤差函數微分方法論已臻成熟，但獲得正確權重調整幅度及方向過程中，必須大量擴增記憶空間與計算過程，耗費計算成本過大，故本研究擬發展最適權重搜尋法，建立線性與非線性方法論結合模式，獲得近似誤差函

數微分方法論，以訓練正確率。本研究基於上述原因，擬改變 BPNN 學習係數產生方式，發展全新推論式學習係數調整法，但經由文獻探討得知，未來仍有以下問題尚待克服：

(1) Etinne 以各權重轉化成特性長度比，產生一種學習係數適用所有權重，未考量各權重間差異性。

(2) 學習係數調整頻率應尋求一適合方式。Etinne 主張推論式學習係數方法論不宜以 Batch（過於僵化）或 Online（過於頻繁）方式作為輸入訓練案例之處理頻率。而初始權重亦被證明對訓練績效具相當影響；訓練案例輸入與權重調整頻率需同時在過濾系統雜訊與突顯背景系統資訊兩種需求間取得平衡。

基於以上學習係數調整頻率需求，本研究整理有關於權重調整頻率與案例輸入量關聯影響訓練正確率之相關研究，首先 Gian[24]指出初始之權重值即決定爾後於權重空間搜尋出發點，對於尋找最佳之權重組合，以跳脫局部最小化有顯著之影響。而訓練案例輸入與權重更新初始值跳脫調整之方式，對於訓練案例之系統雜訊或權重調整震盪 (Oscillation)中，將有助於最佳權重組合獲得。一般而言，訓練案例輸入與權重更新頻率相關方法分為兩類[17]，第一類是在所有訓練案例，當其錯誤方程式偏微分全部完成後，一次調整結點間之權重，稱為批次學習(Batch Mode)。第二類是在每一訓練案例輸入後，隨即調整結點連結之權重，此種權重調整模式稱為即時學習(Online Mode)，

此方法藉隨機選取訓練案例輸入調整造成微小波動有時可減低誤差值。Zhao[25]提出在選用此兩種模式進行分析時，若問題本身具以下特性，以批次學習模式能獲得較佳之權重調整值：

1.訓練案例資料包含雜訊較多。

2.錯誤平面結構較複雜。

3.較少分類樣式數目情形。

若問題特性相反則以即時學習模式較佳。

Rumelhart[23]指出：在學習係數值較小狀態時，即時學習模式近似批次學習模式績效。批次學習之權重調整頻率低於即時學習頻率時，對於隱藏於訓練案例輸入值之資訊之反映較即時學習差，過濾雜訊表現較佳。基於前述之學習係數調整頻率與反映訓練案例背景資料過濾雜訊資料需求，本研究擬結合 Batch 和 Online 兩者優點，發展新訓練案例輸入模式。

鑑此，第二期計畫發展 BPNN 互動式學習模式，期能以合理計算成本獲得推論正確率較高 BPNN 預測模式，並冀以改善第一期所建立之信用評等模式之準確性。

在文檔中營造廠商財務信用評等模式最佳化之研究(III) (頁 31-35)

第二章 文獻探討

2.2 研究方法

2.2.3 互動式學習倒傳遞類神經網路

第二章文獻探討