• 沒有找到結果。

針對模式的強健性評估,本研究考慮可能造成結果變異的情況,分別為訓練 資料量不同、訓練資料挑選不同、資料噪音大小以及模式初始權重不同。於此章 節分析這四種不同情況對 BPN 模式以及 SVM 模式造成的影響,並進行討論。

4-1 訓練資料量的影響

本研究中針對九場資料分別挑選一至九場,以全組合方式建立訓練與測試資 料,而其中 Herb 因有極端的事件資料,故必須在模式訓練資料中,其餘八場為 Polly、Gradys、Tim、Fred、Ted、Ruth、Seth、Doug。各組合內數目如表 3-1 中 所示。

資料的取得在研究過程中,一直以來是相當重要的一個環節,但有時由於測 站故障等天然或人為的因素下,資料並無法順利取得,而在資料量短少的情況下,

模式是否依然可以推估出需要的結果,對於模式的強健性將是一大考驗。在此,

本研究針對不同訓練資料量進行測試,最先加入的是擁有極端資料的 Herb 颱風,

但對於接下來要加入何場資料,目前並無定論說明究竟該如何挑選,故此針對第 一類組合到第九類組合中所有訓練資料進行測試,一共有 255 種不同的訓練資料,

如表 4-1 至表 4-8 所示。測試的結果大致上趨勢相同,故在此使用其中一例來說 明,此例為推估未來五小時流量的結果,如圖 4-1 所示。在圖中可看出,BPN 在 訓練資料量少時,表現的並不良好。在此例中,訓練資料量 200 筆以下時 CE 值更 低於 0,但在逐漸增加訓練資料量後,將提升測試結果的 CE 值,慢慢的增加到接 近 SVM 的水準。反觀,SVM 在不同訓練資料量時,對其測試結果的影響並不大,

能一直維持在一定水平內。這說明了 BPN 受到資料量的影響大過 SVM,BPN 在

訓練資料充足時,方可呈現良好的測試結果。而 SVM 對於訓練資料量的依賴度低 過 BPN,不需要大量的訓練資料即可建構出良好的模式,也就是說,在訓練資料 數的影響下,SVM 的強健性高過於 BPN。

4-2 訓練資料挑選的影響

在收集資料後,該將那些場次挑選為訓練資料,在模式的建立上一直以來尚 未有一定論,通常在架構模式時,會花費大量的時間在於挑選訓練資料上,而挑 選不同的訓練資料對模式表現會有所影響,甚至不確定是否有可能因訓練資料挑 選的不同而造成結果上的差異,因此,模式表現是否會因訓練資料挑選的不同而 不同,這也關乎模式的強健性高低。因此,本研究將表 4-1 至表 4-8 中全部組合 進行測試並計算 CE,結果如表 4-9 至表 4-16,並將每一類組合中 BPN 與 SVM 結果的 MCE 比較如圖 4-2 至圖 4-9 所示。再針對每一類組合中不同訓練資料計算 其 CV,結果如表 4-17 與圖 4-10 至圖 4-16,由於第一類組合只有一個訓練資料,

故無 CV,在此不討論。從圖 4-2 至圖 4-9 中可看出,SVM 的 MCE 略高於 BPN 的 MCE,且差距隨推估時刻的增加而增加,在預報未來五小時流量時最高差達 0.035,而在圖 4-10 至圖 4-16 中卻可發現,BPN 的 CV 隨著預報延時的增加,變 異性也隨著增加。這說明了 BPN 會隨著訓練資料的不同而影響其結果的變化,同 一組合中 BPN 預報結果的 CE 值差可達近 0.3,雖然在 MCE 結果差不多,但卻有 相當大的變異性,也就是說,BPN 受訓練資料影響大過 SVM,而 SVM 並不會因 為訓練資料挑選而有太大的變異。所以,在訓練資料挑選上,SVM 不會像 BPN 受 到相當大的影響,也就是 SVM 並不需要特別去測試訓練資料的組合,其強健性在 建立模式是優於 BPN。

4-3 資料噪音的影響

對於 data-based 的模式而言,用來架構模式的資料是決定模式表現的重要關 鍵,除了資料量以及場次不同的選取方式會對結果產生影響之外,資料中包含噪 音量的多寡,也可能對模式的表現造成影響,而輸入因子與輸出項之間會由於關 連性的強弱造成資料噪音的大小,假設 A 因子與輸出項之間的關連性高於 B 因子,

相對來說,即表示 B 因子對於輸出項而言,資料中所含的噪音會高於 A 因子。若 能藉由改變輸入項來改變噪音量,分析模式表現,便能對模式的容噪音能力有所 認知。若模式容噪音的能力高,則表示模式較不受無用的資料或是有誤差的資料 影響,也就表示模式的強健性較高。

從前人研究得知,颱風因子具有描述降雨趨勢的能力,而降雨資料對流量而 言是相當重要的影響因子,由此猜測颱風資料可能能夠提供較長延時的流量預測 一些資訊。但由於颱風因子在量測上不是非常精密,加上從颱風侵台到產生流量 的過程複雜,颱風因子與流量的關係並不直接,因此對流量而言,颱風因子是具 有相當大噪音量的因子。因此,本研究藉由在 BPN 及 SVM 模式中加入颱風因子 來觀察噪音對模式的影響。

在 BPN 模式中,加入颱風因子使得模式的表現明顯變差,尤其預測時間越長,

模式準確度降低越多,如圖 4-17。預測時間越長代表輸入項與輸出項的相關性越 低,也就表示輸入項對輸出項而言噪音越多。此結果呈現出 BPN 模式對於颱風因 子內包含的噪音無法容忍,且當噪音量越大,對模式影響程度就越大。反觀 SVM 的結果,如圖 4-18。其受影響的程度不明顯,而隨著預測時間拉長,颱風因子對 流量的影響有逐漸顯現的趨勢,在預測 5 小時流量時,有加入颱風因子的 SVM 模 式甚至有略為的增進模式準確度。此現象說明 SVM 容忍噪音的能力優於 BPN,且 SVM 萃取有效資訊的能力也優於 BPN。即從容噪音能力來看,SVM 的強健性亦 優於 BPN。

4-4 初始權重的影響

BPN 因其特性,隱藏層的權重需訂定一初始值,在反覆訓練下修正其權重,

以達到良好的測試結果,但在初始權重不同下,有可能落入區域最佳解的問題,

而初始權重該如何決定也尚未有一定論,一般 BPN 避免權重影響的作法是訓練多 次之後取最佳結果,且需訓練多少次也是因事件而異,這樣的過程相當耗時費力。

而 SVM 是一最佳化問題,解空間為凸面圖形,因此有全域最佳解的特性,在決定 懲罰係數與容許誤差後,將有唯一解。為評估 BPN 受初始權重影響的程度,因此 假定一案例,選用 4-1 節中所使用預報未來五小時流量的結果,並讓 BPN 隨機產 生 60 組初始權重,並將 60 組不同權重產生的結果與 SVM 的結果比較,結果如圖 4-19。從結果可看出,BPN 的測試結果受到初始權重相當大的影響,而 SVM 不論 測試幾次,結果都是相同的,也就是說 SVM 並無初始權重的問題,在建立模式時 無須懷疑每回可能產生不同結果,這表示 SVM 在模式本身的強健性優於 BPN,並 於模式架構過程能節省相當多的時間。

相關文件