6-2.1 2-staged Gamma Test - 時間與空間最佳化資訊於降雨逕流模式分析之研究

由降雨所產生之逕流量在經過複雜地形進入水庫所需時間，其為一高度非線性關係(Zuazo et al.,2014)，然而大部分研究針對降雨逕流之集流時間多以簡單線性相關係數法分析，透過尋找最大相關係數定義集流時間(Pianosi et al., 2014;

Pramanik and Panda, 2009)，如本研究第五章所述。因此本研究將透過一非線性方法 Gamma Test 尋找降雨逕流最佳延遲時間。

Gamma Test為一個可挑選模式最佳輸入項方法，其假設一組資料(資料變數為M)可由某個平滑函數所描述(Chang et al., 2013; Chang, et al., 2014; Jones, et al., 2007; Koncar, 1997)，而剩下無法被平滑函數描述的部分，即稱為Gamma統計量 (Γ)。GT演算中的平滑函數為輸入向量(X)的p個 1 ≤ k ≤ p鄰近資料點所組成，

可計算輸入向量的Delta函數：

= 1

^,−

1 ≤ ≤ (6.1)

其中|⋯ |為尤拉距離，而相對應的輸出向量Gamma函數則可表示為

# = 1

2 %^,− %

1 ≤ ≤ (6.2)

其中p的決定則與取樣密度有關(Koncar, 1997)，而y_,為第k個鄰近點所 對應之y值。針對每個鄰近點都可以計算得到一組Delta函數與Gamma函數。

Gamma統計量的計算，則可透過p組Delta函數與Gamma函數的迴歸式中獲得，如 下式

# = ' + ) (6.3)

其中A為迴歸係數。

針對每個輸入向量的子集合，GT估計其噪音項(即))，當此噪音項最接近零時，

其對應的子集合則可視為最佳的輸入變數組合，因此可有效的找出類神經網路的最佳輸入變數組合，以減少ANN的輸入維度(Chang et al., 2013; Noori et al., 2010)。

一般而言，使用GT挑選出最佳輸入變數組合的計算流程包含：

1. 計算所有可能的輸入組合(2 − 1)之Gamma統計量。

2. 將所有統計量())由小至大排序，並將最小的前10%分類為最好的群組，

將最大的後90%，分為最差的群組。

3. 計算每個變數出現在最好跟最差群組中出現次數的比值，此比值越高表示該變數越好。

雖然GT可有效的找出最佳的輸入變數組合，但是當M值較大時，GT的

在第一階段：

從M個變數中挑選其中1至N個變數，因此可能之輸入組合數共有 C^,+ C + C_*^,+ … + C_.^,個。

重複上述的步驟2與步驟3。

由上述的比值，利用手肘點法(Kim et al., 2013; Su et al., 2006)挑出前K個變數。

在此階段，所有的M個變數彼此之間將互相競爭，而只需要較少的可能組合數(2^,− 1中的C^,+ C^, + C_*^,+ … + C_.^,)。為加快計算時間，N值不需過大，經過許多嘗試後，本研究使用N=4。如前述，每個變數出現在最好與最差群組中的次數比值，可做為判斷變數好壞的指標，但是並沒有統一的論述說明如何設定一門檻值來決定該挑選的變數。因此本研究以該比值做為參考，用以挑選出可能的最佳輸入組合數(K)。由手肘點決定出變數個數(K) 後，若K ≤ N，則最佳的輸入變數組合即為第一階段中具有最低)值的變數組合。若K>N，則最佳的變數組合尚未經過GT的計算，因此需要第二階段：

第二階段中，GT演算需要從M個變數中挑選出K個變數，因此可能的變數組合為C_/^,。例如M=32且K=7，則可能的變數組合由4.3億次 (2^*− 1)減少為3百多萬次。

最佳輸入組合即為具有最低)值的組合。

本研究所提出的2-staged Gamma Test演算法，當輸入變數很多時，可節省大量的計算時間並有效的從眾多可能的輸入變數組合中，挑選出由ANFIS所架構石門水庫入流量預報模式之最佳輸入變數組合。

6-3 方案介紹

方案介紹方案介紹方案介紹

為比較使用線性方法(相關係數法)與非線性方法(Gamma test)所選出雨量與水庫入流量最佳延遲時間，及使用二階段GT所選出最佳延遲時間組合於水庫入流量預報之效益，本研究設計5組不同方案，詳述如下(如表6-2)，研究流程圖如圖6-3所示：

Model 1：與前述S3(4)方案相同，利用相關係數法找出每個雷達網格最大相關係數所對應之降雨量與水庫入流量最佳延遲時間，再利用 ArcGIS劃分出4個子集水區，詳細資料處理方式如第五章節所述。

輸入項包含₀、ΔQ及不同時間延遲的分區雨量(R(I,t-5), R(II,t-6), R(III,t-7), R(IV,t-7))。本章節將此一方案作為參考(benchmark)。

Model 2：與Model 1相似，輸入項包含₀、ΔQ及不同時間延遲的分區雨量。

其中集水區劃分方式為使用SOM劃分出4個子集水區，再分別將各子集水區不同時間延遲之降雨量(R(t-1) ~ R(t-8))及水庫入流量 Q(t)，透過Gamma Test選出各子集水區降雨量與水庫入流量最佳延遲時間，每個子集水區僅選1個最佳延遲時間，分別為R(I,t-5), R(II,t-6), R(III,t-6), R(IV,t-7)。

Model 3：本方案雨量輸入項與Model 2相同，分別為R(I,t-5)、R(II,t-6)、

R(III,t-6)、R(IV,t-7)，但本方案不使用流量資訊。

Model 4：本方案亦僅輸入各子集水區不同時間延遲之雨量。其中集水區劃分方式是使用SOM劃分出四個子集水區，但與Model 3不同地方為

究從32個變數中挑選其中1至4個變數，共有41448(C^*+ C^*+ C_*^*+ C₁^*)種組合，並計算41448個Γ值，將最小的前10%分類為最好群組，將最大的後90%分為最差群組，再計算每個變數出現在最好跟最差群組中出現次數的比值，此比值越高表示該變數越好。由表6-3可知排序第7及第8之變數比值已相當小，因此藉由手軸點定義，本研究即可挑選出可能的最佳輸入組合數為7。由於在 GT第1階段並未計算7種變數組合(C₂^*)，因此在GT第2階段直接計算C₂^*=3365856種組合之Γ值，其最低Γ值為0.0226所對應之7種變數組合即為預報模式最佳輸入變數組合(詳表6-4所示)。

Model 5：本方案雨量輸入項與Model 4相同(詳表6-4所示)，再加入流量資訊

₀及ΔQ。

圖6-3 SOM與二階段GT演算時空間整合法之流程圖

表6-2 方案輸入項描述表

R(I,t-5), R(II,t-6), R(III,t-7), R(IV,t-7)

與前述S3(4)方案相同，輸入項包含₀、_ΔQ及不同時間延遲的分區雨量。其中集水區劃分方式是為使用DEM 資料透過 ArcGIS 劃分出四個子集水區，並利用相關係數法找出最大相關係數所對應之降雨量與水庫入流量最佳延遲時間。

本章節將此一方案作為benchmark。

(SOM+GT)

₀ ΔQ

R(I,t-5), R(II,t-6), R(III,t-6), R(IV,t-7)

與 M1 方案相似，輸入項包含₀、_ΔQ及不同時

R(I,t-5), R(II,t-6), R(III,t-6), R(IV,t-7) 本方案僅輸入各子集水區不同時間延遲之雨量。其中集水區劃分方式是使用SOM 劃分出四

表6-3 第一階段GT 比值之前8名。

排序 1 2 3 4 5 6 7 8

比值 R(IV,t-8)^a R(IV,t-7) R(III,t-8) R(IV,t-6) R(II,t-8) R(III,t-7) R(I,t-8) R(III,t-6) Ratio Inf.^b Inf. 428.7 57.6 32.2 26.8 7.8 7.6

a: R(IV,t-8)為第四分區延遲 8 小時之雨量

b: Infinity.

表6-4 2-staged GT優選出最佳前7名變數組合

排序

預報延時 1 2 3 4 5 6 7

T+1 R(I,t-4) R(II,t-1) R(II,t-3) R(III,t-2) R(IV,t-1) R(IV,t-4) R(IV,t-6) T+2 R(I,t-4) R(II,t-3) R(III,t-2) R(IV,t-4) R(IV,t-6)

T+3 R(I,t-4) R(II,t-3) R(IV,t-4) R(IV,t-6) T+4 R(I,t-4) R(IV,t-4) R(IV,t-6)

6-4 預報模式可靠度分析

預報模式可靠度分析預報模式可靠度分析預報模式可靠度分析

機率預報(probabilistic forecasting)在水文領域逐漸受到矚目，許多研究也指出使用機率預報於水文預報上的諸多優點，也顯示透過機率預報通常可以獲得較好的決策(Boucher et al., 2011, 2012; Dale et al., 2012; Dietrich et al., 2009;

McCollor and Stull, 2008; Ramos et al., 2013; Schellekens et al., 2011; Verkade and Werner, 2011; Younis et al., 2008)。颱洪時期的水庫操作是一項複雜的過程，也是台灣經常面對的重要議題，本研究由定率預報模式提供機率的資訊，透過預先決定之誤差門檻值，提供預報數據之信心區間，將可提供水庫操作的決策者一個重要的量化風險參考資料。

過去許多水文模式都是以模式開發者的角度出發，期望提供最精確的模式預報結果，然而在資訊的呈現上常常無法真正滿足使用者的需求，這樣的模式建立方法可稱為由上而下(Top-down)的建模方式。然而使用者往往關心的是模式預報數值具有多少的不確定性，必須承擔多少的風險，因此本研究將在模式預報結果呈現採用由下而上(Bottom-up)的方式進行，即由使用者的角度出發，為了使預報資訊真正符合需求，本研究提供模式輸出的信賴區間，提供決策者參考的風險資訊。

雖然ANFIS預報模式為定率式模式，只有單一的預報結果，然而從模式建立過程中，從模式輸出的誤差分析亦可提供有用之機率資訊。本研究首先假設預報與觀測數值的誤差為常態分布，其平均值為零，具有一定的標準偏差(N(0,σ))，

當給定一個預先決定的誤差門檻值(Te)後，則預報數值與未來真值的誤差落在門檻值內的機率即可表示為：

P ₄− 56 < ₈ < ₄+ 56 = 9 ₄+ 56 − 9 ₄− 56 (6.4)

其中F為累積分布函數(cumulative distribution function, CDF)。

此方法為一簡單且易於計算的統計方法，但如何決定適當且符合使用者需求的誤差門檻值為最關鍵的問題。石門水庫為一多目標之水庫，其同時扮演防洪洪、

發電及水資源供應等多項任務，以M5規線為操作原則。本研究僅針對颱洪時期討論，以石門水庫防洪操作為例，防洪操作必須考慮壩體安全與下游洪峰流量控制等因素，因此當水庫水位在不同高度時必須有不同的操作考量，例如當水位在上限以上時，考量壩體安全，決策者對於水庫入流量預報的可容忍誤差將相對的小。

本研究將所蒐集颱風季節(7-10月)的9場颱風事件之歷史水位記錄(共501筆)，

依據石門水庫M5操作規線(如圖6-4)，發現水位大多落於225-245公尺之間。可容忍誤差門檻值計算方式以石門水庫M5規線的上限為分界點，將水位資料分成水位在上限以上及上限以下2個群組，找出每個水位對應之水庫入流量後，分別計算入流量之標準偏差，該標準偏差即為本研究所設定之可容忍誤差值。

圖6-4 石門水庫M5操作規線

(275cms)反映出水位在上限以上時，決策者所能容忍之流量預報誤差較小，因此需要較精確的預報值才具有參考價值。

6-5 結果與討論

結果與討論結果與討論結果與討論

本研究為探討資料時間及空間最佳化方法，以Model 1(GIS+CC)作為參考模式(benchmark)，並與Model 2(SOM+GT)做一比較。Model 2各子集水區降雨量與水庫入流量最佳延遲時間，除透過GT選出外並考慮集水區上下游間之物理意義，

因此每個子集水區僅選1個最佳延遲時間(分別為R(I,t-5), R(II,t-6), R(III,t-6), R(IV,t-7))。從Model 1及Model 2測試資料(薔蜜颱風、蘇拉颱風)可知，二種模式雖然在洪峰到達時間皆有明顯延遲現象(如圖6-5)，但在CC、CE、RMSE及MAE 的表現皆不錯，另流量預報時間拉長至t+4時則以Model 2表現較佳(如圖6-6所示)。

由Model 1及Model 2比較結果可知，利用SOM劃分子集水區及透過GT選出降雨逕流最佳延遲時間變數之Model 2表現較佳，故本研究在Model 3及Model 4 即繼續使用相同方式SOM劃分集水區，並進一步比較GT及2階段GT之效益。由圖6-6可知，使用2階段GT所選出之7個最佳變數(表6-4)之Model 4，在t+1至t+4之流量預報評估指標(CC、CE、RMSE及MAE)皆明顯優於Model 3且在洪峰到達時間之延遲亦有1~2小時之改善(如圖6-7)，因此透過類神經網路架構之流量預報模

在文檔中時間與空間最佳化資訊於降雨逕流模式分析之研究 (頁 90-120)