• 沒有找到結果。

由降雨所產生之逕流量在經過複雜地形進入水庫所需時間,其為一高度非線 性關係(Zuazo et al.,2014),然而大部分研究針對降雨逕流之集流時間多以簡單線 性相關係數法分析,透過尋找最大相關係數定義集流時間(Pianosi et al., 2014;

Pramanik and Panda, 2009),如本研究第五章所述。因此本研究將透過一非線性方 法 Gamma Test 尋找降雨逕流最佳延遲時間。

Gamma Test為一個可挑選模式最佳輸入項方法,其假設一組資料(資料變數 為M)可由某個平滑函數所描述(Chang et al., 2013; Chang, et al., 2014; Jones, et al., 2007; Koncar, 1997),而剩下無法被平滑函數描述的部分,即稱為Gamma統計量 (Γ)。GT演算中的平滑函數為輸入向量(X)的p個 1 ≤ k ≤ p鄰近資料點所組成,

可計算輸入向量的Delta函數:

  = 1

  ,− 





1 ≤  ≤  (6.1)

其中|⋯ |為尤拉距離,而相對應的輸出向量Gamma函數則可表示為

#  = 1

2 % ,− %





1 ≤  ≤  (6.2)

其中p的決定則與取樣密度有關(Koncar, 1997),而y ,為第k個鄰近點所 對應之y值。針對每個鄰近點都可以計算得到一組Delta函數與Gamma函數。

Gamma統計量的計算,則可透過p組Delta函數與Gamma函數的迴歸式中獲得,如 下式

# = ' + ) (6.3)

其中A為迴歸係數。

針對每個輸入向量的子集合,GT估計其噪音項(即)),當此噪音項最接近零時,

其對應的子集合則可視為最佳的輸入變數組合,因此可有效的找出類神經網路的 最佳輸入變數組合,以減少ANN的輸入維度(Chang et al., 2013; Noori et al., 2010)。

一般而言,使用GT挑選出最佳輸入變數組合的計算流程包含:

1. 計算所有可能的輸入組合(2 − 1)之Gamma統計量。

2. 將所有統計量())由小至大排序,並將最小的前10%分類為最好的群組,

將最大的後90%,分為最差的群組。

3. 計算每個變數出現在最好跟最差群組中出現次數的比值,此比值越高表 示該變數越好。

雖然GT可有效的找出最佳的輸入變數組合,但是當M值較大時,GT的

在第一階段:

 從M個變數中挑選其中1至N個變數,因此可能之輸入組合數共有 C,+ C + C*,+ … + C.,個。

 重複上述的步驟2與步驟3。

 由上述的比值,利用手肘點法(Kim et al., 2013; Su et al., 2006)挑出 前K個變數。

在此階段,所有的M個變數彼此之間將互相競爭,而只需要較少的可 能組合數(2,− 1中的C,+ C, + C*,+ … + C.,)。為加快計算時間,N值不需 過大,經過許多嘗試後,本研究使用N=4。如前述,每個變數出現在最好與 最差群組中的次數比值,可做為判斷變數好壞的指標,但是並沒有統一的論 述說明如何設定一門檻值來決定該挑選的變數。因此本研究以該比值做為參 考,用以挑選出可能的最佳輸入組合數(K)。由手肘點決定出變數個數(K) 後,若K ≤ N,則最佳的輸入變數組合即為第一階段中具有最低)值的變數 組合。若K>N,則最佳的變數組合尚未經過GT的計算,因此需要第二階段:

 第二階段中,GT演算需要從M個變數中挑選出K個變數,因此可能 的變數組合為C/,。例如M=32且K=7,則可能的變數組合由4.3億次 (2*− 1)減少為3百多萬次。

 最佳輸入組合即為具有最低)值的組合。

本研究所提出的2-staged Gamma Test演算法,當輸入變數很多時,可節省大 量的計算時間並有效的從眾多可能的輸入變數組合中,挑選出由ANFIS所架構石 門水庫入流量預報模式之最佳輸入變數組合。

6-3 方案介紹

方案介紹方案介紹方案介紹

為比較使用線性方法(相關係數法)與非線性方法(Gamma test)所選出雨量與 水庫入流量最佳延遲時間,及使用二階段GT所選出最佳延遲時間組合於水庫入 流量預報之效益,本研究設計5組不同方案,詳述如下(如表6-2),研究流程圖如 圖6-3所示:

Model 1:與前述S3(4)方案相同,利用相關係數法找出每個雷達網格最大相 關係數所對應之降雨量與水庫入流量最佳延遲時間,再利用 ArcGIS劃分出4個子集水區,詳細資料處理方式如第五章節所述。

輸入項包含0、ΔQ及不同時間延遲的分區雨量(R(I,t-5), R(II,t-6), R(III,t-7), R(IV,t-7))。本章節將此一方案作為參考(benchmark)。

Model 2:與Model 1相似,輸入項包含0、ΔQ及不同時間延遲的分區雨量。

其中集水區劃分方式為使用SOM劃分出4個子集水區,再分別將 各子集水區不同時間延遲之降雨量(R(t-1) ~ R(t-8))及水庫入流量 Q(t),透過Gamma Test選出各子集水區降雨量與水庫入流量最佳 延遲時間,每個子集水區僅選1個最佳延遲時間,分別為R(I,t-5), R(II,t-6), R(III,t-6), R(IV,t-7)。

Model 3:本方案雨量輸入項與Model 2相同,分別為R(I,t-5)、R(II,t-6)、

R(III,t-6)、R(IV,t-7),但本方案不使用流量資訊。

Model 4:本方案亦僅輸入各子集水區不同時間延遲之雨量。其中集水區劃 分方式是使用SOM劃分出四個子集水區,但與Model 3不同地方為

究從32個變數中挑選其中1至4個變數,共有41448(C*+ C*+ C**+ C1*)種組合,並計算41448個Γ值,將最小的前10%分類為 最好群組,將最大的後90%分為最差群組,再計算每個變數出現 在最好跟最差群組中出現次數的比值,此比值越高表示該變數越 好。由表6-3可知排序第7及第8之變數比值已相當小,因此藉由手 軸點定義,本研究即可挑選出可能的最佳輸入組合數為7。由於在 GT第1階段並未計算7種變數組合(C2*),因此在GT第2階段直接計 算C2*=3365856種組合之Γ值,其最低Γ值為0.0226所對應之7種 變數組合即為預報模式最佳輸入變數組合(詳表6-4所示)。

Model 5:本方案雨量輸入項與Model 4相同(詳表6-4所示),再加入流量資訊

0及ΔQ。

圖6-3 SOM與二階段GT演算時空間整合法之流程圖

表6-2 方案輸入項描述表

R(I,t-5), R(II,t-6), R(III,t-7), R(IV,t-7)

與前述S3(4)方案相同,輸入項包含0ΔQ及不 同時間延遲的分區雨量。其中集水區劃分方式 是為使用DEM 資料透過 ArcGIS 劃分出四個子 集水區,並利用相關係數法找出最大相關係數 所對應之降雨量與水庫入流量最佳延遲時間。

本章節將此一方案作為benchmark。

M2

(SOM+GT)

0 ΔQ

R(I,t-5), R(II,t-6), R(III,t-6), R(IV,t-7)

與 M1 方案相似,輸入項包含0ΔQ及不同時

R(I,t-5), R(II,t-6), R(III,t-6), R(IV,t-7) 本方案僅輸入各子集水區不同時間延遲之雨 量。其中集水區劃分方式是使用SOM 劃分出四

表6-3 第一階段GT 比值之前8名。

排序 1 2 3 4 5 6 7 8

比值 R(IV,t-8)a R(IV,t-7) R(III,t-8) R(IV,t-6) R(II,t-8) R(III,t-7) R(I,t-8) R(III,t-6) Ratio Inf.b Inf. 428.7 57.6 32.2 26.8 7.8 7.6

a: R(IV,t-8)為第四分區延遲 8 小時之雨量

b: Infinity.

表6-4 2-staged GT優選出最佳前7名變數組合

排序

預報延時 1 2 3 4 5 6 7

T+1 R(I,t-4) R(II,t-1) R(II,t-3) R(III,t-2) R(IV,t-1) R(IV,t-4) R(IV,t-6) T+2 R(I,t-4) R(II,t-3) R(III,t-2) R(IV,t-4) R(IV,t-6)

T+3 R(I,t-4) R(II,t-3) R(IV,t-4) R(IV,t-6) T+4 R(I,t-4) R(IV,t-4) R(IV,t-6)

6-4 預報模式可靠度分析

預報模式可靠度分析預報模式可靠度分析預報模式可靠度分析

機率預報(probabilistic forecasting)在水文領域逐漸受到矚目,許多研究也指 出使用機率預報於水文預報上的諸多優點,也顯示透過機率預報通常可以獲得較 好的決策(Boucher et al., 2011, 2012; Dale et al., 2012; Dietrich et al., 2009;

McCollor and Stull, 2008; Ramos et al., 2013; Schellekens et al., 2011; Verkade and Werner, 2011; Younis et al., 2008)。颱洪時期的水庫操作是一項複雜的過程,也是 台灣經常面對的重要議題,本研究由定率預報模式提供機率的資訊,透過預先決 定之誤差門檻值,提供預報數據之信心區間,將可提供水庫操作的決策者一個重 要的量化風險參考資料。

過去許多水文模式都是以模式開發者的角度出發,期望提供最精確的模式預 報結果,然而在資訊的呈現上常常無法真正滿足使用者的需求,這樣的模式建立 方法可稱為由上而下(Top-down)的建模方式。然而使用者往往關心的是模式預報 數值具有多少的不確定性,必須承擔多少的風險,因此本研究將在模式預報結果 呈現採用由下而上(Bottom-up)的方式進行,即由使用者的角度出發,為了使預報 資訊真正符合需求,本研究提供模式輸出的信賴區間,提供決策者參考的風險資 訊。

雖然ANFIS預報模式為定率式模式,只有單一的預報結果,然而從模式建立 過程中,從模式輸出的誤差分析亦可提供有用之機率資訊。本研究首先假設預報 與觀測數值的誤差為常態分布,其平均值為零,具有一定的標準偏差(N(0,σ)),

當給定一個預先決定的誤差門檻值(Te)後,則預報數值與未來真值的誤差落在門 檻值內的機率即可表示為:

P 4− 56 < 8 < 4+ 56 = 9 4+ 56 − 9 4− 56 (6.4)

其中F為累積分布函數(cumulative distribution function, CDF)。

此方法為一簡單且易於計算的統計方法,但如何決定適當且符合使用者需求 的誤差門檻值為最關鍵的問題。石門水庫為一多目標之水庫,其同時扮演防洪洪、

發電及水資源供應等多項任務,以M5規線為操作原則。本研究僅針對颱洪時期 討論,以石門水庫防洪操作為例,防洪操作必須考慮壩體安全與下游洪峰流量控 制等因素,因此當水庫水位在不同高度時必須有不同的操作考量,例如當水位在 上限以上時,考量壩體安全,決策者對於水庫入流量預報的可容忍誤差將相對的 小。

本研究將所蒐集颱風季節(7-10月)的9場颱風事件之歷史水位記錄(共501筆),

依據石門水庫M5操作規線(如圖6-4),發現水位大多落於225-245公尺之間。可容 忍誤差門檻值計算方式以石門水庫M5規線的上限為分界點,將水位資料分成水 位在上限以上及上限以下2個群組,找出每個水位對應之水庫入流量後,分別計 算入流量之標準偏差,該標準偏差即為本研究所設定之可容忍誤差值。

圖6-4 石門水庫M5操作規線

(275cms)反映出水位在上限以上時,決策者所能容忍之流量預報誤差較小,因此 需要較精確的預報值才具有參考價值。

6-5 結果與討論

結果與討論結果與討論結果與討論

本研究為探討資料時間及空間最佳化方法,以Model 1(GIS+CC)作為參考模 式(benchmark),並與Model 2(SOM+GT)做一比較。Model 2各子集水區降雨量與 水庫入流量最佳延遲時間,除透過GT選出外並考慮集水區上下游間之物理意義,

因此每個子集水區僅選1個最佳延遲時間(分別為R(I,t-5), R(II,t-6), R(III,t-6), R(IV,t-7))。從Model 1及Model 2測試資料(薔蜜颱風、蘇拉颱風)可知,二種模式 雖然在洪峰到達時間皆有明顯延遲現象(如圖6-5),但在CC、CE、RMSE及MAE 的表現皆不錯,另流量預報時間拉長至t+4時則以Model 2表現較佳(如圖6-6所 示)。

由Model 1及Model 2比較結果可知,利用SOM劃分子集水區及透過GT選出 降雨逕流最佳延遲時間變數之Model 2表現較佳,故本研究在Model 3及Model 4 即繼續使用相同方式SOM劃分集水區,並進一步比較GT及2階段GT之效益。由 圖6-6可知,使用2階段GT所選出之7個最佳變數(表6-4)之Model 4,在t+1至t+4之 流量預報評估指標(CC、CE、RMSE及MAE)皆明顯優於Model 3且在洪峰到達時 間之延遲亦有1~2小時之改善(如圖6-7),因此透過類神經網路架構之流量預報模

由Model 1及Model 2比較結果可知,利用SOM劃分子集水區及透過GT選出 降雨逕流最佳延遲時間變數之Model 2表現較佳,故本研究在Model 3及Model 4 即繼續使用相同方式SOM劃分集水區,並進一步比較GT及2階段GT之效益。由 圖6-6可知,使用2階段GT所選出之7個最佳變數(表6-4)之Model 4,在t+1至t+4之 流量預報評估指標(CC、CE、RMSE及MAE)皆明顯優於Model 3且在洪峰到達時 間之延遲亦有1~2小時之改善(如圖6-7),因此透過類神經網路架構之流量預報模

相關文件