建立未設站位置流量延時曲線推估模式

第三章研究方法及步驟

3.3 建立未設站位置流量延時曲線推估模式

利用迴歸方法建立流量延時曲線 (FDC)推估模式是將 FDC區域化之基本統計方法。首先，對同一水文區域內之流量站歷史記錄建立流量延時曲線；其次，利用迴歸方法建立特定流量超越機率值與環境特性變數間之多元迴歸模式；最後，利用欲推估位置之環境特性變數資料反推其特定流量超越機率值。研究中應用三種不同之迴歸方法 ─ 多元線性迴歸方法、主成分迴歸方法及偏最小平方迴歸方法，比較模式表現及模式參數的解釋能力，

獲得各水文區域較佳之流量延時曲線推估模式。多元線性迴歸方法、主成分迴歸方法及偏最小平方迴歸方法均以 Matlab編寫程式求解。

一、迴歸方程式

未設站位置之流量可透過建立有設站位置流量之迴歸方程式加以推估，如下式(Chiang et al., 2002a; Fennessey and Vogel, 1990; Wurbs, 2006)：

n a

a V V

V a

Q ₀ ₁¹  ₂² ... (7)

式 (7)中，V₁, V₂, ... V_n為所選擇環境特性變數，必須是易於未設站位置取得之資料；a₀, a₁, a₂, ..., a_n為模式參數；Q為研究對象之特定流量統計數據，

例如50年一遇之洪水量(Bhaskar and O'Connor, 1989)、低流量統計值 (Vezza et al., 2010)或特定流量超越機率值Q_p(Chiang et al., 2002b; Hope and Bart, 2012; Mohamoud, 2008; Shu and Ouarda, 2012)。

二、多元線性迴歸方法

將式 (7)進行對數轉換 (logarithmically transform)以進行標準多元線性迴歸(multivariable linear regression, MLR)分析，如下式：

n V

a V

a V a V a a

Q ln ln ln ln ... ln

ln  ₀ ₁ ₁ ₂ ₂ ₃ ₃  (8)

令標準化後之變數ln 為依變數 (a vector of dependent variables )Q Y，標準化後之lnV₁, lnV₂, ... lnV_n為解釋變數 (a matrix of explanatory variables)X，則線性迴歸模式表示如下：

αX E

Y  (9)

式 (9)中，α 為模式參數(a vector of model parameters)，E為模式殘差(a vector of model residuals)，藉由最小化模式殘差之平方和 (least square method)求解

α 。本研究以地文因子為解釋變數，特定流量超越機率值 Q_p則作為推估 FDC之依變數。

MLR之解釋變數應為相互獨立 (linearly independent)，當兩個或多個解釋變數間有強烈之線性相關時稱為多重共線性 (multicollinearity)，變異數膨脹係數 (variance inflation factors, VIFs)可用於檢測水文迴歸模式之多重共線性 (Kroll and Song, 2013)。將每個解釋變數取出對其他變數進行MLR，利用迴歸模式之決定係數 (coefficient of determination, R²)計算膨脹係數 (VIF)，

如下式：

-1

VIF  1 (10)

一般而言，VIF值大於 10表示有嚴重之多重共線性問題，此時對應之決定係數 (R²)為大於 0.9，表示解釋變數與其他變數有高度相關。如果多重共線性存在於迴歸模式中，一般係透過逐步迴歸程序 (stepwise regression procedure) 選出具有解釋力之解釋變數。

三、主成分迴歸方法

當解釋變數間存在多重共線性，逐步迴歸程序雖可選出具有解釋力之解釋變數，然而當沒有絕對之信心將變數直接從水文迴歸模式中移除時，則可採用主成分迴歸 (principle component regression, PCR)方法。 PCR乃利

用 PCA原理，將原線性迴歸模式之解釋變數X進行分解，選取其中之主成分

來進行多元線性迴歸。令原變數X經線性轉換得新變數T (T AX)，T代替原變數進入式 (9)，得到下式：

βT F

Y  (11)

式 (11)中，β 為新變數之模式參數，F為模式殘差，β 以最小化模式殘差之 平方和求解。原始變數之模式參數再透過原始變數與主成分間之權重關係反推獲得。

四、偏最小平方迴歸方法

在主成分迴歸方法中，只對解釋變數進行分解，然而，當依變數超過 1 個變數，且也存在多重共線性時，可以對其做同樣的分解處理 (Abudu et al., 2010)，在分解過程中，需同時考慮分解矩陣間之影響，此即偏最小平方迴歸 (partial least squares regression, PLSR)。本研究假設特定流量超越機率值間，如Q_0.05 及Q_0.10，Q_0.10 及Q_0.15，... ，Q_0.90 及Q_0.95存在相關性，利用 PLSR建立迴歸模式，可簡化多元線性迴歸方法或主成分迴歸方法中逐一對特定流量超越機率值Q_p建立推估模式之繁複程序。令原變數X、Y線性轉換之新變數T AX、U BY存在內部之線性關係：

γT G

U  (12)

式 (12)中，γ為對角化矩陣，G 為模式殘差。因U BY (Y  UB^T)，故：

γTB H

Y ^T  (13)

式 (13)中，H為新矩陣之模式殘差。X、Y於確保T、 U 共變異數最大化

(covariance maximization)之原則下進行分解，一般使用非線性疊代淨最小平方 (nonlinear iterative partial least squares, NIPALS) 程序求解 (Geladi and Kowalski, 1986)，主成分迴歸方法及偏最小平方迴歸方法之主成分數選擇通常採用留一交叉驗證法 (leave-one-out cross-validation procedure)，檢驗採用不同主成分數之預測殘差平方和 (prediction residual error sum of squares, PRESS)，選擇具有最小 PRESS之主成分 (Geladi and Kowalski, 1986)。

五、模式誤差表現

三種迴歸方法於流量延時曲線推估之模式表現採用留一交叉驗證法之納許效率係數(Nash-Sutcliffe efficiency, NSE)(Nash and Sutcliffe, 1970)及絕對值相對誤差(absolute relative error)評估。 NSE計算公式如下：

在文檔中以基於可靠度之最佳化河川流量分配模式評估流域可用水量 (頁 23-27)

第三章 研究方法及步驟

3.3 建立未設站位置流量延時曲線推估模式

第三章研究方法及步驟