第三章 研究方法及步驟
3.3 建立未設站位置流量延時曲線推估模式
利 用 迴 歸 方 法 建 立 流 量 延 時 曲 線 (FDC)推 估 模 式 是 將 FDC區 域 化 之 基 本 統 計 方 法 。首 先 ,對 同 一 水 文 區域 內 之流 量 站 歷 史 記 錄 建 立流 量 延 時 曲 線 ; 其 次 , 利用 迴 歸方 法 建 立 特 定 流 量 超越 機 率 值 與 環 境 特 性變 數 間 之 多 元 迴 歸 模 式 ;最 後 ,利 用 欲 推 估 位置 之 環 境 特 性 變 數 資料 反 推 其 特 定 流 量 超 越 機 率 值 。研 究 中應 用 三 種 不 同之 迴 歸方 法 ─ 多 元 線性 迴 歸方 法 、 主 成 分 迴歸 方 法及偏 最小平 方 迴歸方 法,比較 模式表現及模式參數的解釋能力,
獲 得 各 水 文 區域 較 佳之 流 量 延 時 曲線 推 估模 式 。 多 元 線性 迴 歸方 法 、 主 成 分 迴歸 方 法及偏最 小 平方迴 歸 方法均 以 Matlab編寫程式求解。
一 、 迴歸 方程式
未 設 站 位 置 之 流量 可透 過 建 立 有 設 站位 置 流 量 之 迴 歸 方 程式 加以 推 估 , 如 下 式(Chiang et al., 2002a; Fennessey and Vogel, 1990; Wurbs, 2006):
an
n a
a V V
V a
Q 0 11 22 ... (7)
式 (7)中,V1, V2, ... Vn為所 選擇 環 境 特性變數,必須是 易於未設站位 置取得 之 資料;a0, a1, a2, ..., an為 模 式參數;Q為研究對 象 之特定流 量統計數據,
例 如50年一遇之洪水 量(Bhaskar and O'Connor, 1989)、低流量統 計值 (Vezza et al., 2010)或 特定 流 量 超 越 機 率 值Qp(Chiang et al., 2002b; Hope and Bart, 2012; Mohamoud, 2008; Shu and Ouarda, 2012)。
二 、 多元 線性迴歸方法
將 式 (7)進 行 對 數 轉 換 (logarithmically transform)以 進 行 標 準 多 元 線 性 迴 歸(multivariable linear regression, MLR)分析,如下式:
n
n V
a V
a V a V a a
Q ln ln ln ln ... ln
ln 0 1 1 2 2 3 3 (8)
令 標準 化後之變 數ln 為 依變數 (a vector of dependent variables )Q Y, 標準化 後 之lnV1, lnV2, ... lnVn為 解釋 變 數 (a matrix of explanatory variables)X,則線 性 迴歸 模 式表示 如下:
αX E
Y (9)
式 (9)中,α 為模式參數(a vector of model parameters),E為模 式殘差(a vector of model residuals),藉 由 最 小 化 模 式 殘 差 之 平方和 (least square method)求解
α 。 本 研 究 以 地 文 因 子 為 解 釋 變 數 , 特 定 流 量 超 越 機 率 值 Qp則 作 為 推 估 FDC之依 變數 。
MLR之 解 釋 變 數 應 為 相 互 獨 立 (linearly independent), 當 兩 個 或 多 個 解 釋 變 數間有強烈 之 線性相 關 時稱為 多重共 線 性 (multicollinearity),變異數 膨 脹 係 數 (variance inflation factors, VIFs)可 用 於 檢 測 水 文 迴 歸 模 式 之 多 重 共 線 性 (Kroll and Song, 2013)。將每個解釋變數取出對其他變數進行MLR,利 用 迴歸 模 式之決定 係 數 (coefficient of determination, R2)計 算 膨脹 係數 (VIF),
如 下式 :
R2
-1
VIF 1 (10)
一般而言,VIF值大 於 10表示有嚴重之多重共線性問題,此時 對 應之決定係 數 (R2)為 大 於 0.9, 表 示 解 釋 變 數 與 其 他 變 數 有 高 度 相 關 。 如 果 多 重 共 線 性 存 在於 迴 歸模式 中,一般係 透 過逐步 迴 歸程序 (stepwise regression procedure) 選出具有解釋力之解釋變數 。
三 、 主成 分迴歸 方 法
當 解 釋 變 數 間 存 在 多重 共 線 性 , 逐 步 迴歸程 序 雖 可 選 出 具 有解釋 力 之 解 釋 變 數 , 然而 當 沒有 絕 對 之 信 心將 變 數 直 接 從 水 文 迴歸 模 式 中 移 除 時 , 則 可採 用主成 分 迴 歸 (principle component regression, PCR)方法 。 PCR乃利
用 PCA原理,將原線性迴歸模式之解釋變數X進行分解,選取其中之主成分
來 進 行 多 元 線性 迴 歸。 令 原 變 數X經 線 性 轉換 得 新 變 數T (T AX),T代 替 原變 數 進入式 (9), 得到下式:
βT F
Y (11)
式 (11)中,β 為新變數之模式參數,F為模式殘差,β 以最小化模式殘差之 平 方 和 求 解 。原 始 變數 之 模 式 參 數 再 透 過原 始 變 數 與 主成 分 間之 權 重 關 係 反 推 獲 得 。
四 、 偏最 小平方迴歸方法
在主 成分 迴歸 方法 中,只對解釋變數進行分解,然而,當依變數超過 1 個變數,且也存在 多 重 共線性時,可以對 其做同樣的分解處理 (Abudu et al., 2010),在 分 解 過 程 中,需 同 時 考 慮 分 解矩 陣 間之 影 響,此 即偏 最 小 平 方 迴 歸 (partial least squares regression, PLSR)。 本研究假設特定流量超越 機率值 間,如Q0.05 及Q0.10,Q0.10 及Q0.15,... ,Q0.90 及Q0.95存在相關性,利用 PLSR建 立 迴 歸 模 式 ,可 簡 化 多 元 線 性 迴 歸方 法 或主 成 分 迴 歸 方法 中 逐一 對 特 定 流 量 超 越機 率值Qp建立 推 估模式 之 繁複程 序。令原變 數X、Y線 性轉換之新 變 數T AX、U BY存在 內 部之 線性 關 係:
γT G
U (12)
式 (12)中,γ為對角化矩陣,G 為模式殘差。因U BY (Y UBT),故:
γTB H
Y T (13)
式 (13)中 ,H為 新 矩 陣 之 模 式 殘 差 。X、Y於 確 保T、 U 共 變 異 數 最 大 化
(covariance maximization)之 原 則 下 進 行 分 解 , 一 般 使 用 非 線 性 疊 代 淨 最 小 平 方 (nonlinear iterative partial least squares, NIPALS) 程序求 解 (Geladi and Kowalski, 1986), 主 成 分 迴 歸 方 法 及 偏 最 小 平 方 迴 歸 方 法 之 主 成 分 數 選 擇 通 常 採用 留一交叉驗 證 法 (leave-one-out cross-validation procedure),檢驗 採 用 不同 主 成分數 之預 測 殘差平 方 和 (prediction residual error sum of squares, PRESS), 選 擇 具 有 最小 PRESS之主 成 分 (Geladi and Kowalski, 1986)。
五 、 模式 誤差 表 現
三 種 迴 歸 方 法 於 流量延 時 曲 線 推 估 之 模式表 現 採 用 留 一 交 叉驗證 法 之 納 許 效率 係數(Nash-Sutcliffe efficiency, NSE)(Nash and Sutcliffe, 1970)及絕 對 值相 對 誤差(absolute relative error)評估 。 NSE計算公式如下: