第三章 理論概述
3.5 SAE-RNN 區域淹水預報模式
3.5.2 以編碼器-解碼器框架建立淹水特徵編碼預測模式
本研究以編碼器-解碼器框架建立預測模式,可分為處理雨量資訊 之 FFNN 編碼器及輸出多步長淹水特徵編碼預測結果之 LSTM-R-NARX 解碼器,整體如圖 3.5.4 所示。
圖 3.5.4 RNN 淹水特徵編碼預測模式架構圖
1. LSTM-FFNN 編碼器
本研究降雨資訊輸入序列為長度 m 個時刻,每時刻包含 p 個測 站之𝑚 × 𝑝維雨量數值序列,考量降雨-逕流過程中雨量具有累積的特 性,使用 LSTM 與 FFNN 兩層網路層組成編碼器,將𝑚 × 𝑝維雨量資 訊轉換為1 × 𝑟維代表雨量時空特徵之編碼向量,編碼器架構如圖 3.5.5 所示。LSTM 層由時間最早的 m 時刻資料開始,每次輸入同一 時刻之所有測站雨量值,並重複使用 LSTM 層於下一次輸入。此外,
doi:10.6342/NTU202003855
50
本研究以零向量做為 LSTM 層在輸入第一筆資料時使用的初始狀態 值。FFNN 層為單層全連結層,將前一層輸出之數值再進行一次非線 性轉換以增加模式複雜度,整個編碼器運算具有更好的非線性轉換效 果。
圖 3.5.5 LSTM-FFNN 編碼器架構圖
LSTM 層的計算過程會將輸入雨量資訊以時間越近所占比例越 大的方式累積,這與降雨逕流過程中流量匯聚相似。於 Kao 等人 (2020)應用 LSTM 及編碼器-解碼器框架模式於石門水庫入流量預報 的研究中,已證明使用 LSTM 處理多時刻雨量資料有助於降雨-逕流 模式掌握雨量變化時間特徵。此外,LSTM 於長期記憶中有遺忘部分 資訊的功能(遺忘閥)使其更能讓長期記憶中重要的部分保留下來。對 於降雨-逕流模式而言,使用 LSTM 更能模擬雨水在集水區匯聚累積 與逕流的過程,故本研究使用 LSTM 做為處理雨量資訊的編碼器。
doi:10.6342/NTU202003855
51
2. LSTM-R-NARX 解碼器
本研究淹水特徵輸出序列為長度 n 個時刻,每時刻包含 q 個特 徵值之𝑛 × 𝑞維特徵值序列。考量淹水深變化應有明顯的時序關係,
即前時刻淹水深為下一時刻的關鍵影響因子,故以 R-NARX 為解碼 器架構,並將 LSTM 與 FFNN 做為隱藏層及輸出層置入其中,如圖 3.5.6 所示。LSTM 層每次使用時會輸入相同的1 × 𝑟維代表雨量時空 特徵之編碼向量,並藉由回饋狀態值使每次輸出的解碼器內淹水特徵 暫存值𝑌𝑑′產生差異,即在前一時刻之輸出結果上進行微調以符合淹 水歷程之時間連續性,接著再以 FFNN 輸出層將該暫存值轉換成符 合 SAE-RNN 區域淹水預報模式需求之淹水特徵編碼,同時此層亦有 增加模式複雜度之用途。因此,本研究修改圖 3.4.5 中 LSTM 神經元 結構狀態值,將回饋 LSTM 輸出值部分改以解碼器輸出值(即 FFNN 輸出層輸出值)取代,使前時刻解碼器輸出之淹水特徵編碼能直接影 響 LSTM 中核心單元、輸入閥、遺忘閥及輸出閥的運算結果,讓解碼 器具有 R-NARX 模式在多時刻淹水預報模式中使用自身回饋值帶來 的優勢。
doi:10.6342/NTU202003855
52
圖 3.5.6 LSTM-R-NARX 解碼器架構圖
將 LSTM-FFNN 編碼器與 LSTM-R-NARX 解碼器結合後即為本研 究 RNN 淹水特徵編碼預測模式,該模式中可調整之超參數包含:(1)雨 量時空特徵編碼向量維度、(2)編碼器 LSTM 層神經元個數、(3)解碼器 LSTM 層神經元個數、(4)編碼器 LSTM 初始狀態值𝑆𝑒0及(5)解碼器 LSTM 初始狀態值𝑆𝑑0,以下為各項超參數設定說明:
1. 雨量時空特徵編碼向量維度及 LSTM 神經元個數
為減少超參數試誤次數,本研究將模式中兩個 LSTM 層神經元 個數((2)及(3))設定為雨量時空特徵編碼維度(1),並假設這三個數值 任一個超過描述問題所需的複雜度(涵容能力)後,多出來的部分在充 分訓練模式後不會影響其準確度,僅影響訓練效率。
2. LSTM 層初始狀態值
為減少模式訓練學習演算法複雜度,本研究將編碼器 LSTM 層 之初始狀態值𝑆𝑒0設定為 0,並將模式輸入之雨量序列時間長度增加至
doi:10.6342/NTU202003855
53 (coefficient of determination, R2)評價不同模式的預測結果,並以平均絕 對誤差(mean absolute error, MAE)展示研究區域中的預測誤差分布情