以編碼器-解碼器框架建立淹水特徵編碼預測模式

第三章理論概述

3.5 SAE-RNN 區域淹水預報模式

3.5.2 以編碼器-解碼器框架建立淹水特徵編碼預測模式

本研究以編碼器-解碼器框架建立預測模式，可分為處理雨量資訊之 FFNN 編碼器及輸出多步長淹水特徵編碼預測結果之 LSTM-R-NARX 解碼器，整體如圖 3.5.4 所示。

圖 3.5.4 RNN 淹水特徵編碼預測模式架構圖

1. LSTM-FFNN 編碼器

本研究降雨資訊輸入序列為長度 m 個時刻，每時刻包含 p 個測 站之𝑚 × 𝑝維雨量數值序列，考量降雨-逕流過程中雨量具有累積的特性，使用 LSTM 與 FFNN 兩層網路層組成編碼器，將𝑚 × 𝑝維雨量資訊轉換為1 × 𝑟維代表雨量時空特徵之編碼向量，編碼器架構如圖 3.5.5 所示。LSTM 層由時間最早的 m 時刻資料開始，每次輸入同一 時刻之所有測站雨量值，並重複使用 LSTM 層於下一次輸入。此外，

doi:10.6342/NTU202003855

本研究以零向量做為 LSTM 層在輸入第一筆資料時使用的初始狀態值。FFNN 層為單層全連結層，將前一層輸出之數值再進行一次非線性轉換以增加模式複雜度，整個編碼器運算具有更好的非線性轉換效果。

圖 3.5.5 LSTM-FFNN 編碼器架構圖

LSTM 層的計算過程會將輸入雨量資訊以時間越近所占比例越大的方式累積，這與降雨逕流過程中流量匯聚相似。於 Kao 等人 (2020)應用 LSTM 及編碼器-解碼器框架模式於石門水庫入流量預報的研究中，已證明使用 LSTM 處理多時刻雨量資料有助於降雨-逕流模式掌握雨量變化時間特徵。此外，LSTM 於長期記憶中有遺忘部分資訊的功能(遺忘閥)使其更能讓長期記憶中重要的部分保留下來。對於降雨-逕流模式而言，使用 LSTM 更能模擬雨水在集水區匯聚累積與逕流的過程，故本研究使用 LSTM 做為處理雨量資訊的編碼器。

doi:10.6342/NTU202003855

2. LSTM-R-NARX 解碼器

本研究淹水特徵輸出序列為長度 n 個時刻，每時刻包含 q 個特徵值之𝑛 × 𝑞維特徵值序列。考量淹水深變化應有明顯的時序關係，

即前時刻淹水深為下一時刻的關鍵影響因子，故以 R-NARX 為解碼器架構，並將 LSTM 與 FFNN 做為隱藏層及輸出層置入其中，如圖 3.5.6 所示。LSTM 層每次使用時會輸入相同的1 × 𝑟維代表雨量時空特徵之編碼向量，並藉由回饋狀態值使每次輸出的解碼器內淹水特徵暫存值𝑌_𝑑′產生差異，即在前一時刻之輸出結果上進行微調以符合淹水歷程之時間連續性，接著再以 FFNN 輸出層將該暫存值轉換成符合 SAE-RNN 區域淹水預報模式需求之淹水特徵編碼，同時此層亦有增加模式複雜度之用途。因此，本研究修改圖 3.4.5 中 LSTM 神經元結構狀態值，將回饋 LSTM 輸出值部分改以解碼器輸出值(即 FFNN 輸出層輸出值)取代，使前時刻解碼器輸出之淹水特徵編碼能直接影響 LSTM 中核心單元、輸入閥、遺忘閥及輸出閥的運算結果，讓解碼器具有 R-NARX 模式在多時刻淹水預報模式中使用自身回饋值帶來的優勢。

doi:10.6342/NTU202003855

圖 3.5.6 LSTM-R-NARX 解碼器架構圖

將 LSTM-FFNN 編碼器與 LSTM-R-NARX 解碼器結合後即為本研究 RNN 淹水特徵編碼預測模式，該模式中可調整之超參數包含：(1)雨量時空特徵編碼向量維度、(2)編碼器 LSTM 層神經元個數、(3)解碼器 LSTM 層神經元個數、(4)編碼器 LSTM 初始狀態值𝑆_𝑒⁰及(5)解碼器 LSTM 初始狀態值𝑆_𝑑⁰，以下為各項超參數設定說明：

1. 雨量時空特徵編碼向量維度及 LSTM 神經元個數

為減少超參數試誤次數，本研究將模式中兩個 LSTM 層神經元個數((2)及(3))設定為雨量時空特徵編碼維度(1)，並假設這三個數值任一個超過描述問題所需的複雜度(涵容能力)後，多出來的部分在充分訓練模式後不會影響其準確度，僅影響訓練效率。

2. LSTM 層初始狀態值

為減少模式訓練學習演算法複雜度，本研究將編碼器 LSTM 層之初始狀態值𝑆_𝑒⁰設定為 0，並將模式輸入之雨量序列時間長度增加至

doi:10.6342/NTU202003855

53 (coefficient of determination, R²)評價不同模式的預測結果，並以平均絕對誤差(mean absolute error, MAE)展示研究區域中的預測誤差分布情

在文檔中結合自編碼器及回饋式類神經網路建立區域淹水預測模式之研究 (頁 63-67)

以編碼器-解碼器框架建立淹水特徵編碼預測模式

第三章 理論概述

3.5 SAE-RNN 區域淹水預報模式

3.5.2 以編碼器-解碼器框架建立淹水特徵編碼預測模式

第三章理論概述