Stacked Autoencoders - 以循環神經網路模型增進新台幣匯率的短期預測能力

國

立政治大學

‧

Na tiona

l Ch engchi University 圖8: LSTM

2.4 Stacked Autoencoders

從前幾節介紹中_, 類神經網路模型在結構的架構上有許多的變形與進化_, 從最基本的前饋類神經網路 _(FNN) 能夠以非線性的估計方式估計匯率_, 到循環類神經網路(RNN)的長短期網路架構_(LSTM)能夠保存多期的資訊的能力_, 都解釋了如何控制與轉換資料的訊息量是非常的重要的_, 近期類神經網路的架構不斷在更新與演進_,包含Deep Boltzmann Machines (DBMs),Deep Belief Networks (DBNs),Autoencoder (AE),Stacked Autoencoders (SAEs),Re-stricted Boltzman Machines (RBMs),Convolutional Neural Networks (CNNs),

等模型_,而本文參考Bao et al. (2017)使用的Stacked Autoencoders (SAEs)

模型架構結合循環類神經網路模型來進行匯率的預測,SAEs模型由

Autoen-coder 模型所疊加而成,Autoencoder透過輸入變數與輸出變數為同一組數值

‧

的模擬輸入值代表著 Autoencoder 模型能夠有效地保存最有用的資訊而達到降低誤差干擾的效果。

2.4.1 單層 Autoencoder 模型

單層的 Autoencoder 模型為三層的類神經網路_, 如圖 _9,第一層與第三層型相同_,f 的部分本文採用 Rectified Linear Unit (ReLU) 來作為激活函數

(Activation Function), 而目標函數在此不同於前節類神經網路的目標函式

定義_,SAEs 定義是如下_:

‧

國

立政治大學

‧

Na tiona

l Ch engchi University 圖9: 單層Auto encoder結構

過度配適 (Overfitting) 的情況_{,J wd} 為衡量輸入向量與輸出向量之間的 _KL 散度 (Kullback–Leibler Divergence), 用意在於衡量輸入與輸出值之間分布的相似程度。

J_sp = (1/2) ∗ λ(kW₁k²+ kW₂k²), (18)

J_wd = β ∗

t=1

KL(ρ_t|| ρ^∗_t), (19)

參數 _λ 與 _β 為目標函數的超參數_, 用來控制目標函式衡量目標的分配權重_, 例如_{: λ} 訂的較高_, 過大的權重會造成目標函數數值更顯著的上升, 因此模型會偏好調整成較稀疏的權重。

2.4.2 多層 Autoencoder 模型

模型由多個 _AE 所組成_, 下圖 ₁₀ 為 ₅ 層 _SAEs 的結構_, 此 ₅ 層結構亦為本文所使用的堆疊數量_,SAEs模型的參數訓練是漸進的_, 首先先訓練一個

‧

國

立政治大學

‧

Na tiona

l Ch engchi University 圖10: Stacked Auto encoder結構

AE, 訓練完成後將最後一層重組層去除,將剩下的前兩層當成是訓練下一個

AE 模型的輸入層_, 亦即的一個 _AE 模型留下的前兩層訓練完後_, 參數會固定_, 不會再被下一層疊上的 _AE 模型所改變_, 重複此動作不斷的疊加直到第

5 層為止_, 在本文中堆疊至五層的原因是經由測試 ₃ 到 ₁₀ 層過後_, 第 ₅ 層的效果最為卓越_, 而輸入向量與重組向量的選擇也經由誤差測試來決定。

3 實證方法

3.1

資料說明

本文所採用各國匯率資料來自 _Datastream 資料庫_, 所採用之樣本期間為

1994/08/31 到 2018/01/24 , 頻率為日資料_, 共 ₆₁₀₆ 筆_, 樣本採用各國貨幣兌美元的匯率_,所研究之貨幣包含_,台幣_(TWD)、歐元_(EUR)、英鎊_(GBP)、日圓、人民幣、韓寰等種已開發市場之貨幣兌美元

‧

率 (Federal Fund Rate) 等日資料來探討新增加之變數是否會加強模型預測

精準度。其中, 油價與利率來源取自於 _Datastream 資料庫, 我們將杜拜原油與布侖特原油以 _7D3B 的比例計算台灣油價_;金價資料取自世界黃金協會

(World Gold Council) 資料庫_, 油價與金價皆以美元計價。本篇論文將依上述 ₁₀ 種原始資料_, 以常用數據處理套件 _(Sklearn) 中的標準化方式 ₍

Nor-malization , Minimax Scaler) 轉換數據成為輸入模型的資料。

在文檔中以循環神經網路模型增進新台幣匯率的短期預測能力 - 政大學術集成 (頁 21-25)