Scaling - 路徑學習 - 應用GAN於回測交易策略以避免過擬合

4.1 路徑學習

4.1.3 Scaling

我們比較了資料量以及 scaling 的對於 RGAN 的學習的影響。從圖 4.11 圖 4.12 上可以看到而在資料量和 scaling 對於學習速度的影響。

結果顯示，在相同的 scaling 之下，以 epoch 來算，資料量越大學習的越快（當然一個 epoch 對於資料量大的資料實際的樣本也更多）。

圖4.11 sample 的數量以及 scaling 的訓練的結果（期望值）。

圖4.12 sample 的數量以及 scaling 的訓練的結果（變異數）。

而在學習的效果部分，圖 4.13 和圖 4.14 表現了在 GAN 學習的樣本長度為 T=100 的時候，生成樣本為 200 的結果。可以看到，在平均值的部分，GAN 所生成的結果依舊穩定（繼續固定斜率線性增加），而在變異數的部分有一個明顯的轉折。

當我們把生成的樣本的長度增加到 300 的時候，即圖 4.15 和圖 4.16 的結果，

我們可以看到此時的變異數依舊沒有繼續保持線性了，而平均的部分甚至出現了下降，這部分的原因很有可能是，當我們將用樣本的最大值作為總體的最大值（以此做(3.4）的時候所帶來的問題：由於我們的生成器的最後的激活函數是 tanh，

則值域被固定在(−1,1)，且 1（−1）對應到樣本的最大值（最小值），當 GAN 試圖生成更大的值的時候，便會出現圖 4.15 最後的結果。

當我們使用了 scaling=4 之後，相當於某種程度上把 0.25（−0.25）對應到樣本的最大值（最小值），此時前面的問題會得到一定程度上的緩解。如圖 4.17 和圖 4.19 所示：在時間上，尤其是超過了 𝑇𝑇 = 100 的部分，其期望值的線性依舊平滑。

但是這樣會有一個明顯的代價：從圖 4.18 和圖 4.20 也能看出，樣本的變異數被壓縮了，這某種程度上改變了學習的樣本的一些統計性質。

圖 4.13 scaling 為 1 的時候 RGAN 生成的長度為 200 的時間序列的在每個時刻的期望值的分佈。

圖 4.14 scaling 為 1 的時候 RGAN 生成的長度為 200 的時間序列的在每個時刻的變異數的分佈。

圖 4.15 scaling 為 1 的時候 RGAN 生成的長度為 300 的時間序列的在每個時刻的期望值的分佈。

圖 4.16 scaling 為 1 的時候 RGAN 生成的長度為 300 的時間序列的在每個時刻的變異數的分佈。

圖 4.17 scaling 為 4 的時候 RGAN 生成的長度為 200 的時間序列的在每個時刻的期望值的分佈。

圖 4.18 scaling 為 4 的時候 RGAN 生成的長度為 200 的時間序列的在每個時刻的變異數的分佈。

圖 4.19 scaling 為 4 的時候 RGAN 生成的長度為 300 的時間序列的在每個時刻的期望值的分佈。

圖 4.20 scaling 為 4 的時候 RGAN 生成的長度為 300 的時間序列的在每個時刻的變異數的分佈。

綜合上述的實驗結果，我們有以下結論：（一） GAN 可以學習到常用的股價模型的一些性質。（二）樣本數在這個試驗中的重要性並不是那麼大。（三）用 scaling 可以緩解一些在生成階段值域的相關問題，但是代價是犧牲了變異數的統計性質。

另外，值得指出的我們並沒有說 GAN 完全學習到了 GBM 這個模型：因為顯然在各個方面，離完美的擬合理論值還有不小的距離（包括樣本的均值、變異數、分佈的形狀等等），但是的確在各個方面和理論值已經接近了。那麼，一個很重要的問題是，對於我們希望應用的的回測而言，這樣的學習效果到底足夠不足夠呢？在下面我們進行了討論。

在文檔中應用GAN於回測交易策略以避免過擬合 (頁 40-44)