• 沒有找到結果。

4.1 路徑學習

4.1.3 Scaling

我們比較了資料量以及 scaling 的對於 RGAN 的學習的影響。從圖 4.11 圖 4.12 上可以看到而在資料量和 scaling 對於學習速度的影響。

結果顯示,在相同的 scaling 之下,以 epoch 來算,資料量越大學習的越快(當 然一個 epoch 對於資料量大的資料實際的樣本也更多)。

圖4.11 sample 的數量以及 scaling 的訓練的結果(期望值)。

圖4.12 sample 的數量以及 scaling 的訓練的結果(變異數)。

而在學習的效果部分,圖 4.13 和圖 4.14 表現了在 GAN 學習的樣本長度為 T=100 的時候,生成樣本為 200 的結果。可以看到,在平均值的部分,GAN 所 生成的結果依舊穩定(繼續固定斜率線性增加),而在變異數的部分有一個明顯 的轉折。

當我們把生成的樣本的長度增加到 300 的時候,即圖 4.15 和圖 4.16 的結果,

我們可以看到此時的變異數依舊沒有繼續保持線性了,而平均的部分甚至出現了 下降,這部分的原因很有可能是,當我們將用樣本的最大值作為總體的最大值(以 此做(3.4)的時候所帶來的問題:由於我們的生成器的最後的激活函數是 tanh,

則值域被固定在(−1,1),且 1(−1)對應到樣本的最大值(最小值),當 GAN 試 圖生成更大的值的時候,便會出現圖 4.15 最後的結果。

當我們使用了 scaling=4 之後,相當於某種程度上把 0.25(−0.25)對應到樣 本的最大值(最小值),此時前面的問題會得到一定程度上的緩解。如圖 4.17 和 圖 4.19 所示:在時間上,尤其是超過了 𝑇𝑇 = 100 的部分,其期望值的線性依舊 平滑。

但是這樣會有一個明顯的代價:從圖 4.18 和圖 4.20 也能看出,樣本的變異 數被壓縮了,這某種程度上改變了學習的樣本的一些統計性質。

圖 4.13 scaling 為 1 的時候 RGAN 生成的長度為 200 的時間序列的在每 個時刻的期望值的分佈。

圖 4.14 scaling 為 1 的時候 RGAN 生成的長度為 200 的時間序列的在每 個時刻的變異數的分佈。

圖 4.15 scaling 為 1 的時候 RGAN 生成的長度為 300 的時間序列的在每 個時刻的期望值的分佈。

圖 4.16 scaling 為 1 的時候 RGAN 生成的長度為 300 的時間序列的在每 個時刻的變異數的分佈。

圖 4.17 scaling 為 4 的時候 RGAN 生成的長度為 200 的時間序列的在每 個時刻的期望值的分佈。

圖 4.18 scaling 為 4 的時候 RGAN 生成的長度為 200 的時間序列的在每 個時刻的變異數的分佈。

圖 4.19 scaling 為 4 的時候 RGAN 生成的長度為 300 的時間序列的在每 個時刻的期望值的分佈。

圖 4.20 scaling 為 4 的時候 RGAN 生成的長度為 300 的時間序列的在每 個時刻的變異數的分佈。

綜合上述的實驗結果,我們有以下結論:(一) GAN 可以學習到常用的股 價模型的一些性質。(二) 樣本數在這個試驗中的重要性並不是那麼大。(三) 用 scaling 可以緩解一些在生成階段值域的相關問題,但是代價是犧牲了變異數的統 計性質。

另外,值得指出的我們並沒有說 GAN 完全學習到了 GBM 這個模型:因為 顯然在各個方面,離完美的擬合理論值還有不小的距離(包括樣本的均值、變異 數、分佈的形狀等等),但是的確在各個方面和理論值已經接近了。那麼,一個 很重要的問題是,對於我們希望應用的的回測而言,這樣的學習效果到底足夠不 足夠呢?在下面我們進行了討論。

相關文件