第四章 模擬與比較
4.2 GAPLS 法 與 BIC 法的比較
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
取的節點進行 B-spline 的函數估計,其估計誤差的標準差也都為 0.4 左右,於是 結果顯示以 GAPLS 法來選取節點時,因為不同的 𝑐1 , 𝑐2 組合下,估計的效果都 不會有太大的差異,對於 B-spline 的函數估計穩定性很高,所以我們建議取 𝑐1 = 1 , 𝑐2 = 1 即可,且此時 𝑐1 , 𝑐2 控制權重的部分會與 APLS 法相同。
4.2 GAPLS 法 與 BIC 法的比較
本節目的在於比較 GAPLS 法與 BIC 法之間,在節點選取數量與估計效果優 劣做比較,首先我們總共有八種真實函數,每種函數生成十組固定種子之下的隨 機樣本資料,且兩方法皆針對這些資料進行模擬,進而比較兩法之間對於資料的 估計誤差大小,以及估計的穩定度,和是否容易造成過度配適,而取過多節點數。
首先下列估計函數圖共分成兩種,第一種為 GAPLS 法模擬十次之下,此法 估計誤差最小的那組樣本,然後將 GAPLS 法與 BIC 法根據此組資料所配適出來 的函數圖放在一起比較,第二種則為 BIC 法模擬十次之下,此法估計誤差最小 的那組樣本,而畫圖的方法則如第一種,且函數估計圖下方有顯示此估計效果來 自哪組樣本。
於是八種函數 (附錄一) 我們共可以得到十六張圖,並且以根據下列估計函 數圖發現 GAPLS 法與 BIC 法的估計效果都很不錯,配適出來的 B-Spline 迴歸函 數與真實函數的差異都很小,不論是平滑型的函數圖型 (前四組函數),或是有 間斷型的函數圖型 (後四組函數)。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖(一) 函數一 圖(二) 函數一
圖(三) 函數二 圖(四) 函數二
圖(五) 函數三 圖(六) 函數三
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖(七) 函數四 圖(八) 函數四
圖(九) 函數五 圖(十) 函數五
圖(十一) 函數六 圖(十二) 函數六
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖(十三) 函數七 圖(十四) 函數七
圖(十五) 函數八 圖(十六) 函數八
因為圖型看起來估計效果都不錯,只看圖型看不出有什麼明顯的差異,那麼 我們現在就使用 GAPLS 法與 BIC 法的估計誤差值來做比較,結果如下表:
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
在來細看各函數模擬十次之下,GAPLS 法的估計誤差比 BIC 法的估計誤差來 得小的個數,進而更仔細的比較兩方法之間優劣,模擬結果如下:
表(七) 十次中,GAPLS 法比 BIC 法好的個數 函數
估計誤差 函數一 函數二 函數三 函數四
# of GAPLS<BIC 0 0 0 0
表(八) 十次中,GAPLS 法比 BIC 法好的個數 函數
估計誤差 函數五 函數六 函數七 函數八
# of GAPLS<BIC 3 4 0 0
根據上表可以看出,雖然 BIC 法的估計效果比 GAPLS 法好得多,但是我們 發現在不同的函數設定之下,兩方法之間對於估計效果的優劣關係還是會有差異 的。
在來比較兩方法之下,對於不同的函數類型,其最後選取節點的平均個數,
模擬結果如下表:
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
表(九) 平均選取節點數 函數
平均#knot 函數一 函數二 函數三 函數四 GAPLS 9.6 9.5 9.7 9.6
BIC 8.1 2 2 2.7
真實函數 * 3 2 *
(*因為為多項式函數,所以真實函數並無節點設定)
表(十) 平均選取節點數 函數
平均#knot 函數五 函數六 函數七 函數八 GAPLS 9.3 8.9 8.7 9.7
BIC 5 6.8 5.9 5
真實函數 5 6 6 6
結果顯示 GAPLS 法不論資料為什麼型態的函數關係,其選取的節點數量全 都高於真實函數的節點數量,而且個數幾乎都落在 8 到 10 個之間,很接近我們 設定的最高數量,相對的 BIC 法則選取的節點數量與真實函數相比則大都偏少,
但比較接近真實函數的節點數量,這很有可能是因為 BIC 法中的懲罰項只單純 懲罰節點配適過多的問題。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
因為 BIC 法的近似效果在上述假設中大致看起來都比 GAPLS 法來的有效,
所以我們考慮了一些基本假設的更動,首先第一部分,我選擇將建立隨機樣本時 所使用的種子換成在接下來的十組,也就是換了一批隨機資料,然後照著前面相 同的模擬方法進行模擬比較,模擬結果如下:
表(十一) 下十組資料 函數
估計誤差 函數一 函數二 函數三 函數四
# of GAPLS<BIC 1 1 1 0
表(十二) 下十組資料 函數
估計誤差 函數五 函數六 函數七 函數八
# of GAPLS<BIC 1 3 2 1
我們將這裡產出的表(十一)與表(十二)和表(七)和表(八)相比,可以看出已兩 種設定之下已有明顯的不同,發現 GAPLS 法在十次的模擬當中,其估計誤差比 BIC 法的估計誤差來得小的個數已經明顯增加,所以我們可以得知不同的資料對 於 GAPLS 法與 BIC 法的估計效果來說,影響也是滿明顯的。
再來第二部分的更動則是訊噪比,在此我不僅將資料換為接下來的十組資料,
且也將資料的訊噪比調整為 4,讓資料的變動看起來更大,模擬結果如下:
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
表(十三) 下十組資料且訊噪比為四 函數
估計誤差 函數一 函數二 函數三 函數四
# of GAPLS<BIC 1 1 1 2
表(十四) 下十組資料且訊噪比為四 函數
估計誤差 函數五 函數六 函數七 函數八
# of GAPLS<BIC 1 3 2 1
看起來與表(十一)和表(十二)差異並不大,但是函數四的情況下,GAPLS 法 比 BIC 法好的個數多了一次,所以可以得知其實訊噪比對於這兩方法的估計也 是有一些影響的。
最後是第三部份的更動,這是是除了前兩部分的更動以外,還將樣本數調整 為一百筆,而模擬結果如下:
表(十五) 下十組資料且訊噪比為四且樣本數為一百筆 函數
估計誤差 函數一 函數二 函數三 函數四
# of GAPLS<BIC 2 2 2 0
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
表(十六) 下十組資料且訊噪比為四且樣本數為一百筆 函數
估計誤差 函數五 函數六 函數七 函數八
# of GAPLS<BIC 5 6 3 2
在此我們可以看到,GAPLS 法的估計效果比 BIC 法的估計效果來得好的個數 已經有明顯的增加,所以可以得知當樣本數變大時,很有可能 GAPLS 法會比 BIC 法來得表現優異。
最後看看兩方法在更改設定之後,其平均選取的節點個數是否有較接近真實 函數的節點個數,但因為 GAPLS 法所選取的節點數量都落於 8 到 10 之間,並 不會因為更改設定而有什麼明顯的影響,所以這裡我將 BIC 法模擬的結果進行 整理,結果如下表:
表(十七) 節點差異 函數
平均節點差 函數一 函數二 函數三 函數四
下十組資料 * 1.3 2.2 *
訊噪比調整為四 * 1.1 2.2 *
樣本增加至一百 * -0.4 0 *
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
表(十八) 節點差異 函數
平均節點差 函數五 函數六 函數七 函數八
下十組資料 1.3 1.2 0.7 -0.4
訊噪比調整為四 -0.7 1.5 0.2 -1.5
樣本增加至一百 0 -0.4 -0.2 -2.6
這裡可以看出,不同的設定之中,對於節點估計的準確度幾乎沒有什麼明顯 的趨勢,其中較為明顯的因素則是樣本數,可以看出在本文的研究範圍內,樣本 增加到一百筆以後,對於節點數量的準確度則會提升很多。
最後可以得到一些小結論,不管函數類型、參數值、不同的隨機資料、訊噪 比的大小以及樣本數的多寡,GAPLS 法所選取的節點數量幾乎都落在 8 到 10 個 之間,而當樣本數增加時,GAPLS 法所選取的節點數量會稍微接近真實函數的 節點數量,此外在不同的設定之下最有差異的地方,在於可以明顯的看出 GAPLS 法的估計效果比 BIC 法的估計效果來得好的次數有明顯增加,所以當訊噪比降 低和樣本數增加時,GAPLS 法的估計效果可以有效地提升。而 BIC 法對於節點 選取的個數,在樣本數提升的情況之下,BIC 法選取的節點就很靠近真實節點數 量,整體看起來 BIC 法的估計效果是很不錯的。