• 沒有找到結果。

第四章 實證研究

第二節 實證結果-無解釋變數

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

26

若電流為常態分配,則距離期望值 6 倍標準差的尾端機率約為 ,若直接 以千萬筆( 筆)的樣本數量估計至 6 倍標準差數值,因缺乏真實資料值對照,

估計結果無所依據,故本實證研究將目標縮小為估計至尾端機率 (約為 5.2 標準差)的電流值。

總言之,本實證研究目標為以較少的資料數量(少於 筆),估計右尾機率 (約為標準常態值 3.7、4.3、4.8、5.2)的極端電流值,

以及左尾機率 (約為標準常態值-5.2、-4.8、-4.3、

-3.7)的罕見電流值。

 估計目標:左右尾機率 的電流值

 電壓設定:電壓 1.0、電壓 0.8、電壓 0.6

 樣本篩選:整筆樣本、尾端 1%樣本

 估計方法:有解釋變數、無解釋變數(Moment 法、WLS(z) 、WLS(log)、EVT)

 衡量指標:均方誤差 MSE

第二節 實證結果-無解釋變數

(一) Box-Cox 轉換資料

首先以 Q-Q Plot 了解三種電壓(1.0、0.8、0.6)下電流左右尾端分配情形。從 一千萬筆資料中,各隨機抽出 1%即十萬筆電流值,繪製 Q-Q Plot 如圖 4-1 所示

(圖中斜直線表示常態分配),由圖中可以看出不管是左尾還是右尾,電壓越小 其電流尾端數值越偏離常態分配,亦即電壓 0.6 時的電流左右尾偏離情形都較電 壓 0.8 與電壓 1.0 嚴重;另一方面,不管是哪一種電壓,電流右尾分配都比左尾 更為偏離常態。

接著以 Box-Cox 轉換方法嘗詴將三種電流值轉換成較為接近常態分配,見 圖 4-2,取其概似函數最大時的 值為最佳轉換次方值,電壓 1.0 時的電流最佳轉

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

27

換次方值約為 0,即為 log 轉換,而電壓 0.8 時的最佳轉換次方約為 1/3,又電壓 0.6 時的最佳轉換次方約為 1/7,故以取 log、1/3 次方、1/7 次方轉換資料。轉換 後的電流值 Q-Q Plot 如圖 4-3 所示,三種電壓尾端電流值都變成較為近似常態,

其中又以電壓 0.6 轉換效果最好,樣本多在 Q-Q Plot 的對角線上,而電壓 0.8 次 之,電壓 1.0 轉換效果較差,左右尾兩端皆仍有偏離常態現象。

圖 4-1 三種電壓(1.0、0.8、0.6)下,電流值的 Q-Q Plot

圖 4-2 三種電壓的電流值進行 Box-Cox 轉換(無解釋變數)

圖 4-3 三種電壓(1.0、0.8、0.6)下,轉換後電流值的 Q-Q Plot

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

28

(二) 樣本數決定

本研究希望能以較少的樣本數估計至千萬筆機率值( ),因此需要先決定 樣本數,考慮樣本數量為千萬筆的 10%、1%、0.1%、0.01%四種情況,亦即隨機 抽樣百萬筆、十萬筆、一萬筆、一千筆樣本,而後採用上述加權迴歸方法(WLS(z) 與 WLS(log))估計尾端罕見機率電流值,反覆執行 10 次抽樣,計算估計值的均 方誤差(MSE)。

以電壓 1.0 資料為例,圖 4-4 為左尾(左圖)與右尾(右圖)的均方誤差,

當樣本數從一千筆增加至一萬筆、一萬筆增加至十萬筆、十萬筆增加至百萬筆時,

MSE 會逐漸減少,但減少幅度有略減趨勢,其中左尾 WLS(z)和右尾 WLS(log) 方法,樣本為十萬筆時的 MSE 已和百萬筆的 MSE 相當接近,而電壓 0.8 和電壓 0.6 皆有類似情況。

因此本實證研究決定以千萬筆資料的百分之一(即十萬筆)作為樣本數量。

從千萬筆電流值中隨機抽取十萬筆作為樣本進行估計,重覆 100 次抽樣,便得到 估計值平均與標準差,最後將此結果與千萬筆觀察值比較,以下先討論右尾各個 電壓的估計結果,再討論左尾各電壓的估計結果。

圖 4-4 電壓 1.0 左尾(左)與右尾(右)不同樣本數的 MSE(無解釋變數)

兩種選樣方式下,WLS(z)、WLS(log)、EVT 估計結果皆優於 Moment 法,

其中以使用全部樣本的 WLS(log)其 MSE 最小為最佳估計方式,其次為 EVT,又

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

30

EVT 在較高右尾機率值( )的估計較 WLS(log)佳,但於較低右尾機率值(

)的估計較 WLS(log)差;而 WLS(z)的 MSE 較 WLS(z)和 EVT 大,而其 右尾 1%篩選樣本方式比使用整筆好。若單看偏誤情形,使用 Moment 法估計右 尾 電流值,其偏誤皆為使用整筆資料 WLS(log)的 6 倍以上、篩選 1%

右尾樣本 WLS(z)的 1.5 倍以上、EVT 的 2 倍以上;而 WLS(log)和 EVT 估計值 平均偏誤皆小於 2 倍估計值標準差。

表示電壓 1.0 下,以 WLS(z)、WLS(log)、EVT 能取代 Moment 法改善右尾 電流值估計,且使用整筆資料的 WLS(z)和門檻值 1%的 EVT,能夠有效估計至 右尾機率 電流值。

(2) 電壓 0.8 右尾

電壓 0.8 結果和電壓 1.0 類似,兩種選樣方式下,WLS(z)、WLS(log)、EVT 估計結果皆優於 Moment 法,其中以使用全部樣本的 WLS(log)其 MSE 最小為最 佳估計方式,其次為 EVT,又 EVT 在較高右尾機率值( )的估計較 WLS(log)佳,但於較低右尾機率值( )的估計較 WLS(log)差;而 WLS(z)的 MSE 較 WLS(z)和 EVT 大,而其右尾 1%篩選樣本方式比使用整筆好。

若單看偏誤情形,使用 Moment 法估計右尾 電流值,其偏誤皆為使用 整筆資料 WLS(log)的 2.8 倍以上、篩選 1%右尾樣本 WLS(z)的 1.7 倍以上、EVT 的 2 倍以上;而 WLS(log)和 EVT 估計值平均偏誤皆小於 2 倍估計值標準差。

表示電壓 0.8 下,以 WLS(z)、WLS(log)、EVT 能取代 Moment 法改善右尾 電流值估計,且使用整筆資料的 WLS(z)和門檻值 1%的 EVT,能夠有效估計至 右尾機率 電流值。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

31

(3) 電壓 0.6 右尾

以 MSE 最小為衡量準則,則 Moment 法估計最佳,其次為使用整筆的 WLS(z) 和 EVT,其中 EVT 在較高右尾機率值( )的估計較 WLS(z) 佳,但於較低右尾機率值( )的估計較 WLS(z)差;而 WLS(log)所得 MSE 較 WLS(z)和 EVT 大,但其右尾 1%篩選樣本方式比使用整筆好。若單看偏誤情形,

使用 Moment 法估計右尾 電流值,其偏誤皆為 WLS(z)的 1.3 倍以上、

EVT 的 2 倍以上;而 WLS(z)和 EVT 估計值平均偏誤皆小於 2 倍估計值標準差。

表示電壓 0.6 下,若以不偏性為考量重點,WLS(z)和 EVT 能取代 Moment 法改善右尾電流值估計,且使用整筆資料的 WLS(z)和門檻值 1%的 EVT,能夠 有效估計至右尾機率 電流值;但若要同時考量不偏與變異小,採用 Moment 法估計表現較佳。

(四) 左尾部分實證結果

從千萬筆觀察值中重覆 100 次隨機抽樣十萬筆樣本值, 估計左尾罕見機率 電流值的均方誤差如表 4-2 所示。

表中由左而右分兩區塊:左為使用全部十萬筆樣本、右為只篩選 1%的樣本 資料;由上而下分三區塊:電壓 1.0、電壓 0.8、電壓 0.6。

每一種電壓下,MSE 平均而言最佳的估計結果(即 MSE 最小者)以粗體表 示,次佳者(即 MSE 次小者)以粗斜體表示。又各電壓下詳細的估計值平均和 標準差見附表 3,以圖形呈現估計值平均見附圖 2 左半部,以下分別探討各電 壓的左尾估計結果。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

33

(2) 電壓 0.8 左尾

電壓 0.8 估計結果與電壓 1.0 結果相似,使用全部樣本的 WLS(z)其 MSE 最 小為最佳估計方式,其次為 Moment 法和 EVT,又 EVT 在較高左尾機率值( )的估計較 Moment 佳,但於較低機率值( )的估計較 Moment 差;

而 WLS(log)的 MSE 為最大,有低估左尾電流值的趨勢,而其左尾 1%篩選樣本 方式比使用整筆好。

若單看偏誤情形,使用 Moment 法估計左尾 電流值,其偏誤皆為 使用整筆資料 WLS(z)的 2.2 倍以上、EVT 的 2.3 倍以上;而 WLS(z)和 EVT 估計 值平均偏誤皆小於 1 倍估計值標準差。

表示電壓 0.8 下,以 WLS(z)、EVT 能取代 Moment 法改善左尾電流值估計,

且使用整筆資料的 WLS(z)和門檻值 1%的 EVT,能夠有效估計至左尾機率 電 流值。

(3) 電壓 0.6 左尾

以 MSE 最小為衡量準則,則 Moment 法估計最佳,其次為使用整筆的 WLS(z) 和 EVT,其中 EVT 在較高左尾機率值( )的估計較 WLS(z)佳,但於較低左尾 機率值( )的估計較 WLS(z)差;而 WLS(log)的 MSE 較大,

而其右尾 1%篩選樣本方式比使用整筆好。若單看偏誤情形,Moment 法在左尾 較高機率值( )的偏誤比 WLS(z)大,且在較高機率值( )的偏誤比 EVT 大;而 Moment、WLS(z)和 EVT 估計值平均偏誤皆小於 1 倍估計值標準差。

表示電壓 0.6 下,若以不偏性為考量重點,WLS(z)和 EVT 能階段式的改善 Moment 法左尾電流值估計,且使用整筆資料的 WLS(z)和門檻值 1%的 EVT 能 有效估計至左尾機率 電流值;但若要同時考量不偏與變異小,採用 Moment 法估計較佳。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

34

相關文件