第四章 實例分析
本章共分為兩個部分,分別介紹所採用的兩個實例,並在不同的 狀況下,說明與比較加上限制條件
a
j ∈[0,1]和未加上該條件時,M.W.G.係數估計以及變數刪除結果上有何差異。
4.1 例一:礦坑內支撐物最大強度之分析
4.1.1 說明與探討
本文所採用的第一個例子是 Jeffers(1967)中一份 180 筆橫木(timber) 的 資 料 , 以 主 成 份 迴 歸 來 分 析 礦 坑 內 支 撐 物 (pitprop) 最 大 強 度 (compressive strength)與另外 13 個變數間的關係。該資料的 13 個變數 分 別 為 : 支 撐 物 的 長 度 (X1-LENGTH) 、 支 撐 物 頂 端 的 直 徑 (X2-TOPDIAM)、支撐物的溼度(X3-MOIST)、支撐物在測試時的比重 (X4-TESTSG)、將支撐物烘乾後的比重(X5-OVENSG)、支撐物頂端的 年輪數(X6-RINGTOP)、支撐物底部的年輪數(X7-RINGBUT)、支撐物 所能彎曲的極限(X8-BOWMAX)、支撐物處於最大彎曲狀態時頂端至 底部的距離(X9-BOWDIST)、環生體的個數(X10-WHORLS0)、經過清 理後支撐物的長度(X11-CLEAR1)、每個環生體中“節”的平均個數 (X12-KNOTS) 及節的平均直徑(X13-DIAKNOT),所有的資料訊息以相 關係數矩陣形式陳列於附錄 D 中。在本章中各表格所獲得的計算結
果,均係利用 MATLAB 及 LINGO 程式語言求得。
的特徵值由大至小依序為:4.219,2.378,1.878
X
本例中矩陣X '
,1.109,0.910,0.815,0.576,0.440,0.353,0.191,0.0506,0.0415 及 0.0387,X 'X 的條件數(condition number)κ =4.219/0.0387=109.02 1 0 0 , 表 示 沒 有 共 線 性 問 題 ; 條 件 數 κ <
。 一 般 來 說 , 條 件 數
100<κ<1000,表示有輕度至強度間的多重共線性問題;而κ >1000,
則表示有嚴重的多重共線性問題。本例中,κ =109.02,顯示有輕微的 多重共線性情形。另一方面,根據 2.1 節曾提到,矩陣 之對 角線元素 ,即變異膨脹因子 ,係另一個判斷自變數間共線性強 弱的指標。當變數間共線性很強時,(2.1.11)式中的 會趨近於 1。也 就是說當共線性很強時,至少會有一個以上的VIF的值很大。對所有自 變數迴歸的係數估計、標準差、t 值、p 值、決定係數 以及採用後退 刪除法的係數估計與標準差結果如下:
) 1
' ( −
= X X C
Cjj VIFj
2
Rj
2
Rj
表 4.1 完全模型及後退刪除法的相關結果
對所有自變數迴歸 後退刪除法 變數 迴歸係數 標準差 t 值 p 值 R2j 迴歸係數 標準差
X1 -0.4885 1.8802 -0.26 0.3975 0.9239 -0.4921 1.8728 X2 0.4006 1.9212 0.20 0.4308 0.9272 0.3896 1.8814 X3 -0.9753 1.7715 -0.55 0.2912 0.9143 -0.9719 1.7690 X4 0.2925 1.8283 0.16 0.4365 0.9192 0.2854 1.8257 X5 -0.0822 0.8257 -0.10 0.4602 0.6051 -0.0761 0.8214 X6 0.1789 1.3659 0.13 0.4483 0.8558 0.2271 1.1991 X7 0.1351 1.7996 0.075 0.4711 0.9168 - - X8 -0.2632 0.7061 -0.37 0.3557 0.4602 -0.2775 0.6746 X9 -0.0728 0.7524 -0.10 0.4602 0.5245 -0.0745 0.7519 X10 -0.0846 1.1736 -0.07 0.4721 0.8046 - - X11 0.0967 0.6377 0.15 0.4404 0.3382 0.1190 0.5438 X12 -0.0689 0.6214 -0.11 0.4602 0.3028 -0.0624 0.6128 X13 0.0010 0.6904 0.001 0.5000 0.4353 - -
而根據表 4.1 中各變數的決定係數 ,計有 5 個變數之 大於 0.9,顯 示某些變數間有極強的線性關係;但也有 4 個變數之 小於 0.5,顯示 這 4 個變數與其他變數間的線性關係較弱。因此,就 值而言,本例 的共線性非常嚴重,這與由條件數來判斷本例共線性強弱的結果有些 出入。繼續觀察對變數分別進行 t-檢定後所得到的 p 值,我們發現個別 檢定的結果均不顯著。但對整體模型進行 F 檢定時,結果卻是顯著的,
此表示有些變數是多餘的。因後退刪除法和 M.W.G.變數刪除法較為類 似,故將其係數估計、標準差的結果一併列在表 4.1 中,以便後續的對 照比較用。
2
Rj R2j
2
Rj
VIFj
註:表 4.1 中後退刪除法已剔除了變數 X7,X10 及 X13,故表中對應格內的值沒有,以“-”顯示。
應變數Y 對全部 13 個主成份迴歸時的殘差平方和(sum of squares of residuals)為 0.26914,而自由度(degree of freedom)為 166 的均方誤
(mean square error)則為 0.0016213。當對應於最小 3 個特徵值的主 成份被刪除後,殘差平方和增至 0.31489,而 則為 0.0018633。
MSE
MSE
不論採用 M.W.G.原方法或改良法進行變數刪除時,所使用的仿 - 型檢定統計量 之值係與
F
F F0.25(1,166)=1.33比較,以便決定變數應保留或 刪 除 。 根 據 3 . 5 節 的 說 明 , 有 三 個 重 要 因 素 會 影 響 到 自 變 數 的 刪除與否,因此在分析實例時,共有八種情況需要考慮。而本文的主 要目的是探討與比較加上限制條件aj∈
[ ]
0,1 與否對 M.W.G.自變數刪除 的過程與結果究竟會產生怎樣的影響?因此,在區分為四種不同狀況 下,我們將“加上限制條件aj∈[ ]
0,1”與“未加上限制條件 ”時,執 行 M.W.G.變數刪除的結果分別表列如後,以便進行分析、比較。M.W.G.的係數估計及標準差可根據式(3.3.1)與(3.3.3)求得。但加上限制條件的 M.W.G.係數估計無法以公式表示,因此標準差就無從獲得,此時僅對 變數刪除的過程與結果加以討論。
j ∈ a
[
0,1]
狀況一:不刪除對應於較小的特徵值之主成分,採用 M.W.G.原方法 (1) 未加上aj ∈
[
0,1]
限制條件表 4.2 自變數刪除過程
步驟 被刪之主成分個數 欲刪除的變數 F 值 結論 1 0 X13-DIAKNOT 0.0003 刪除 X13 2 0 X10-WHORLS 0.9032 再刪 X10 3 0 X7-RINGBUT 0.2660 再刪 X7 4 0 X9-BOWDIST 1.4005 停止,不刪 X9
表 4.3
最後模型的係數估計
變數 迴歸係數 標準差 X1-TOPDIAM -0.4601 1.8665 X2-LENGTH 0.3366 1.8749 X3-MOIST -0.9776 1.7463 X4-TESTSG 0.2803 1.8254 X5-OVERSG -0.0741 0.8169 X6-RINGTOP 0.2646 0.6502 X7-RINGBUT 0 0.0195 X8-BOWMAX -0.2905 0.6295 X9-BOWDIST -0.0637 0.7260 X10-WHORLS 0 0.0083 X11-CLEAR 0.1117 0.5304 X12-KNOTS -0.0699 0.5759 X13-DIANOT 0 0.0029
表 4.4 對角矩陣 A 之對角線元素
a
j值a1 a2 a3 a4 a5 a6 a7
0.9697 1.0044 0.9656 0.9686 1.0027 0.9817 0.8898
a8 a9 a10 a11 a12 a13
1.3275 0.3771 20.7292 2.5387 0.9357 -26.273
(2) 加上aj ∈
[ ]
0,1 限制條件表 4.5
自變數刪除過程
步驟 被刪之主成
分個數 欲刪除的變數 F 值 結論 1 0 X13-DIAKNOT 8.3000 不刪除 X13
表 4.6
最後模型的係數估計
變數 迴歸係數
X1-TOPDIAM -0.4658 X2-LENGTH -0.3971 X3-MOIST -0.9614 X4-TESTSG 0.2866 X5-OVERSG -0.0836 X6-RINGTOP 0.1478 X7-RINGBUT 0.2256 X8-BOWMAX -0.1509 X9-BOWDIST -0.1980 X10-WHORLS -0.1239 X11-CLEAR 0.0922 X12-KNOTS -0.0276 X13-DIANOT 0.02569
表 4.7 對角矩陣 A 之對角線元素
a
j值a1 a2 a3 a4 a5 a6 a7
1 1 1 1 1 1 1
a8 a9 a10 a11 a12 a13
0 1 1 0 1 1
註:加了限制條件aj∈[0,1]後係數估計無法以公式表示,故表 4.6 未列出其標準差。
狀況二:刪除對應於較小的 3 個特徵值之主成分,採用 M.W.G.原方法
(1) 未加上aj ∈
[
0,1]
限制條件表 4.8
自變數刪除過程
步驟 被刪之主成分個數 欲刪除的變數 F 值 結論 1 3 X13-DIAKNOT 0.1225 刪除 X13 2 3 X9-BOWDIST 0.2238 再刪 X9 3 3 X12-KNOTS 1.8857 停止,不刪 X12
表 4.9
最後模型的係數估計
變數 迴歸係數 標準差 X1-TOPDIAM -0.0846 0.2846 X2-LENGTH -0.0369 0.3164 X3-MOIST -0.4120 0.3216 X4-TESTSG -0.3178 0.2912 X5-OVERSG 0.1296 0.5639 X6-RINGTOP 0.1909 0.4389 X7-RINGBUT 0.1832 0.2681 X8-BOWMAX -0.3255 0.6489 X9-BOWDIST 0 0.0024 X10-WHORLS -0.0572 0.2454 X11-CLEAR 0.0971 0.4716 X12-KNOTS -0.0573 0.5537 X13-DIANOT 0 0.0012
表 4.10 對角矩陣 A 之對角線元素
a
j值a1 a2 a3 a4 a5 a6 a7
0.9879 1.0061 1.0132 0.8720 1.0081 0.9511 0.9398
a8 a9 a10 a11 a12 a13
1.1523 1.1725 0.0000 0 0 0
(2) 加上aj∈
[ ]
0,1限制條件表 4.11 自變數刪除過程
步驟 被刪之主成分個數 欲刪除的變數 F 值 結論 1 3 X5-OVENSG 18.7410 不刪除 X5
表 4.12
最後模型的係數估計
變數 迴歸係數
X1-TOPDIAM -0.1098 X2-LENGTH -0.0580 X3-MOIST -0.4150 X4-TESTSG -0.2979 X5-OVERSG 0.2314 X6-RINGTOP 0.1268 X7-RINGBUT 0.1278 X8-BOWMAX -0.2068 X9-BOWDIST 0.0773 X10-WHORLS -0.0702 X11-CLEAR 0.1004 X12-KNOTS 0.0518 X13-DIANOT -0.0327
表 4.13 對角矩陣 A 之對角線元素
a
j值a1 a2 a3 a4 a5 a6 a7
1 1 1 0 1 1 0
a8 a9 a10 a11 a12 a13
1 1 0 0 0 0
註:加了限制條件aj∈[0,1]後係數估計無法以公式表示,故表 4.12 未列出其標準差。
狀況三:不刪除對應於較小的特徵值之主成分,採用 M.W.G.改良法
(1) 未加上aj ∈
[
0,1]
限制條件表 4.14 自變數刪除過程
步驟 被刪之主成分個數 欲刪除的變數 F 值 結論 1 0 X13-DIAKNOT 0.0004 刪除 X13 2 0 X10-WHORLS 0.9087 再刪 X10 3 0 X7-RINGBUT 0.2692 再刪 X7 4 0 X9-BOWDIST 1.4259 停止,不刪 X9
表 4.15
最後模型的係數估計
變數 迴歸係數 標準差
X1-TOPDIAM -0.4862 1.8671 X2-LENGTH 0.3958 1.8750 X3-MOIST -0.9828 1.7478 X4-TESTSG 0.2866 1.8255 X5-OVERSG -0.0762 0.8215 X6-RINGTOP 0.2674 0.6515 X8-BOWMAX -0.2727 0.6641 X9-BOWDIST -0.0667 0.7262 X11-CLEAR 0.1142 0.5305 X12-KNOTS -0.0708 0.5759
表 4.16 對角矩陣 A 之對角線元素
a
j值a1 a2 a3 a4 a5
1.0043 0.9972 0.9942 0.9902 0.9963
a6 a8 a9 a11 a12
0.9657 0.9813 1.6555 1.0078 0.0000
註:採改良法在最後模型中僅剩 10 個變數,故表 4.16 中矩陣 A 大小只有 10×10。
(2) 加上aj ∈
[ ]
0,1 限制條件表 4.17
自變數刪除過程
步驟 被刪之主成分個數 欲刪除的變數 F 值 結論 1 0 X13-DIAKNOT 8.3000 不刪除 X13
表 4.18
最後模型的係數估計
變數 迴歸係數
X1-TOPDIAM -0.4658 X2-LENGTH 0.3971 X3-MOIST -0.9614 X4-TESTSG 0.2866 X5-OVERSG -0.0836 X6-RINGTOP 0.1418 X7-RINGBUT 0.2256 X8-BOWMAX -0.1509 X9-BOWDIST -0.1980 X10-WHORLS -0.1239 X11-CLEAR 0.0922 X12-KNOTS -0.0277 X13-DIANOT 0.2569
表 4.19 對角矩陣 A 之對角線元素
a
j值a1 a2 a3 a4 a5 a6 a7
1 1 1 1 1 1 1
a8 a9 a10 a11 a12 a13
0 1 1 0 1 1
註:加了限制條件aj∈[0,1]後係數估計無法以公式表示,故表 4.18 未列出其標準差。
狀況四:刪除對應於較小的 3 個特徵值之主成分,採用 M.W.G.改良法
(1) 未加上aj∈
[
0,1]
限制條件表 4.20
自變數刪除過程
步驟 被刪之主成分個
數 欲刪除的變數 F 值 結論 1 3 X13-DIAKNOT 0.1225 刪除 X13 2 3 X9-BOWDIST 0.1746 再刪 X9 3 3 X2-LENGTH 1.233 再刪 X2 4 2 X10-WHORLS 0.9556 再刪 X10 5 2 X12-KNOTS 1.1373 再刪 X12 6 2 X11-CLEAR 7.6481 停止,不刪 X11
表 4.21
最後模型的係數估計
變數 迴歸係數 標準差
X1-TOPDIAM -0.1702 0.6757 X3-MOIST -0.4069 0.3209 X4-TESTSG -0.3144 0.2902 X5-OVERSG 0.1309 0.5598 X6-RINGTOP 0.2044 0.4193 X7-RINGBUT 0.1629 0.2851 X8-BOWMAX -0.3087 0.5999 X11-CLEAR 0.1119 0.5279
表 4.22 對角矩陣 A 之對角線元素
a
j值a1 a3 a4 a5 a6 a7 a8 a11
1.0029 1.0177 0.6621 1.0601 0.8321 0.8909 0 0
註:採改良法在最後模型中僅剩 8 個變數,故表 4.22 中矩陣 A 大小只有 8×8。
(2) 加上aj ∈
[
0,1]
限制條件表 4.23 自變數刪除過程
步驟 被刪之主成分個數 欲刪除的變數 F 值 結論 1 3 X5-OVENSG 18.7410 不刪除 X5
表 4.24 最後模型的係數估計
變數 迴歸係數
X1-TOPDIAM -0.1098 X2-LENGTH -0.0580 X3-MOIST -0.4150 X4-TESTSG -0.2979 X5-OVERSG 0.2314 X6-RINGTOP 0.1268 X7-RINGBUT 0.1278 X8-BOWMAX -0.2068 X9-BOWDIST 0.0773 X10-WHORLS -0.0702 X11-CLEAR 0.1004 X12-KNOTS 0.0518 X13-DIANOT -0.0327
表 4.25 對角矩陣 A 之對角線元素
a
j值a1 a2 a3 a4 a5 a6 a7
1 1 1 0 1 1 0
a8 a9 a10 a11 a12 a13
1 1 0 0 0 0
註:加了限制條件aj∈[0,1]後係數估計無法以公式表示,故表 4.24 未列出其標準差。
4.1.2 結果分析
綜觀前一節所獲致各表的結果,可歸納出下列四點結論:
1. 當aj ∈[0,1]這個限制條件被加入模式後,四種狀況下所獲得 的結果均有一個現象趨於一致,即被刪除的變數個數均少於 未加上限制條件aj ∈[0,1]時所刪除的變數個數,這和之前理論 的預期結果是符合的。
2. 在不考慮aj ∈[0,1]這個限制條件時,比較表 4.2 與 4.14、表 4.8 與 4.20,可印證 Mansfield et al.(1977)所言,他們的改良法較 原方法有效,即所刪除的變數個數會較多。
3. 在不考慮aj∈[0,1]這個限制條件時,Mansfield et al.(1977)認為 ,預先刪除對應較小的特徵值之主成份會使變數刪除的個數 更多。但比較表 4.2 與 4.8 後,發現他們所言不完全正確。
4. 後退刪除法所選擇的變數和狀況三採用改良法(即表 4.14)所選 擇的變數相同,且兩者的係數估計極為接近。
4.2 例二:乙炔( acetylene )轉換比例之分析
4.2.1 說明與探討
本文所採用的第二個例子是 Douglas, Montgomery , Peck (2001)中 關於乙炔(acetylene)轉換比例與另九個變數的資料。本資料的九個變數 分別為:氣體接觸的時間長短(X1-T)、氫( )與 n-Heptane 的比值 (X2-H)、氣體接觸時的溫度(X3-C)、T 與 H 的交互項( X4-T×H )、T 與 C 的交互項(X5-T×C)、C 與 H 的交互項( X6-C×H )、T 本身的交互項 (X7-
H2
T2)、H 本身的交互項(X8-H )、C 本身的交互項(X9-2 )、此例之 原始資料已被標準化,且並詳列於附錄 D 中。
C2
本例中矩陣X'X 的特徵值由大至小依序為:4.2048,2.16261,
1.13839,1.0413,0.38453,0.04951,0.01363,0.00513,0.0001。
X X'
矩陣 的條件數κ =4.2048/0.0001=42048。依照上一節對共線性嚴重 程度的分類,顯示本例有嚴重的多重共線性問題。
應變數 Y 對所有自變數迴歸的係數估計、標準差、t 值、p 值、決 定係數R2j以及採用後退刪除法的係數估計、標準差如下表:
表 4.26 完全模型及後退刪除法的相關結果
對所有自變數迴歸 後退刪除法 變數 迴歸係數 標準差 t 值 p 值 R2j 迴歸係數 標準差
X1 3.2893 2.9785 1.10 0.3117 0.9973 0.3563 0.0360 X2 -0.5209 0.2037 -2.56 0.0431 0.4041 -0.4884 0.2559 X3 3.9665 4.0131 0.99 0.3611 0.9985 - - X4 -1.8484 0.8588 -2.15 0.0749 0.9678 -1.8660 0.7737 X5 13.4133 12.475 1.08 0.3236 0.9998 1.5628 1.1945 X6 -2.0819 0.9199 -2.26 0.0643 0.9719 -2.1686 0.7962 X7 7.7582 6.4627 1.20 0.2752 0.9994 1.6543 1.0931 X8 0.3259 0.2747 1.19 0.2803 0.6851 0.2921 0.1893 X9 4.7475 5.2379 0.91 0.2803 0.9991 - - 觀察表 4.26 中各個變數之決定係數 值,得知計有 7 個變數的 超過 0.9,而另外兩個變數的 分別為 0.4041 及 0.6851。由此可知本例大多 數的 值均很大,即變數間有極強的線性關係,此結果與由條件數判 斷共線性強弱程度的結論一致。依據表 4.26 中對個別變數進行 t-檢定 後得到的 p 值,我們發現除了 X2,X4,X6 外個別檢定的結果均不顯 著。但對整體模型進行 F 檢定時,結果卻是顯著的,此表示有些變數 是 可 刪 除 的 。 本 例 中 保 留 全 部 的 9 個 主 成 份 時 的 殘 差 平 方 和 為 0.14256,而自由度為 6 的均方誤為 0.02376。此例使用的仿 -型檢定 統計量同例一,且 係我們決定保留或刪除變數的臨界點。
2
Rj R2j
2
Rj
VIFj
F
62 . 1 ) 6 , 1
25(
.
0 =
F
與例一的處理方式相同,在區分為四種不同狀況下,我們將“加上 限制條件aj ∈[0,1]”和“未加上限制條件aj ∈[0,1]”時,執行 M.W.G.變數刪 除的結果分別表列如後,以便進行分析、比較。
狀況一:不刪除對應於較小的特徵值之主成分、採用 M.W.G.原方法
(1) 未加上aj ∈
[
0,1]
限制條件表 4.27 自變數刪除過程
步驟 被刪之主成分
個數 欲刪除的變數 F 值 結論 1 0 X3-C 0.0898 刪除 X3 2 0 X1-T 0.7692 再刪 X1 3 0 X8-H 2 2.4688 停止,不刪 X8
表 4.28 最後模型的係數估計
變數 迴歸係數 標準差
X1-T 0 0.3743
X2-H -0.4833 0.1562
X3-C 0 0.5192
X4- T×H -1.8674 0.6511 X5- T×C 1.5627 3.9330 X6- C×H -2.1702 0.6942
X7-T2 1.6545 0.5514 X8-H2 0.2921 0.2114 X9-C2 -0.7887 2.1269
表 4.29 對角矩陣 A 之對角線元素
a
j值a1 a2 a3 a4 a5 a6 a7 a8 a9
1.2002 0.9679 0.8692 0.9886 0.9486 0.3777 1.2206 0.3014 0.9648
(2) 加上aj ∈
[ ]
0,1 限制條件表 4.30 自變數刪除過程
步驟 被刪之主成分
個數 欲刪除的變數 F 值 結論 1 0 X3-C 0.1040 刪除 X3 2 0 X8-H 2 2.8893 停止,不刪 X8
表 4.31 最後模型的係數估計
變數 迴歸係數
X1-T 0.3782 X2-H -0.4634 X3-C 0 X4- T×H -1.8654
X5- T×C 1.5022 X6- C×H -2.1950
X7-T2 0.8218
X8-H2 0.2405
X9-C2 -0.7738
表 4.32 對角矩陣 A 之對角線元素
a
j值a1 a2 a3 a4 a5 a6 a7 a8 a9
0.9999 1 1 1 1 1 1 0.2726 0.9675
註:加了限制條件a ∈[0,1]後係數估計無法以公式表示,故表 4.31 未列出其標準差。
狀況二:刪除對應於較小的 2 個特徵值之主成分、採用 M.W.G.原方法
(1) 未加上aj ∈
[
0,1]
限制條件表 4.33 自變數刪除過程
步驟 被刪之主成
分個數 欲刪除的變數 F 值 結論 1 2 X5-T×C 0.1560 刪除 X5 2 2 X1-T 0.0721 刪除 X1 3 2 X9-C2 1.2503 刪除 X9 4 2 X8-H 2 4.3446 停止,不刪 X8
表 4.34 最後模型的係數估計
變數 迴歸係數 標準差
X1-T 0 0.1265
X2-H -0.4916 0.1371
X3-C -0.6550 0.0173
X4- T×H -1.5763 0.0707
X5-T×C 0 0.0144
X6- C×H -1.8424 0.0616
X7-T2 0.6919 0.0141 X8-H2 0.3307 0.1480
X9-C2 0 0.3437
表 4.35 對角矩陣 A 之對角線元素
a
j值a1 a2 a3 a4 a5 a6 a7 a8 a9
1.7509 0.8990 0.9004 0.8732 0.9341 2.0711 0.9047 0 0
(2) 加上aj ∈
[ ]
0,1 限制條件表 4.36 自變數刪除過程
步驟 被刪之主成分
個數 欲刪除的變數 F 值 結論 1 2 X5-T×C 0.2400 刪除 X5 2 2 X1-T 0.1003 刪除 X1 3 2 X8-H 2 4.1997 停止,不刪 X8
表 4.37 最後模型的係數估計
變數 迴歸係數
X1-T 0 X2-H -0.4688 X3-C -0.6120 X4- T×H -1.4416
X5-T×C 0 X6- C×H -1.6969
X7-T2 0.6408
X8-H2 0.3186
X9-C2 -0.2995
表 4.38 對角矩陣 A 之對角線元素
a
j值a1 a2 a3 a4 a5 a6 a7 a8 a9
0.8398 1 1 1 1 1 0.7451 0 0
註:加了限制條件 ∈ 後係數估計無法以公式表示,故表 4.37 未列出其標準差。
狀況三:不刪除對應於較小的特徵值之主成分、採用 M.W.G.改良法
(1) 未加上aj ∈
[
0,1]
限制條件表 4.39 自變數刪除過程
步驟 被刪之主成分
個數 欲刪除的變數 F 值 結論 1 0 X3-C 0.0898 刪除 X3 2 0 X9-C2 0.0171 再刪 X9 3 0 X5-T×C 1.9958 停止,不刪 X5
表 4.40 最後模型的係數估計
變數 迴歸係數 標準差
X1-T 0.3565 0.2121
X2-H -0.4883 0.1449
X4- T×H -1.8674 0.6409 X5- T×C 1.5627 0.9898 X6- C×H -2.1702 0.6732
X7-T2 1.6545 0.9060 X8-H2 0.2921 0.1568
表 4.41 對角矩陣 A 之對角線元素
a
j值a1 a2 a4 a5 a6 a7 a8
0.9984 1.0017 0.9998 1.0001 1.0002 0.9758 1.0009
註:採改良法在最後模型中僅剩 7 個變數,故表 4.41 中矩陣 A 大小只有 7×7。
(2) 加上aj∈
[
0,1]
限制條件表 4.42 自變數刪除過程
步驟 被刪之主成分
個數 欲刪除的變數 F 值 結論 1 0 X3-C 0.1040 刪除 X3 2 0 X9-C2 0.0176 刪除 X9 3 0 X7-T 2 2.8421 停止,不刪 X7
表 4.43 最後模型的係數估計
變數 迴歸係數
X1-T 0.3753 X2-H -0.4641 X4- T×H -1.8900
X5- T×C 1.5329 X6- C×H -2.2215
X7-T2 0.8331
X8-H2 0.2399
表 4.44 對角矩陣 A 之對角線元素
a
j值a1 a2 a4 a5 a6 a7 a8
0.9984 1 1 1 1 0.9753 1
註 1:採改良法在最後模型中僅剩 7 個變數,故表 4.44 中矩陣 A 大小只有 7×7。
註 2:加了限制條件a ∈[0,1]後係數估計無法以公式表示,故表 4.43 未列出其標準差。
狀況四:刪除對應於 2 個較小的特徵值之主成分、採用 M.W.G.改良法
(1) 未加上aj ∈
[
0,1]
限制條件表 4.45 自變數刪除過程
步驟 被刪之主成分
個數 欲刪除的變數 F 值 結論 1 2 X5-T×C 0.1560 刪除 X5 2 2 X7-T 2 0.0061 再刪 X7 3 2 X4-T×H 1.6506 停止,不刪 X4
表 4.46 最後模型的係數估計
變數 迴歸係數 標準差
X1-T 0.6191 0.1414
X2-H -0.4495 0.1446
X3-C -0.3322 0.1375
X4- T×H -0.3509 0.5666 X6- C×H -0.5719 0.5765
X8-H2 0.2936 0.1594 X9-C2 -0.7856 0.0831
表 4.47 對角矩陣 A 之對角線元素
a
j值a1 a2 a3 a4 a6 a8 a9
1.0132 0.9987 1.0020 1.0415 1.0005 0 0
註:採改良法在最後模型中僅剩 7 個變數,故表 4.47 中矩陣 A 大小只有 7×7。
(2) 加上aj∈
[
0,1]
限制條件表 4.48 自變數刪除過程
步驟 被刪之主成分
個數 欲刪除的變數 F 值 結論 1 2 X5-T×C 0.0240 刪除 X5 2 2 X7-T 2 0.0068 再刪 X7 3 2 X4-T×H 2.5248 停止,不刪 X4
表 4.49 最後模型的係數估計
變數 迴歸係數
X1-T 0.4765 X2-H -0.4601 X3-C -0.2093 X4- T×H -0.0549
X6- C×H -0.2629 X8-H2 0.3190
X9-C2 0.3985
表 4.50 對角矩陣 A 之對角線元素
a
j值a1 a2 a3 a4 a6 a8 a9
1 0.9986 1 1 0.9075 0 0
註 1:採改良法在最後模型中僅剩 7 個變數,故表 4.50 中矩陣 A 大小只有 7×7。
註 2:加了限制條件aj∈[0,1]後係數估計無法以公式表示,故表 4.49 未列出其標準差。
4.2.2 結果分析
經觀察 4.2 節中各表的結果,可歸納出下列幾點結論:
1. 和前例的結果一樣,當限制條件aj ∈[0,1]被加入模型後,不論在 何種狀況下,被刪除變數的個數均不超過未加上限制條件時所 刪除變數的個數。
2. 在前例中,如果加上限制條件aj ∈[0,1],則沒有任何變數被刪除 掉。但在本例中,加了限制條件aj ∈[0,1]後,仍有變數被刪除掉,
其中的原因之一有可能是本例的多重共線性程度較為嚴重的緣 故。
3. 在不考慮限制條件aj∈[0,1]時,比較表 4.33 與表 4.45,我們發 現採用 M.W.G.改良法所刪除變數的個數反而少於採用 M.W.G.
原方法所刪除的變數個數,此結果與 Mansfield et al.(1977)文中 所言相違背。
4. 在不考慮 這個限制條件時,Mansfield et al. (1977)文中提 到,事先刪除對應於較小特徵值的主成份會增加變數刪除的個 數。當比較表 4.27 與 4.33、表 4.30 與 4.36、表 4.39 與 4.45、
表 4.42 與 4.48 後,我們發現不論有無加上限制條件 , 本例所呈現的結果都符合該文的說法。
] 1 , 0
∈[ aj
] 1 , 0
∈[ aj
5. 本例中,採用後退刪除法所刪除的變數與狀況三採用 M.W.G.
改良法(即表 4.39)時相同,且兩者的係數估計亦差距甚微。