(一)HLM
由前章節以截距項為結果的混合模型的估計迴歸式,作為我們的租買預測函數,
其估計結果已於前文所述。我們設定機率的切割點為0.5,得出表6的錯誤分類表。由表 中得知正確命中率為87.40%。
表6 HLM預測錯誤分類表(N=3031)
預測家戶
租 買
觀察家戶 租 192 339
買 43 2457
命中率 ( % ) 87.40%
43
ROC曲線方面,由租買錯誤率與命中率可繪製漸近通過座標 (0,0),(43/2500,192/53 1),(339/531,2457/2500),(1,1)及逐次2個樣本數組、3個樣本數組……、N-1個樣本數組之
44
稱「模型經交叉驗證之客觀命中率」。顯示出10折測試組交叉驗證命中率(84.60%)相較 於總樣本(87.40%)與訓練組(86.91%)的命中率分別有2.8%與2.31%的差異。
(二)二元邏吉斯迴歸模型
在進行二元邏吉斯迴歸模型預測前,我們先對二元邏吉斯迴歸模型作個別係數Wald 檢定,即檢定參數 是否顯著異於 0,來判斷進行二元邏吉斯迴歸模型分析預測是否合j 適。Wald 檢定實際上就是 Z 統計量的平方,W= / 2
j
j Se
,在自由度為1 時,其值 會接近於自由度為1 的卡方分配。由實證結果顯示,Wald 值為 1041.407,自由度 1,依 Wald 檢定達 1%顯著水準,表示拒絕各參數 等於 0 的虛無假設,亦即各參數j 顯著j 異於0,可以進行二元邏吉斯迴歸分析預測。
表7 Wald檢定
截距項估計係數 標準誤 Wald
1.549 0.048 1041.407
由表 8 實證結果顯示,解釋變數中除了環境品質為正向,未達 10%顯著水準(HLM 為正向影響,但達10%顯著水準)、休閒與運動為負向影響,未達顯著水準(HLM 為正向 影響,未達 10%顯著水準)、每人居住面積為正向影響,達 10%顯著水準(HLM 為正向 影響,但未達10%顯著水準),貸款成數、私人借貸 1、私人借貸 2 與政府優惠貸款為正 向影響,未達10%顯著水準(HLM 為正向影響,但達 1%顯著水準)對租買選擇的影響與 HLM 不同外,其他的解釋變數的正、負向及顯著水準與前章節 HLM 之變數對租買選擇 的影響相同。各估計係數Wald 檢定方面,Wald 檢定即 Z 統計量的平方,當
=0.05 時,Z 如果大於1.96,即達顯著水準。因此,當
=0.05,95%信賴區間時,Wald 如果大於 3.84,表示估計係數達顯著水準。如年齡、年齡平方、教育水準、戶內常住人口。Exp(B) 為解釋變數的估計係數取指數,例如性別表示男性購屋與租屋的勝算,是女性的 1.08645
倍,但未達10%顯著水準。標準誤方面,二元邏吉斯迴歸模型的解釋變數的標準誤均比 HLM 為小,表示二元邏吉斯迴歸模型對巢套資料,會忽略了不同行政區的「情境變數」
或「脈絡變項」(contextual variable)具有的組間變異,容易使分析結果得到係數估計值 不是不偏估計值,且標準誤較小,此實證結果亦符合Morrow-Jones (1988)實證研究結果 的理論,即將具有巢套結構資料以單一層次處理,其截距項與斜率項不受另一層次變數 之影響,僅以固定效果來估計,其可能會造成結果偏誤、係數高估等問題。
46 LOANR 19.387 900.329 0.000 0.983 2.630E8 PMORTGAGE1 17.014 1183.232 0.000 0.989 24499372.003 PMORTGAGE2 19.404 3241.508 0.000 0.995 2.674E8 PRELOAN 17.483 1047.169 0.000 0.987 39166087.126 ENVI 7.113 635.542 0.000 0.991 1227.899 LEIS -6.869 647.322 0.000 0.992 0.001 E102 -10.871 411.591 0.001 0.979 0.000 E103 -0.399 417.008 0.000 0.999 0.671 E104 7.991 470.419 0.000 0.986 2954.316 E105 -9.565 452.524 0.000 0.983 0.000 E106 4.173 334.625 0.000 0.990 64.888 E107 -7.763 380.595 0.000 0.984 0.000 E108 -8.293 430.833 0.000 0.985 0.000 E109 -15.736 614.201 0.001 0.980 0.000 E110 5.001 380.138 0.000 0.990 148.634 E111 -3.327 328.707 0.000 0.992 0.036 E112 -3.442 204.394 0.000 0.987 0.032 E201 -2.956 236.630 0.000 0.990 0.052 E202 -7.974 315.350 0.001 0.980 0.000 E203 -6.635 247.373 0.001 0.979 0.001 E204 -6.770 327.413 0.000 0.984 0.001 E205 3.031 259.078 0.000 0.991 20.727 E206 -1.841 169.654 0.000 0.991 0.159 E207 10.428 385.860 0.001 0.978 33781.549
47
E208 6.487 385.142 0.000 0.987 656.230 E209 -2.332 135.702 0.000 0.986 0.097 E210 49.136 7548.606 0.000 0.995 2.185E21 AIC -7020.47
BIC 907527.60
註:***代表P<0.01,**代表 P<0.05,*代表P<0.1。
我們將二元邏吉斯迴歸模型的估計迴歸式,建立租買選擇的分類規則,並設定機 率的切割點為0.5,來驗證樣本租買選擇行為被正確分配的命中率,得出表9的錯誤分類 表,命中率為86.08%,低於HLM 的87.40%。
表9 二元邏吉斯迴歸模型錯誤分類表(N=3031)
預測家戶
租 買
觀察家戶 租 228 303
買 119 2381
命中率 ( % ) 86.08%
實證結果顯示,AIC值為-7020.5,BIC值為907527.6。相較於前小節HLM相關數值,
顯示二元邏吉斯迴歸模型AIC值與BIC值大於HLM,表示模型配適度不及HLM。
由租買錯誤率與命中率同樣可繪製通過漸近座標(0,0),(0.08,0.43), (0.57,0.95),(1,1) 及逐次2個樣本數組、3個樣本數組…… N-1個樣本數組之(命中率,錯誤率),無數散佈 點所形成的ROC曲線如圖4,圖4實證結果顯示,曲線位於AUC=0.5的左上方,ROC曲 線下的面積AUC=0.893,表示AUC>0.5且模型對租買樣本分類具有鑑別力,惟ROC曲 線下AUC面積顯示,相對小於HLM(AUC =0.918) 0.025,表示其租買樣本分類的鑑別力 差於HLM。另外,表14實證結果顯示,MAE與MAPE分別為0.156與0.230,依Lewis(1982) 評估指標20%<MAPE(%)≤50%可作為合理的預測適配模型,亦可判定二元邏吉斯迴歸 模型符合此指標。
二元預測準確性關聯量數四個指標,由實證顯示,二元邏吉斯迴歸模型不和諧配
48
對數(Nd=109345),結配對數(Tie=73072),和諧配對數(Nc=1145083),計算出Gamma 為0.826、Somers' D為0.780、Tau-a為0.226、c為0.890。同樣,四個二元預測準確性關 聯量數指標值越大,表示模型的預測精準度相對為優。四個二元預測準確性關聯量數 小於HLM,即表示二元邏吉斯迴歸模型在預測的準確性上不及HLM,亦同樣再次應證 了命中率,HLM>二元邏吉斯迴歸模型的實證結果。
10折交叉驗證方面,10折訓練組(總樣本數×90%=2728)的命中率為86.07%,與總樣 本(總樣本數N=3031)命中率86.08%,差0.01%。10折測試組(總樣本數×10%=303)交叉驗 證命中率,分別得出10組命中率0.839,0.809,0.805,0.822,0.858,0.838,0.845,0.851,
0.861,0.851。10組平均得出,二元邏吉斯迴歸模型10折測試組交叉驗證的命中率為 83.80%,顯示10折測試組命中率(83.80%)較總樣本(86.08%)與訓練組(86.07%)的命中率 分別有2.28%與2.27%的差異。與HLM10折測試組交叉驗證命中率(84.60%)相較,減少 0.8%的命中率且二者與本身模型訓練組命中率與總樣本命中率皆同方向下降,由此結 果顯示,10折測試組交叉驗證命中率,HLM>二元邏吉斯迴歸模型,結果同向呼應了 前述總樣本命中率的實證比較結果。
(三)區別分析模型
區別函數的有效性檢定為特徵值與Wilks' Lambda值。因為為租買二元變數,所以只 有一個典型變量函數與特徵值,Wilks' Lambda值檢定亦即向度縮減分析。租買二元變數 Wilks' Lambda值=1/(11)。首先,我們作整個模型檢定,即區別函數的有效性檢定。
表10特徵值的變異數100%(即0.332/0.332*100%),顯示區別函數能有效的解釋租買行為 幾達100%。其次,是整個模型之解釋變數之間的檢定,即區別指標自變數的顯著性檢 定。Wilks'Lambda值 0.751 (即1/1+0.332),卡方值862.087,自由度37,P值小於1%,表 示拒絕各自變數的平均數相同的虛無假設,顯示各自變數的平均數有顯著差異水準,表 示進行區別分析是有效的。
49
表10 典型變量特徵值
特徵值 變異數% 累積% 典型相關
0.332 100.0 100.0 0.499
表11 Wilks' Lambda值
Wilks' Lambda值 卡方值 自由度 顯著性
0.751 862.087 37 0.000
區別分析的解釋變數對租買選擇影響的結果與HLM仍有差異,由表12實證結果顯示
,除了教育水準正向影響但未達10%顯著水準(HLM正向影響,達1%顯著水準)、屋齡為 負向影響,達10%顯著水準(HLM為正向影響,未達10%顯著水準)、環境品質滿意度正 向影響,未達10%顯著水準(HLM正向影響,達1%顯著水準)及休閒與運動滿意度負向,
未達10%顯著水準(HLM正向影響,未達10%顯著水準),與前章節HLM租買選擇估計的 影響有差異外;其餘的變數對家計部門租買選擇的正負向影響及是否達顯著水準均與 HLM估計的結果相同。係數估計值與標準誤方面,第一層解釋變數略同於HLM,惟第 二層特徵變數環境品質滿意度與休閒與運動滿意度與HLM比較,其係數估計值有變得特 別膨脹及標準誤過小情形,表示其對巢套資料,同樣會忽略了不同行政區的「情境變數」
或「脈絡變項」具有的組間變異,容易使分析結果得到係數估計值不是不偏估計值,且 標準誤會較小。
50 PAGE2 -0.001 *** 1255.55424 0.977 70.426 0.000 HIGHT 0.286 0.44943 1.000 0.902 0.342 COLLEGE 0.567 0.39486 0.999 1.517 0.218 UNI 0.515 0.41852 1.000 0.580 0.446 HAGE -0.002* 11.51496 0.999 3.592 0.058 PAREA 0.013 6.09419 1.000 0.147 0.702 PROOM 0.238 0.48454 1.000 0.512 0.475 FMSZ 0.165 *** 1.64095 0.991 28.083 0.000 LOANR 1.689 *** 0.48531 0.833 605.196 0.000 PMORTGAGE1 0.042 *** 0.38522 0.949 162.239 0.000 PMORTGAGE2 0.927 *** 0.18095 0.991 27.478 0.000 PRELOAN 0.389 *** 0.42675 0.922 255.627 0.000 ENVI 1.842 0.28461 1.000 1.310 0.252
51
E207 0.591 0.13932 0.999 2.395 0.122 E208 0.437 0.11272 1.000 0.603 0.437 E209 -0.664 0.10222 1.000 0.034 0.854 E210 2.016 * 0.06782 0.999 2.988 0.084 AIC
BIC
-6889.93 946397.20
註:***代表P<0.01,**代表 P<0.05,*代表P<0.1。
由前面區別分析模型的估計迴歸式所建立租買選擇的分類規則,我們設定模型的機 率的切割點為0.5,進一步來驗證區別分析模型之租買選擇行為被正確分配的命中率,由 表13的錯誤分類表,顯示其命中率為85.65%,低於HLM 87.40%與二元邏吉斯模型 86.1%。
表13 區別分析模型錯誤分類表(N=3031)
預測家戶
租 買
觀察家戶 租 183 348
買 87 2413
命中率 ( % ) 85.65%
表12實證結果顯示,區別分析模型AIC值為-6889.93,BIC值為946397.20。其二個指 標值為三個模型中最大者,表示模型配適度不及其他二模型。
由租買錯誤率與命中率同樣可繪製通過漸近座標(0,0),(0.03,0.34), (0.66,0.97),(1,1) 及逐次2個樣本數組、3個樣本數組…… 、N-1個樣本數組之(命中率,錯誤率),無數散 佈點所形成的ROC曲線,圖4實證結果顯示,曲線位於AUC=0.5的左上方,ROC曲線下 的面積AUC=0.879,表示AUC>0.5且模型租買樣本分類的鑑別力佳,惟圖4實證結果 顯示,ROC曲線下AUC面積,分別小於HLM (AUC=0.918)與二元邏吉斯迴歸模型 (AUC=0.893),表示其租買樣本分類的鑑別力較差於HLM與二元邏吉斯迴歸模型。另 外,表14實證結果顯示,MAE與MAPE分別為0.145與0.237,顯示MAE與MAPE結果幾
52
趨近於0,且MAPE符合依Lewis (1982)評估指標20%<MAPE(%)≤50%,可判定亦為合 理的預測且配適良好的模型。
二元預測準確性關聯量數四個指標,由區別分析模型不和諧配對數(Nd=121948),
結配對數(Tie=94159),和諧配對數(Nc=1111393),同上可計算出,Gamma為0.802、
Somers' D為0.745、Tau-a為0.215、C為0.873。相同地,四個二元預測準確性關聯量數 指標值越大時,表示模型的預測精準度的關聯性相對為優。相較於前小節HLM與二元 邏吉斯迴歸模型相關數值顯示,區別分析模型之四個二元預測準確性關聯量數小於 HLM與二元邏吉斯迴歸模型,即表示區別分析模型在預測的準確性上不及HLM與二元 邏吉斯迴歸模型,亦同樣再次應證了總樣本命中率,HLM>二元邏吉斯迴歸模型>區 別分析模型的實證結果。
10折交叉驗證方面,訓練組(總樣本數×90%=2728)的命中率為85.78%,與總樣本(總 樣本數N=3031)命中率85.65%,差0.13%,為三種模型唯一增加者,推究原因,可能由 於其模型ROC的租買鑑別力為三者模型中最不優的,減去10%的樣本,相對使模型的 錯誤率減少大於正確率的減少,相對使訓練組(總樣本數N×90%=2728)命中率提升,同 樣地推論,HLM的ROC鑑別力最佳,減去10%的樣本,相對使模型的正確率減少會大 於錯誤率的減少,所以前小節HLM訓練組命中率減少為最大,有0.49%的差異減少,
而二元邏吉斯迴歸模型之ROC介於二者之間,其差異的變動應介於二者之間,實證也 顯示為近於不變。而10折測試組(總樣本數N×10%=303)交叉命中率,分別得出10組交 叉驗證命中率為0.855,0.825,0.828,0.848,0.832,0.805,0.825,0.805,0.875,0.832。
10組平均得出,區別分析模型10折交叉驗證的命中率為83.33%,顯示出與總樣本命中 率(85.65%)與訓練組命中率(85.78%)分別有2.32%與2.45%的差異。區別分析模型交叉驗 證的命中率(83.33%)與HLM10折交叉驗證命中率(84.60%)及二元邏吉斯迴歸模型交叉 驗證的命中率(83.80%)相較,分別有1.27%與0.47%的減少差異且三者交叉驗證命中率 與總樣本命中率皆同方向下降,由此結果顯示,10折交叉驗證命中率,HLM>二元邏