敘述性統計

表 2.1 敘述統計量

敘述統計量

標籤樣本數平均數標準差總和最小值最大值

失業率(%) 96 4.47708 0.68238 429.8 3.78 6.13 出生人數(千) 96 16.57316 2.29609 1591.023 10.597 23.398 外籍勞工人數(千) 96 384.732 44.96188 36934.272 327.311 489.134 消費者物價基本指數 96 98.50979 3.15064 9456.94 91.94 104.06

景氣同時指標綜合指

數(點) 96 90.51854 10.42325 8689.78 66.76 103.93

外銷訂單(千) 96 9.83729 1.35283 944.38 5.87 12.56

歇業家數(千) 96 2.84524 1.29472 273.143 1.307 7.81

平均薪資(千) 96 44.4688 9.67392 4269.005 38.138 83.392

工業生產指數 96 90.00698 11.90233 8640.67 54.21 107.42

所得稅 (百萬) 96 58927.19417 69778.29919 5657010.64 -26803.73 332543.84

第參章原始複回歸模型一、複回歸模型

影響失業率（）的變數有出生人數（）、外籍勞工人數（）、消費者物價基

本指數（）、景氣同時指標綜合指數（）、外銷訂單（）、歇業家數（）、

平均薪資（）、工業生產指數（）、所得稅（），利用這九個變數組成複回歸模型。

表 3.1 參數估計表 參數估計表

變數標籤參數估計值標準誤差 t 值 Pr(>|t|) 截距截距 -8.4094 2.3969 -3.508 0.000720

出生人數(千) -0.0634 0.0198 -3.202 0.001916 外籍勞工人數(千) -0.0137 0.0025 -5.455 4.64e-07 消費者物價基本指數 0.2220 0.0308 7.202 2.11e-10 景氣同時指標綜合指數(點) -0.0523 0.0130 -4.027 0.000121 外銷訂單(千) 0.3515 0.0889 3.955 0.000157 歇業家數(千) -0.2094 0.0356 -5.887 7.41e-08 平均薪資(千) 0.0040 0.0052 0.774 0.440969 工業生產指數 -0.0099 0.0124 -0.798 0.426926 所得稅(百萬) -1.311e-06 5.976e-07 -2.193 0.030975

由上表參數估計值初步建立的預測模型為：

二、模型適合度

我們利用 R 做出變異數分析表如下：

表 3.2 變異數分析表 anova

變數標籤自由度平方和均方和 F 值 Pr(>F)

出生人數(千) 1 3.9854 3.9854 25.6634 2.295e-06 外籍勞工人數(千) 1 1.0915 1.0915 7.0283 0.0095499 消費者物價指數 1 16.1593 16.1593 104.0562 < 2.2e-16 景氣同時指標綜合指數(點) 1 1.8968 1.8968 12.2145 0.0007521

外銷訂單(千) 1 1.3895 1.3895 8.9477 0.0036239 歇業家數(千) 1 5.1927 5.1927 33.4378 1.160e-07 平均薪資(千) 1 0.2721 0.2721 1.7523 0.1890979 工業生產指數(%) 1 0.1468 0.1468 0.9452 0.3336661 所得稅(百萬) 1 0.7471 0.7471 4.8111 0.0309750

殘差 86 13.3552 0.1553

經過我們整理得到適合度檢定表，如下：

表 3.3 適合度檢定表

來源 df 平方和 均方 F 值 Pr>F Model 9 30.88142 3.431269 22.09584 < 2.2e-16

Error 86 13.35496 0.1552903 SST 95 44.23638

整體模式檢定假設檢定

檢定統計量

由，我們得出拒絕虛無假設，表示解釋變數與反應變數有

線性關係。

三、模型解釋力

表 3.4 模型解釋力解釋力

標準化殘差值 0.3941 調整 R 平方 0.6665 自由度 86 F 統計量 22.1 判定係數 R 平方 0.6981 P 值 < 2.2e-16

全模型的為 0.6981，而經過校正的為 0.6665，減輕因樣本估計所帶來的膨脹效果。表示解釋變數的變異可以被新模型所解釋的比例有 66.65%。在下一章我們將進行選取變數來選出最佳模型。

四、參數檢定所得稅(百萬) -1.311e-06 5.976e-07 -2.193 0.030975

（1）想要判斷 (出生人数)和 (失業率)之間是否存在線性相關，首先我們先假設其他變數為固定的情况下

統計基本假設

在虛無假設之下的拒絕域為：P-value ＜α=0.05

檢定如下：因為 P-value=0.00191＜α=0.05 所以拒絕虛無假設，表

示我們有充分的證據顯示。因此， (出生人數)是一個顯著的解釋

變數和 (失業率)存在線性相關。

（2）想要判斷 (外籍勞工人數)和 (失業率)之間是否存在線性相關，首先我們先假設其他變數為固定的情况下

統計基本假設

在虛無假設之下的拒絕域為：P-value ＜α=0.05

檢定如下：因為 P-value=4.64e-07＜α=0.05 所以拒絕虛無假設

，表示我們有充分的證據顯示。因此， (外籍勞工人數)

是一個顯著的解釋變數和 (失業率)存在線性相關。

（3）想要判斷 (消費者物價指數)和 (失業率)之間是否存在線性相關，首先我們先假設其他變數為固定的情况下

統計基本假設

在虛無假設之下的拒絕域為：P-value ＜α=0.05

檢定如下：因為 P-value=2.11e-10＜α=0.05 所以不拒絕虛無假設

，表示我們沒有充分的證據顯示。因此， (消費者物價指

數)是一個顯著的解釋變數和 (失業率)存在線性相關。

（4）想要判斷 (景氣同時指標綜合指數)和 (失業率)之間是否存在線性相關，首先我們先假設其他變數為固定的情况下

統計基本假設

在虛無假設之下的拒絕域為：P-value ＜α=0.05

檢定如下：因為 P-value=0.000121＜α=0.05 所以不拒絕虛無假設，

表示我們沒有充分的證據顯示。因此， (景氣同時指標綜合指數)

是一個顯著的解釋變數和 (失業率)存在線性相關。

（5）想要判斷 (外銷訂單)和 (失業率)之間是否存在線性相關，首先我們先假設其他變數為固定的情况下

統計基本假設

在虛無假設之下的拒絕域為：P-value ＜α=0.05

檢定如下：因為 P-value=0.000157＜α=0.05 所以拒絕虛無假設，表

示我們有充分的證據顯示。因此， (外銷訂單)是一個顯著的解釋

變數和 (失業率)存在線性相關。

（6）想要判斷 (歇業家數)和 (失業率)之間是否存在線性相關，首先我们先假設其他變數為固定的情况下

統計基本假設

在虛無假設之下的拒絕域為：P-value ＜α=0.05

檢定如下：因為 P-value=7.41e-08＜α=0.05 所以拒絕虛無假設，表

示我們有充分的證據顯示。因此， (歇業家數)是一個顯著的解釋

變數和 (失業率)存在線性相關。

（7）想要判斷 (平均薪資)和 (失業率)之間是否存在線性相關，首先我們先假設其他變數為固定的情况下

統計基本假設

在虛無假設之下的拒絕域為：P-value ＜α=0.05

檢定如下：因為 P-value=0.440969＞α=0.05 所以不拒絕虛無假設，

表示我們沒有充分的證據顯示。因此， (平均薪資)不是一個顯著的解釋變數和 (失業率)不存在線性相關。

（8）想要判斷 (工業生產指數)和 (失業率)之間是否存在線性相關，首先我們先假設其他變數為固定的情况下

統計基本假設

在虛無假設之下的拒絕域為：P-value ＜α=0.05

檢定如下：因為 P-value=

=

0.426926＞α=0.05 所以拒絕虛無假設，

表示我們有充分的證據顯示。因此， (工業生產指數)不是一個顯

著的解釋變數和 (失業率)不存在線性相關。

（9）想要判斷 (所得稅)和 (失業率)之間是否存在線性相關，首先我们先假設其他變數為固定的情况下

統計基本假設

在虛無假設之下的拒絕域為：P-value ＜α=0.05

檢定如下：因為 P-value=0.030975＜α=0.05 所以不拒絕虛無假設，

表示我們沒有充分的證據顯示。因此， (所得稅)是一個顯著的解

釋變數和 (失業率)存在線性相關。

第肆章變數選取

二、向後選取法(Back Selection)：

與向前選取法相反，開始時將所有變項都選入模型內，接著第一步驟將最沒有區別能力的變項刪除，再依序將沒有區別能力的變項一一去除。

表 4.2 向後選取法結果

No (Intercept) x1 x2 x3 x4 x5 x6 x7 x8 x9 rsq adj rss Cp BIC 1 1 1 0 0 0 0 0 0 0 0 0.0901 0.0804 40.2510 167.1931 0.0651 2 1 0 1 1 0 0 0 0 0 0 0.4545 0.4427 24.1319 65.3956 -44.4841 3 1 0 1 1 0 0 1 0 0 0 0.5412 0.5263 20.2939 42.6810 -56.5483 4 1 0 1 1 1 0 1 0 0 0 0.5862 0.5680 18.3058 31.8784 -61.8820 5 1 0 1 1 1 1 1 0 0 0 0.6397 0.6196 15.9403 18.6463 -70.6007 6 1 1 1 1 1 1 1 0 0 0 0.6717 0.6496 14.5213 11.5086 -74.9870 7 1 1 1 1 1 1 1 0 0 1 0.6928 0.6683 13.5907 7.5164 -76.7805 8 1 1 1 1 1 1 1 0 1 1 0.6960 0.6680 13.4483 8.5993 -73.2275

由上表，依據選取方法

1. 從調整找出最大值為 0.6683 (模型編號 7) 2. 最接近 Cp 值得為 8.5993(模型編號 8) 3. 最小的 BIC 值為 (模型編號 7)

因此我們在模型 7 與模型 8 之間繼續挑選最佳模型，由調整和 BIC 值我們更

傾向於模型 7，且與 Cp 值之間的差值，兩組模型相差不大，所以向後選取

法的最佳模型為模型編號 7，解釋變數包括。

三、逐步替換法(All-Possible Selection)：

結合「向前選取法」與「向後選取法」而成，開始時以向前選取法選入一個預測變數；而後每當選入一個新的預測變數時，就利用向後選取法，看看在模式

中已存在的預測變數有無偏 F 值小於的變數。如果有，則偏 F 值最小的預測

變數就會被排除在模型之外，接著再進行向前選取；如果沒有，則繼續向前選取，

重複輪流使用向前、向後選取的步驟，直到沒有預測變數可以再被選進來，也沒有預測變數應該被剔除掉時即停止。

表 4.3 逐步替換法結果

No (Intercept) x1 x2 x3 x4 x5 x6 x7 x8 x9 rsq adj rss Cp BIC 1 1 1 0 0 0 0 0 0 0 0 0.0901 0.0804 40.2510 167.1931 0.0651 2 1 0 1 1 0 0 0 0 0 0 0.4545 0.4427 24.1319 65.3956 -44.4841 3 1 0 1 1 0 0 1 0 0 0 0.5412 0.5263 20.2939 42.6810 -56.5483 4 1 0 1 1 1 0 1 0 0 0 0.5862 0.5680 18.3058 31.8785 -61.8820 5 1 0 1 1 1 1 1 0 0 0 0.6397 0.6196 15.9403 18.6463 -70.6007 6 1 1 1 1 1 1 1 0 0 0 0.6717 0.6496 14.5213 11.5086 -74.9870 7 1 1 1 1 1 1 1 0 0 1 0.6928 0.6683 13.5907 7.5164 -76.7805 8 1 1 1 1 1 1 1 0 1 1 0.6960 0.6680 13.4483 8.5993 -73.2275

由上表，依據選取方法

1. 從調整找出最大值為 0.6683 (模型編號 7) 2. 最接近 Cp 值得為 8.5993(模型編號 8) 3. 最小的 BIC 值為 (模型編號 7)

因此我們在模型 7 與模型 8 之間繼續挑選最佳模型，由調整和 BIC 值我們更

傾向於模型 7，且與 Cp 值之間的差值，兩組模型相差不大，所以向後選取

法的最佳模型為模型編號 7，解釋變數包括。

四、選取變數

表 4.4 各選取法統整表選取出的變數

模型 BIC

向前選取法 -76.7805

向後選取法 -76.7805

逐次替換法 -76.7805

分析三種選取法後，選出調整找出最大值、Cp 值最接近、BIC 值最小的最佳

模型，為第七組模型，變數分別為。

第伍章選取後新複回歸模型一、複回歸模型

利用前一章三種選取法選出的變數有 (出生人數)、 (外籍勞工人數)、 (消

費者物價基本指數)、 (景氣同時指標綜合指數)、 (外銷訂單)、 (歇業家

數)、 (所得稅)，其模型為：

二、模型適合度

經整理我們得到適合度檢定表，如下

表 5.1 選取後新適合度檢定表

來源 df 平方和均方 F 值 Pr(>F) Model 7 30.64697 4.378138 28.35119 < 2.2e-16

Error 88 13.58942 0.1544252 SST 95 44.23638

假設檢定：

檢定統計量

由，我們得出拒絕虛無假設，表示解釋變數與反應變數有

線性關係。

三、模型解釋力

表 5.2 選取後新模型解釋力解釋力

標準化殘差值 0.393 調整 R 平方 0.6683 自由度 88 F 統計量 28.35119 判定係數 R 平方 0.6928 P 值 < 2.2e-16

模型的為 0.6928，而經過調整的為 0.6683，減輕因樣本估計所帶來的膨脹效果。表示解釋變數的變異可以被新模型所解釋的比例有 66.83%。下一步我們將進行殘差檢定，判斷此模型是否合理及可靠。

第陸章殘差分析

在模型的基本假設之中，殘差富含了重要的信息。利用殘差的特性來檢測模型假設的合理性及數據的可靠性。

而再建立迴歸分析前，須先檢查資料是否符合迴歸分析的基本統計假設;倘若資料沒有符合迴歸分析的基本統計假設，則會造成統計推論偏誤的發生。

迴歸分析基本假設檢定分別有：

 常態性

 均齊性

 獨立性

利用上述假設檢定來檢驗模型假設是否合理及可靠。

一、常態性

表 6.1 常態性檢定表常態性檢定 W 統計量 0.9885

P 值 0.5788

圖 6.1 Q-Q Plot

基本假設

：殘差服從常態分配AA

：殘差不服從常態分配

檢定統計量 P-Value檢定

因此不拒絕H₀，顯示資料服從常態分配

且由 Q-Q Plot 中(圖 1)中，看出殘差和常態分位數的分布，散落在 45 度的直線上。所以由此推斷殘差也具有常態性。

二、均齊性

表 6.2 均齊性檢定表均齊性檢定

卡方值 5.132734

自由值１

P 值 0.02347872

圖 6.2 殘差圖

假設

：殘差變異數有均齊性恩

：殘差變異數沒有均齊性 P-Value 檢定

所以拒絕，表示資料顯示殘差變異數並不符合均齊性

但由殘差圖(圖 6.2)中，可發現殘差均勻分布在-1.0~0.5 之間，故我們可以推論殘差具有均齊性。

三、獨立性

表 6.3 獨立性檢定表獨立性檢定

D-W 統計量 0.9926741

P 值 0

基本假設

：殘差之間互相獨立恩

：殘差之間互相不獨立

獨立性的 P-Value 等於 0 時表示獨立性假定被違反。

由於上述的均齊性及獨立性皆不符合基本統計假設，因此需重新轉換模型。

第柒章轉換模型後的殘差分析

由於殘差分析的均齊性及獨立性沒有服從假設，因此我們將模型做轉換。

我們通常對 Y 的轉換有兩種方法，一種是對 Y 取倒數另一種是對 Y 取對數 log，

而我們這兩種方法都執行，然後比較兩種的調整來選擇使用哪一種轉換，如下：

表 7.1 兩種轉換解釋力比較兩種轉換解釋力比較 Y 轉換轉換後轉換後調整

0.686 0.661 0.6902 0.6656

由上表(表 7.1)，我們可得知轉換後的及轉換後調整皆是比較大，所以

我們選用對 Y 取對數 log 來做轉換，得到我們轉換後的模型，如下：

經轉換模型後我們再檢定一次殘差分析，檢查是否符合殘差檢定。

一、常態性

表 7.2 轉換後常態性檢定表常態性檢定

W 統計量 0.9867 P 值 0.4489

圖 7.1 轉換後 Q-Q Plot 基本假設

：殘差服從常態分配─

：殘差不服從常態分配檢定統計量

P-Value檢定

因此不拒絕，顯示資料服從常態分配。

且由 Q-Q Plot 中(圖 7.1)，看出殘差和常態分位數的分布，散落在 45 度的直線上。所以由此推斷殘差也具有常態性。

二、均齊性

表 7.3 轉換後均齊性檢定均齊性檢定

卡方值 3.609447

自由值 1

P 值 0.05745221

圖 7.2 轉換後殘差圖基本假設

：殘差變異數有均齊性恩

：殘差變異數沒有均齊性 P-Value 檢定

所以不拒絕 ,表示資料顯示殘差變異數有均齊性。

且由殘差圖中(圖 7.2)，可發現殘差均勻分布在-0.2~0.1 之間，故我們可以推論殘差具有均齊性。

三、獨立性

表 7.4 轉換後獨立性檢定獨立性檢定

D-W 統計量 1.005478

P 值 0

在文檔中回歸分析：分析失業率的影響因素 (頁 11-0)

敘述統計量

標籤 樣本數 平均數 標準差 總和 最小值 最大值

失業率(%) 96 4.47708 0.68238 429.8 3.78 6.13 出生人數(千) 96 16.57316 2.29609 1591.023 10.597 23.398 外籍勞工人數(千) 96 384.732 44.96188 36934.272 327.311 489.134 消費者物價基本指數 96 98.50979 3.15064 9456.94 91.94 104.06

景氣同時指標綜合指

數(點) 96 90.51854 10.42325 8689.78 66.76 103.93

外銷訂單(千) 96 9.83729 1.35283 944.38 5.87 12.56

歇業家數(千) 96 2.84524 1.29472 273.143 1.307 7.81

平均薪資(千) 96 44.4688 9.67392 4269.005 38.138 83.392

工業生產指數 96 90.00698 11.90233 8640.67 54.21 107.42

所得稅 (百萬) 96 58927.19417 69778.29919 5657010.64 -26803.73 332543.84

檢定如下：因為 P-value=4.64e-07＜α=0.05 所以拒絕虛無假設

，表示我們有充分的證據顯示 。因此， (外籍勞工人數)

是一個顯著的解釋變數和 (失業率)存在線性相關。

檢定如下：因為 P-value=2.11e-10＜α=0.05 所以不拒絕虛無假設

，表示我們沒有充分的證據顯示 。因此， (消費者物價指

數)是一個顯著的解釋變數和 (失業率)存在線性相關。

=

標籤樣本數平均數標準差總和最小值最大值

，表示我們有充分的證據顯示。因此， (外籍勞工人數)

，表示我們沒有充分的證據顯示。因此， (消費者物價指