模式校估及檢定

第四章實證分析

4.2 模式校估及檢定

在此節中進行本研究模式的校估與檢定工作，首先進行初步校估，接著根據初步校估的結果，進行模式的檢定與修正，其中過程包括t-test與VIF的共線性檢定，並依據檢定之結果繼續進行模式的修正與再校估，最後會針對修正過的模式進行殘差之常態分配檢定，再利用最後步驟的成果對模式進行最後的修正。

4.2.1模式初步校估

根據先前的樣本資料，利用二階段最小平方法進行初步的校估工作，並加入虛擬變數一同進行模式的校估；虛擬變數的使用可用以表現出地區發展的差異特性，在此進一步詳列虛擬變數設定為1之鄉鎮市，如表4.13：

表4.13 虛擬變數為1之鄉鎮市 1_i

D =1(有觀光風景區) D =1(有工商業中心) 2_i 南投縣埔里鎮、竹山鎮、集集鎮、名間

鄉、鹿谷鄉、魚池鄉、仁愛鄉

南投市、埔里鎮、草屯鎮、竹山鎮、名間鄉、水里鄉

屏東縣

潮州鎮、東港鎮、恆春鎮、萬巒鄉、萬丹鄉、車城鄉、滿州鄉、

三地門鄉、霧臺鄉、瑪家鄉、獅子鄉、牡丹鄉

屏東市、潮州鎮、東港鎮、恆春鎮、萬丹鄉、長治鄉、麟洛鄉、

九如鄉、里港鄉、鹽埔鄉、高樹鄉、萬巒鄉、內埔鄉、竹田鄉、

新埤鄉、枋寮鄉

其中對於觀光風景區之選擇準則為根據觀光局於民國95年所發布之《觀光年報》，選取年報中所列舉之國家級、縣市級、國家公園、公營、民營、森林遊樂區、海水浴場以及古蹟寺廟等觀光遊憩區係該區所擁有或是設立者；對工商業中心之選取準則為根據行政院於民國95年發布之《工商及服務業普查》資料中佔該縣市前二分之一之鄉鎮市。

利用所蒐集的樣本資料，接著開始進行第一次的模式校估動作：

1. 居住人口

在本研究中的模式第一式為居住人口項目的迴歸式，校估結果如表4.14：

表4.14 居住人口第一次校估結果

自變數係數 P值 t值 VIF 共線性 t-1期居住人口比例 0.957 0.000 84.549*** 18.775 有 t-1期交通可及性指標 0.185 0.174 1.433 2.667 無 t期二級產業人口比例 0.007 0.120 1.567 7.869 些許 t期三級產業人口比例 0.033 0.000 5.229*** 8.329 些許 t-1期住宅面積 0.000309 0.927 0.178 3.536 無 t-1期公共設施面積 -0.004 0.862 -0.239 2.540 無虛擬變數D 1_i 0.000270 0.271 0.909 1.188 無虛擬變數D 2_i -0.000174 0.652 -0.449 2.054 無常數項 -0.000259 0.394 -0.863 ─ ─

R² 0.999701

adjusted R² 0.999634

F 19057.289***

***：在顯著水準為0.005 時 (雙尾)，係數顯著。**：在顯著水準為0.01時(雙尾)，係數顯著。

根據邱皓政(2004)所述，R²反應了自變數與因變數所形成線性迴歸模式的契合度，而以R²來評估整體模式的解釋力，並進而推論到母群體時，樣本數愈小愈容易高估，解釋力膨脹效果愈明顯，因此當樣本愈小時，宜採用adjusted R²，如此即可減輕膨脹效果。

由表4.14的校估結果可以看到adjusted R²為0.999634，相當接近1，因此此迴歸式的配適極佳；在F檢定的部份的顯著機率比顯著水準0.05小，故此迴歸式對於預測有幫助；進一步看到各項自變數的t值，可以發現只有t-1期居住人口和t期三級產業及業人口的變數顯著性超過0.005的水準，其餘變數之顯著性皆不高。

接著看到各項自變數對應的係數，為負者有t-1期公共設施面積以及虛擬變數D ，其餘皆為正值，表示其餘自變數對於居住人口有正向影響，在虛擬變數2_i 上，代表工商業發展較高的D 為負，說明相較於無工商業中心的鄉鎮市而言，2_i 有工商業中心者之居住人口發展較呈緩和的趨勢；而D 的係數為正，則代表有1_i 觀光風景區之鄉鎮市的居住人口發展比無觀光風景區者來得積極。

接著觀察到共線性的部份，因自變數不只一個，若自變數間的相關程度愈高，不但變數間的區隔模糊難以解釋外，在數學上會因為自變數間共變過高，造成自變數與因變數共變分析上的扭曲現象，稱之多元共線性，而這在迴歸分析上是應該避免的，因此對於共線性的評估在此採變異數膨脹因素VIF(varance inflation factor)來檢驗，VIF愈大表示共線關係愈強烈，通常VIF超過10之自變數即無法接受與其它自變數不相關之假設，在第一式模式中的t-1期居住人口的共線性高，t期二級產業、三級產業及業人口比例則有些許共線性存在，其餘自變數VIF值皆不高。

2. 二級產業及業人口

在本研究中的模式第二式為二級產業及業人口項目的迴歸式，校估結果如表 4.15所示：

表4.15 二級產業及業人口第一次校估結果

自變數係數 P值 t值 VIF 共線性 t-1期二級產業人口比例 0.940 0.000 18.329*** 15.649 有 t-1期交通可及性指標 -0.346 0.749 -0.306 2.992 無 t期居住人口比例 -0.011 0.923 -0.117 20.495 有 t-1期三級產業人口比例 0.007019 0.978 -0.132 8.627 些許 t-1期工業面積 0.294 0.208 1.307 7.075 些許

表4.15 二級產業及業人口第一次校估結果(續)

自變數係數 P值 t值 VIF 共線性虛擬變數D 1_i -0.002014 0.417 -0.822 1.192 無虛擬變數D 2_i 0.002335 0.395 0.864 1.472 無常數項 0.001383 0.549 0.597 ─ ─

R² 0.987417

adjusted R² 0.985036

F 819.755***

***：在顯著水準為0.005 時 (雙尾)，係數顯著。**：在顯著水準為0.01時(雙尾)，係數顯著。

由表4.15的校估結果可以看到adjusted R²為0.985036，相當接近1，因此此迴歸式的配適極佳；在F檢定的部份的顯著機率比顯著水準0.005小，故此迴歸式對於預測有幫助；進一步看到各項自變數的t值，可以發現只有前期二級產業及業人口的變數顯著性超過0.005的水準，其餘變數之顯著性皆不高。

接著看到各項自變數對應的係數，為負者有t-1期交通可及性指標、t期居住人口比例以及虛擬變數D ，其餘皆為正值，表示其餘自變數對於二級產業及業1_i 人口有正向影響，在虛擬變數上，代表有觀光風景區的D 為負，說明相較於無1_i 觀光風景區的鄉鎮市而言，有觀光風景區者之二級產業及業人口發展較呈緩和的趨勢；而D 的係數為正，則代表有工商業中心之鄉鎮市的二級產業及業人口發2_i 展比無工商業中心者來得積極。

接著觀察到共線性的部份，在第二式模式中的t-1期二級產業及業人口比例、t期居住人口比例的共線性高，t-1期三級產業及業人口比例與t-1期工業面積有些許的共線性，其餘自變數VIF值皆不高。

3. 三級產業及業人口

在本研究中的模式第三式為三級產業及業人口項目的迴歸式，校估結果如表 4.16所示：

表4.16 三級產業及業人口第一次校估結果

自變數係數 P值 t值 VIF 共線性 t-1期三級產業人口比例 0.944 0.000 18.665*** 36.498 有 t-1期交通可及性指標 2.448 0.002 3.681*** 2.851 無 t期居住人口比例 -0.075 0.508 -1.216 23.100 有 t-1期二級產業人口比例 0.080 0.973 3.683*** 7.753 些許

表4.16 三級產業及業人口第一次校估結果(續)

自變數係數 P值 t值 VIF 共線性虛擬變數D 1_i 0.001860 0.581 1.278 1.155 無虛擬變數D 2_i -0.001388 0.660 -0.826 1.563 無常數項 -0.001039 0.569 -0.739 ─ ─

R² 0.997189

adjusted R² 0.996658

F 1964.541***

***：在顯著水準為0.005 時 (雙尾)，係數顯著。**：在顯著水準為0.01時(雙尾)，係數顯著。

由表4.16的校估結果可以看到adjusted R²為0.996658，相當接近1，因此此迴歸式的配適極佳；在F檢定的部份的顯著機率比顯著水準0.005小，故此迴歸式對於預測有幫助；進一步看到各項自變數的t值，可以發現有t-1期三級產業及業人口、t-1期交通可及性指標與t-1期二級產業及業人口比例的變數顯著性超過0.005 的水準，其餘變數之顯著性皆不高。

接著看到各項自變數對應的係數，為負者有t期居住人口比例以及虛擬變數 2_i

D ，其餘皆為正值，表示其餘自變數對於三級產業及業人口有正向影響，在虛 擬變數上，代表工商業發展較高的D 為負，說明相較於無工商業中心的鄉鎮市2_i 而言，有工商業中心者之三級產業及業人口發展較呈緩和的趨勢；而D 的係數1_i 為正，則代表有觀光風景區之鄉鎮市的三級產業及業人口發展比無觀光風景區者來得積極。

接著觀察到共線性的部份，在第三式模式中的t-1期三級產業及業人口比例、t期居住人口比例的共線性高，t-1期二級產業及業人口比例與t-1期商業面積有些許的共線性，其餘自變數VIF值皆不高。

4. 模式初步檢討

經整理前述的檢定結果，本研究有以下的發現：

(1).模式解釋能力

在本研究建構的模式當中，觀察adjusted R²以及F檢定，皆顯示出本研究使用的模式其解釋與預測能力是值得信賴的。

(2).變數顯著性

本研究設定的地區不同發展背景之虛擬變數在模式中的顯著性皆不高；

而根據先驗關係建立的模式所討論的三個因變數─居住人口、二級產業及業人口與三級產業及業人口，最受本身前期的自變數所影響，與其相比之下，

其它的自變數影響因子的顯著性較低，這可能是因為自變數間存在共線性或是各因變數本身前期的解釋能力過強所導致，須再進一步對模式進行修正。

(3).自變數共線性

在本研究的模式中，居住人口、二級產業及業人口與三級產業及業人口此三式中，因變數本身前期的自變數都和其餘自變數有共線性的關係存在，

此外，當期居住人口也在第二及第三式中皆與其它自變數有共線性存在；另外，共線性也說明了自變數的線性組合關係，例如：影響三級產業及業人口的自變數中，前期的二級產業及業人口與其它自變數間有些許共線性的關係，表示二級產業對三級產業之影響可由其他變數的線性組合來反映，同樣地，在二級產業及業人口亦有相同的情形發生。

4.2.2模式第一次修正

這階段開始對前述的統計檢定結果進行模式的修正，修正的方向首先考慮將顯著性低的自變數刪除，但這樣的結果會使得各個因變數僅受本身的前期自變數所影響，不過在本研究中的主要目的就是想討論在地區發展項目中，各個因素對人口及產業發展的影響，因此這樣的修正方向並不符合本研究所需；第二個修正方向則是將共線性高的變數刪除，即刪除VIF超過10者，在模式中根據共線性檢定的結果，共線性高的自變數其發展趨勢可由其它影響變數共同表現之，故將共線性高的變數刪除的方向可以採用。

根據討論的結果，最後本研究採取將各項因變數其自身前期之自變數刪除來改善本研究使用之模式；經修正後的聯立方程模式如式(10)至(12)：

, 11

(

, -1

)

2

, 31

3

, 41 , -1 51 , -1

1 2

i t i t i t i t i t i t i i

P = a i A + a E i + a E i + a RA i + a PA i + D + D

(10)

, 12 , -1 22 , -1 32 , -1

2

_{i t}

(

_{i t}

) 3

_{i t} _{i t}

1

2 E = a i A + a E i + a IA i + D + D

(11)

, 13 , -1 23 , -1 33 , -1

3

_{i t}

(

_{i t}

) 2

_{i t} _{i t}

1

2 E = a i A + a E i + a BA i + D + D

(12) 接著開始進行第一次的修正模式校估動作：

1. 居住人口

在文檔中第三章研究設計 (頁 65-78)

第四章 實證分析

4.2 模式校估及檢定

(

)

2

3

1 2

P = a i A + a E i + a E i + a RA i + a PA i + D + D

2

(

) 3

1

2

E = a i A + a E i + a IA i + D + D

3

(

) 2

1

2

E = a i A + a E i + a BA i + D + D

第四章實證分析