第四章 實證分析
4.2 模式校估及檢定
在此節中進行本研究模式的校估與檢定工作,首先進行初步校估,接著根據 初步校估的結果,進行模式的檢定與修正,其中過程包括t-test與VIF的共線性檢 定,並依據檢定之結果繼續進行模式的修正與再校估,最後會針對修正過的模式 進行殘差之常態分配檢定,再利用最後步驟的成果對模式進行最後的修正。
4.2.1模式初步校估
根據先前的樣本資料,利用二階段最小平方法進行初步的校估工作,並加入 虛擬變數一同進行模式的校估;虛擬變數的使用可用以表現出地區發展的差異特 性,在此進一步詳列虛擬變數設定為1之鄉鎮市,如表4.13:
表4.13 虛擬變數為1之鄉鎮市 1i
D =1(有觀光風景區) D =1(有工商業中心) 2i 南投縣 埔里鎮、竹山鎮、集集鎮、名間
鄉、鹿谷鄉、魚池鄉、仁愛鄉
南投市、埔里鎮、草屯鎮、竹山 鎮、名間鄉、水里鄉
屏東縣
潮州鎮、東港鎮、恆春鎮、萬巒 鄉、萬丹鄉、車城鄉、滿州鄉、
三地門鄉、霧臺鄉、瑪家鄉、獅 子鄉、牡丹鄉
屏東市、潮州鎮、東港鎮、恆春 鎮、萬丹鄉、長治鄉、麟洛鄉、
九如鄉、里港鄉、鹽埔鄉、高樹 鄉、萬巒鄉、內埔鄉、竹田鄉、
新埤鄉、枋寮鄉
其中對於觀光風景區之選擇準則為根據觀光局於民國95年所發布之《觀光年 報》,選取年報中所列舉之國家級、縣市級、國家公園、公營、民營、森林遊樂 區、海水浴場以及古蹟寺廟等觀光遊憩區係該區所擁有或是設立者;對工商業中 心之選取準則為根據行政院於民國95年發布之《工商及服務業普查》資料中佔該 縣市前二分之一之鄉鎮市。
利用所蒐集的樣本資料,接著開始進行第一次的模式校估動作:
1. 居住人口
在本研究中的模式第一式為居住人口項目的迴歸式,校估結果如表4.14:
表4.14 居住人口第一次校估結果
自變數 係數 P值 t值 VIF 共線性 t-1期居住人口比例 0.957 0.000 84.549*** 18.775 有 t-1期交通可及性指標 0.185 0.174 1.433 2.667 無 t期二級產業人口比例 0.007 0.120 1.567 7.869 些許 t期三級產業人口比例 0.033 0.000 5.229*** 8.329 些許 t-1期住宅面積 0.000309 0.927 0.178 3.536 無 t-1期公共設施面積 -0.004 0.862 -0.239 2.540 無 虛擬變數D 1i 0.000270 0.271 0.909 1.188 無 虛擬變數D 2i -0.000174 0.652 -0.449 2.054 無 常數項 -0.000259 0.394 -0.863 ─ ─
R2 0.999701
adjusted R2 0.999634
F 19057.289***
***:在顯著水準為0.005 時 (雙尾),係數顯著。**:在顯著水準為0.01時(雙尾),係數顯著。
根據邱皓政(2004)所述,R2反應了自變數與因變數所形成線性迴歸模式的契 合度,而以R2來評估整體模式的解釋力,並進而推論到母群體時,樣本數愈小愈 容易高估,解釋力膨脹效果愈明顯,因此當樣本愈小時,宜採用adjusted R2,如 此即可減輕膨脹效果。
由表4.14的校估結果可以看到adjusted R2為0.999634,相當接近1,因此此迴 歸式的配適極佳;在F檢定的部份的顯著機率比顯著水準0.05小,故此迴歸式對 於預測有幫助;進一步看到各項自變數的t值,可以發現只有t-1期居住人口和t期 三級產業及業人口的變數顯著性超過0.005的水準,其餘變數之顯著性皆不高。
接著看到各項自變數對應的係數,為負者有t-1期公共設施面積以及虛擬變 數D ,其餘皆為正值,表示其餘自變數對於居住人口有正向影響,在虛擬變數2i 上,代表工商業發展較高的D 為負,說明相較於無工商業中心的鄉鎮市而言,2i 有工商業中心者之居住人口發展較呈緩和的趨勢;而D 的係數為正,則代表有1i 觀光風景區之鄉鎮市的居住人口發展比無觀光風景區者來得積極。
接著觀察到共線性的部份,因自變數不只一個,若自變數間的相關程度愈 高,不但變數間的區隔模糊難以解釋外,在數學上會因為自變數間共變過高,造 成自變數與因變數共變分析上的扭曲現象,稱之多元共線性,而這在迴歸分析上 是應該避免的,因此對於共線性的評估在此採變異數膨脹因素VIF(varance inflation factor)來檢驗,VIF愈大表示共線關係愈強烈,通常VIF超過10之自變數 即無法接受與其它自變數不相關之假設,在第一式模式中的t-1期居住人口的共 線性高,t期二級產業、三級產業及業人口比例則有些許共線性存在,其餘自變 數VIF值皆不高。
2. 二級產業及業人口
在本研究中的模式第二式為二級產業及業人口項目的迴歸式,校估結果如表 4.15所示:
表4.15 二級產業及業人口第一次校估結果
自變數 係數 P值 t值 VIF 共線性 t-1期二級產業人口比例 0.940 0.000 18.329*** 15.649 有 t-1期交通可及性指標 -0.346 0.749 -0.306 2.992 無 t期居住人口比例 -0.011 0.923 -0.117 20.495 有 t-1期三級產業人口比例 0.007019 0.978 -0.132 8.627 些許 t-1期工業面積 0.294 0.208 1.307 7.075 些許
表4.15 二級產業及業人口第一次校估結果(續)
自變數 係數 P值 t值 VIF 共線性 虛擬變數D 1i -0.002014 0.417 -0.822 1.192 無 虛擬變數D 2i 0.002335 0.395 0.864 1.472 無 常數項 0.001383 0.549 0.597 ─ ─
R2 0.987417
adjusted R2 0.985036
F 819.755***
***:在顯著水準為0.005 時 (雙尾),係數顯著。**:在顯著水準為0.01時(雙尾),係數顯著。
由表4.15的校估結果可以看到adjusted R2為0.985036,相當接近1,因此此迴 歸式的配適極佳;在F檢定的部份的顯著機率比顯著水準0.005小,故此迴歸式對 於預測有幫助;進一步看到各項自變數的t值,可以發現只有前期二級產業及業 人口的變數顯著性超過0.005的水準,其餘變數之顯著性皆不高。
接著看到各項自變數對應的係數,為負者有t-1期交通可及性指標、t期居住 人口比例以及虛擬變數D ,其餘皆為正值,表示其餘自變數對於二級產業及業1i 人口有正向影響,在虛擬變數上,代表有觀光風景區的D 為負,說明相較於無1i 觀光風景區的鄉鎮市而言,有觀光風景區者之二級產業及業人口發展較呈緩和的 趨勢;而D 的係數為正,則代表有工商業中心之鄉鎮市的二級產業及業人口發2i 展比無工商業中心者來得積極。
接著觀察到共線性的部份,在第二式模式中的t-1期二級產業及業人口比 例、t期居住人口比例的共線性高,t-1期三級產業及業人口比例與t-1期工業面積 有些許的共線性,其餘自變數VIF值皆不高。
3. 三級產業及業人口
在本研究中的模式第三式為三級產業及業人口項目的迴歸式,校估結果如表 4.16所示:
表4.16 三級產業及業人口第一次校估結果
自變數 係數 P值 t值 VIF 共線性 t-1期三級產業人口比例 0.944 0.000 18.665*** 36.498 有 t-1期交通可及性指標 2.448 0.002 3.681*** 2.851 無 t期居住人口比例 -0.075 0.508 -1.216 23.100 有 t-1期二級產業人口比例 0.080 0.973 3.683*** 7.753 些許
表4.16 三級產業及業人口第一次校估結果(續)
自變數 係數 P值 t值 VIF 共線性 虛擬變數D 1i 0.001860 0.581 1.278 1.155 無 虛擬變數D 2i -0.001388 0.660 -0.826 1.563 無 常數項 -0.001039 0.569 -0.739 ─ ─
R2 0.997189
adjusted R2 0.996658
F 1964.541***
***:在顯著水準為0.005 時 (雙尾),係數顯著。**:在顯著水準為0.01時(雙尾),係數顯著。
由表4.16的校估結果可以看到adjusted R2為0.996658,相當接近1,因此此迴 歸式的配適極佳;在F檢定的部份的顯著機率比顯著水準0.005小,故此迴歸式對 於預測有幫助;進一步看到各項自變數的t值,可以發現有t-1期三級產業及業人 口、t-1期交通可及性指標與t-1期二級產業及業人口比例的變數顯著性超過0.005 的水準,其餘變數之顯著性皆不高。
接著看到各項自變數對應的係數,為負者有t期居住人口比例以及虛擬變數 2i
D ,其餘皆為正值,表示其餘自變數對於三級產業及業人口有正向影響,在虛 擬變數上,代表工商業發展較高的D 為負,說明相較於無工商業中心的鄉鎮市2i 而言,有工商業中心者之三級產業及業人口發展較呈緩和的趨勢;而D 的係數1i 為正,則代表有觀光風景區之鄉鎮市的三級產業及業人口發展比無觀光風景區者 來得積極。
接著觀察到共線性的部份,在第三式模式中的t-1期三級產業及業人口比 例、t期居住人口比例的共線性高,t-1期二級產業及業人口比例與t-1期商業面積 有些許的共線性,其餘自變數VIF值皆不高。
4. 模式初步檢討
經整理前述的檢定結果,本研究有以下的發現:
(1).模式解釋能力
在本研究建構的模式當中,觀察adjusted R2以及F檢定,皆顯示出本研究 使用的模式其解釋與預測能力是值得信賴的。
(2).變數顯著性
本研究設定的地區不同發展背景之虛擬變數在模式中的顯著性皆不高;
而根據先驗關係建立的模式所討論的三個因變數─居住人口、二級產業及業 人口與三級產業及業人口,最受本身前期的自變數所影響,與其相比之下,
其它的自變數影響因子的顯著性較低,這可能是因為自變數間存在共線性或 是各因變數本身前期的解釋能力過強所導致,須再進一步對模式進行修正。
(3).自變數共線性
在本研究的模式中,居住人口、二級產業及業人口與三級產業及業人口 此三式中,因變數本身前期的自變數都和其餘自變數有共線性的關係存在,
此外,當期居住人口也在第二及第三式中皆與其它自變數有共線性存在;另 外,共線性也說明了自變數的線性組合關係,例如:影響三級產業及業人口 的自變數中,前期的二級產業及業人口與其它自變數間有些許共線性的關 係,表示二級產業對三級產業之影響可由其他變數的線性組合來反映,同樣 地,在二級產業及業人口亦有相同的情形發生。
4.2.2模式第一次修正
這階段開始對前述的統計檢定結果進行模式的修正,修正的方向首先考慮將 顯著性低的自變數刪除,但這樣的結果會使得各個因變數僅受本身的前期自變數 所影響,不過在本研究中的主要目的就是想討論在地區發展項目中,各個因素對 人口及產業發展的影響,因此這樣的修正方向並不符合本研究所需;第二個修正 方向則是將共線性高的變數刪除,即刪除VIF超過10者,在模式中根據共線性檢 定的結果,共線性高的自變數其發展趨勢可由其它影響變數共同表現之,故將共 線性高的變數刪除的方向可以採用。
根據討論的結果,最後本研究採取將各項因變數其自身前期之自變數刪除來 改善本研究使用之模式;經修正後的聯立方程模式如式(10)至(12):
2
, 11
(
, -1)
212
, 313
, 41 , -1 51 , -11 2
i t i t i t i t i t i t i i
P = a i A + a E i + a E i + a RA i + a PA i + D + D
(10)2
, 12 , -1 22 , -1 32 , -1
2
i t(
i t) 3
i t i t1
i2
iE = a i A + a E i + a IA i + D + D
(11)2
, 13 , -1 23 , -1 33 , -1
3
i t(
i t) 2
i t i t1
i2
iE = a i A + a E i + a BA i + D + D
(12) 接著開始進行第一次的修正模式校估動作:1. 居住人口