研究模型建立

第四章研究方法

4.3 研究模型建立

在最近的研究學者中， Ingene and Yu (1981) ， Oritz Buonafina(1992)都是利用簡單線性迴歸的研究模型(方法)去分析影響零售銷售( Retail Sales)的因素。故本文建立其研究模型如下:

Y＝α０+α^１*X1+α2*X2+α^３*X3+α^４*X4+α^５*X5+α^６*X6+α^７*X7

+α^８*X 8+α^９*X9+α^１０*X10+α^１１*X11+α^１２*X12+α^１３*X13+α^１４*X14

+α^１５*X15+ε

Y=零售業銷售

X1＝政府支出/GDP X2＝外商實際投資額

X3＝平均零售業員工工資 X₄＝零售業平均員工人數

X5＝平均每千人的零售店數 X6＝平均每萬人公共汽電車 X7＝鋪裝道路面積 X₈＝國民所得

X9＝總人口數 X10＝GDP 成長率 X11＝人口密度 X12＝百貨公司銷售佔總零售額的百分比 X₁₃＝居住在市區人口 X14＝非農業人口/總人口

4.3.1 研究變數的選取

依據第二章的文獻探討，然後從《中國統計年鑑 2003》與《中國城市統計年鑑 2002》的次級資料選取適切且可獲得的變數。我們首先選取的自變數為︰城鄉居民儲蓄年末餘額、政府支出/GDP、固定資產投資總額、外商實際投資額、外商投資額/每人、外商實際投資額 /GDP、新簽外資協議合同數、平均零售業員工工資、零售業全時員工數、每家零售店平均員工人數、平均每人零售家店數、每萬人擁有公共汽電車、鋪建道路面積、國民所得、人口數、液化石油氣家庭用量、

GDP 成長率、人口密度、百貨公司銷售佔總零售額的百分比、人口成長率、居住在市區人口、非農人口/總人口等共 22 個自變數；而依變數是選擇討論主題的零售業銷售額。然而，這些自變數有可能存在共線性的問題，所以我們必須可經由統計方法以刪除存在共線性的變數；而資料的觀察值有可能有變異偏差或影響力較大的偏異值，我們同樣需做資料處理。而變數選取與資料觀察值的處理分析如下。

(1)共線性診斷

診斷變數共線性的統計方法有許多種:例如: Pearson 相關檢定、VIF 值檢查…等。若 Pearson 相關檢定中兩兩變數相關值大於

0.8，我們即認定此兩變數存在高度共線性；而在迴歸分析中出現的 VIF 值，若變數的 VIF 值大於 10，即表此變數存在共線性的問題。本研究將所有變數，進行了 Pearson 相關係數檢定。一般而言，若是兩變數間的相關係數高於 0.8，則表示兩者具有高度的共線性，必須根據文獻，將較有理論支持的變數納入模型中，而將其他高度相關的變數加以刪除（陳正昌等，2003）。

而本研究先就第一階段選取的 22 個變數做 Pearson 相關檢定，

發現“城鄉居民儲蓄年末餘額＂、“固定資產投資總額＂、“外商投資額/每人＂、“外商實際投資額/GDP＂、“新簽外資協議合同數＂、

“零售業全時員工數＂、“液化石油氣家庭用量＂、“人口成長率＂

出現高度共線性的問題(且相關值大於 0.8)，因此刪除這 8 個變數。

刪除這 8 個變數之後，再進行 Pearson 相關檢定、VIF 值檢查確認。

最後得到這 14 變數:政府支出/GDP、外商實際投資額、平均零售業員工工資、每家零售店平均員工人數、平均每千人的零售店數、每萬人擁有公共汽電車、鋪建道路面積、國民所得、人口數、GDP 成長率、

人口密度、百貨公司銷售佔總零售額的百分比、居住在市區人口、非農業人口/總人口，而這 14 個變數均不存在共線性的問題。

(2) 變數觀察值的資料處理

選取變數的觀察值為中國大陸 262 個地級以上的城市之次級資料，但這些觀察值可能存在有遺漏值或偏差值。本研究透過迴歸統計分析中將 Studentized Residual 絕對值大於 2 的具影響力的觀察值刪除，再加上資料存在一些遺漏值，最後實證研究分析的觀察值共為 213 個。變數觀察值亦滿足『常態分配』的假設。

在文檔中在轉型經濟下，影響中國大陸零售業銷售的因素之實證研究:以區域差異的觀點 (頁 56-59)

第四章 研究方法

4.3 研究模型建立

第四章研究方法