• 沒有找到結果。

第四章 研究方法

4.3 研究模型建立

在 最 近 的 研 究 學 者 中 , Ingene and Yu (1981) , Oritz Buonafina(1992)都是利用簡單線性迴歸的研究模型(方法)去分析影 響零售銷售( Retail Sales)的因素。故本文建立其研究模型如下:

Y=α*X12*X2*X3*X4*X5*X6*X7

*X 8*X910*X1011*X1112*X1213*X1314*X14

15*X15

Y=零售業銷售

X1=政府支出/GDP X2=外商實際投資額

X3=平均零售業員工工資 X4=零售業平均員工人數

X5=平均每千人的零售店數 X6=平均每萬人公共汽電車 X7=鋪裝道路面積 X 8=國民所得

X9=總人口數 X10=GDP 成長率 X11=人口密度 X12=百貨公司銷售佔總零售額的百分比 X13=居住在市區人口 X14=非農業人口/總人口

4.3.1 研究變數的選取

依據第二章的文獻探討,然後從《中國統計年鑑 2003》與《中國 城市統計年鑑 2002》的次級資料選取適切且可獲得的變數。我們首 先選取的自變數為︰城鄉居民儲蓄年末餘額、政府支出/GDP、固定資 產投資總額、外商實際投資額、外商投資額/每人、外商實際投資額 /GDP、新簽外資協議合同數、平均零售業員工工資、零售業全時員工 數、每家零售店平均員工人數、平均每人零售家店數、每萬人擁有公 共汽電車、鋪建道路面積、國民所得、人口數、液化石油氣家庭用量、

GDP 成長率、人口密度、百貨公司銷售佔總零售額的百分比、人口成 長率、居住在市區人口、非農人口/總人口等共 22 個自變數;而依變 數是選擇討論主題的零售業銷售額。然而,這些自變數有可能存在共 線性的問題,所以我們必須可經由統計方法以刪除存在共線性的變 數;而資料的觀察值有可能有變異偏差或影響力較大的偏異值,我們 同樣需做資料處理。而變數選取與資料觀察值的處理分析如下。

(1)共線性診斷

診斷變數共線性的統計方法有許多種:例如: Pearson 相關檢 定、VIF 值檢查…等。若 Pearson 相關檢定中兩兩變數相關值大於

0.8,我們即認定此兩變數存在高度共線性;而在迴歸分析中出現的 VIF 值,若變數的 VIF 值大於 10,即表此變數存在共線性的問題。本 研究將所有變數,進行了 Pearson 相關係數檢定。一般而言,若是兩 變數間的相關係數高於 0.8,則表示兩者具有高度的共線性,必須根 據文獻,將較有理論支持的變數納入模型中,而將其他高度相關的變 數加以刪除(陳正昌等,2003)。

而本研究先就第一階段選取的 22 個變數做 Pearson 相關檢定,

發現“城鄉居民儲蓄年末餘額"、“固定資產投資總額"、“外商投 資額/每人"、“外商實際投資額/GDP"、“新簽外資協議合同數"、

“零售業全時員工數"、“液化石油氣家庭用量" 、“人口成長率"

出現高度共線性的問題(且相關值大於 0.8),因此刪除這 8 個變數。

刪除這 8 個變數之後,再進行 Pearson 相關檢定、VIF 值檢查確認。

最後得到這 14 變數:政府支出/GDP、外商實際投資額、平均零售業員 工工資、每家零售店平均員工人數、平均每千人的零售店數、每萬人 擁有公共汽電車、鋪建道路面積、國民所得、人口數、GDP 成長率、

人口密度、百貨公司銷售佔總零售額的百分比、居住在市區人口、非 農業人口/總人口,而這 14 個變數均不存在共線性的問題。

(2) 變數觀察值的資料處理

選取變數的觀察值為中國大陸 262 個地級以上的城市之次級資 料,但這些觀察值可能存在有遺漏值或偏差值。本研究透過迴歸統計 分析中將 Studentized Residual 絕對值大於 2 的具影響力的觀察值 刪除,再加上資料存在一些遺漏值,最後實證研究分析的觀察值共為 213 個。變數觀察值亦滿足『常態分配』的假設。