第三章 研究方法
第三節 迴歸模型與檢定
對不同 22 個地方政府在 8 個不同年度時間上的財政資料研究,採用各固定樣本 單位在某一時點上多項特性,以及在每隔一段時間的連續觀察,結合橫斷面與時間 序列的資料型態,瞭解這些資料在不同時間點上呈現的個體差異與整體差異變化 (張紹勳,2016a)。若只採用時間序列分析,可能發生序列相關;僅以橫斷面資料分 析,又容易產生異質變異(張紹勳,2016b);綜合以上的這種追蹤資料(Panel Data ) 在財務與計量經濟學上的估計應用,對於財務與經濟變數間關係可以同時分析時間 序列上財政數據動態的規律性,又能保有各個地方政府個體資料的差異性,訊息較 完整,並以檢定方式選定最適的追蹤資料分析迴歸模型。透過迴歸模型分析找出對 被解釋變數真正相關及重要的解釋變數,建立二者間的因果關係,希望能對未來反 應結果提供預測。
為了對追蹤資料做迴歸模型實證分析,一般而言,流程可分三個步驟:首先,
以單根檢定來檢視追蹤資料是否屬於定態;再對解釋變數及被解釋變數做相關檢定 判別採用何種較適合的迴歸模型;最後,以適當的迴歸模型對變數推估進行統計實 證(張紹勳,2016a)。本節探討追蹤資料 3 種不同迴歸模型及將採用變數檢定的 3 種 不同單根檢定、3 種模型檢定方法。
一、追蹤資料迴歸模型
變數指標值屬追蹤資料,其迴歸模型的關係式表示為:
GAP = ( ) 即 = + ∑ +
其中 k = 不同的財政努力變數指標或財政能力變數指標。
i = 22 個不同地方政府,即個體構面。
t = 2011 年至 2018 年不同年度,即時間構面。
代表截距項。
代表第 i 個地方政府第 t 年的第 k 個指標的迴歸係數。
代表第 i 個地方政府第 t 年的第 k 個指標的解釋變數。
代表第 i 個地方政府第 t 年的隨機殘差項。
傳統迴歸模型中的一般最小平方法(Ordinary Least Squares Method, 簡稱 OLS ) 只考慮了單獨橫斷面或縱斷面的資料,而產生可能忽略不同個體間時序上資料 的差異性;在追蹤資料迴歸模型主要分為混合 OLS 迴歸模型、固定效果模型、
隨機效果模型等三種方式探討(Wooldridge, 2002)。其中混合 OLS 模型是最簡單 的線性迴歸,可以有效忽略異質性;固定效果或隨機效果的模型則是用於估計 均值偏差的迴歸模型,藉由變數檢測結果來擇定一個合適的迴歸模型。以下對 三種迴歸模型探討:
(一)混合 OLS 迴歸模型:
= α + ∑ +
混合線性迴歸模型是採用考量不同時間下的最小平方法估計參數 ,估計 值會使各個不同觀察值的殘差 值的總合最小,假設為殘差項包含時間上 及個體間差異、殘差變異數具同質性,所有模型參數被視為非隨機變數,
適用所有係數是固定值,所有樣本截距項都相同 = 。 (二)固定效果模型:
= + ∑ +
固定效應模型(又稱個體虛擬變數模型)著重個體間差異性,其參數為固定 值或非隨機量,它是一種分層線性模型,不同分層的組均值是固定非隨機 的,適用於斜率係數是固定值,個體特性不隨時間不同而改變,但截距項 和殘差項是個體所獨有的,會因個體不同而不同。假設母體內相似性低,
故不採抽樣方式而是直接以母體全部觀察所有個體間差異;且假設殘差為 特定個體效果與解釋變數相關,每一個個體截距項為特定常數 = 。
(三)隨機效果模型:
= + ∑ + +
隨機效果模型(又稱誤差成分模型)強調母體整體性,所有或部分模型參數 是隨機變量,其不同分層的組均值是來自總體的隨機樣本,適用於斜率係 數是固定值,截距項為隨機變數,會隨時間和個體變動而有所不同。隨機 效果是固定效果的特例,它分析個體是從不同總體的層次中抽取,這些總 體的差異與該層次結構有關,有助於控制未觀察到的變異性。假設迴歸誤 差與解釋變數不相關,截距項為隨機變數,包含個體間誤差及個體內誤差
= + + 。
二、變數檢定
檢定資料在時間序列上是否恆定,先進行單根檢定;再對解釋變數及被解釋變 數做相關檢定,包含 F 檢定、拉氏乘數檢定、Hausman 檢定,判別採用何種追蹤資 料迴歸模型最為合適。
(一)單根檢定:對於有個體性及時間序列性之追蹤資料,需先檢視各變數的相 關數值等是否與時間序列相互獨立而為定態,這對於具時間序列性質資料 而言是很重要的檢定。即是指當受單一事件衝擊時資料僅有短期波動,隨 著時間增加而逐漸回復收斂至長期均衡,資料的統計特性不會跟隨時間而 改變,長期趨勢為一個線性函數。根據以往文獻研究,一般與財政、金融 相關追蹤資料多屬於非定態,易出現殘差項自我相關的虛假迴歸現象,而 產生因果關係實證結果虛假,導致推論錯誤。因為傳統最小平方法之迴歸 模型在估計變數與變數間的相關性時,是以定態為假設前提,然而,追蹤 資料是否定態,需先進行單根檢定,檢視模型是否平穩;如果檢定結果為 非定態,需先將資料差分後,再做迴歸。
即檢定時間序列: =
+ + +
其中 :當期變數, :前期變數, :截距項, :時間趨勢項,
:自我迴歸係數, :殘差項。
虛無假設 :當 = 1 時,有單根存在,時間序列非定態。
對立假設 :當 1 時,單根不存在,時間序列為定態。
對追蹤資料採單根檢定方式以消除殘差自我相關及異質變異的問題。為提 高檢定力並使結果較為精確,採以下三種檢定方式:
1、ADF 檢定(Augmentde Dickey-Fuller Test, 1984) 優點為解決殘差序列自我相關的限制。
2、PP 檢定(Phillips-Perron Test, 1988)
優點為解決殘差自我相關及異質性的限制。
3、IPS 檢定(Im-Pesaran-Shin Test, 2003)
優點為適合追蹤資料並解決各組自我迴歸係數相同的限制。
(二)F 檢定:為檢定不同個體間所有未可觀測之解釋變數效果是否相同,即檢視 每個觀察個體的截距項是否相同,以判別觀察個體是否具追蹤資料的特性。
其假設為:
: = = … = ,個體效果相同。
:所有的 不完全相等,個體效果存在異質性。
檢定結果若無法拒絕 ,表示個體效果相同,採用混合 OLS 迴歸模型;
若拒絕 ,表示個體效果存在異質性,則採固定效果模型。一般而言,較 小的橫斷面與長的時間序列資料,適合混合 OLS 模型;大的橫斷面與短的 時間序列資料,較適用於追蹤資料模型。
(三)拉式乘數檢定:為檢定自我相關條件異質變異性,由 Breusch and Pagan(1980) 提出,之後經由 Baltagi and Li (1990)修正成為適用於追蹤資料模型的拉式 乘數 (lagrange multiplier)檢定來檢測個體間的殘差項是否符合穩定性,即截 距項是否有差異,以判別模型設定的適應性(即無 panel effect)。其假設為:
: = = … = ,個體不具異質性。
:所有的 不完全相等,個體效果存在異質性。
拉式乘數檢定結果若無法拒絕 ,表示橫斷面資料不具異質性,殘差項符 合穩定性,採用混合 OLS 迴歸模型;若拒絕 ,表示個體間存在異質性,
則採隨機效果模型。
(三)Hausman 檢定:為檢定模型變數為隨機或固定,由 Hausman(1978)提出的檢 測是否個別效果顯著不同,基於截距項 與解釋變數 X 間可能產生相關性,
造成迴歸模型存在內生性問題,以判斷是採用隨機效果模型或固定效果模 型。其假設為:
:E( , ) = 0,個體效果與解釋變數不具相關性。
:E( , ) 0,個體效果與解釋變數具相關性。
Hausman 檢定結果若無法拒絕 ,表示截距項與釋解變數不具相關性,採 隨機效果模型;若拒絕 ,表截距項與釋解變數具相關性,個體效果與模 型內其他變數有相關性而違反隨機效果模型假設,則採用固定效果模型。
研究探討之研究檢定及相關模型關係之流程圖如下:
圖 3-2 追蹤資料研究檢定流程圖 追蹤資料
非定態 定態
拉式乘數 檢定
個體不具 異質性 個體具
異質性
混合 OLS 迴歸模型
Hausman 檢定
截距項與釋解變數 不具相關性
截距項與釋解變數 具相關性
隨機效果模型 固定效果模型
F 檢定
截距項 不全相同 截距項
相同
單根檢定
混合 OLS 迴歸模型 差分