第四章 研究設計
第一節 研究方法說明
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
30
第四章 研究設計
在進行實證研究前,本章將先說明本研究之設計。第一節闡明使用追 蹤資料的原因,並比較固定效果模型和隨機效果模型之異同及取捨方法;
5再著,第二節建立本研究之實證模型,並說明實證資料來源;第三節則為 本研究實證模型之實證變數假設。
第一節 研究方法說明
如前所述,本研究的目的在於瞭解醫療保健支出對失業率是否存在影 響效果?若失業率的確會受到各縣市醫療保健支出占歲出比率之影響,又 此具有影響力的變數對不同性別、不同年齡層、不同教育程度等之失業率 影響是否相同?
本研究針對台灣 2000 年至 2010 年,23 個縣市的追蹤資料,利用固 定效果模型加以分析,共分為 A、B 兩組,A 組解釋變數與被解釋變數 同 一 期 ( 期 間 為 2000 年 至 2009 年 ) , 而 B 組 為 了 避 免 內 生 性
(endogeneity)的計量問題以及可能產生的延遲效果(lag effect),解釋 變數(期間為 2000 年至 2009 年)皆為被解釋變數(期間為 2001 年至 2010 年)前一期的數據。
所謂追蹤資料是指針對某一特定調查對象組群,持續鎖定一段時間所 得到 的資 料。 由於 是時 間序 列資 料( time-series data) 和橫 斷面 資料
(cross-section data)的合併使用,因此不但擁有時間序列的動態性質,尚 能兼顧橫斷面資料,表達不同樣本間特性的優點。因此,追蹤資料包含更 多的資訊,不但有助於提高樣本數與自由度,使估計結果較為準確;而實 證模型的採用也將更具有更多的選擇。因此,若欲分析某觀察群體長期性 的決定因素,使用追蹤資料較能得出正確且嚴謹的結果,而這正符合本研 究的要求。
5 本文研究方法主要參閱 Greene(2003)及黃台心(2005)。
‧
果(individual effect)解釋,視每個截距項為待估計未知常數,故也稱為共 變異數模型(Covariance Model)。固定效果模型的迴歸式可表示為:Y
it=φ
i+
生變數(exogenous variables)。Yit 為應變數,Xit 為對應之自變數向量,β
k 為斜率項變數;φi 為截距項變數,即個別效果。可將第(4.1.2)式改寫成:Yi =Xiβ+Jφi
+ε
i(4.1.3)
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
32
令 Yi 與 Xi
分別為 T×1 和 T×(K-1) 向量和矩陣,是第 i 觀察單位的應
變數與自變數樣本觀察值,εi 為對應之隨機干擾項向量,JT=(1‥1‥1)′
為 T × 1 向量,其中每個元素皆為一。式中:
Yi = Xi= ε
i= (4.1.4)
將全部 N×T 樣本堆疊貣來成為
= β + εi = (4.1.5)
或
Y= [d
1 d2〃〃〃dN 〃〃〃X] + ε (4.1.6) 式中 di 對應 i 單位的虛擬變數行向量,即第 (4.1.5) 式等號右邊第一 個矩陣的第 i 行,令D=[d1 d2 dN] 代表 NT×N 矩 陣 ,並 進 一 步將 第 (4.1.6) 式簡化為:Y = Xβ + Dφ + ε (4.1.7) 此 模 型 通 常 被 稱 作 最 小 帄 方 虛 擬 變 數 模 型 ( least squares dummy variable model),簡稱 LSDV 模型。LSDV 模型屬於古典迴歸模型。若 觀察單位數 N 不大,第(4.1.7)式直接可以最小帄方法估計;相對的,如果 觀察 單位成千上萬,應設法先消除固定效果,則可容易估計出係數向量 β ,進而再估計固定效果參數。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
33
二、隨機效果模型
隨機效果模型又稱為誤差成分模型(error component model)。之前由 於對模型的認知不足,懷疑有遺漏變數,因此在模型中加入虛擬變數而成 為固定效果模型。但當同樣從干擾項著手,卻假設未觀察到的個體效果和 時間效果與其他自變數無關時,不同觀察單位擁有不同的特定隨機變數,
此即為隨機效果模型。其迴歸式可表示為:
Y
it=β1+1 K
k K
X
kit+ u
i+εit (4.1.8) 等號右邊第一項 β1 為截距項;μi 是隨機變數,屬第 i 觀察單位特 有,不隨時間而改變,且此迴歸式中的誤差項共有兩個,包含整體誤差與 個體效果之無法觀察到的隨機誤差。與固定效果模型相似的是,μi 以及 εit
分別代表了個體效果和時間效
果。至於其相異處,則隨機效果模型假設 μi 和 εit為隨機變數,可視為 N
個個體和 T 個期間是由一龐大母體所抽出的隨機樣本。本研究選取之觀察群體為台灣地區 23 縣市,並非隨機抽樣數個縣市 做為代表資料,因此,將採用較適當的固定效果模型進行分析,以估計醫 療保健支出對台灣各縣市失業率的影響。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
34