第四章 研究問題與模型
第三節 研究方法、資料收集
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
的人事任免與職務調動的策略。
第三節 研究方法、資料收集
在上一節提出本文的兩個研究問題,以及相關的假設之後,在這一節我們進 一步說明整個研究預計要使用的研究方法、資料收集。以下,首先針對本文所要 採用的研究方法,進行說明與討論。
一、研究方法
首先,就研究方法而言,配合本文所要回答的兩個研究問題,我們必須同時 採用量化,並且輔以相關文獻資料的分析,進而掌握台灣在政治自由化、民主化 進程中,有權力者與高階行政官員之間的互動。此外,在這些質化資料的基礎下,
我們才有空間進一步採取量化的研究方法,分析高階人事的任免,是否受到政治 時機、部會特質(技術、職權)等,制度性或者是組織性因素的影響。所以,在研 究 方 法 上 , 本 文 所 採 取 的 是 , 量 化 配 合 質 化 文 獻 分 析 的 整 合 性 研 究 方 法 (triangulation of methods)。52
至於在量化的研究方法方面,除了會透過描述性統計,呈現出總統對於行政 院各部會高階行政菁英控制的總體情況,並且進一步進行控制模式的比較之外。
為了回答本文所提出的問題二,我們預計採用縱橫資料分析(panel data analysis)53, 進行以部會為單位的季度別分析。以下,簡要的說明縱橫資料分析,並且介紹相 關變數的建構。
(一)縱橫資料分析
傳統的迴歸分析模型,主要的特色是靜態的(static),使用的資料多為橫斷面 的(cross-sectional)資料,用以分析如性別、出生地、種族等,不會隨時間變動而 改變的變數。而這種分析的特質傾向於變數之間的共變(covariate)分析,但並非 是因果(causal)的分析。(薛承泰,1993)
於是,當我們要以部會為單位,探究台灣在政治自由化、民主化至一次政黨 輪替,以及二次政黨輪替期間。被用以作為緩解,總統與高階行政官員之間,持 續存在的代理人難題的高階政、事務官員的人事任命、調動,將會受到哪些制度
52 關於整合性研究方法,請參考 Tashakkori and Teddlie(1998:40-48)。
53 本 文 所 要 採 用 的 縱 橫 資 料 分 析 , 也 有 人 稱 為 是 合 併 橫 斷 面 時 間 序 列 資 料 分 析 (time-series-cross-sectional analysis)。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
性(總統處境的差異、任期階段的不同、不同層級選舉、權力轉移、立法院競爭、
監察院監督)、組織性(核心 / 非核心部會、部會技術性差異)因素影響。
也因為這些制度性、組織性的影響因素,並非是靜態的,是會有可能在橫斷 面﹙不同的部會之間﹚呈現出差異性,且也是會隨著時序的改變,而有所改變的 資料型態。所以,我們需要一個能夠同時考慮到時序,又能夠兼顧橫斷面,有別 於傳統靜態迴歸模型的統計模型。而這一種能夠同時考量到時序,又能夠兼顧橫 斷面的資料型態分析,不外就是縱橫資料分析(Frees, 2004:1-2)。
不過,在進行縱橫資料分析的相關說明之前,我們首先就以式子(1.1)及(1.2),
呈現多元線性迴歸模型(multiple linear regression model)的基礎型態。就如同式子 (1.1)或者是(1.2)所呈現的,這兩個式子的差異在於,式子(1.2)所意味的是由樣本 所進行的分析,反之式子(1.1)所代表的就是指母體。就以式子(1.1)作為例子,進 行相關的說明,在這個式子當中 y 所代表的是,依變數(dependent variable)或者 是 被 解 釋 變 數 (explained variable) 。 而 在 該 式 子 當 中 , 於 等 號 另 一 邊 的
1 2 3... k
x x x x
,則是自變數(independent variable),或者也被稱之為解釋變數 (explanatory variables)。1 1 2 2 3 3
...
k ky x x x x
……… (1.1)1 1 2 2 3 3
...
i i i i i k k i
y x x x x
……… (1.2)至於
則是這個式子當中的隨機干擾(random disturbance),之所以這樣子被 命名,是因為
會去干擾到除此之外的穩定關係(otherwise stable relationship)。而 在多元線性迴歸式當中,之所以會有
此一隨機干擾的產生,是有著相當多的因 素。其中最為重要的原因是,不論我們是如何的細膩,皆沒有辦法掌握,每一個 會對於 y 有所影響的因素。此外,相關變數測量的誤差,也是造成干擾的重要原因。對於這些未能夠被 掌握,而被忽略的影響因素(omitted factors),不論是有著正向的,或者是負向的 影響,就都被歸在
此一干擾項。而在這一個多元線性迴歸方程式當中,被解釋 變項 y 的數值,則是來自於解釋變項(x1x2x3...xk),以及
此一干擾項等,兩個部分加總而成。然而,必須強調的是,以上所提到的多元線性迴歸分析模式,
就是一個基礎的線性多元迴歸,並沒有將時間與個體差異都加以考慮。
那麼,在這樣一個多元線性迴歸模型的變數關係基礎之下,依變數和自變數 之間所存有,未知或然關係的參數(parameters of the stochastic relation),是有著不
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
同的估計方法,可以進行模型參數的估算。54在各種參數的估計方法當中,如果 我們不考慮到要分析的資料,所可能具有的時間性差別,以及觀察個體之間的差 異。那麼,在多元線性迴歸基礎模式當中,最常被使用的估計方式,不外是簡單 最小平方法(ordinary least squares),或者也稱之為是線性最小平方法(linear least squares),簡稱為 OLS 估計方法。以下,就以式子(2)呈現,以 OLS 方法作為估 計方法的多元線性迴歸模型。
0
n n n
Y X u
……… (2)在這個以簡單最小平方法,作為估計方法的迴歸式當中,Yn所代表的是整個 迴歸式的依變項,Xn則是該模型的解釋變數矩陣,至於un則是迴歸分析當中的 殘差項。必須要被強調的是,被納入迴歸式當中的觀察值,皆是以一個獨立的樣 本進行分析。而在這樣一個迴歸模型當中,基本上不考慮到時間因素,同時也忽 略了樣本當中的個體差異。因此,不論所要分析的樣本,包含了多少個組別,其 各自跨越了多少個時間點。在這樣的迴歸模型當中,所有的樣本均可說是受到一 視同仁的待遇,樣本之間並不被認為有時間、組別的差異性。55
所以,很明顯的如果我們所要分析的資料,有著不同的組別,且又涵蓋了多 個時間點,具有隨時間的差異而改變的特質,那麼式子(2)所呈現的以線性最小 平方法,為估計方法的多元線性迴歸模型,基本上並不合適。因為這樣的迴歸模 式,頂多只能用來分析資料當中,自變數與依變數之間,在忽略了時間因素、個 體異質性之後,兩者之間所存在的共變關係。同時這種分析模式,也沒有能夠處 理,隨著時間差所造成的影響。
在這樣的模式之下,即便我們採取虛擬(dummy)變數的方式,將特定的時間 點,和其他時間點進行差異的比較,但這樣的處理方式,依然不能被視為是時間 差的影響。而只能視為,特定時間點,和非特定時間點之間,依變數的差異比較。
因此,當我們所要分析的資料型態,必須同時考慮到自變數和依變數之間,以及 自變數和自變數之間,是會隨時間的改變而有所變動,同時又存有時間差的影響 時,縱橫資料分析就是一個適切的分析模型。
因為縱橫資料分析模型,是可以同時考慮到資料的空間(space),以及時間特 點(Frees, 2004:1-2; Greene, 2003:283-284; Hsiao, 2003:1; Yafee, 2003:1-2)。而且 Hsiao(1986)也指出:縱橫資料的分析方法,相較於一般的時間序列、橫斷面資料,
可以提供更多資料,而且降低估計的偏誤,並且減少模型估計的共線問題。以下,
54 關於線性多元迴歸模型的相關說明,是參考且引用自 Greene, William H. 2003. Econometric analysis 5th ed, Upper Saddle River, N.J. : Prentice Hall., pp. 7~18(Chapter 2).
55 式子(2)以及這一段關於傳統迴歸模式的說明,主要參考引用自徐永明、林昌平(2009)。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
分別以式子(3)、式子(4),以及式子(5)分別呈現,縱橫資料模型的基本迴歸式、
固定效果模型(fixed effects model),以及隨機效果模型(random effects model)等,
同時考慮時間差異的影響,以及橫斷面共變關係的縱橫資料分析模型。56
' '
it it i it
y x z
………(3)如式子(3)所呈現的迴歸模型,是整個縱橫資料分析模式的基本架構。在此 一 迴 歸 式 當 中 , yit 是 該 迴 歸 模 型 當 中 的 依 變 數 , 而 且 所 指 的 是 y 於 第 i (i1, 2, 3,...,N )個單位,在
t
(t= 1,2,3,...,T)時間點,所呈現的數值。至於xit則 是該模型當中的(
k
1)解釋變數的向量,不過這個解釋變數的向量,並不包含常 數項,而
則是(k 1
)係數向量。在這個縱橫資料的基本模型當中,除了被解釋變數 y ,以及作為解釋變數的
x
之外,zi所指的是包含常數項,以及一組被觀察(如性別、種族等)或者是未被 觀察(如家族的特殊性格、個人的偏好或技巧的異質性等)的個別變數,或是群體 變數的向量,而則是相對應的係數。還必須強調的是,zi所包含的常數項、個 別變數、群體變數等,是被設定為不會隨時間變動的。至於 '
zi 所意指的,是整個方程式所存在的異質性(heterogeneity),亦或者 是個別效果(individual effect)。最後,如方程式所呈現的it,所意指的就是該模 型的殘差項(隨機干擾)。而如果我們將方程式(3),和先前所提到的方程式(2)、(1.1) 比較。其實不難發現到,方程式(3)與前兩者的關鍵差異在於,對於時間,以及 個體異質性的重視。那麼,在縱橫資料這樣的迴歸模式結構當中,又該採取什麼 樣的估計方式,以下分別介紹。
同樣如式子(3)所呈現的,假設式子當中代表常數項,以及一組被觀察或者 是未被觀察的個別變數,或是群體變數的zi,唯一只有包含一個常數項。那麼我 們這時候就可以發現的是,因為在沒有出現異質性的情況下,那麼其實只要採用 傳統的最小平方法進行估計,就可以提供有效的估計值,以及斜率係數
。而 這種不需要考慮到異質性的方法,亦即是把所有的資料加以合併(pooling),即是 所謂的合併的迴歸(pooled regression)。不過,如果當zi並非是唯一只有包含一個常數項時,假如zi是未被觀察到的,
但卻和xit有相關性。那麼,這個時候如果我們依然是使用最小平方法進行估計 的話,其估計出來的值,將會是有偏差,且是不一致的(inconsistent)。於是在
56 式子(3)、式子(4)、式子(5),以及關於縱橫資料模型的固定效果模型、隨機效果模型等,模型 的公式與相關說明,均參考以及引用自 Greene, William H. 2003. Econometric analysis 5th ed, Upper Saddle River, N.J. : Prentice Hall.,pp. 283~338(Chapter 13).
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
這樣的情況下,就可以採用縱橫資料分析的固定效果模型。該模型又被稱為最小 平方虛擬變數模型(least square dummy variable model, LSDV),亦被稱之為是共變 異數模型(Covariance Model),以下就以式子(4)呈現。
'
it it i it
y x
………(4)在縱橫資料的固定效果模型當中i z'i ,其包含了所有可以被觀察到的影 響(observable effects),被視為是群體的特定常數項(group-specific constant term),
且值得注意的是,這個常數項並不會隨時間而有所改變。換句話說,在固定效果 模型當中,i可以說是非隨時間而改變,但卻會因為觀察個體的不同而有所改變 的因素。此外,每一群個體有著同樣的斜率,但截距卻是不同的。而固定效果模
且值得注意的是,這個常數項並不會隨時間而有所改變。換句話說,在固定效果 模型當中,i可以說是非隨時間而改變,但卻會因為觀察個體的不同而有所改變 的因素。此外,每一群個體有著同樣的斜率,但截距卻是不同的。而固定效果模