• 沒有找到結果。

第四章 研究問題與模型

第三節 研究方法、資料收集

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

的人事任免與職務調動的策略。

第三節 研究方法、資料收集

在上一節提出本文的兩個研究問題,以及相關的假設之後,在這一節我們進 一步說明整個研究預計要使用的研究方法、資料收集。以下,首先針對本文所要 採用的研究方法,進行說明與討論。

一、研究方法

首先,就研究方法而言,配合本文所要回答的兩個研究問題,我們必須同時 採用量化,並且輔以相關文獻資料的分析,進而掌握台灣在政治自由化、民主化 進程中,有權力者與高階行政官員之間的互動。此外,在這些質化資料的基礎下,

我們才有空間進一步採取量化的研究方法,分析高階人事的任免,是否受到政治 時機、部會特質(技術、職權)等,制度性或者是組織性因素的影響。所以,在研 究 方 法 上 , 本 文 所 採 取 的 是 , 量 化 配 合 質 化 文 獻 分 析 的 整 合 性 研 究 方 法 (triangulation of methods)。52

至於在量化的研究方法方面,除了會透過描述性統計,呈現出總統對於行政 院各部會高階行政菁英控制的總體情況,並且進一步進行控制模式的比較之外。

為了回答本文所提出的問題二,我們預計採用縱橫資料分析(panel data analysis)53, 進行以部會為單位的季度別分析。以下,簡要的說明縱橫資料分析,並且介紹相 關變數的建構。

(一)縱橫資料分析

傳統的迴歸分析模型,主要的特色是靜態的(static),使用的資料多為橫斷面 的(cross-sectional)資料,用以分析如性別、出生地、種族等,不會隨時間變動而 改變的變數。而這種分析的特質傾向於變數之間的共變(covariate)分析,但並非 是因果(causal)的分析。(薛承泰,1993)

於是,當我們要以部會為單位,探究台灣在政治自由化、民主化至一次政黨 輪替,以及二次政黨輪替期間。被用以作為緩解,總統與高階行政官員之間,持 續存在的代理人難題的高階政、事務官員的人事任命、調動,將會受到哪些制度

52 關於整合性研究方法,請參考 Tashakkori and Teddlie(1998:40-48)。

53 本 文 所 要 採 用 的 縱 橫 資 料 分 析 , 也 有 人 稱 為 是 合 併 橫 斷 面 時 間 序 列 資 料 分 析 (time-series-cross-sectional analysis)。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

性(總統處境的差異、任期階段的不同、不同層級選舉、權力轉移、立法院競爭、

監察院監督)、組織性(核心 / 非核心部會、部會技術性差異)因素影響。

也因為這些制度性、組織性的影響因素,並非是靜態的,是會有可能在橫斷 面﹙不同的部會之間﹚呈現出差異性,且也是會隨著時序的改變,而有所改變的 資料型態。所以,我們需要一個能夠同時考慮到時序,又能夠兼顧橫斷面,有別 於傳統靜態迴歸模型的統計模型。而這一種能夠同時考量到時序,又能夠兼顧橫 斷面的資料型態分析,不外就是縱橫資料分析(Frees, 2004:1-2)。

不過,在進行縱橫資料分析的相關說明之前,我們首先就以式子(1.1)及(1.2),

呈現多元線性迴歸模型(multiple linear regression model)的基礎型態。就如同式子 (1.1)或者是(1.2)所呈現的,這兩個式子的差異在於,式子(1.2)所意味的是由樣本 所進行的分析,反之式子(1.1)所代表的就是指母體。就以式子(1.1)作為例子,進 行相關的說明,在這個式子當中 y 所代表的是,依變數(dependent variable)或者 是 被 解 釋 變 數 (explained variable) 。 而 在 該 式 子 當 中 , 於 等 號 另 一 邊 的

1 2 3... k

x   x xx

,則是自變數(independent variable),或者也被稱之為解釋變數 (explanatory variables)。

1 1 2 2 3 3

...

k k

yx   x   x   x   

……… (1.1)

1 1 2 2 3 3

...

i i i i i k k i

yx   x   x   x   

……… (1.2)

至於

則是這個式子當中的隨機干擾(random disturbance),之所以這樣子被 命名,是因為

會去干擾到除此之外的穩定關係(otherwise stable relationship)。而 在多元線性迴歸式當中,之所以會有

此一隨機干擾的產生,是有著相當多的因 素。其中最為重要的原因是,不論我們是如何的細膩,皆沒有辦法掌握,每一個 會對於 y 有所影響的因素。

此外,相關變數測量的誤差,也是造成干擾的重要原因。對於這些未能夠被 掌握,而被忽略的影響因素(omitted factors),不論是有著正向的,或者是負向的 影響,就都被歸在

此一干擾項。而在這一個多元線性迴歸方程式當中,被解釋 變項 y 的數值,則是來自於解釋變項(x1x2x3...xk),以及

此一干擾項等,

兩個部分加總而成。然而,必須強調的是,以上所提到的多元線性迴歸分析模式,

就是一個基礎的線性多元迴歸,並沒有將時間與個體差異都加以考慮。

那麼,在這樣一個多元線性迴歸模型的變數關係基礎之下,依變數和自變數 之間所存有,未知或然關係的參數(parameters of the stochastic relation),是有著不

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

同的估計方法,可以進行模型參數的估算。54在各種參數的估計方法當中,如果 我們不考慮到要分析的資料,所可能具有的時間性差別,以及觀察個體之間的差 異。那麼,在多元線性迴歸基礎模式當中,最常被使用的估計方式,不外是簡單 最小平方法(ordinary least squares),或者也稱之為是線性最小平方法(linear least squares),簡稱為 OLS 估計方法。以下,就以式子(2)呈現,以 OLS 方法作為估 計方法的多元線性迴歸模型。

0

n n n

Y    X   u

……… (2)

在這個以簡單最小平方法,作為估計方法的迴歸式當中,Yn所代表的是整個 迴歸式的依變項,Xn則是該模型的解釋變數矩陣,至於un則是迴歸分析當中的 殘差項。必須要被強調的是,被納入迴歸式當中的觀察值,皆是以一個獨立的樣 本進行分析。而在這樣一個迴歸模型當中,基本上不考慮到時間因素,同時也忽 略了樣本當中的個體差異。因此,不論所要分析的樣本,包含了多少個組別,其 各自跨越了多少個時間點。在這樣的迴歸模型當中,所有的樣本均可說是受到一 視同仁的待遇,樣本之間並不被認為有時間、組別的差異性。55

所以,很明顯的如果我們所要分析的資料,有著不同的組別,且又涵蓋了多 個時間點,具有隨時間的差異而改變的特質,那麼式子(2)所呈現的以線性最小 平方法,為估計方法的多元線性迴歸模型,基本上並不合適。因為這樣的迴歸模 式,頂多只能用來分析資料當中,自變數與依變數之間,在忽略了時間因素、個 體異質性之後,兩者之間所存在的共變關係。同時這種分析模式,也沒有能夠處 理,隨著時間差所造成的影響。

在這樣的模式之下,即便我們採取虛擬(dummy)變數的方式,將特定的時間 點,和其他時間點進行差異的比較,但這樣的處理方式,依然不能被視為是時間 差的影響。而只能視為,特定時間點,和非特定時間點之間,依變數的差異比較。

因此,當我們所要分析的資料型態,必須同時考慮到自變數和依變數之間,以及 自變數和自變數之間,是會隨時間的改變而有所變動,同時又存有時間差的影響 時,縱橫資料分析就是一個適切的分析模型。

因為縱橫資料分析模型,是可以同時考慮到資料的空間(space),以及時間特 點(Frees, 2004:1-2; Greene, 2003:283-284; Hsiao, 2003:1; Yafee, 2003:1-2)。而且 Hsiao(1986)也指出:縱橫資料的分析方法,相較於一般的時間序列、橫斷面資料,

可以提供更多資料,而且降低估計的偏誤,並且減少模型估計的共線問題。以下,

54 關於線性多元迴歸模型的相關說明,是參考且引用自 Greene, William H. 2003. Econometric analysis 5th ed, Upper Saddle River, N.J. : Prentice Hall., pp. 7~18(Chapter 2).

55 式子(2)以及這一段關於傳統迴歸模式的說明,主要參考引用自徐永明、林昌平(2009)。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

分別以式子(3)、式子(4),以及式子(5)分別呈現,縱橫資料模型的基本迴歸式、

固定效果模型(fixed effects model),以及隨機效果模型(random effects model)等,

同時考慮時間差異的影響,以及橫斷面共變關係的縱橫資料分析模型。56

' '

it it i it

yx   z   

………(3)

如式子(3)所呈現的迴歸模型,是整個縱橫資料分析模式的基本架構。在此 一 迴 歸 式 當 中 , yit 是 該 迴 歸 模 型 當 中 的 依 變 數 , 而 且 所 指 的 是 y 於 第 i (i1, 2, 3,...,N )個單位,在

t

(t= 1,2,3,...,T)時間點,所呈現的數值。至於

xit則 是該模型當中的(

k

1)解釋變數的向量,不過這個解釋變數的向量,並不包含常 數項,而

則是(

k  1

)係數向量。

在這個縱橫資料的基本模型當中,除了被解釋變數 y ,以及作為解釋變數的

x

之外,zi所指的是包含常數項,以及一組被觀察(如性別、種族等)或者是未被 觀察(如家族的特殊性格、個人的偏好或技巧的異質性等)的個別變數,或是群體 變數的向量,而則是相對應的係數。還必須強調的是,zi所包含的常數項、個 別變數、群體變數等,是被設定為不會隨時間變動的。

至於 '

zi 所意指的,是整個方程式所存在的異質性(heterogeneity),亦或者 是個別效果(individual effect)。最後,如方程式所呈現的it,所意指的就是該模 型的殘差項(隨機干擾)。而如果我們將方程式(3),和先前所提到的方程式(2)、(1.1) 比較。其實不難發現到,方程式(3)與前兩者的關鍵差異在於,對於時間,以及 個體異質性的重視。那麼,在縱橫資料這樣的迴歸模式結構當中,又該採取什麼 樣的估計方式,以下分別介紹。

同樣如式子(3)所呈現的,假設式子當中代表常數項,以及一組被觀察或者 是未被觀察的個別變數,或是群體變數的zi,唯一只有包含一個常數項。那麼我 們這時候就可以發現的是,因為在沒有出現異質性的情況下,那麼其實只要採用 傳統的最小平方法進行估計,就可以提供有效的估計值,以及斜率係數

。而 這種不需要考慮到異質性的方法,亦即是把所有的資料加以合併(pooling),即是 所謂的合併的迴歸(pooled regression)。

不過,如果當zi並非是唯一只有包含一個常數項時,假如zi是未被觀察到的,

但卻和xit有相關性。那麼,這個時候如果我們依然是使用最小平方法進行估計 的話,其估計出來的值,將會是有偏差,且是不一致的(inconsistent)。於是在

56 式子(3)、式子(4)、式子(5),以及關於縱橫資料模型的固定效果模型、隨機效果模型等,模型 的公式與相關說明,均參考以及引用自 Greene, William H. 2003. Econometric analysis 5th ed, Upper Saddle River, N.J. : Prentice Hall.,pp. 283~338(Chapter 13).

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

這樣的情況下,就可以採用縱橫資料分析的固定效果模型。該模型又被稱為最小 平方虛擬變數模型(least square dummy variable model, LSDV),亦被稱之為是共變 異數模型(Covariance Model),以下就以式子(4)呈現。

'

it it i it

yx     

………(4)

在縱橫資料的固定效果模型當中iz'i ,其包含了所有可以被觀察到的影 響(observable effects),被視為是群體的特定常數項(group-specific constant term),

且值得注意的是,這個常數項並不會隨時間而有所改變。換句話說,在固定效果 模型當中,i可以說是非隨時間而改變,但卻會因為觀察個體的不同而有所改變 的因素。此外,每一群個體有著同樣的斜率,但截距卻是不同的。而固定效果模

且值得注意的是,這個常數項並不會隨時間而有所改變。換句話說,在固定效果 模型當中,i可以說是非隨時間而改變,但卻會因為觀察個體的不同而有所改變 的因素。此外,每一群個體有著同樣的斜率,但截距卻是不同的。而固定效果模