• 沒有找到結果。

多層次與重複測量特性

第五章 政治上無力的實證研究設計與測量

5.6 資料分析方法與模型的建立

5.6.1 多層次與重複測量特性

觀察對象資料中當某一個變數內容較不會隨觀察個體改變,而是隨著觀察個 體所屬的上層結構群組而改變因而與同群組內的其他對象相同或具有同質性時,

這樣的資料具有嵌套的特性。287 例如學生與學校之間呈現嵌套關係,學生個人 層次的變數(例如個人人口屬性資料)與學校層級的變數(例如師生比)相較,

後者是總體層次的資料,實際上只隨著上層結構變動。在這樣有嵌套關係的資料 結構之下,會需要檢視變項在不同層次、不同群集間是否呈現不同的關係,若在 研究中並未針對這種資料間具有相依特性而特別處理分析,把所有資料全部當作 各自獨立的個體來看,會有偏誤的結果,例如「圖 四-3:多層次資料總體迴歸、

分層迴歸、隨機截距與斜率的不同示意圖」顯示總體迴歸與不同群集內的迴歸,

287 詳參邱皓政(2017),《多層次模式與縱貫資料分析:Mplus 8 解析應用》,臺北市:五南

其自變數與應變數間的關係(截距與斜率)就有所不同。在本研究中由於資料採 多階段分層且群集抽樣(群集=鄉鎮市區或村里)抽樣,謝雨生指出特別適合多 層次分析。288 因此,多層次資料的分析,可以依據研究需要在建立模型時假設 不同群集間截距、斜率與變異有所不同。也因此多層次分析可以用來避免區群謬 誤(Ecological fallacy)。

288 于若蓉等,瞿海源 et al.(編)(2015),《社會及行為科學研究法:資料分析》,頁 185,臺北 市:臺灣東華書局

五-3:追蹤資料的多層次結構示意圖

圖片來自邱皓政(邱皓政,2018)

五-3:多層次關係研究問題示意圖

圖片來自邱皓政(邱皓政,2018)

五-3:多層次資料總體迴歸、分層迴歸、隨機截距與斜率的不同 示意圖

圖片來自Harrision 等人(Harrison 等人,2018)

另外如果資料具有追蹤資料(panel data)的特性,也就是多個橫斷面資料跨 越時間而合併因而具有時間特性時,由於個人層次的資料跨越時間重複測量多 次,此時也相當於個人作為一個上層結構,時間作為一個下層結構,如「圖 四-3:

追蹤資料的多層次結構示意圖」所示。本研究中由於將問卷調查資料對不同時點 的立法院表決串聯,所以資料具有時間特性。

當研究問題涉及認定上層結構會影響下層結構的變數間關係,或者是資料呈 現多層次的結構或是具有重複量測特性時,就可以(需要)使用多層次分析。此 類問題假設通常有三種型態,如「圖 四-3:多層次關係研究問題示意圖」所示,

第一 A 型態僅有是單純個體層次的自變數與應變數關係(此時還沒有上層結構 介入),第二B 型態則是給定個體層次的變數後,總體層次的自變數會與個體層 次變數各自影響個體層次的應變數,第三 C 型態則是會介入而與個體層次的自 變數產生交互反應的「跨層次交互作用」,改變原來個體層次的效果。以下先將 本研究使用的資料中的多層次結構以下「表 五-4:本研究變數多層次關係說明」

說明。

五-4:本研究變數多層次關係說明

層次 變數名稱 嵌套變數(用以指認嵌套

結構)

1 時間 表決日期與受訪日期差距日

數、立委是否回應民意

2 議題領域層次 議題領域 議題領域

2 議案層次 政黨團結程度/同政黨壓力 議案ID

3受訪者個人層次 社經地位、婚姻狀態、年齡、

性別、族群、宗教信仰、受訪 者與立委不相似程度、政策理 想點(政策理想點與全體民眾 空間中位數相似程度)、政治 參與程度

受訪者ID

4抽樣單位第三層 (村里)

5抽樣單位第二層 (鄉鎮市區)

6縣市 (縣市)

7抽樣單位第一層地理分層 (戶籍地理區域類型地理分 層)

8群體 (所屬群體)

9 立委層次 立委資深程度、民眾與立委不

相似程度

立委(姓名)

10 政黨層次 大小黨、政黨團結程度/同政

黨壓力

參與黨團名稱

11時期/立法院屆期層次 立法院屆期/問卷種類

2010綜合或2016公民)

註:作者自製,標示底線者為應變數

其中標示斜體字部分層次3-8&11 是分析政策意向相似性、政治參與(非決 策層面權力)所涵蓋的資料層次,而整個表格層次 1-11 是分析立法委員回應性

(決策層面權力)所涵蓋的資料層次。標示底線者為應變項。

有幾個變數性質需要注意。「政黨團結程度/同政黨壓力」此變項是由每個 議案層次的委員投票情形匯總計算而移動至政黨層次下分別嵌套於政黨及議案 層次下成為個別政黨的一個變項,以及「群體」是由集群分析法演算而來,這二 個在多層次模型中稱為脈絡變數(contexual variable)。289

上述變數中「政黨團結程度/同政黨壓力」以及「民眾與立委不相似程度」

均重複出現在不同層次,這會連結到「相嵌套」與「交叉嵌套」兩種不同概念。

所謂相嵌套層次nested levels 意指就第一層、第二層、第三層……依序建立下層 次屬於上層次、上層次屬於更上層次……等的層次結構,且下對上為一對一的關 係。與交叉嵌套crossed levels(交叉嵌套 cross-classification)不同處在於交叉嵌 套彼此可能平行而沒有結構上關係,或者是縱然有結構上上下層關係,也不會是 下層對單一個上層,而是一個下層可能對應多個上層結構,如「圖 四-4:nested level/crossed level 示意圖」所示。

本研究中村里、鄉鎮市區、縣市這三層明顯就不必然與其他上層結構呈現一 對一關係。群體與立委、政黨間沒有相嵌套關係。立委與政黨有相嵌套關係;時

289 邱皓政(2017),《多層次模式與縱貫資料分析:Mplus 8 解析應用》,頁 137,臺北市:五南;

邱皓政舉的例子是個人IQ 與班級整體 IQ。脈絡效果的處理比較需要注意的是低層次的自變項

與彙整後的高層次脈絡自變項的平減策略以及應用斜率結果模型(例如班級整體IQ 是否影響

到個人IQ 的效果),不過在本研究中並沒有這個問題,因為在本研究中立委回應與否是應變數

而非低層次自變數,高(群體)階層也沒有自變數而僅有低(個人)層次的「群體身份」自變 數。

期/立法院屆期層次這幾個層次中則無必然隸屬關係。另外,根據抽樣研究設計,

臺灣社會變遷基本調查的工作團隊是將全臺灣各鄉鎮市區分成若干個類型稱為 地理分層,這些地理分層直接連結到各鄉鎮市區,所以縣市層級下也有各種地理 分層類型的鄉鎮市區,彼此間沒有關係而屬於交叉嵌套(但地理分層與鄉鎮市區 則有相嵌套關係)。

在回應性資料的追蹤資料中,「政黨團結程度/同政黨壓力」以及「民眾與 立委不相似程度」都有在多個不同的層次下(政黨+議案、立委+受訪者)的交 叉 嵌 套 特 性 , 也 就 是 說 這 兩 個 自 變 項 同 時 擁 有 不 同 的 群 體 身 份 (crossed membership, multiple membership)。290

以下以圖示方式描繪本研究資料多層次關係。

290 邱皓政(2017),《多層次模式與縱貫資料分析:Mplus 8 解析應用》,頁 150,臺北市:五南

五-4:nested level/crossed level 示意圖

上圖為nested,下圖為 crossed 圖片來源:Long(Long,2016)

基於資料多層次的特性,所以需要透過多層次分析方法分析。多層次模型的 主要內容是將原本低層次(個體層次)只有一行的迴歸式中,以高層次(總體層 次)的另一個迴歸式帶入低層次的迴歸式項目(如個體層次的自變數的斜率或截 距)變數去捕捉群體層次效果(group level effect,貝氏學派用語),而過程中因 為高層次迴歸式的誤差項/變異數與共變數對於個體層次斜率或截距連帶產生 了隨機的效果,所以又可稱為隨機效果(random effect)。因此,分析結果中會包 含母體效果(population effect,貝氏學派用語,也就是頻率學派的固定效果 fixed

政黨 1 立委 1 立委 2

政黨 2 立委 3 立委 4 群體 1 群體 2 群體 3 群體 4

地理分層1 地理分層2 地理分層3 地理分層4

縣市1

鄉1 村1

鄉2 村3 受訪者1

縣市2

鎮2 里1 受訪者2

鎮3 里3

縣市3

市3 里5

市4 里7 受訪者3

縣市4

區4 里9 受訪者4

區5 里11

議案 1 議案 2 議案 3 議案 4

議題領域1 議題領域2 議題領域3 議題領域4

時點 1 時點 2 時點 3 時點 4

時期 1 時期2

五-5:本研究資料多層次關係示意圖

effect)與群體效果(隨機效果),其中固定效果是可以向外推論至母體(或觀察 資料對象的整體)解釋整體現象的部分,而群體效果則是不能向外推論至母體或 整體,而只能以其他未觀測到的變數或群體層次解釋現象的部分。

前述區別 nested/crossed 的用意,實際上的用處在於是否得以高層次的方程 式帶入低層次方程式等,區辨群體效果應該使用哪一個嵌套變數。更根本的是對 於是否有上下層關係的判斷更有直接決定性的影響。在本研究中,上圖所示為研 究者判斷的上下層關係,但實際上如議案與議題領域也可以往更上層移動,例如 移動到立委層次下方,或甚至移動到政黨層次上方也是可以的。在這種情況下,

議案與議題領域就不適合以受訪者層次的方程式帶入以建立群體效果。

並不是在所有情況下都需要使用多層次分析,因為多層次分析本來關心的是 要避免組間變異很大而組內同質性很高的以及避免區位謬誤的情形。邱皓政指出 若組數不夠多時通常不會有組間變異出現;291Maas 及 Hox 指出第二層的樣本數 如果小於等於50 時反而效果不佳。292 除此之外,是否需要多層次分析也需要與 理論與研究問題本身結合。例如邱皓政指出橫斷面資料較少使用隨機斜率;而組 間截距變異通常也與組間斜率有相同的方向,也就是說組平均截距較大者,組平 均斜率也較大,而組間斜率在極為罕見的情況下才會有組間的顯著的差異甚至是 在組間有相反的係數。由於本研究理論上有關研究旨趣所涉及的自變數多為常見 人口變項,在理論上並沒有特別組間變異的情形,關於隨機效果的選用大多是為 了控制「同質性」使結果不產生過大偏誤,再加上回應性資料量較龐大,基於運 算能量因此隨機效果除了跨層次交互反應項使用隨機斜率結果之外,隨機效果只

並不是在所有情況下都需要使用多層次分析,因為多層次分析本來關心的是 要避免組間變異很大而組內同質性很高的以及避免區位謬誤的情形。邱皓政指出 若組數不夠多時通常不會有組間變異出現;291Maas 及 Hox 指出第二層的樣本數 如果小於等於50 時反而效果不佳。292 除此之外,是否需要多層次分析也需要與 理論與研究問題本身結合。例如邱皓政指出橫斷面資料較少使用隨機斜率;而組 間截距變異通常也與組間斜率有相同的方向,也就是說組平均截距較大者,組平 均斜率也較大,而組間斜率在極為罕見的情況下才會有組間的顯著的差異甚至是 在組間有相反的係數。由於本研究理論上有關研究旨趣所涉及的自變數多為常見 人口變項,在理論上並沒有特別組間變異的情形,關於隨機效果的選用大多是為 了控制「同質性」使結果不產生過大偏誤,再加上回應性資料量較龐大,基於運 算能量因此隨機效果除了跨層次交互反應項使用隨機斜率結果之外,隨機效果只