第五章 政治上無力的實證研究設計與測量
5.6 資料分析方法與模型的建立
5.6.2 政策理想點的單變量、多變量群體間比較方法
分析政策理想點(與空間中位數相似程度)在群體間是否有差異時,因為應
291 邱皓政(2017),《多層次模式與縱貫資料分析:Mplus 8 解析應用》,頁 104,臺北市:五南
292 Cora J. M. Maas&Joop J. Hox, Sufficient Sample Sizes for Multilevel Modeling, 1 METHODOLOGY 86(2005)
變數為一連續變項或多連續變項,組間比較時常使用t 檢定、變異數分析(應變 項為單變量)或是多變量變異數分析(應變項為多變量),但由於本研究需要區 辨觀察對象的同質性,捕捉多層次的群體效果,同時先前檢測得出政策理想點並 不呈現多變量常態分布,因此本研究除如前5.5.3 所述應變數轉換外此處並使用 多層次迴歸模型進行組間比較,此處使用的是隨機截距模型。應變項政策理想點 與空間中位數相似程度以餘弦相似度變數帶入為一連續變數。表述完整模型迴歸 方程式如下(類別資料均設為虛擬變項):
Lv1(受訪者):
與空間中位數的政策理想點相似程度yij=β0j+βjX+[受訪者個體組內變異εij]
其中i 表示第一層次觀察對象編號(個人),j 則是上一層次編號,β0j 也就 是層1 總截距(各受訪者總平均截距),ij 表示為嵌套資料。X 為自變數矩陣(設 計矩陣,design matrix),包含變數為時期、社經地位、年齡、性別、族群、宗教 信仰、群體、戶籍地地理層別。
Lv2:β0j=層 2 總平均截距γ00+[村里間變異] 293 Lv3:γ00=層 3 總平均截距δ000+[鄉鎮市區間變異]
Lv4:δ000=層 4 總平均截距ζ0000+[縣市間變異]
Mix(綜合帶入 Lv1):
與空間中位數的政策理想點相似程度yij=層4 總平均截距ζ0000+βjX+[村里間變異]+
[鄉鎮市區間變異]+[縣市間變異]+[受訪者個體組內變異εij] 294
受訪者層次總平均截距由於Lv2、Lv3 截距方程式的帶入,所以可以觀察到 有隨機的截距結果。另外由於研究關心群體身份本身的效果,所以直接把群體身 份作為 Lv1 自變項,而不是把 Lv1 其他可能的變數(例如社經地位)連結 Lv2
293 此時 Lv2 的β0j 這個式子稱為截距方程式;此處依據邱皓政的建議並沒有刻劃各交叉嵌套層 間共變異,邱皓政(2017),《多層次模式與縱貫資料分析:Mplus 8 解析應用》,頁 151,臺北 市:五南;由於交叉嵌套特性,而分層抽樣設計中鄉鎮市區彼此間的同質性較大,縣市內可能 包含許多不同種類的的鄉鎮市區而同質性較低,所以此處將縣市與村里放在同一層。
294 捕捉群體間隨機效果時,lmertest 套件會出現 “Model is nearly unidentifiable: large eigenvalue ratio” 的警告訊息,不捕捉群體間隨機效果時則沒有錯誤訊息;捕捉地理分層間隨機效果時,
lmertest 套件會出現 “unable to evaluate scaled gradient; Model failed to converge: degenerate Hessian with 1 negative eigenvalues; Model failed to converge with 1 negative eigenvalue” 等錯誤 訊息,不捕捉時則無錯誤訊息。可能原因是群體以及地理分層組數都較少,因此群體與地理分 層不放入方程式中捕捉截距間變異。同時透過零模型捕捉不同的層別隨機效果並且比較模型 AIC 後,決定以縣市、鄉鎮市區、村里三層建立模型。
群體層次解釋(以致於變成如斜率結果模型)。這一個混合方程式僅用在下述 robustlmm 套件所建立的模型。其他模型基於軟體功能限制則是以僅以鄉鎮市區 作為第二層對照,混合方程式中僅存[鄉鎮市區間變異]以及[受訪者個體組內變異 εij]。
雖然與空間中位數的政策理想點相似程度並非呈現常態分配的情形,但由於 大樣本特性以及資料分配的特性上離常態分配並沒有很遠,所以此處使用穩健統 計方法。由於軟體支援的功能限制,分別使用R 語言的 robustlmm 套件 rlmer 函 數(不支援權重調整但支援穩健標準誤,可配合其他套件支援多重填補合併)295 與R 語言 lmerTest 的 lmer 函數296 估計自由度後合併計算 p 值,以及 R 語言的 svylme 套件 svy2lme 函數 297建立多層次模型(支援權重調整以及群集穩健標準 誤,但只能分析兩層,沒有回報自由度,無法多重填補合併隨機效果)。298
另外基於上述軟體功能上的限制以及資料的不呈常態分布的特性,另外再以 無母數的迴歸模型處理,使用R 語言的 jrfit 套件分析。299 無母數分析通常是以 等級(Rank)為主要統計量而非平均數與變異數,無母數方法也不預設資料的分 配型態(例如常態分配),jrfit 套件可以將有群集關連特性的資料特性特別處理。
jrfit 以及 svylme 套件功能只有提供第二層,所以此處使用村里當作群集。三個軟 體及模型的分析結果可以彼此對照參考。
以下圖表示本模型要驗證的概念與概念之間的關係。
295 Manuel Koller, robustlmm: an R Package for Robust Estimation of Linear Mixed-Effects Models, 75 JOURNAL OF STATISTICAL SOFTWARE 1(2016)
296 Alexandra Kuznetsova、Per B Brockhoff&Rune HB Christensen, lmerTest Package: Tests in Linear Mixed Effects Models, 82 JOURNAL OF STATISTICAL SOFTWARE 1(2017)
297 Thomas Lumley, tslumley/svylme: Linear Mixed Models for Complex Survey Data version 1.1 from GitHub, available at https://rdrr.io/github/tslumley/svylme/ (last visited: Jul 09, 2020)
298 後者則未支援隨機效果的多重填補合併。
299 John Kloke, kloke/jrfit: Joint Ranking Estimates, available at https://rdrr.io/github/kloke/jrfit/ (last visited: Jul 13, 2020)
政策理想點
(與空間中位數差距)
人口特性(人口變項)