統計模型與方法 - 研究設計與方法 - 兩岸經濟整合與簽署ECFA對台灣民眾統獨立場的影響：2008至2012定群追蹤樣本的實證分析

第三章研究設計與方法

第四節統計模型與方法

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

第四節統計模型與方法

相較於橫斷面資料，縱貫時序的定群追蹤資料不僅能夠從「個體」選民層次掌握政治態度的持續與變化，更重要的是，透過統計控制可以觀察同一個人在不同時間點態度變化對於依變數的影響效果（組內效果），也可以看到不同選民之間態度差異對於依變數的影響效果（組間效果）。但是，適用縱貫時序資料的統計模型很多也各有千秋，以下先針對本文使用的統計模型進行說明，接著將討論延伸到交互變項模型的詮釋。

一、統計模型分析方法

若要進一步瞭解影響民眾兩個時間點統獨立場變動背後的因素，我們必須考量定群追蹤樣本在統計上相依（statistically dependent）的資料特性（Agresti 2002, 409），運用其他適當的方法來加以分析。過去定群追蹤的資料型態在政治學研究中並不多見，故相關的分析方法也較少被推廣。隨著 1980 年代統計學者發展出多層模型（multilevel model，或稱階層模型 hierarchical model）（Raudenbush and Bryk 2002），針對定群追蹤資料的分析方法才逐漸被應用。基本上，這種分析方法認為觀察的單元（units of observation）隸屬於（nested in）某個群體或集群之中；舉例來說，孩子隸屬於某個家庭、學生隸屬於某個學校，形成分析層次之間前者包含於後者的「套疊結構」（nested structure）。同樣地，針對縱貫時序研究，

亦可將不同時間點所做的觀察視為隸屬在同一位受訪者身上的資料結構

（Rabe-Hesketh and Skrondal 2008, 51），彷彿各個時間的觀察隸屬於案例，但時間先後有一定的順序，定群追蹤資料的結構如下圖 3-2 所示。依照這樣的套疊結 構，第一層（level 1）是選民在兩個時間點所進行的兩次訪問，以 i 來表示；然 後第二層（level 2）則是個別選民，以 j 來表示。根據上述的資料結構特性，本

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

文運用多層模型來探討 2008 年至 2012 年兩個時間點影響民眾統獨立場的因素。

【圖 3-2】定群追蹤資料套疊結構，

修改自 Rabe-Hesketh and Skrondal（2008, 51）

一般而言，適用縱貫時序資料的統計模型主要有兩種，一個是「隨機效果模型」（random effect model），另一個是「固定效果模型」（fixed effect model）。隨機效果模型主要是將樣本的差異視為從母體中抽取的隨機變數，透過把所有未解釋的變異（total variance）區分為受訪者之間的上層變異（higher-level variance），

和不同訪問時間點的下層變異（lower-level variance），並運用最大概似法（maxima likelihood method）來進行參數估計。其優點是模型具有彈性，可以估計不隨時間變化之變數，但其缺點是該模型假定受訪者之間的差異對於依變數的影響，和給定同一位受訪者兩年度訪問的態度變化對於依變數的影響具有相同的效果

（Bartels 2008）。然而，在實際分析上，組間效果和組內效果相等的假設卻未必經得起考驗，其與依變數之間的關連甚至可能出現正負符號相反的情況，形成所謂的「跨層次干擾」（cluster confounding）（Bartels 2008, 9-11; Rabe-Hesketh and Skrondal 2008, 115）。當組間效果和組內效果不相等時，通常意謂著模型可能因為遺漏了一些未被觀察或未測量到的個體層次變數（ omitted subject-level variables），使得解釋變數 𝑋_𝑖𝑗和誤差項 𝑢_0𝑗相關，違反隨機效果模型中的「外生性假定」（exogenous assumption），³⁸ 導致係數估計發生偏誤。因此，若研究者

38 隨機效果模型的外生性假定指的是，兩個層次的誤差項必須和解釋變數之間彼此相互獨立，

也就是 𝐶𝑜𝑣(𝑋𝑖𝑗, 𝑢𝑗) = 0; 𝐶𝑜𝑣(𝑋𝑖𝑗, 𝑒𝑖𝑗) = 0。但在實際社會科學研究中，儘管研究者依據相關學理，

Eric Susan John

1 2 1 2 1 2

Subjects j

Occasions i

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

發現模型無法滿足此假設時，往往會退而求其次使用固定效果模型。

固定效果模型則是將樣本的差異視為固定值，藉著在統計模型中加入個別受訪者的虛擬變數，達到一種自我控制的效果，排除這些因人而異的個人特徵因素對於依變數的可能影響，進而專注在其他因時而異的自變數對於依變數的效果。

由於固定效果模型只估計隨時間變化自變數對於依變數影響的組內效果，所以不受上述外生性假定的限制（Bell and Jones 2014）。在實際應用時，研究者通常會以 Hausman test 來檢驗固定效果模型與隨機效果模型兩者估計係數之間的差異

（Hausman 1978），若拒絕虛無假設，捨棄隨機效果模型轉而使用固定效果模型幾乎已是分析方法上的「黃金標準作業模式」。然而，固定效果模型的缺點是犧牲了不隨時間變化變數的重要性。特別是在社會科學中，民眾的特徵屬性、社會經濟位階、及其所處的環境系絡等，通常是學理上感興趣的重要變數，若模型無法納入這些變數，難免讓人有遺珠之憾的感覺。此外，若每個單元或個體重複觀察的次數不多，變數組內變異的程度不夠大，可能也會影響固定效果模型的參數估計（Clark and Linzer 2013, 7）。

有鑑於隨機效果模型違反假定的主要原因是企圖用一個參數來估計兩種不同的效果，Mundlak（1978）提出的解決方法是在模型中針對隨時間變化的變數加入其組平均的變數，藉此來區分自變數對於依變數的影響，究竟是來自不同個體之間的變數效果（between-subject or cross-sectional effect），或是同一個體在不同時間點的變數效果（within-subject or longitudinal effect）。在操作上，是將隨時間變化之變數 𝑋_𝑖𝑗，拆解成「個體不同時間點的平均數」（𝑋̅_𝑗，subject mean），以及「個體與其組平均之差」（(𝑋_𝑖𝑗 − 𝑋̅_𝑗)，subject-mean centered）。所謂「個體不同時間點的平均數」（又稱組平均數）是指將受訪者對於同一變數，在兩個時間點

盡可能地將會影響依變數的自變數納入模型中，但仍無法避免可能遺漏其他未觀察到或未被測量的個體層次變數，而這些變數就可能會和誤差項產生關連。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

調查中的分數取平均數，其估計係數呈現的是不同個體之間的效果，以 𝛽^𝐵來代表。而「個體與其組平均之差」（以下簡稱與組平均之差）是將受訪者回答之原始數值減去前述平均數所得之差距，其估計係數的意義則是同一個體在不同時間點的效果，以 𝛽^𝑊來代表（林長志 2010, 84-85）。以本研究為例，假設𝑌_𝑖𝑗為民眾的統獨立場， 𝑋_𝑖𝑗為一系列隨時間變動的變數，𝑍_𝑗為一系列不隨時間變動的變數，

則此時第一層模型可寫成：

第一層（level 1）：

𝑌_𝑖𝑗 = 𝛽_0𝑗+ 𝛽₁𝑋_𝑖𝑗 + 𝑒_𝑖𝑗 𝑒_𝑖𝑗~𝑁(0, 𝜎_𝑒²)

然後在第二層加入選民個人特徵背景等不隨時間變動之變數和個體不同時間點的平均數：

第二層（level 2）：

𝛽_0𝑗 = 𝛽₀+ 𝛽₂𝑍_𝑗+ 𝛽₃𝑋̅_𝑗+ 𝑢_0𝑗 𝑢_0𝑗~𝑁(0, 𝜎_𝑢²)

合併第一層和第二層的模型之後得到：

𝑌_𝑖𝑗 = 𝛽₀+ 𝛽₁𝑋_𝑖𝑗+ 𝛽₃𝑋̅_𝑗+ 𝛽₂𝑍_𝑗+ 𝑢_0𝑗 + 𝑒_𝑖𝑗

經代數轉換之後，模型變成：

𝑌_𝑖𝑗 = 𝛽₀+ 𝛽₁(𝑋_𝑖𝑗− 𝑋̅_𝑗) + 𝛽₃𝑋̅_𝑗+ 𝛽₂𝑍_𝑗+ 𝑢_0𝑗 + 𝑒_𝑖𝑗

𝑒_𝑖𝑗~𝑁(0, 𝜎_𝑒²); 𝑢_0𝑗~𝑁(0, 𝜎_𝑢²)

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

其中，𝛽₁顯現的即是所謂的組內效果，而𝛽₃的意義則是組間效果。因為在計算「組平均」和「與組平均之差」的過程中，我們已經完全區分了𝑋_𝑖𝑗的組內效果和組間效果，所以這兩個變數不但彼此之間無任何相關，同時也和個體層次的誤差項 𝑢_0𝑗之間沒有相關，使得這個方法能夠滿足外生性假設（Bartels 2008）。

此外，可以注意到在上面這個模型中也包含了 𝑍_𝑗這個不隨時間變動的變數；換句話說，這個模型比固定效果模型更具有彈性，並不會因為估計組內效果而犧牲個體層次（上層）的重要變數。最後，更重要的是，這個模型不再預設組間效果和組內效果相等，使得我們能夠在係數詮釋上區分這兩種效果不同的經驗意涵

（Bartels 2008; Bell and Jones 2014; Fairbrother 2014）。因此，後續會以這個組間組內隨機效果模型（或稱隨機效果與固定效果並用法，Allison 2009）做為主要的統計分析模型。

二、交互變項模型與邊際效果

由於本研究假設當民眾覺得兩岸簽訂 ECFA 後經濟狀況變好，台灣人認同對於統獨的負向效果傾向削弱或變得不顯著，意即理性的 ECFA 經濟評估對於統獨的效果可能會抵消台灣人認同的效果。要檢驗類似的條件假設（ conditional hypotheses）的方法是在統計模型中加入交互變項。而上述的組間組內隨機效果模型也可依據理論推演上的需要，進一步延伸為具有「跨層次交互變項的隨機係數模型」（random coefficient model with cross-level interactions）（Bartels 2008; Bell and Jones 2014）。儘管交互變項模型在學界被廣泛使用，但是在詮釋結果時，卻經常忽略交互變項模型下條件假設的本質，或只倚賴報表的統計顯著水準來判斷交互變項是否存在，導致研究者做出與經驗資料不符的結論。因此，以下我們以最簡單的交互變項模型為例來說明「邊際效果」（marginal effect）的解讀方式。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

一般而言，在無交互變項的線性迴歸模型中；𝑦 = 𝛽₀+ 𝛽_𝑥𝑥 + 𝛽_𝑧𝑧 + 𝜀，若要 探討自變數 x 對於依變數 y 的效果，往往我們會藉由針對 x 取微分而得到 𝛽_𝑥，意 謂當 x 每增加一個單位，y 增加 𝛽_𝑥個單位；同理可知，自變數 z 對於 y 的效果即 是係數 𝛽_𝑧。然而，在交互變項模型 𝑦 = 𝛽₀+ 𝛽_𝑥𝑥 + 𝛽_𝑧𝑧 + 𝛽_𝑥𝑧𝑥𝑧 + 𝜀中，上述迴歸 係數等同邊際效果的情形並不存在；因為取微分之後，x 對於 y 的邊際效果為：

𝜕𝑦

𝜕𝑥= 𝛽_𝑥+ 𝛽_𝑥𝑧𝑧

上式表示自變數 x 對於 y 的效果隨另一個自變數 z 的變化而有所不同，或者 也可以說 x 對於 y 的影響受到 z 的調節（moderate）。此外，即便學理上我們可能 並無假設 z 對於 y 的影響隨 x 的變化而不同，但由於數學邏輯對稱（symmetry）

的緣故，自變數 z 對依變數 y 的效果也同樣取決於 x。因此，若對變數 z 取微分 可得：

𝜕𝑦

𝜕𝑧 = 𝛽_𝑧+ 𝛽_𝑥𝑧𝑥

在交互變項模型中，x 對於 y 的邊際效果是 𝛽_𝑥+ 𝛽_𝑥𝑧𝑧。³⁹ 表示自變數 x 對於 y 的效果隨另一個自變數 z 的變化而有所不同，它反映的正是理論上關心的條件 假設，亦即 x 對 y 的效果端視 z 的值而定。唯有當 z = 0 時，x 對於 y 的效果才是 𝛽_𝑥，因此在解讀交互變項結果時，應避免將 𝛽_𝑥錯誤解讀成，控制其他變數不變 的條件下，x 對於 y 的獨立效果、平均效果或主要效果（Brambor, Clark, and Golder 2006, 72; Kam and Franzese 2007, 23）。事實上，只要模型中包含 x 和 z 的交互項，

即已隱含預設了條件假設。因此，在交互變項模型中，自變數 x 的迴歸係數 𝛽_𝑥僅

39 在 probit 或 logit 等廣義線性模型（generalized linear model, GLM）之中，由於連結函數（link

在文檔中兩岸經濟整合與簽署ECFA對台灣民眾統獨立場的影響：2008至2012定群追蹤樣本的實證分析 - 政大學術集成 (頁 81-91)

統計模型與方法

第三章 研究設計與方法

第四節 統計模型與方法

國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第三章研究設計與方法

第四節統計模型與方法

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學