• 沒有找到結果。

選區規模不但影響有效候選人數與理論預期的偏差量,同時也跟政黨協調問題及選舉 情境有關係,特別是再加入競爭激烈程度、新進候選人數與現任者人數之後,變數間彼此 相互關連的情況容易使得模型產生多元共線的問題。儘管多元共線問題不會影響整體迴歸 模型解釋的有效性,但卻會使得個別變數的解釋出現錯誤的結論。為了避免多元共線問 題所發生的嚴重錯誤,在此試圖藉由比較原始模型與加入競爭激烈程度、新進候選人數、

現任者人數的模型,來解釋為何在正文的迴歸分析中沒有包含這些變數。以下首先比較 兩種模型的迴歸係數與 R2,檢視納入這些變數後是否有明顯的改變,接著呈現所有變數 的相關係數矩陣 (correlation matrix),找出彼此相互重疊的變數,最後比較兩種模型的 VIF 值 (variance inflation factor) 及 CI 值 (conditional index) 檢視統計上多元共線問題的嚴重程 度。

由附表 3-1 可以發現,加入「競爭激烈程度」、「新進候選人數」與「現任者人數」之 後,儘管整體迴歸模型的 R2增加,但是原本 M+1 法則中最關鍵的變數「選區規模」卻與 偏差量呈現負相關,換言之,選區規模越大,有效候選人數與理論預期的偏差量越小。當 進一步檢視所有變數的相關係數矩陣時(附表 3-2),我們發現選區規模不但與偏差量呈 正相關,而且跟「競爭激烈程度」、「新進候選人數」與「現任者人數」這三個變數高度相 關。因此,造成選區規模相關方向改變的主要原因,是這幾個變數的相互重疊所致。

兩個迴歸模型的多元共線統計值如附表 3-3。非常明顯地,選區規模因為在加入兩個 高度相關的變數之後,VIF 值超過 10 以上 (11.078)。此外,條件指數 CI 值也超過 35 以 上。代表該迴歸模型的多元共線問題嚴重,導致選區規模的迴歸係數產生正負符號相反的 情形。

綜上所述,儘管依照研究流程應該是先理論而後統計,且不應該基於統計上的考量而 將理論的重要變數排除於模型之外,但是由於多元共線的問題已經確實對分析產生不當的 影響。因此,因果發生時間點最早的「選區規模」應該保留。「競爭激烈程度」、「新進候 選人數」與「現任者人數」三個變數分別測量選舉情境的不同面向,但三者高度相關,且 都會影響選民的資訊品質。基於理論模型的完整性,以及避免共線問題的考量,本文之模 型僅納入「新進候選人數」。

附表 3-1 迴歸模型的比較

本文之模型 納入所有變數的模型

變數名稱 Coeff.(S.E.) Coeff.(S.E.)

常數 -1.127(.460) 2.238(1.095)

選區規模 .228(.068) -.165( .123)

選區中政黨過度提名程度 .260(.105) .284( .098)

選區中政黨低度提名程度 -.341(.090) -.284( .085)

國民黨棄保操作比值 1.261(.372) 1.213( .351)

民進黨棄保操作比值 .411(.372) .439( .352)

選區競爭激烈程度 -29.435(9.280)

選區新進候選人數 .045(.028) .065( .027)

現任者人數 .245( .091)

1992年立委選舉虛擬變數 -.733(.463) -.862( .432) 1995年立委選舉虛擬變數 .567(.464) -.220( .477) 1998年立委選舉虛擬變數 .295(.489) -.160( .479) 2001年立委選舉虛擬變數 .919(.482) .050( .500) 2004年立委選舉虛擬變數 .548(.525) -.265( .530)

N=99 R2=0.645 N=99 R2=0.700 資料來源:作者自行整理

附表3-2 相關係數矩陣(表內數字由上至下分別代表相關係數、顯著水準及樣本數) 相關係數有效候選 人數與理 論偏差量

國民黨棄保操 作比值

附表 3-3 兩種迴歸模型的多元共線統計值

變數名稱

共線統計值 (collinearity statistics)

本文之模型 納入所有變數的模型

容忍度 (tolerance)

變異數波動因素 (VIF)

容忍度 (tolerance)

變異數波動因素 (VIF)

選區規模 .337 2.967 0.090 11.078

選區中政黨過度提名程度 .622 1.607 0.617 1.620

選區中政黨低度提名程度 .726 1.378 0.703 1.422

國民黨棄保操作比值 .736 1.358 0.718 1.393

民進黨棄保操作比值 .742 1.348 0.717 1.394

選區競爭激烈程度 - - 0.261 3.831

選區新進候選人數 .394 2.541 0.359 2.786

現任者人數 - - 0.182 5.493

1992年虛擬變數 .492 2.032 0.489 2.044

1995年虛擬變數 .465 2.150 0.381 2.622

1998年虛擬變數 .365 2.737 0.330 3.027

2001年虛擬變數 .377 2.655 0.303 3.298

2004年虛擬變數 .332 3.016 0.281 3.559

條件指數 CI 值 13.203 35.064

資料來源:作者自行整理。

說明:容忍度 (tolerance) 為 VIF 之倒數,容忍度值介於 0~1 之間,容忍度越接近 0,表示多元共線問題越嚴 重。

相關文件