選舉民調與選戰動態分析---貝式統計模型的應用

(1)

行政院國家科學委員會專題研究計畫成果報告

選舉民調與選戰動態分析:貝式統計模型的應用

研究成果報告(精簡版)

計畫類別：個別型計畫編號： NSC 99-2410-H-004-005- 執行期間： 99 年 01 月 01 日至 99 年 07 月 31 日執行單位：國立政治大學選舉研究中心計畫主持人：俞振華計畫參與人員：碩士班研究生-兼任助理人員：湯惕維碩士班研究生-兼任助理人員：賴怡潔公開資訊：本計畫可公開查詢

中華民國 99 年 10 月 31 日

(2)

「選舉民調與選戰動態分析:貝式統計模型的應用」成果報告

中文摘要本研究以 2008 年總統大選前近三個月內各媒體所發佈的民調數據為基礎，利用貝式統計模型分析時間序列，以評估媒體民調包括 TVBS/年代、中國時報、遠見、聯合報、及蘋果日報等的機構效應—即是否媒體民調結果有所謂偏藍偏綠的傾向。實証研究發現，並非每個媒體機構所發佈的民調結果都有所謂「機構效應」存在。此外，透過時間序列模型及 Kalman Filtering and Smoothing Algorithm 的應用，本研究整合了過去的選舉結果、實際的選舉結果、及即時的民調資料來描繪馬英九的兩黨支持度在競選期間每日的變化。

(3)

Analyzing Election Polls and Campaign Dynamic:

A Bayesian Modeling Approach

Abstract

This analysis uses Bayesian modeling approach to assess time series of media’s poll data and to explore the so-called “house effect”. Specifically, we collected data three months prior to the 2008 Presidential Election from five media

institutions—namely, TVBS/ERA, China Times, Global Vision Monthly, United Daily News, and Apple Daily to analyze whether their poll results biased toward Pan-blue or Pan-green camps. Our findings are twofold: first, while some media poll results have a consistent “house effect”, some do not have such systematic bias. Second, by utilizing Kalman Filtering and Smoothing Algorithm and combining past and recent election results as well as updated poll numbers, this analysis successfully depict day-to-day changes of Ma ying-jeou’s two-party vote during the campaign period.

Key Words: Bayesian Statistical Modeling; Election polls; House effects; Systematic biases; Pooling data; Time series

(4)

一、前言每次選舉期間，眾家主流媒體幾乎都會利用民意調查結果來報導選戰動態，並藉以推斷哪位候選人在選戰中領先。尤其當競選過程中有重要事件發生，如候選人宣佈參選、辯論會後、或出現各類外來突發狀況時，媒體機構除了圍繞這些即時新聞做文章外，通常會利用民調來檢測選民的投票意向是否受到這些事件的影響。畢竟將民意當成新聞來處理是媒體從事民意調查主要的目的之一（Crespi, 1980；周祖誠，1999A）。就一場選舉而言，一般大眾最感興趣的還是誰能從選戰中脫穎而出。從商業利益觀之，媒體報導選舉時若是能掌握「你追我趕」的競選動態，將民眾意向與選戰發展緊密連結，則選舉新聞勢必充滿故事性。也難怪「賽馬式」 (Horse Race) 的選舉民調數字很自然地成為媒體報導選戰的焦點。由於「新聞價值」是媒體民調的最主要考量，於是時效與成本兩大因素某種程度主宰了媒體民調的形式與內容(Crespi, 1989)。媒體的選戰民調幾乎皆採用電話訪問的方式（希望愈快獲得調查結果愈好），問卷題目通常不多（只需提供足夠的報導素材即可），且樣本數也往往有限（不需做精密的推論）。專家學者多半批評媒體機構所做的選戰民調在方法上不夠嚴謹，調查結果能夠被用來分析的材料（變數）太少，所以學術價值不高。即便在方法和內容上較嚴謹的學術研究調查有所出入，多數媒體民調仍標榜能提供閱聽人「客觀」的數據來評估選情。畢竟「客觀」二字早已成為新聞工作的指導哲學（羅文輝，1991）。在此新聞傳統下，媒體的民意調查報導也被要求必須不偏不倚（周祖誠 A，1999）。然事實上，各家民調數據時常呈現極大的落差，就算是在同一時期做的民調，結果往往不盡相同。這種現象使得媒體民調的客觀性受到各界質疑。尤其到了選戰後期，各家媒體機構的民調數據時常成為各界評論與爭議的焦點，有些媒體公佈民調結果時甚至被指控是為了達成特定目的，有影響選舉結果之嫌。為了避免民調數據在選前被當成競選工具，總統、副總統選舉罷免法中明文規定選前十天不得公佈選舉相關的民調結果。媒體民調數據紊亂的情況使得許多評論者或分析家紛紛主張「選前民調不準確」、「媒體民調不可信」、或「選前民調不等於選舉預測」等。於是一般民眾對媒體機構所公佈的民調結果往往半信半疑，對於民調能否反映民情或選情也愈來愈沒有信心（李恆宇，2003）。再加上近年來許多媒體機構因政治立場的關係被貼上政黨標籤（親藍、親綠或親國民黨、親民進黨），譬如，聯合報、中國時報、及 TVBS 就被歸類為所謂「親藍媒體」1，其所屬民調機構公佈的調查結果往往因母機構的「顏色屬性」而被視為有所偏頗—即調查結果往往過度代表藍色選民的意見而無法充分反應綠色選民的意見。台灣的民調專家及政治評論者將此種現象視為某種「機構效應」（House Effect）：由於受訪選民傾向拒絕透露自己的投票或政策意向給予和本身政治立場不相同的媒體民調機構，使得各機構調查結果產生系統性偏誤 (Bias)（劉念夏，2008A）。2換言之，此類機構效應並非源自於各調查機構在方法與技術層面上的差異，而是基於受訪者對於不同調查機構的信賴感不同，是為狹義的機構效應（Smith, 1978; 1982; 周祖誠，1999B）。儘管科學性的民意調查技術經超過半個世紀的發展已臻成熟，絕大多數民意調查機構原則上也都會遵從數個基本原則和程序來進行調查研究。然單純從技術層面分析，有調查就會有誤差（Measurement Error）。民意調查研究不但不可能完全排除隨機產生的誤差，因調查程序與技術考量所產生的系統性偏誤也再所難免。各個民意調查機構基於成本及效率考量，往往都會各自制定一套「標準作業模式」（Standard Operation Procedure）來執行各項民意調查計畫。因此，各機構的調查程序雖

1 譬如 Feng (2008)將主要平面媒體（報紙）依統獨立場及政黨屬性歸為三類：親藍媒體—聯合報、中國時報；親綠媒體— 自由時報；及中立媒體—蘋果日報。 2 為了避免這類問題，有些民調公司在執行訪問時甚至用別的名稱替代原本的機構名。然而在發表調查結果時又用回原本的機構名稱，形成研究倫理的問題（李恆宇，2003）。相關調查研究倫理的探討請見游清鑫、鄭夙芬（2009）。

(5)

然掌握幾個共通的原則，但實際執行調查時的模式卻不盡相同：舉凡抽取樣本的涵蓋性、成功樣本的代表性、訪問的方法、問卷的結構與字句、資料的加權和後續處理、乃至於訪員所使用的語言等面向都可能因採不同的處理模式而使得調查結果產生顯著的差異。換言之，即便兩個民調機構同時針對相同的主題進行調查（譬如總統大選辯論後的候選人支持度），我們也無法預期兩者所得出的結果完全相同。畢竟，除了受訪者可能因訪問機構不同而提供不同的答案外，不同機構在執行調查時因方法上的差異所產生的偏誤亦不盡相同。以上兩種因機構不同造成民調結果差異的理由皆可稱作「機構效應」。綜合而論，廣義的「機構效應」指涉所有因民調機構屬性和其所採方法而造成調查結果偏誤的現象(Czaja and Blair, 1996)。

除了廣義的「機構效應」影響測量的效度外，媒體民調的樣本數往往不夠大，進而影響了測量的信度。曾幾何時，「百分之九十五信心水準下，正負三個百分點的抽樣誤差」成為民調業界普遍公認可接受的抽樣誤差標準。在百分之九十五信心水準下及樣本數夠大的情況下，計算比例估計值的信賴區間公式如下（Kalton, p.15, 1983）： ) ( 96 . 1 ˆ s D_ˆp p± ⋅ （1）其中 n p p D s( _p_ˆ)= ˆ(1− ˆ) pˆ是民調的比例估計值（介於 0 與 1 之間，譬如馬英九支持度的比例），n 是樣本數。假設樣本數夠 大而pˆ呈常態分配時，則有百分之九十五的可能性pˆ會落在其平均值左右各 1.96 個標準差s(D_ˆp)內。換言之，式（1）當中，正負符號後面所帶出的數值即是我們一般實務上所稱的抽樣誤差值。於是， 假設調查的有效樣本數控制在 1000 至 1100 個左右（以 n = 1068 為例），並把pˆ設定為 0.5 時，則套入式（1）所計算出的誤差值約為正負 0.03（即 3 個百分點）。然而，正負三個百分點的誤差值讓我們有時很難依調查結果進行推論。譬如，TVBS 在 2004 年總統大選前所做滾動式民調顯示，陳水扁、呂秀蓮與連戰、宋楚瑜兩組候選人的支持度差距從該年二月中起到三月十九日投票前夕止很少超過六個百分點，有時甚至連三個百分點都不到。3如果我們執意採用一千出頭的樣本數來做推論，則我們很難透過 TVBS 的民調資料來推論哪位候選人領先。或許 2004 年總統大選兩組人馬實力太接近是一個極端的例子，況且媒體民調的功能也不僅僅是讓民眾知道誰在選戰中領先。更多時候，即時的民調數據是為了輔助報導某競選或突發事件對選情的影響。我們另以 2008 年大選媒體民調為例。在三月九日最後一場辯論會前（三月五日），中國時報與中天電視台所公佈的調查數據顯示，馬英九、蕭萬長的支持度為 53％；辯論會後，中時民調立刻又委託民調公司進行的另一波調查則顯示，馬英九、蕭萬長的支持度降為 49％。於是，記者以最直觀的方式詮釋民調結果，報導原文是：「馬蕭配本次的支持度為 49％，若與五日調查的 53％比較，支持度下滑了四個百分點」（中國時報 03/10/2009 要聞 A1 版）。但事實上，若兩波民調分別僅有 1100 個樣本數，我們根本無法確認馬蕭支持度下跌四個百分點在統計上有顯著的意義。同樣的，在百分之九十五信心水準下及樣本數夠大的情況下，計算兩筆比例估計值差距的信賴區間公式如下： ) ( 96 . 1 ˆ ˆ 2 1 ˆ ˆ 2 1 p s Dp p p − ± ⋅ ₋ （2） 3 資料經作者自行收集整理。

(6)

其中 2 2 2 1 1 1 ˆ ˆ ) ˆ 1 ( ˆ ) ˆ 1 ( ˆ ) ( 2 1 n p p n p p D s p p − + − = − 如果我們將式（2）中的n₁、n2各代入樣本數 1100， ˆp1、 ˆp2分別帶入兩波馬蕭支持度估計值 0.53 及 0.49，則我們得出的 1.96* ( ) 2 1 ˆ ˆ p p D s ₋ 值為 0.042。換言之，兩波馬蕭支持度差距的百分之九十五信賴區間為-0.2 個百分點到 8 個百分點（4-4.2, 4+4.2）。因為 0 也在該區間內，所以在百分之九十五的信心水準下(採雙尾檢定)，我們無法拒絕兩者之間差距為 0 的虛無假定（Null Hypothesis）。同理，倘若我們觀察到一個百分點的支持度變化（譬如從 50%變化成 51%），事實上我們需要兩波民調各約 19,500 個樣本才能 95%地確認這麼微小的變化。除非是利用網路方式進行調查，不然一般採用電訪或面訪方式進行的民調幾乎不可能在短時間內累積這麼大的有效樣本數。成本考量也會讓所有民調機構對於如此大樣本的調查望而卻步。但不可否認，唯有擴大樣本數，我們才能更精準地測量到兩組民調數字的差距。擴大樣本數最便捷的方法，就是將多筆的民調資料結合起來（Pooled Data）。倘若約莫在同一個時期有兩個以上的民調機構針對某個問題進行調查，理論上就算民調結果來自不同的機構，在不考量機構效應的情況下，將它們結合在一起所得出的估計值肯定比自單一筆民調資料所得的估計值來得準確。舉例來說，譬如有兩個民調機構 A 和 B 分別於 2008 年總統大選辯論會後一星期內，針對馬英九 的支持率（假設為 p ）進行調查，依樣本數n_A及nB得出pÂ與pˆB兩個無偏差(Unbiased)的點估計值。又假設pˆ_A與pˆ_B皆呈常態分配，則根據式（1）兩者的標準差將分別為s_p p_A p_A n_A A ˆ (1 ˆ ) ˆ = − 及 B B B p p p n s B ˆ (1 ˆ ) ˆ = − 。由於 pÂ與pˆB皆是 p 的估計值，且兩者皆呈常態分配，因此我們可以將兩者結 合起來，得出一個依精密度加權（Precision-weighted）的平均值(Jackman, 2005)： B A B b A A AB w w p w p w p + + = ˆ ˆ ˆ （3）其中w_A及w_B分別為兩項點估計值的權重，各為 A p sˆ 1 及 B p sˆ 1 。因pÂB亦呈常態分配，其標準差為： B A p w w s AB = + 1 ˆ （4）根據式（4），我們必須將兩筆民調資料的樣本數皆納入考量，即透過計算 A p sˆ 及spˆ_B方可得出spˆ_AB，且 AB p sˆ 肯定小於spˆ_A或sˆp_B。換言之，合併資料後所得的估計值其標準差較小，理論上pÂB應較pÂ與pˆB來得更準確。 二、研究目的 上述討論分別從機構效應與樣本數不足兩方面，點出媒體民調結果在效度與信度方面可能存在的問題。本文就是為了更進一步探索這兩方面的相關問題，研究目的包括以下兩點：第一、雖然評論者與民調專家總是以機構效應為由，認為台灣媒體所公佈的選戰民調數字問題重重，然而，至今不論學界或民調實務界尚未有任何系統性的研究告訴我們到底哪家媒體民調存有偏

(7)

差？偏差值約多少？本文的首要目標就是以各家媒體選戰民調結果為例，透過實証模型來測量到底媒體機構的選戰民調存在多大的偏誤，所謂的「機構效應」到底有多大？第二、本研究企圖綜合各家選戰期間媒體民調結果，藉由增加樣本數的方式，來更真實地反應選戰的動態。畢竟任何統計分析都會因樣本數增加而使結果更精確。適當地將資料合併（Pooling Data），將更有助於我們測量選戰期間候選人支持度的消長。總之，本文企圖利用貝氏統計模型，同時探測媒體民調的機構效應並更準確地估計競選期間候選人支持度的變化。三、分析模型

Jackman(2005)曾利用隨機漫步模型(Random Walk Model)，結合五家媒體民調機構於 2004 年澳州國會大選前的民調結果，描繪出澳州最大黨—聯盟黨（Coalition），在大選期間以日為單位的可能得票率（或稱支持度）序列，並估計個別民調單位的機構效應。該模型的要點簡述如下：設i=1,2,...,n為民調結果的次序編號，則： ) , ( ~ _i _i2 i N y μ σ （5）其中y 為第 i 次的民調結果，依常態分配其平均值為i μi，標準差為σi。進一步可假設第 i 次的民調是 由機構 j 於競選期第 t 日時所執行，v 為競選期第 t 日某候選人（或政黨）的可能得票率。於是t i i j t i v δ μ = + （6）其中δ_j代表機構 j 的機構效應，是我們要估計的參數之一。v 與_t δj項的註記 i 則代表了可能得票率v 與t 機構效應δ_j反應在第 i 次調查時的情形。v 亦是我們要估計的參數，其分配依據隨機漫步模型，即：_t T t v N v_t ~ ( _t₋₁_,ω2), =2,... （7） 1 v 則根據過去實際得票率的記錄設定為在一定區間內移動的單一分配(Uniform Distribution)。v （即最t 後一日的得票率）為選舉日候選人（或政黨）的實際得票率。式（7）成立的前提為：除非隨機的外力（Random Shock）發生，不然候選人（或政黨）今天的支持率和前一天的支持率相同。而隨機外力對得票率的影響則呈常態分配，以 0 為平均值，標準差為ω 。透過估計以上三式將可取得兩組參數，即δ_j與v 分別代表機構效應的大小與候選人（或政黨）在_t 選舉期間每日可能得票率（即支持度）的變化。此模型運作的關鍵在於針對v1與v 所做的假設：即分t 別用過往的得票率紀錄限制住v1，及用最後一期的實際得票率限制住v 。有了這兩項假設，我們可以t

運用 Kalman Filtering and Smoothing Algorithm 估計時間序列，其中包括兩個步驟（Green, Gerber, and De Boef, 1999）：第一、從頭到尾估計整個序列，過濾(Filtering)每筆資料，並依序賦予各筆資料權重（Weight），以第一個時間點的資料加權後求取第二個時間點的估計值，再依第二個時間點的資料加權後求取第三個時間點的估計值，依此類推到最後一個時間點的估計值；第二、由後往前，依整個序列的分佈趨勢，來修勻(Smoothing)各個時間點的點估計值。4 四、研究方法與資料分析 4

(8)

本研究所使用的實証資料為 2008 年總統大選競選期間，平面媒體所公佈的候選人支持度。這裡所謂的競選期間並不以法定競選期（元月二十七日）為準，而是以 2008 年元月初開始計算，合計不到三個月的時間。2008 年元月第一波有關選舉的媒體民調是中國時報於 3 日針對國民黨宣布拒領公投票後所進行的電話訪問，因此我們既以這一波民調結果當作本研究實証資料的起始點。到選舉前一天為止（3 月 21 日），共計有 43 筆媒體民調資料，其中包含 TVBS 在選前十天所進行的 8 次調查結果，發佈的機構則包括 TVBS/年代、中國時報、遠見、聯合報、及蘋果日報等共 5 家，合計樣本數為 44,802 個。5 過去美國的研究（Smith, 1982）及許多媒體評論人皆認為，機構效應會影響受訪民眾無反應（或未表態）的比例。不過，卻也有台灣的研究發現，機構效應對拒訪率確實有影響，但對於無反應的比例卻沒有顯著的影響（周祖誠，1999B）。依據經驗法則，針對總體資料處理未表態的方式有很多， Mitofsky(1998,233)依美國媒體選前民調的經驗，提出四種常見的調整方法，包括（1）將未表態選民依已表態者的比例，分配給各候選人；（2）將未表態者平均分配給兩大主要政黨的候選人；（3）如果有在位者參選的話，將未表態者歸給挑戰的候選人；（4）完全不考慮未表態者。或許由於商業機密的關係，台灣媒體民調幾乎從不公開其處理未表態者的方法。唯一有的參考文獻大概就屬陳俊明、劉念夏（1998）及劉念夏（2008）的選舉民調比較推估法。該推估法主要是透過經驗法則歸納並比較各家媒體民調數據與實際得票率之間的關係，並據此作為日後觀察選舉民調時解析未表態者的依據。舉例而言，劉念夏（2008）利用 2008 年總統大選的媒體民調資料及投票結果歸納出所謂「反比原則」，即主要幾個媒體民調中未表態選民中，可能投給馬蕭配與長昌配的比例大致與已表態者的比例成反比。換言之，如果已表態的兩組候選人支持比例是 7:3，則未表態者的選票將可能以 3:7 之比分配給兩組候選人。本文的主要目的並非選舉預測，而是希望以最原始的方式呈現機構效應及候選人支持度的變化。所以本文選擇以完全不考慮未表態者的方式，來計算候選人支持度。這裡的假設有兩點：(1)未表態者投票率低，對選情影響小。當計算候選人支持度時刪除未表態者等於假設這些人不會去投票；（2）倘若機構效應影響了未表態者的比例（如同劉念夏所發現的反比原則），則當我們不考慮該比例而直接計算兩黨候選人支持度時，等於也將機構效應帶進來，而扭曲了候選人支持度。由於本文的重點之一即在評估各個機構效應的大小，為了將研究目標單純化，以下分析皆以馬英九的「兩黨支持度」（即馬英九的 Two-party Vote）為主要分析對象。圖一列出選前 80 天五家媒體機構的調查結果及 95%信心水準下，各估計值的信賴區間。水平實黑線則為馬英九的大選得票率（58.45%）。倘若我們假設馬英九的兩黨支持度在這段期間和最後的實際得票比例相同，則五家媒體的調查結果顯然都高估了馬英九的支持度。除了 TVBS 後期的調查結果外，58.45%幾乎總是落在各估計值信賴區間的下限之外。直觀上，這些機構所公佈的民調結果總是較偏向馬英九，似乎真的做實了「泛藍媒體」的稱號，其中也包括了一般認為較沒有政治立場的蘋果日報。 【圖一在此】 接著我們利用第二節所介紹的分析模型來描繪馬英九兩黨支持度在這段期間可能的變化（v 共t 80 個參數），並求取各家媒體民調的機構效應（δ_j共五個參數）。這裡有兩個重要的假設：（一）在整個競選時程（80 天）開始前，我們必須先假設馬英九的支持度大概落在哪裡，才能依此推演整個時間序列。根據過去總統大選的經驗，2004 年大選是國民黨（或泛藍陣營）得票率最低的一次，2000 年 5 選前民調通常使用以下的問題來測量候選人支持度：「如果明天就是 XX 選舉的投票日，你（妳）會把票投給誰？」這個問題的結果是我們收集的主要標的。

(9)

的連戰加宋楚瑜則可能是泛藍陣營得票比例的上限。所以在本文所定義的競選時程前，我們假設馬英九的支持度為介於 60%及 49%之間的均勻分配（Uniform Distribution）；（二）到了整個競選時程的最後一期，馬英九的兩黨支持度就是他的實際得票率，該數值不以分配（Distribution）表示，因為沒有任何的不確定性。 我們利用貝氏統計方法估計該模型，使用的軟體為 WinBUGS，並以 R 為程式媒介。6 四、結果與討論 圖二顯示了整個競選時程馬英九兩黨支持度的變化，及整個時間序列和媒體民調結果的相對位置。以下三點值得我們注意： 【圖二在此】 首先，相對於各個民調結果，我們在整個序列前後兩邊所設定的值（即過去藍營大選的得票率及此次的選舉結果）是較低的。且由於這兩個值的不確定性較低，所以在計算整個序列時這兩個值（特別是後者）權重較高，於是把整個數列的兩側往下壓。因此儘管五家媒體民調可能都高估了馬英九的支持度，但整個序列不會因為民調資料偏差而大幅向上升。其次，觀察整個序列發現，馬英九的支持度在大選前 80 天並沒有大幅度的變化，也顯示這次大選在最後的衝刺期並沒有太多戲劇性的發展。兩項比較受人注意的事件，包括發生在一月底、二月初，民進黨針對馬英九是否有美國籍的「綠卡事件」(圖二競選時程第 29 天)，及發生在 3 月 12 日（競選時程第 71 天），國民黨籍四名立委至謝長廷競選總部會勘頂樓是否有非法使用的「踢館事件」等，對馬英九的支持度都沒有致命性的打擊，儘管圖二顯示後者發生後，馬英九的支持度確實呈現些許下滑的趨勢。最後，倘若圖二序列代表馬英九在這段競選衝刺期間，兩黨支持度的實際變化，則各家媒體多數的民調結果顯然高估了馬英九的支持度—即絕大多數的民調結果都落在序列上方。換言之，這些媒體民調數據或許存有系統性的偏誤。表一列出統計模型所估計的機構效應係數：【表一在此】從表一我們發現，各機構的偏誤係數皆為正數，表示以上所檢驗的媒體民調通常高估了馬英九的支持度。遠見雜誌公佈的民調數據偏誤最小，平均僅有約 1.2 個百分點誤差。此外，其 95%的分佈區間包含 0，顯示其誤差可能並非來自系統性的因素（套用 Frequentist 統計的說法，即其偏誤未達顯著水準）；聯合報所公佈的民調數據偏誤最大，平均約有 10.3 個百分點誤差。同時，其偏誤值 95%的區間未包含 0（從 3.17 到 17.37），證實其民調數據系統性地偏向馬英九。中國時報的平均偏誤值也很大，高達 8.3 個百分點，並且亦系統地偏向馬英九。TVBS 進行的民調次數最多，其平均偏誤值約 327，略大於一般媒體民調訪問一千出頭個樣本數時所得的正負三個百分點的誤差。換言之，通常 TVBS 所公佈的民調數據，其 95%信心區間的下限大概和實際馬英九的支持度相距不遠。TVBS 的 95%信賴區間也包含 0。蘋果日報只公佈了三次民調數字，利用蘋果的數據得出的馬英九兩黨支持度變動的幅度很大，這可能和蘋果民調未表態的比例異常大有關（分別為 43%、44%、及 39%，其它民調未表態的平均約在 25%左右）。也因此其係數的分佈範圍最大，95%的信賴區間勉強包含 0。最後，將所有的民調數據合併起來（Pooling）的確可獲得大樣本的效果，即整體而言，本文所推估的馬英九支持度的誤差範圍較一般民調的誤差範圍小。圖三顯示，推估的馬英九支持度信賴區間多半在 4 到 5 個百分點間移動，變動程度端視民調施行的密集程度，有時甚至低於 4 個百分點—譬如基 6

使用的 R Package “arm” 。關於如何透過 R 使用 WinBUGS ，請見 Andrew Gelman 網站 :

http://www.stat.columbia.edu/~gelman/bugsR/。本研究程式原始碼來自 Simon Jackman，並經作者修改以符合本研究設計。關於貝式統計方法的應用，請見 Gelman, Carlin, Stern, and Rubin (2004)。

(10)

於選罷法規定，在可公佈民調的期限前（約競選時程的 70 天），各機構都會公佈最後一波民調，於是樣本數大幅提高，支持度推估值的信賴區間也因此縮小。 【圖三在此】 五、結論與討論 本文仿效 Jackman（2005）的方法，以 2008 年總統大選前近三個月內各媒體所發佈的民調數據為基礎，評估媒體民調包括 TVBS/年代、中國時報、遠見、聯合報、及蘋果日報等的機構效應。此外，該統計模型整合了過去的選舉經驗（如國民黨過去總統大選的得票率）、實際的選舉結果（馬英九的實際得票率），及即時的民調資料，描繪出馬英九的兩黨支持度在這段期間的變化。本文的主要發現有以下兩點：第一、本文所分析的五家媒體民調資料，儘管其偏誤的方向上似乎一致（皆高估馬英九的支持度），但程度有不小的差別。其中聯合報民調的偏誤最大，中國時報其次，兩者的偏誤係數皆達統計上的顯著水準。相對地，遠見的偏誤最小，TVBS 也還可接受，兩者的係數皆不顯著。蘋果日報的偏誤係數雖不顯著（95%信賴區間幾乎正好包含 0），但因結果是基於三筆資料所得出，故仍不易判斷其偏誤是否真的不是系統性偏誤。總之，若從機構效應的角度來看，聯合報、中國時報的 08 年總統大選民調結果確實過度代表藍色選民的意見，而未充分反應綠色選民的意見。TVBS、遠見或許也被貼上藍色的標籤，但事實上兩者的機構效應並不顯著。第二、合併資料確實有助我們求得更精確的估計結果，降低估計值的不確定性。本項分析未來還有很多延展及改善的空間，譬如擴大樣本數（包括涵蓋更長的時間序列及加入更多的民調資料），使得在估計整個序列時，不會過度依賴頭尾的設定值。其次，改變各種假設將有助於我們評估模型的適用性，並觀察估計係數是否會因此大幅改變（譬如改變處理未表態者的方式）。此外，利用同樣的模型去研究不同的時間序列（譬如 2004 年總統大選），能讓我們在不同的情境下探究機構效應。畢竟，2008 年大選前，藍、綠的態勢就是藍營大幅領先。綠色選民在這樣的氛圍下很容易隱藏她們的支持意向。2004 年的總統大選則不同，是一場旗鼓相當的選舉。我們或許可以預期，在不同的情境下，所謂「偏藍、偏綠」的機構效應會有所差別。最後，本文所估計的機構效應或許只適用於解釋某次總統大選某段競選期間的民調資料。但這畢竟是一個經驗參考值，希望對未來學界或實務界評估大選媒體民調準確度有所助益。 參考文獻 中文部分李恆宇，2003 台灣民調看看就好。新台灣新聞週刊，第 402 期。周祖誠，1999A 新聞媒體的兩岸關係民意調查。發表於兩岸關係學術研討會，國立政治大學選舉研究中心，台北，1999 年 5 月 15 日。周祖誠，1999B 選舉民意調查機構效應之探討。致理學報，第 12 期，1999 年 6 月，頁 31-51。劉念夏，2008A 煤體選舉民調另類價值之追求：民意表達的放心度。國政評論，國家政策研究基金會，2008 年 4 月 2 日。http://npf.org.tw/copy/4076。劉念夏，2008B

(11)

2008 年總統選舉媒體民調的運用與省思：選舉推估與民意表達。選舉評論，第四期，2008 年 4 月，頁 9-18。陳俊明、劉念夏，1998 民意調查與選舉結果之推估比較：一個協助閱聽大眾解讀媒體民調的新嚐試。理論與政策，12(1)： 52-72。游清鑫、鄭夙芬，2009 調查研究倫理。收錄於游清鑫編，民意調查新論，台北，五南出版社。羅文輝，1999 精確新聞報導，台北，正中書局。英文部分

Czaja, Ronald and Johnny Blair, 1996

Designing Surveys: A Guide to Decisions and Procedures. Thousand Oaks, California: Pine Forge Press. Crespi, Irving, 1980

Polls as Journalism. Public Opinion Quarterly, 44: 462-476. Crespi, Irving, 1989

Public Opinion, Polls, and Democracy. Boulder: Westview Press. Feng, Chian-seng, 2008

Press Freedom, DPP Government and the Intellectuals. Paper presented in the 2008 Conference on Democratic Consolidation in Taiwan, Stanford University, May 29-30, 2008.

Gelman, Andrew, John B. Carlin, Hal S.Stern, and Donald B. Rubin, 2004

Bayesian Data Analysis, Second ed. Boca Raton, Florida: Chapman and Hall. Green P. Donald, Alan S. Gerber, and Suzanna De Boef, 1999

Tracking Opinion over Time: A Method for Reducing Sampling Error. Public Opinion Quarterly 63:178-192.

Harvey, Andrew C., 1996

Forecasting, Structural Time Series Models and the Kalman Filter. New York: Cambridge University Press. Jackman, Simon, 2005

Pooling the Polls Over an Election Campaign. Australian Journal of Political Science 40(4): 499-517. Mitofsky, Warren J., 1998

Poll Review: Was 1996 Worse than 1948? Public Opinion Quarterly 62: 230-249. Kalton, Graham, 1983

Introduction to Survey Sampling. Sage University Paper. Smith, Tom W., 1978

In Search of House Effects: A Comparison of Responses to Various Questions by Different Survey Organizations. Public Opinion Quarterly 42: 443-463.

Smith, Tom W., 1982

House Effects and the Reproducibility of Survey Measurement: A Comparison of the 1980 GSS and the 1980 American National Election Study. Public Opinion Quarterly 46: 54-68.

(12)

表一：各媒體民調偏誤比較 95%區間 媒體機構 估計係數 下限 (2.5%) 上限 (97.5%) TVBS 3.27 -0.88 7.42 中國時報 8.32 3.07 13.56 遠見 1.21 -0.81 3.21 聯合報 10.27 3.17 17.37 蘋果日報 8.23 -0.03 16.49 註：以上數據單位為百分點。圖一：選前八十天媒體民調馬英九支持度變化（去除未表態者） 50 60 70 80 50 60 70 80 0 20 40 60 80 0 20 40 60 80 0 20 40 60 80 TVBS 中國時報遠見聯合報蘋果日報信心區間上限/信心區間下限馬英九支持度(只計算馬謝比) 馬英九支持率 ( 馬謝比 ) 競選時程 (自08年1月2日起) Graphs by 媒體民調機構

(13)

圖二：推估選前八十天馬英九支持度變化（只計算馬謝比） 55 60 65 70 75 百分比 0 20 40 60 80 競選時程 (自08年1月2日起) 馬英九支持度 (馬謝比) TVBS 中國時報遠見聯合報 圖三：馬英九支持度的 95%信賴區間變化 4 4. 5 5 馬英九支持度 95 % 信賴區間 ( 百分點 ) 0 20 40 60 80 競選時程 (自08年1月2日起) 註：頭、尾兩天的支持度並非依民調數據推估得來，因此未計算其信賴區間

(14)

(15)

99 年度專題研究計畫研究成果彙整表

計畫主持人：俞振華計畫編號： 99-2410-H-004-005-計畫名稱：選舉民調與選戰動態分析:貝式統計模型的應用量化成果項目實際已達成數（被接受或已發表）預期總達成數(含實際已達成數) 本計畫實際貢獻百分比單位備註（質化說明：如數個計畫共同成果、成果列為該期刊之封面故事 ... 等）期刊論文 0 1 100% 研究報告/技術報告 0 0 100% 研討會論文 1 1 100% 篇論文著作專書 0 0 100% 申請中件數 0 0 100% 專利已獲得件數 0 0 100% 件件數 0 0 100% 件技術移轉權利金 0 0 100% 千元碩士生 2 2 100% 博士生 0 0 100% 博士後研究員 0 0 100% 國內參與計畫人力（本國籍）專任助理 0 0 100% 人次期刊論文 0 0 100% 研究報告/技術報告 0 0 100% 研討會論文 0 0 100% 篇論文著作專書 0 0 100% 章/本申請中件數 0 0 100% 專利已獲得件數 0 0 100% 件件數 0 0 100% 件技術移轉權利金 0 0 100% 千元碩士生 0 0 100% 博士生 0 0 100% 博士後研究員 0 0 100% 國外參與計畫人力（外國籍）專任助理 0 0 100% 人次

(16)

其他成果

(

無法以量化表達之成果如辦理學術活動、獲得獎項、重要國際合作、研究成果國際影響力及其他協助產業技術發展之具體效益事項等，請以文字敘述填列。) 無成果項目量化 名稱或內容性質簡述 測驗工具(含質性與量性) 0 課程/模組 0 電腦及網路系統或工具 0 教材 0 舉辦之活動/競賽 0 研討會/工作坊 0 電子報、網站 0 科教處計畫加填項目計畫成果推廣之參與（閱聽）人數 0

(17)

國科會補助專題研究計畫成果報告自評表

請就研究內容與原計畫相符程度、達成預期目標情況、研究成果之學術或應用價

值（簡要敘述成果所代表之意義、價值、影響或進一步發展之可能性）

、是否適

合在學術期刊發表或申請專利、主要發現或其他有關價值等，作一綜合評估。

1. 請就研究內容與原計畫相符程度、達成預期目標情況作一綜合評估

■達成目標

□未達成目標（請說明，以 100 字為限）

□實驗失敗

□因故實驗中斷

□其他原因

說明：

2. 研究成果在學術期刊發表或申請專利等情形：

論文：□已發表 ■未發表之文稿 □撰寫中 □無

專利：□已獲得 □申請中 ■無

技轉：□已技轉 □洽談中 ■無

其他：

（以 100 字為限）

曾於台灣政治學會年會發表第一稿，計畫執行後的論文二稿已完成，將於小幅修訂後於年底前將第三稿投稿期刊。

(18)

3. 請依學術成就、技術創新、社會影響等方面，評估研究成果之學術或應用價

值（簡要敘述成果所代表之意義、價值、影響或進一步發展之可能性）（以

500 字為限）

學術成就本研究屬於政治學方法論的範疇。由於純粹方法論的研究在政治學界相對較少，本研究發表後期望激起回響，使得政治學統計方法的應用能朝更專業化的方向邁進。另外，就研究主題而言，國內民意調查的研究往往是藉分析民調資料做為驗證理論的手段。本研究則純粹從方法的角度探討民調品質，將充實民意調查這個領域的相關文獻。技術創新政治學界實證研究利用時間序列分析資料的並不多，而採用 Kalman Filter 技術的也屈指可數。本研究另外導入貝式統計模型的方法，欲進一步推廣貝氏統計分析方法在台灣政治學界的應用。最後，本研究所提出的統計方法勢必可以進一步應用在其它時間序列的分析研究上。社會影響雖然媒體民調和一般學術性質的調查研究在方法與實務上有許多不同之處，但學術研究畢竟有領頭的作用，期盼能對日後如何改善實務界調查方法有所貢獻。本研究主要探討的對象是媒體調查實務所產生的偏誤。然而，本研究儘管發現各媒體民調可能偏誤的大小，但並沒有確實指出為何發生偏誤。這是日後實務界應進一步反思的問題。