• 沒有找到結果。

選舉民調與選戰動態分析---貝式統計模型的應用

N/A
N/A
Protected

Academic year: 2021

Share "選舉民調與選戰動態分析---貝式統計模型的應用"

Copied!
18
0
0

加載中.... (立即查看全文)

全文

(1)

行政院國家科學委員會專題研究計畫 成果報告

選舉民調與選戰動態分析:貝式統計模型的應用

研究成果報告(精簡版)

計 畫 類 別 : 個別型 計 畫 編 號 : NSC 99-2410-H-004-005- 執 行 期 間 : 99 年 01 月 01 日至 99 年 07 月 31 日 執 行 單 位 : 國立政治大學選舉研究中心 計 畫 主 持 人 : 俞振華 計畫參與人員: 碩士班研究生-兼任助理人員:湯惕維 碩士班研究生-兼任助理人員:賴怡潔 公 開 資 訊 : 本計畫可公開查詢

中 華 民 國 99 年 10 月 31 日

(2)

「選舉民調與選戰動態分析:貝式統計模型的應用」成果報告

中文摘要 本研究以 2008 年總統大選前近三個月內各媒體所發佈的民調數據為基礎, 利用貝式統計模型分析時間序列,以評估媒體民調包括 TVBS/年代、中國時報、 遠見、聯合報、及蘋果日報等的機構效應—即是否媒體民調結果有所謂偏藍偏綠 的傾向。實証研究發現,並非每個媒體機構所發佈的民調結果都有所謂「機構效 應」存在。此外,透過時間序列模型及 Kalman Filtering and Smoothing Algorithm 的應用,本研究整合了過去的選舉結果、實際的選舉結果、及即時的民調資料來 描繪馬英九的兩黨支持度在競選期間每日的變化。

(3)

Analyzing Election Polls and Campaign Dynamic:

A Bayesian Modeling Approach

Abstract

This analysis uses Bayesian modeling approach to assess time series of media’s poll data and to explore the so-called “house effect”. Specifically, we collected data three months prior to the 2008 Presidential Election from five media

institutions—namely, TVBS/ERA, China Times, Global Vision Monthly, United Daily News, and Apple Daily to analyze whether their poll results biased toward Pan-blue or Pan-green camps. Our findings are twofold: first, while some media poll results have a consistent “house effect”, some do not have such systematic bias. Second, by utilizing Kalman Filtering and Smoothing Algorithm and combining past and recent election results as well as updated poll numbers, this analysis successfully depict day-to-day changes of Ma ying-jeou’s two-party vote during the campaign period.

Key Words: Bayesian Statistical Modeling; Election polls; House effects; Systematic biases; Pooling data; Time series

(4)

一、前言 每次選舉期間,眾家主流媒體幾乎都會利用民意調查結果來報導選戰動態,並藉以推斷哪位候選 人在選戰中領先。尤其當競選過程中有重要事件發生,如候選人宣佈參選、辯論會後、或出現各類外 來突發狀況時,媒體機構除了圍繞這些即時新聞做文章外,通常會利用民調來檢測選民的投票意向是 否受到這些事件的影響。畢竟將民意當成新聞來處理是媒體從事民意調查主要的目的之一(Crespi, 1980;周祖誠,1999A)。就一場選舉而言,一般大眾最感興趣的還是誰能從選戰中脫穎而出。從商 業利益觀之,媒體報導選舉時若是能掌握「你追我趕」的競選動態,將民眾意向與選戰發展緊密連結, 則選舉新聞勢必充滿故事性。也難怪「賽馬式」 (Horse Race) 的選舉民調數字很自然地成為媒體報導 選戰的焦點。 由於「新聞價值」是媒體民調的最主要考量,於是時效與成本兩大因素某種程度主宰了媒體民調 的形式與內容(Crespi, 1989)。媒體的選戰民調幾乎皆採用電話訪問的方式(希望愈快獲得調查結果愈 好),問卷題目通常不多(只需提供足夠的報導素材即可),且樣本數也往往有限(不需做精密的推 論)。專家學者多半批評媒體機構所做的選戰民調在方法上不夠嚴謹,調查結果能夠被用來分析的材 料(變數)太少,所以學術價值不高。 即便在方法和內容上較嚴謹的學術研究調查有所出入,多數媒體民調仍標榜能提供閱聽人「客觀」 的數據來評估選情。畢竟「客觀」二字早已成為新聞工作的指導哲學(羅文輝,1991)。在此新聞傳 統下,媒體的民意調查報導也被要求必須不偏不倚(周祖誠 A,1999)。然事實上,各家民調數據時 常呈現極大的落差,就算是在同一時期做的民調,結果往往不盡相同。這種現象使得媒體民調的客觀 性受到各界質疑。尤其到了選戰後期,各家媒體機構的民調數據時常成為各界評論與爭議的焦點,有 些媒體公佈民調結果時甚至被指控是為了達成特定目的,有影響選舉結果之嫌。為了避免民調數據在 選前被當成競選工具,總統、副總統選舉罷免法中明文規定選前十天不得公佈選舉相關的民調結果。 媒體民調數據紊亂的情況使得許多評論者或分析家紛紛主張「選前民調不準確」、「媒體民調不 可信」、或「選前民調不等於選舉預測」等。於是一般民眾對媒體機構所公佈的民調結果往往半信半 疑,對於民調能否反映民情或選情也愈來愈沒有信心(李恆宇,2003)。再加上近年來許多媒體機構 因政治立場的關係被貼上政黨標籤(親藍、親綠或親國民黨、親民進黨),譬如,聯合報、中國時報、 及 TVBS 就被歸類為所謂「親藍媒體」1,其所屬民調機構公佈的調查結果往往因母機構的「顏色屬性」 而被視為有所偏頗—即調查結果往往過度代表藍色選民的意見而無法充分反應綠色選民的意見。台灣 的民調專家及政治評論者將此種現象視為某種「機構效應」(House Effect):由於受訪選民傾向拒絕 透露自己的投票或政策意向給予和本身政治立場不相同的媒體民調機構,使得各機構調查結果產生系 統性偏誤 (Bias)(劉念夏,2008A)。2換言之,此類機構效應並非源自於各調查機構在方法與技術層 面上的差異,而是基於受訪者對於不同調查機構的信賴感不同,是為狹義的機構效應(Smith, 1978; 1982; 周祖誠,1999B)。 儘管科學性的民意調查技術經超過半個世紀的發展已臻成熟,絕大多數民意調查機構原則上也都 會遵從數個基本原則和程序來進行調查研究。然單純從技術層面分析,有調查就會有誤差 (Measurement Error)。民意調查研究不但不可能完全排除隨機產生的誤差,因調查程序與技術考量 所產生的系統性偏誤也再所難免。各個民意調查機構基於成本及效率考量,往往都會各自制定一套「標 準作業模式」(Standard Operation Procedure)來執行各項民意調查計畫。因此,各機構的調查程序雖

1 譬如 Feng (2008)將主要平面媒體(報紙)依統獨立場及政黨屬性歸為三類:親藍媒體—聯合報、中國時報;親綠媒體— 自由時報;及中立媒體—蘋果日報。 2 為了避免這類問題,有些民調公司在執行訪問時甚至用別的名稱替代原本的機構名。然而在發表調查結果時又用回原本 的機構名稱,形成研究倫理的問題(李恆宇,2003)。相關調查研究倫理的探討請見游清鑫、鄭夙芬(2009)。

(5)

然掌握幾個共通的原則,但實際執行調查時的模式卻不盡相同:舉凡抽取樣本的涵蓋性、成功樣本的 代表性、訪問的方法、問卷的結構與字句、資料的加權和後續處理、乃至於訪員所使用的語言等面向 都可能因採不同的處理模式而使得調查結果產生顯著的差異。換言之,即便兩個民調機構同時針對相 同的主題進行調查(譬如總統大選辯論後的候選人支持度),我們也無法預期兩者所得出的結果完全 相同。畢竟,除了受訪者可能因訪問機構不同而提供不同的答案外,不同機構在執行調查時因方法上 的差異所產生的偏誤亦不盡相同。以上兩種因機構不同造成民調結果差異的理由皆可稱作「機構效 應」。綜合而論,廣義的「機構效應」指涉所有因民調機構屬性和其所採方法而造成調查結果偏誤的 現象(Czaja and Blair, 1996)。

除了廣義的「機構效應」影響測量的效度外,媒體民調的樣本數往往不夠大,進而影響了測量的 信度。曾幾何時,「百分之九十五信心水準下,正負三個百分點的抽樣誤差」成為民調業界普遍公認 可接受的抽樣誤差標準。在百分之九十五信心水準下及樣本數夠大的情況下,計算比例估計值的信賴 區間公式如下(Kalton, p.15, 1983): ) ( 96 . 1 ˆ s Dˆp p± ⋅ (1) 其中 n p p D s( pˆ)= ˆ(1− ˆ) pˆ是民調的比例估計值(介於 0 與 1 之間,譬如馬英九支持度的比例),n 是樣本數。假設樣本數夠 大而呈常態分配時,則有百分之九十五的可能性會落在其平均值左右各 1.96 個標準差s(Dˆp)內。 換言之,式(1)當中,正負符號後面所帶出的數值即是我們一般實務上所稱的抽樣誤差值。於是, 假設調查的有效樣本數控制在 1000 至 1100 個左右(以 n = 1068 為例),並把pˆ設定為 0.5 時,則套 入式(1)所計算出的誤差值約為正負 0.03(即 3 個百分點)。 然而,正負三個百分點的誤差值讓我們有時很難依調查結果進行推論。譬如,TVBS 在 2004 年總 統大選前所做滾動式民調顯示,陳水扁、呂秀蓮與連戰、宋楚瑜兩組候選人的支持度差距從該年二月 中起到三月十九日投票前夕止很少超過六個百分點,有時甚至連三個百分點都不到。3如果我們執意採 用一千出頭的樣本數來做推論,則我們很難透過 TVBS 的民調資料來推論哪位候選人領先。 或許 2004 年總統大選兩組人馬實力太接近是一個極端的例子,況且媒體民調的功能也不僅僅是 讓民眾知道誰在選戰中領先。更多時候,即時的民調數據是為了輔助報導某競選或突發事件對選情的 影響。我們另以 2008 年大選媒體民調為例。在三月九日最後一場辯論會前(三月五日),中國時報 與中天電視台所公佈的調查數據顯示,馬英九、蕭萬長的支持度為 53%;辯論會後,中時民調立刻又 委託民調公司進行的另一波調查則顯示,馬英九、蕭萬長的支持度降為 49%。於是,記者以最直觀的 方式詮釋民調結果,報導原文是:「馬蕭配本次的支持度為 49%,若與五日調查的 53%比較,支持 度下滑了四個百分點」(中國時報 03/10/2009 要聞 A1 版)。 但事實上,若兩波民調分別僅有 1100 個樣本數,我們根本無法確認馬蕭支持度下跌四個百分點 在統計上有顯著的意義。同樣的,在百分之九十五信心水準下及樣本數夠大的情況下,計算兩筆比例 估計值差距的信賴區間公式如下: ) ( 96 . 1 ˆ ˆ 2 1 ˆ ˆ 2 1 p s Dp p p − ± ⋅ (2) 3 資料經作者自行收集整理。

(6)

其中 2 2 2 1 1 1 ˆ ˆ ) ˆ 1 ( ˆ ) ˆ 1 ( ˆ ) ( 2 1 n p p n p p D s p p − + − = − 如果我們將式(2)中的n1n2各代入樣本數 1100, ˆp1、 ˆp2分別帶入兩波馬蕭支持度估計值 0.53 及 0.49,則我們得出的 1.96* ( ) 2 1 ˆ ˆ p p D s 值為 0.042。換言之,兩波馬蕭支持度差距的百分之九十五信賴區 間為-0.2 個百分點到 8 個百分點(4-4.2, 4+4.2)。因為 0 也在該區間內,所以在百分之九十五的信心 水準下(採雙尾檢定),我們無法拒絕兩者之間差距為 0 的虛無假定(Null Hypothesis)。同理,倘若我 們觀察到一個百分點的支持度變化(譬如從 50%變化成 51%),事實上我們需要兩波民調各約 19,500 個樣本才能 95%地確認這麼微小的變化。除非是利用網路方式進行調查,不然一般採用電訪或面訪方 式進行的民調幾乎不可能在短時間內累積這麼大的有效樣本數。成本考量也會讓所有民調機構對於如 此大樣本的調查望而卻步。但不可否認,唯有擴大樣本數,我們才能更精準地測量到兩組民調數字的 差距。 擴大樣本數最便捷的方法,就是將多筆的民調資料結合起來(Pooled Data)。倘若約莫在同一個 時期有兩個以上的民調機構針對某個問題進行調查,理論上就算民調結果來自不同的機構,在不考量 機構效應的情況下,將它們結合在一起所得出的估計值肯定比自單一筆民調資料所得的估計值來得準 確。舉例來說,譬如有兩個民調機構 A 和 B 分別於 2008 年總統大選辯論會後一星期內,針對馬英九 的支持率(假設為 p )進行調查,依樣本數nAnB得出pˆApˆB兩個無偏差(Unbiased)的點估計值。 又假設AB皆呈常態分配,則根據式(1)兩者的標準差將分別為sp pA pA nA A ˆ (1 ˆ ) ˆ = − 及 B B B p p p n s B ˆ (1 ˆ ) ˆ = − 。由於 pˆApˆB皆是 p 的估計值,且兩者皆呈常態分配,因此我們可以將兩者結 合起來,得出一個依精密度加權(Precision-weighted)的平均值(Jackman, 2005): B A B b A A AB w w p w p w p + + = ˆ ˆ ˆ (3) 其中wAwB分別為兩項點估計值的權重,各為 A p sˆ 1 及 B p sˆ 1 。因pˆAB亦呈常態分配,其標準差為: B A p w w s AB = + 1 ˆ (4) 根據式(4),我們必須將兩筆民調資料的樣本數皆納入考量,即透過計算 A p sˆ 及spˆB方可得出spˆAB,且 AB p sˆ 肯定小於spˆAsˆpB。換言之,合併資料後所得的估計值其標準差較小,理論上pˆAB應較pˆApˆB來 得更準確。 二、研究目的 上述討論分別從機構效應與樣本數不足兩方面,點出媒體民調結果在效度與信度方面可能存在的 問題。本文就是為了更進一步探索這兩方面的相關問題,研究目的包括以下兩點: 第一、雖然評論者與民調專家總是以機構效應為由,認為台灣媒體所公佈的選戰民調數字問題重重, 然而,至今不論學界或民調實務界尚未有任何系統性的研究告訴我們到底哪家媒體民調存有偏

(7)

差?偏差值約多少?本文的首要目標就是以各家媒體選戰民調結果為例,透過實証模型來測量 到底媒體機構的選戰民調存在多大的偏誤,所謂的「機構效應」到底有多大? 第二、本研究企圖綜合各家選戰期間媒體民調結果,藉由增加樣本數的方式,來更真實地反應選戰的 動態。畢竟任何統計分析都會因樣本數增加而使結果更精確。適當地將資料合併(Pooling Data),將更有助於我們測量選戰期間候選人支持度的消長。 總之,本文企圖利用貝氏統計模型,同時探測媒體民調的機構效應並更準確地估計競選期間候選 人支持度的變化。 三、分析模型

Jackman(2005)曾利用隨機漫步模型(Random Walk Model),結合五家媒體民調機構於 2004 年澳州 國會大選前的民調結果,描繪出澳州最大黨—聯盟黨(Coalition),在大選期間以日為單位的可能得 票率(或稱支持度)序列,並估計個別民調單位的機構效應。該模型的要點簡述如下: 設i=1,2,...,n為民調結果的次序編號,則: ) , ( ~ i i2 i N y μ σ (5) 其中y 為第 i 次的民調結果,依常態分配其平均值為i μi,標準差為σi。進一步可假設第 i 次的民調是 由機構 j 於競選期第 t 日時所執行,v 為競選期第 t 日某候選人(或政黨)的可能得票率。於是t i i j t i v δ μ = + (6) 其中δj代表機構 j 的機構效應,是我們要估計的參數之一。v 與t δj項的註記 i 則代表了可能得票率v 與t 機構效應δj反應在第 i 次調查時的情形。v 亦是我們要估計的參數,其分配依據隨機漫步模型,即:t T t v N vt ~ ( t1,ω2), =2,... (7) 1 v 則根據過去實際得票率的記錄設定為在一定區間內移動的單一分配(Uniform Distribution)。v (即最t 後一日的得票率)為選舉日候選人(或政黨)的實際得票率。式(7)成立的前提為:除非隨機的外 力(Random Shock)發生,不然候選人(或政黨)今天的支持率和前一天的支持率相同。而隨機外力 對得票率的影響則呈常態分配,以 0 為平均值,標準差為ω 。 透過估計以上三式將可取得兩組參數,即δjv 分別代表機構效應的大小與候選人(或政黨)在t 選舉期間每日可能得票率(即支持度)的變化。此模型運作的關鍵在於針對v1與v 所做的假設:即分t 別用過往的得票率紀錄限制住v1,及用最後一期的實際得票率限制住v 。有了這兩項假設,我們可以t

運用 Kalman Filtering and Smoothing Algorithm 估計時間序列,其中包括兩個步驟(Green, Gerber, and De Boef, 1999):第一、從頭到尾估計整個序列,過濾(Filtering)每筆資料,並依序賦予各筆資料權重 (Weight),以第一個時間點的資料加權後求取第二個時間點的估計值,再依第二個時間點的資料加 權後求取第三個時間點的估計值,依此類推到最後一個時間點的估計值;第二、由後往前,依整個序 列的分佈趨勢,來修勻(Smoothing)各個時間點的點估計值。4 四、研究方法與資料分析 4

(8)

本研究所使用的實証資料為 2008 年總統大選競選期間,平面媒體所公佈的候選人支持度。這裡 所謂的競選期間並不以法定競選期(元月二十七日)為準,而是以 2008 年元月初開始計算,合計不 到三個月的時間。2008 年元月第一波有關選舉的媒體民調是中國時報於 3 日針對國民黨宣布拒領公投 票後所進行的電話訪問,因此我們既以這一波民調結果當作本研究實証資料的起始點。到選舉前一天 為止(3 月 21 日),共計有 43 筆媒體民調資料,其中包含 TVBS 在選前十天所進行的 8 次調查結果, 發佈的機構則包括 TVBS/年代、中國時報、遠見、聯合報、及蘋果日報等共 5 家,合計樣本數為 44,802 個。5 過去美國的研究(Smith, 1982)及許多媒體評論人皆認為,機構效應會影響受訪民眾無反應(或 未表態)的比例。不過,卻也有台灣的研究發現,機構效應對拒訪率確實有影響,但對於無反應的比 例卻沒有顯著的影響(周祖誠,1999B)。依據經驗法則,針對總體資料處理未表態的方式有很多, Mitofsky(1998,233)依美國媒體選前民調的經驗,提出四種常見的調整方法,包括(1)將未表態選民 依已表態者的比例,分配給各候選人;(2)將未表態者平均分配給兩大主要政黨的候選人;(3)如 果有在位者參選的話,將未表態者歸給挑戰的候選人;(4)完全不考慮未表態者。或許由於商業機 密的關係,台灣媒體民調幾乎從不公開其處理未表態者的方法。唯一有的參考文獻大概就屬陳俊明、 劉念夏(1998)及劉念夏(2008)的選舉民調比較推估法。該推估法主要是透過經驗法則歸納並比較 各家媒體民調數據與實際得票率之間的關係,並據此作為日後觀察選舉民調時解析未表態者的依據。 舉例而言,劉念夏(2008)利用 2008 年總統大選的媒體民調資料及投票結果歸納出所謂「反比原則」, 即主要幾個媒體民調中未表態選民中,可能投給馬蕭配與長昌配的比例大致與已表態者的比例成反 比。換言之,如果已表態的兩組候選人支持比例是 7:3,則未表態者的選票將可能以 3:7 之比分配給兩 組候選人。 本文的主要目的並非選舉預測,而是希望以最原始的方式呈現機構效應及候選人支持度的變化。 所以本文選擇以完全不考慮未表態者的方式,來計算候選人支持度。這裡的假設有兩點:(1)未表態者 投票率低,對選情影響小。當計算候選人支持度時刪除未表態者等於假設這些人不會去投票;(2) 倘若機構效應影響了未表態者的比例(如同劉念夏所發現的反比原則),則當我們不考慮該比例而直 接計算兩黨候選人支持度時,等於也將機構效應帶進來,而扭曲了候選人支持度。由於本文的重點之 一即在評估各個機構效應的大小,為了將研究目標單純化,以下分析皆以馬英九的「兩黨支持度」(即 馬英九的 Two-party Vote)為主要分析對象。 圖一列出選前 80 天五家媒體機構的調查結果及 95%信心水準下,各估計值的信賴區間。水平實 黑線則為馬英九的大選得票率(58.45%)。倘若我們假設馬英九的兩黨支持度在這段期間和最後的實 際得票比例相同,則五家媒體的調查結果顯然都高估了馬英九的支持度。除了 TVBS 後期的調查結果 外,58.45%幾乎總是落在各估計值信賴區間的下限之外。直觀上,這些機構所公佈的民調結果總是較 偏向馬英九,似乎真的做實了「泛藍媒體」的稱號,其中也包括了一般認為較沒有政治立場的蘋果日 報。 【圖一在此】 接著我們利用第二節所介紹的分析模型來描繪馬英九兩黨支持度在這段期間可能的變化(v 共t 80 個參數),並求取各家媒體民調的機構效應(δj共五個參數)。這裡有兩個重要的假設:(一)在整 個競選時程(80 天)開始前,我們必須先假設馬英九的支持度大概落在哪裡,才能依此推演整個時間 序列。根據過去總統大選的經驗,2004 年大選是國民黨(或泛藍陣營)得票率最低的一次,2000 年 5 選前民調通常使用以下的問題來測量候選人支持度:「如果明天就是 XX 選舉的投票日,你(妳)會把票投給誰?」這 個問題的結果是我們收集的主要標的。

(9)

的連戰加宋楚瑜則可能是泛藍陣營得票比例的上限。所以在本文所定義的競選時程前,我們假設馬英 九的支持度為介於 60%及 49%之間的均勻分配(Uniform Distribution);(二)到了整個競選時程的 最後一期,馬英九的兩黨支持度就是他的實際得票率,該數值不以分配(Distribution)表示,因為沒 有任何的不確定性。 我們利用貝氏統計方法估計該模型,使用的軟體為 WinBUGS,並以 R 為程式媒介。6 四、結果與討論 圖二顯示了整個競選時程馬英九兩黨支持度的變化,及整個時間序列和媒體民調結果的相對位 置。以下三點值得我們注意: 【圖二在此】 首先,相對於各個民調結果,我們在整個序列前後兩邊所設定的值(即過去藍營大選的得票率及 此次的選舉結果)是較低的。且由於這兩個值的不確定性較低,所以在計算整個序列時這兩個值(特 別是後者)權重較高,於是把整個數列的兩側往下壓。因此儘管五家媒體民調可能都高估了馬英九的 支持度,但整個序列不會因為民調資料偏差而大幅向上升。 其次,觀察整個序列發現,馬英九的支持度在大選前 80 天並沒有大幅度的變化,也顯示這次大 選在最後的衝刺期並沒有太多戲劇性的發展。兩項比較受人注意的事件,包括發生在一月底、二月初, 民進黨針對馬英九是否有美國籍的「綠卡事件」(圖二競選時程第 29 天),及發生在 3 月 12 日(競選 時程第 71 天),國民黨籍四名立委至謝長廷競選總部會勘頂樓是否有非法使用的「踢館事件」等, 對馬英九的支持度都沒有致命性的打擊,儘管圖二顯示後者發生後,馬英九的支持度確實呈現些許下 滑的趨勢。 最後,倘若圖二序列代表馬英九在這段競選衝刺期間,兩黨支持度的實際變化,則各家媒體多數 的民調結果顯然高估了馬英九的支持度—即絕大多數的民調結果都落在序列上方。換言之,這些媒體 民調數據或許存有系統性的偏誤。表一列出統計模型所估計的機構效應係數: 【表一在此】 從表一我們發現,各機構的偏誤係數皆為正數,表示以上所檢驗的媒體民調通常高估了馬英九的 支持度。遠見雜誌公佈的民調數據偏誤最小,平均僅有約 1.2 個百分點誤差。此外,其 95%的分佈區 間包含 0,顯示其誤差可能並非來自系統性的因素(套用 Frequentist 統計的說法,即其偏誤未達顯著 水準);聯合報所公佈的民調數據偏誤最大,平均約有 10.3 個百分點誤差。同時,其偏誤值 95%的區 間未包含 0(從 3.17 到 17.37),證實其民調數據系統性地偏向馬英九。中國時報的平均偏誤值也很 大,高達 8.3 個百分點,並且亦系統地偏向馬英九。TVBS 進行的民調次數最多,其平均偏誤值約 327, 略大於一般媒體民調訪問一千出頭個樣本數時所得的正負三個百分點的誤差。換言之,通常 TVBS 所 公佈的民調數據,其 95%信心區間的下限大概和實際馬英九的支持度相距不遠。TVBS 的 95%信賴區 間也包含 0。蘋果日報只公佈了三次民調數字,利用蘋果的數據得出的馬英九兩黨支持度變動的幅度 很大,這可能和蘋果民調未表態的比例異常大有關(分別為 43%、44%、及 39%,其它民調未表態的 平均約在 25%左右)。也因此其係數的分佈範圍最大,95%的信賴區間勉強包含 0。 最後,將所有的民調數據合併起來(Pooling)的確可獲得大樣本的效果,即整體而言,本文所推 估的馬英九支持度的誤差範圍較一般民調的誤差範圍小。圖三顯示,推估的馬英九支持度信賴區間多 半在 4 到 5 個百分點間移動,變動程度端視民調施行的密集程度,有時甚至低於 4 個百分點—譬如基 6

使 用 的 R Package “arm” 。 關 於 如 何 透 過 R 使 用 WinBUGS , 請 見 Andrew Gelman 網 站 :

http://www.stat.columbia.edu/~gelman/bugsR/。本研究程式原始碼來自 Simon Jackman,並經作者修改以符合本研究設計。 關於貝式統計方法的應用,請見 Gelman, Carlin, Stern, and Rubin (2004)。

(10)

於選罷法規定,在可公佈民調的期限前(約競選時程的 70 天),各機構都會公佈最後一波民調,於 是樣本數大幅提高,支持度推估值的信賴區間也因此縮小。 【圖三在此】 五、結論與討論 本文仿效 Jackman(2005)的方法,以 2008 年總統大選前近三個月內各媒體所發佈的民調數據為 基礎,評估媒體民調包括 TVBS/年代、中國時報、遠見、聯合報、及蘋果日報等的機構效應。此外, 該統計模型整合了過去的選舉經驗(如國民黨過去總統大選的得票率)、實際的選舉結果(馬英九的 實際得票率),及即時的民調資料,描繪出馬英九的兩黨支持度在這段期間的變化。本文的主要發現 有以下兩點: 第一、 本文所分析的五家媒體民調資料,儘管其偏誤的方向上似乎一致(皆高估馬英九的支 持度),但程度有不小的差別。其中聯合報民調的偏誤最大,中國時報其次,兩者的 偏誤係數皆達統計上的顯著水準。相對地,遠見的偏誤最小,TVBS 也還可接受,兩 者的係數皆不顯著。蘋果日報的偏誤係數雖不顯著(95%信賴區間幾乎正好包含 0), 但因結果是基於三筆資料所得出,故仍不易判斷其偏誤是否真的不是系統性偏誤。總 之,若從機構效應的角度來看,聯合報、中國時報的 08 年總統大選民調結果確實過度 代表藍色選民的意見,而未充分反應綠色選民的意見。TVBS、遠見或許也被貼上藍色 的標籤,但事實上兩者的機構效應並不顯著。 第二、 合併資料確實有助我們求得更精確的估計結果,降低估計值的不確定性。 本項分析未來還有很多延展及改善的空間,譬如擴大樣本數(包括涵蓋更長的時間序列及加入更 多的民調資料),使得在估計整個序列時,不會過度依賴頭尾的設定值。其次,改變各種假設將有助 於我們評估模型的適用性,並觀察估計係數是否會因此大幅改變(譬如改變處理未表態者的方式)。 此外,利用同樣的模型去研究不同的時間序列(譬如 2004 年總統大選),能讓我們在不同的情境下 探究機構效應。畢竟,2008 年大選前,藍、綠的態勢就是藍營大幅領先。綠色選民在這樣的氛圍下很 容易隱藏她們的支持意向。2004 年的總統大選則不同,是一場旗鼓相當的選舉。我們或許可以預期, 在不同的情境下,所謂「偏藍、偏綠」的機構效應會有所差別。最後,本文所估計的機構效應或許只 適用於解釋某次總統大選某段競選期間的民調資料。但這畢竟是一個經驗參考值,希望對未來學界或 實務界評估大選媒體民調準確度有所助益。 參考文獻 中文部分 李恆宇,2003 台灣民調看看就好。新台灣新聞週刊,第 402 期。 周祖誠,1999A 新聞媒體的兩岸關係民意調查。發表於兩岸關係學術研討會,國立政治大學選舉研究中心,台北,1999 年 5 月 15 日。 周祖誠,1999B 選舉民意調查機構效應之探討。致理學報,第 12 期,1999 年 6 月,頁 31-51。 劉念夏,2008A 煤體選舉民調另類價值之追求:民意表達的放心度。國政評論,國家政策研究基金會,2008 年 4 月 2 日。http://npf.org.tw/copy/4076。 劉念夏,2008B

(11)

2008 年總統選舉媒體民調的運用與省思:選舉推估與民意表達。選舉評論,第四期,2008 年 4 月, 頁 9-18。 陳俊明、劉念夏,1998 民意調查與選舉結果之推估比較:一個協助閱聽大眾解讀媒體民調的新嚐試。理論與政策,12(1): 52-72。 游清鑫、鄭夙芬,2009 調查研究倫理。收錄於游清鑫編,民意調查新論,台北,五南出版社。 羅文輝,1999 精確新聞報導,台北,正中書局。 英文部分

Czaja, Ronald and Johnny Blair, 1996

Designing Surveys: A Guide to Decisions and Procedures. Thousand Oaks, California: Pine Forge Press. Crespi, Irving, 1980

Polls as Journalism. Public Opinion Quarterly, 44: 462-476. Crespi, Irving, 1989

Public Opinion, Polls, and Democracy. Boulder: Westview Press. Feng, Chian-seng, 2008

Press Freedom, DPP Government and the Intellectuals. Paper presented in the 2008 Conference on Democratic Consolidation in Taiwan, Stanford University, May 29-30, 2008.

Gelman, Andrew, John B. Carlin, Hal S.Stern, and Donald B. Rubin, 2004

Bayesian Data Analysis, Second ed. Boca Raton, Florida: Chapman and Hall. Green P. Donald, Alan S. Gerber, and Suzanna De Boef, 1999

Tracking Opinion over Time: A Method for Reducing Sampling Error. Public Opinion Quarterly 63:178-192.

Harvey, Andrew C., 1996

Forecasting, Structural Time Series Models and the Kalman Filter. New York: Cambridge University Press. Jackman, Simon, 2005

Pooling the Polls Over an Election Campaign. Australian Journal of Political Science 40(4): 499-517. Mitofsky, Warren J., 1998

Poll Review: Was 1996 Worse than 1948? Public Opinion Quarterly 62: 230-249. Kalton, Graham, 1983

Introduction to Survey Sampling. Sage University Paper. Smith, Tom W., 1978

In Search of House Effects: A Comparison of Responses to Various Questions by Different Survey Organizations. Public Opinion Quarterly 42: 443-463.

Smith, Tom W., 1982

House Effects and the Reproducibility of Survey Measurement: A Comparison of the 1980 GSS and the 1980 American National Election Study. Public Opinion Quarterly 46: 54-68.

(12)

表一:各媒體民調偏誤比較 95%區間 媒體機構 估計係數 下限 (2.5%) 上限 (97.5%) TVBS 3.27 -0.88 7.42 中國時報 8.32 3.07 13.56 遠見 1.21 -0.81 3.21 聯合報 10.27 3.17 17.37 蘋果日報 8.23 -0.03 16.49 註:以上數據單位為百分點。 圖一:選前八十天媒體民調馬英九支持度變化(去除未表態者) 50 60 70 80 50 60 70 80 0 20 40 60 80 0 20 40 60 80 0 20 40 60 80 TVBS 中國時報 遠見 聯合報 蘋果日報 信心區間上限/信心區間下限 馬英九支持度(只計算馬謝比) 馬英九支持率 ( 馬謝 比 ) 競選時程 (自08年1月2日起) Graphs by 媒體民調機構

(13)

圖二:推估選前八十天馬英九支持度變化(只計算馬謝比) 55 60 65 70 75 百分比 0 20 40 60 80 競選時程 (自08年1月2日起) 馬英九支持度 (馬謝比) TVBS 中國時報 遠見 聯合報 圖三:馬英九支持度的 95%信賴區間變化 4 4. 5 5 馬英九支持度 95 % 信賴區 間 ( 百分點 ) 0 20 40 60 80 競選時程 (自08年1月2日起) 註:頭、尾兩天的支持度並非依民調數據推估得來,因此未計算其信賴區間

(14)
(15)

99 年度專題研究計畫研究成果彙整表

計畫主持人:俞振華 計畫編號: 99-2410-H-004-005-計畫名稱:選舉民調與選戰動態分析:貝式統計模型的應用 量化 成果項目 實際已達成 數(被接受 或已發表) 預期總達成 數(含實際已 達成數) 本計畫實 際貢獻百 分比 單位 備 註(質 化 說 明:如 數 個 計 畫 共 同 成 果、成 果 列 為 該 期 刊 之 封 面 故 事 ... 等) 期刊論文 0 1 100% 研究報告/技術報告 0 0 100% 研討會論文 1 1 100% 篇 論文著作 專書 0 0 100% 申請中件數 0 0 100% 專利 已獲得件數 0 0 100% 件 件數 0 0 100% 件 技術移轉 權利金 0 0 100% 千元 碩士生 2 2 100% 博士生 0 0 100% 博士後研究員 0 0 100% 國內 參與計畫人力 (本國籍) 專任助理 0 0 100% 人次 期刊論文 0 0 100% 研究報告/技術報告 0 0 100% 研討會論文 0 0 100% 篇 論文著作 專書 0 0 100% 章/本 申請中件數 0 0 100% 專利 已獲得件數 0 0 100% 件 件數 0 0 100% 件 技術移轉 權利金 0 0 100% 千元 碩士生 0 0 100% 博士生 0 0 100% 博士後研究員 0 0 100% 國外 參與計畫人力 (外國籍) 專任助理 0 0 100% 人次

(16)

其他成果

(

無法以量化表達之成 果如辦理學術活動、獲 得獎項、重要國際合 作、研究成果國際影響 力及其他協助產業技 術發展之具體效益事 項等,請以文字敘述填 列。) 無 成果項目 量化 名稱或內容性質簡述 測驗工具(含質性與量性) 0 課程/模組 0 電腦及網路系統或工具 0 教材 0 舉辦之活動/競賽 0 研討會/工作坊 0 電子報、網站 0 目 計畫成果推廣之參與(閱聽)人數 0

(17)

國科會補助專題研究計畫成果報告自評表

請就研究內容與原計畫相符程度、達成預期目標情況、研究成果之學術或應用價

值(簡要敘述成果所代表之意義、價值、影響或進一步發展之可能性)

、是否適

合在學術期刊發表或申請專利、主要發現或其他有關價值等,作一綜合評估。

1. 請就研究內容與原計畫相符程度、達成預期目標情況作一綜合評估

■達成目標

□未達成目標(請說明,以 100 字為限)

□實驗失敗

□因故實驗中斷

□其他原因

說明:

2. 研究成果在學術期刊發表或申請專利等情形:

論文:□已發表 ■未發表之文稿 □撰寫中 □無

專利:□已獲得 □申請中 ■無

技轉:□已技轉 □洽談中 ■無

其他:

(以 100 字為限)

曾於台灣政治學會年會發表第一稿,計畫執行後的論文二稿已完成,將於小幅修訂後於年 底前將第三稿投稿期刊。

(18)

3. 請依學術成就、技術創新、社會影響等方面,評估研究成果之學術或應用價

值(簡要敘述成果所代表之意義、價值、影響或進一步發展之可能性)(以

500 字為限)

學術成就 本研究屬於政治學方法論的範疇。由於純粹方法論的研究在政治學界相對較少,本研究發 表後期望激起回響,使得政治學統計方法的應用能朝更專業化的方向邁進。另外,就研究 主題而言,國內民意調查的研究往往是藉分析民調資料做為驗證理論的手段。本研究則純 粹從方法的角度探討民調品質,將充實民意調查這個領域的相關文獻。 技術創新 政治學界實證研究利用時間序列分析資料的並不多,而採用 Kalman Filter 技術的也屈指 可數。本研究另外導入貝式統計模型的方法,欲進一步推廣貝氏統計分析方法在台灣政治 學界的應用。最後,本研究所提出的統計方法勢必可以進一步應用在其它時間序列的分析 研究上。 社會影響 雖然媒體民調和一般學術性質的調查研究在方法與實務上有許多不同之處,但學術研究畢 竟有領頭的作用,期盼能對日後如何改善實務界調查方法有所貢獻。本研究主要探討的對 象是媒體調查實務所產生的偏誤。然而,本研究儘管發現各媒體民調可能偏誤的大小,但 並沒有確實指出為何發生偏誤。這是日後實務界應進一步反思的問題。

參考文獻

相關文件

微算機原理與應用 第6

台灣大選將於明年 1 月登場,屆時將舉行第十五任總統、副總統與第十屆立法委

在選擇合 適的策略 解決 數學問題 時,能與 別人溝通 、磋商及 作出 協調(例 如在解決 幾何問題 時在演繹 法或 分析法之 間進行選 擇,以及 與小組成 員商 討統計研

台灣大選將於明年 1 月登場,屆時將舉行第十五任總統、副總統與第十屆立法委

4.1 多因子變異數分析 多因子變異數分析 多因子變異數分析 多因子變異數分析與線性迴歸 與線性迴歸 與線性迴歸 與線性迴歸 4.1.1 統計軟體 統計軟體 統計軟體 統計軟體 SPSS 簡介 簡介

在軟體的使用方面,使用 Simulink 來進行。Simulink 是一種分析與模擬動態

住宅選擇模型一般較長應用 Probit 和多項 Logit 兩種模型來估計,其中以 後者最常被使用,因其理論完善且模型參數之估計較為簡便。不過,多項

則巢式 Logit 模型可簡化為多項 Logit 模型。在分析時,巢式 Logit 模型及 多項 Logit 模型皆可以分析多方案指標之聯合選擇,唯巢式 Logit