網路民意調查的理論與實務 - 解析台灣民眾的統獨偏好---從抽樣分配的假設出發

俞振華

政治大學選舉研究中心助理研究員暨政治學系助理教授摘要

過去數年來，網路在台灣的普及率快速增加，特別是寬頻網路的建制，

使得網路使用者更方便利用網路進行日常生活的溝通媒介及取得資訊的主要來源。根據資策會（2010）最新的調查數據顯示，過去七年來台灣家庭可上網率從 56.4％（2003）增加到 76.8％（2010），利用寬頻上網的比率也從 38.9％增加到 68.9％。換言之，在台灣已不再僅是少數人使用網路。和其它先進國家譬如美國相比，台灣的網路普及率不但不遑多讓，甚至更高。

既然網路普及率增加了，網路是否能一躍成為新的調查利器，全面取代電話成為市場或民意調查的主要工具及媒介？事實上，目前各式各樣的網路調查在我們生活周遭時常出現。但一般學術界對於網路調查的結果多半不會認真看待，因為網路調查多半以非機率樣本的方式選擇受訪者，所得出的結果無助於我們推論母體特徵，即難以克服「非源於觀察此一動作所產生的誤差」所造成的估計偏誤。

本文首先將從理論面探討網路民調所造成的偏誤為何，並介紹可透過何種途徑來校正網路調查結果。其次，本文將分析網路訪問及電話訪問所得資料的差異，從實務面檢討校正估計偏誤時可採取的步驟及方式。

關鍵字：網路民調；估計偏誤；數位落差；

壹、前言

社會科學的行為研究相當程度需要靠調查來獲取資料，進行分析。早期的研究往往以面對面訪問為主要的調查方式。但隨著電話普及率增高，電話訪問漸漸取代了面訪。美國自從 1970 年代開始，除了幾項大型的學術調查工作，譬如美國選舉研究（National Election Studies）及一般社會調查（General Social Survey）以外，大多數的學術及實務界（譬如媒體民調）的調查多半以電話訪問的方式執行。台灣的情形也相當類似，電話訪問業已成為調查的主要方式。¹

過去數年來，網路在台灣的普及率快速增加，特別是寬頻網路的建制，

使得網路使用者更方便利用網路進行日常生活的溝通媒介及取得資訊的主要來源。根據資策會（2010）最新的調查數據顯示，過去七年來台灣家庭可上網率從 56.4％（2003）增加到 76.8％（2010），利用寬頻上網的比率也從 38.9

％增加到 68.9％。換言之，在台灣已不再僅是少數人使用網路。和其它先進

國家譬如美國相比，台灣的網路普及率不但不遑多讓，甚至更高。²

數十年前由於電話普及率增加了，電話訪問於是取代了面對面訪問，成為市場及民意調查最主要的工具。現在既然網路普及率增加了，網路是否能一躍成為新的調查利器，全面取代電話成為市場或民意調查的主要工具及媒介？就目前為止，這個問題的答案顯然是否定的。儘管網路普及已成趨勢，

但使用者急遽地增加不代表所謂的「數位落差」（Digital divide）問題（Norris 2001）已被解決。不論在台灣還是在美國，網路的使用者仍然以特定地區（譬如經濟發展程度較高的都會區）的民眾，或是特定族群（譬如年輕、教育程度較高者）為主要對象（游清鑫等 2007；Nie and Erbing 2000）。另外，即便網路普及率增加，但民眾使用網路的方式及頻率可能較過去有更大的區隔，

譬如，較年輕的族群已將網路視為生活的一部分，非常熟悉利用網路與他人溝通並搜集各類資訊；而較年長的族群雖然或多或少亦開始利用網路收發電子郵件、瀏覽網站，但和前者相比，往往還是無法融入網路的環境當中。於是網路雖然普及了，但使用者之間對網路環境的熟悉度顯然存有更大的差異

（Dillman 2000）。不過，亦有研究顯示，網路普及率終究會使得網路使用人口的異質性逐漸增加，亦即網路使用者與非網路使用者之間的差異逐漸模糊

（Buchanan and Smith 1999; Hewson et al. 2003; Smith and Leigh 1997）。

1台灣現階段大多數的調查（特別是民意調查）皆採用電話訪問的方式。然而幾個大型的學術調查工作（譬如台灣社會變遷調查及台灣選舉與民主化調查等），因為問題較多，仍然採用面對面訪問。

2根據 2009 年美國的 Current Population Survey（CPS），美國家庭約有 69%具備網路聯結，另外約有 77%的美國民眾會在家裡或其它地點（譬如辦公室）上網。

雖然現階段網路調查還不是主流，但隨著數位時代的來臨，其未來性仍不可小覷。根據美國民意研究學會最新出爐的網路調查報告（Baker et al.

2010）引述一家調查公司的分析（Inside Research 2009）資料顯示，光是 2009 年美國調查相關產業投資在發展網路調查的金額即超過 20 億美金，金額之大前所未見。各公司願意投資在網路調查的主要原因還是看重於網路調查和傳統調查方式相比（即電話訪問及面對面訪問），其成本更低（或更確切地說，是邊際成本降低），效益更高，且調查時程（Turnaround time）更短

（Dommeyer and Moriarty 2000; Pitkow and Recker 1994; Tse 1998; Witte, Amoroso, and Howard 2000）

。但相對而言，由於現階段網路調查在技術面上

仍有很多面向需要克服，因此仍然需要蠻大量的研發資金投入，以期能克服許多網路調查的潛在問題，全面提昇網路調查的品質。

台灣在解嚴後的二十多年來，包括市場及民意調查的發展皆相當迅速。

除了許多學術機構紛紛成立調查研究中心以利相關實證研究之外，實務界的調查機構（譬如媒體、民調及市調公司等）更有如雨後春筍般成立。雖然調查實務上我們仍未見確切的規範性、標準化調查機制，但大致來說，各主要

（或已具有相當聲譽）的調查機構在面對面訪問或電話訪問的技術上已漸趨成熟及標準化，或至少認可某些標準化程序。在調查計畫執行的各個環節上，包括抽樣、調查執行、乃至於報告撰寫等，各主要調查機構基本上皆會採取某些標準化程序，以提高調查結果的信度（Validity）及效度（Reliability）。舉例來說，電話訪問輔助系統（Computer Assisted Telephone Interviewing:

CATI）現已成為各主要調查機構進行電話訪問必備的工具。總之，我們雖不諱言台灣整體的調查實務界仍存有很多面向需要改進並建立標準，但當相關專家學者在面對利用傳統調查工具所進行的調查研究時，至少還能判斷出甚

麼樣的調查程序是妥當的，甚至評估何種調查程序會造成何種估計偏誤。³

然而相對而言，我們對於新興的網路調查方式所知顯然仍相當有限。特別是網路新科技的發展日新月異，網路普及化亦同時帶動網路調查方式不斷推陳出新。但不論過去數年發展如何，學術界及實務界對於網路調查方式爭論的焦點還是在於：參與網路調查的對象究竟是誰？我們是否能夠利用網路調查所獲得的結果正確地推估母體特徵？畢竟大多數調查的目的是利用樣本資料推論母體特徵為何，倘若我們對樣本的估計值存有疑慮，或是樣本資料代表性失真，則我們勢必無法確切掌握母體的特質。

本研究將探討網路調查方式所造成的估計偏誤。主要的研究問題有以下兩個：首先，網路調查所造成的偏誤究竟有多嚴重？通常對網路調查最直接的批評即為，網路調查的樣本非來自隨機抽樣，因此網路調查的結果無法用

3 關於各種傳統調查方式的比較整理表，請參見洪永泰（2009），頁 101。

來推論母體特徵。然而，過去台灣並沒有系統性的探討究竟網路調查因樣本代表性不足所造成的偏誤為何。因此，這是本研究主要探討的第一個問題。

其次，在方法上，當我們確認因樣本代表性不足所造成的偏誤之後，我們應透過何種方式來校正網路調查結果？矯正此類偏誤的方式不外乎是在事前抽樣時即進行校正，或是事後採用各式加權處理。本研究的第二個探討主題即是如何採用不同的方式來調整網路調查結果的偏誤。

配合本研究欲探討的主題，本研究首要任務即為建置實驗性的網路民意調查系統。這項工作將奠基於研究者服務單位（政大選舉研究中心）過去發展網路民意調查的基礎上。另外，透過網路調查結果與傳統電話訪問結果進行各種比較，我們方能確認網路調查所造成的偏誤為何。另外透過建立龐大的網路使用者名單（On-line panel），我們可以進一步發展如何在抽樣階段或採用事後加權的方式調整網路調查的結果，期能利用調查結果準確推論母體特徵。

（二～2）文獻探討

學者依樣本建立是否採隨機的方式，將各式各樣的網路調查方式大致歸類為以下兩種類型（Couper 2000）：

一、非機率樣本（Non-probability sample）：

非機率的樣本強調受訪者的來源不具有代表性。這類型的調查大致包涵三種類型：（1）以娛樂為導向的網路調查（Web surveys as entertainment）。這類型的調查其實更像一個論壇，我們常見在媒體或入口網站有這樣類型的網路投票，其結果不是用來推論母體特徵，而只是讓參與者有個抒發已見的管道；（2）自我選擇的網路調查（Self-selected web surveys），調查的執行不限制受訪者的行為，只要受訪者有興趣，就可以上網多次填寫問卷。這類型的調查常常以旗標（Banner）或彈出視窗（Pop-up）的形式在各網站出現，瀏覽者自行點入聯結並填寫問卷；（3）網路使用者的自願參與名單（Volunteer panels of internet users），透過邀請的方式尋找網路使用者進入調查系統，並且透過電子郵件給予參與者密碼參與調查。許多網站（譬如媒體或求職網站）

透過其所建立的資料庫名單來邀請其會員參與調查，但因為名單的建立並非

在文檔中解析台灣民眾的統獨偏好---從抽樣分配的假設出發 (頁 70-85)