網路聲量與傳統民調之資料比對研究 -以2020台灣總統大選為例 - 政大學術集成
全文
(2) 謝辭 研究撰寫期間,距離從學校修課畢業轉眼五年時光過去,期間前指導教授劉 幼俐⽼師都已經去職政⼤,轉往⾹港學校任教,幼俐⽼師熱⼼託付政⼤傳院同事 陳憶寧⽼師,務必敦促我完成最後⼀關的論⽂作業,取得⽂憑。. 論⽂沒有寫完的壓⼒在⼼頭不斷縈繞,深怕辜負兩位教授的期待,期間⼀度 動筆,但在研究題⽬卡關的情形下⼜⼀再擱置,幸虧憶寧⽼師豐富指導經驗,在. 政 治 大. 經過幾次討論中,指引我⼀盞明燈。. 立. ‧ 國. 學. 在⼯作與寫作兩頭燒的情況下,論⽂進度緩慢,期間⾯臨結婚、⽣⼦,⼜得. ‧. 兼顧家庭的情況下,完成之⽇看似遙遙無期,但就在最後期限前,終究還是交出. sit. y. Nat. 了最終的研究結果。. n. al. er. io. 如果沒有陳憶寧教授不斷忍受學⽣的延宕愚魯,這個研究永無⾒天⽇的⼀天,. Ch. 陳⽼師是我⼈⽣中的貴⼈,這份論⽂要獻給她。. engchi. i Un. v. 由衷感謝 陳憶寧⽼師. DOI:10.6814/NCCU202100300.
(3) 摘要 2019 年臺灣民主進步黨黨內總統初選,⾸次在初選民調中加⼊⼿機加權,為 市話調查提供了另⼀種可能性。事實上從業界經驗與結果判讀,近幾年臺灣幾次 ⼤型的選舉預測,市話仍然能在選前就準確的預估選戰結果,然⽽調查⽅法與時 俱進,⼤數據探勘系統逐漸成熟,坊間民調公司幾乎都開始提供⼤數據服務,配 合市話調查,提供客⼾更多元的參考訊息。 早期民意調查多採市話調查的⽅式,趁著晚上民眾回家的時刻,撥打電話進. 政 治 大 ⾏訪問,隨著外租族與年輕⼈使⽤⾏動電話變成習慣,不裝市話的年輕家庭愈來 立. ‧ 國. 學. 愈多,⾃然被排除在市話調查樣本之外。從統計原理來說,只要樣本加權後對應. ‧. 母體,這些被排除的調查對象,其實並不影響市話調查的結果。這形成⼆派學說. sit. y. Nat. 的意⾒,傳統派主張根基於母體對應樣本之統計學理,市話調查仍具參考價值;. n. al. er. io. 另⼀派專家學者則認為,市話已經不⾜以涵蓋對應母體的⾜夠樣本。然⽽在⼆派. v. 意⾒相持下,並沒有實際的研究結果,⾜以⽀撐或證明任何⼀⽅的說法。. Ch. engchi. i Un. 市話加⼊⼿機加權後的雙重調查組合,和原本的市話調查有沒有差異性?是 否更為準確?和⼤數據探勘的網路聲量⽐較,能為政治候選⼈提供什麼樣的資訊? 從學術研究上來說,市話加⼊⼿機調查為近年來才開啟的新的民意調查⽅式,相 關的研究很少,也沒有太多實際的結論得以對照與驗證其結果為何?. DOI:10.6814/NCCU202100300.
(4) 本研究以臺灣 2020 年的總統⼤選結果做為⽐較基礎,探究上述三種調查⽅ 式的差異與特性,在接近半年的重覆調查中,截取各次調查中相同的對象(即總 統候選⼈蔡英⽂與韓國瑜)與相同的提問(⼆⼈⽀持度⽐對),做為⽐較基礎。 研究範圍包含 4 次傳統市話民調與 1 次市話加⼊⼿機加權調查,同時對⽐了網路 ⼤數據資料庫在調查同時期的聲量,對應實際的選舉結果後,發現市話加⼊⼿機 加權結果並沒有⽐傳統市話調查來得特別準確,無論是單獨看待蔡英⽂之得票結 果或是韓國瑜最終的得票結果,市話加⼊⼿機的調都沒有傳統市調或⼤數據資料. 政 治 大. 庫的聲量判讀來得有優勢,⼿機的使⽤族群加權是否過度矯正了樣本的對應性,. 立. 還需更多的研究,當然本研究僅就單⼀次的數據資料,可能包括了其它變項與誤. ‧ 國. 學. 差影響研究結果,還需要更多實質的研究來證明,做為⼀個開端,本研究期能為. ‧. 政治民意調查提供⼀個不⼀樣的觀點。. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 關鍵字:⼤數據、市話民調、政治傳播、網路聲量、輿情探勘. DOI:10.6814/NCCU202100300.
(5) Abstract In the rapidly changing information age. We must accept to the changes by the maturity of network communications and the explosion of information reception. Physical stores have become online shopping malls; Internet dial-up has become Wi-Fi, meetings Online; Line for chat, Netflix watching movies; Spotify listening to music, political communication and election investigations are no exception. Early public opinion surveys mostly adopted with home call. They dialed the phone to conduct interviews, when people go home in the evening. As young people use mobile phones to become a habit, more and more families do not use home call, and they are excluded from the sample in the room phone survey.. 政 治 大 In terms of statistical principles, 立 as long as the sample is weighted to correspond to the. population, these excluded survey subjects do not actually affect the results of the laboratory. ‧ 國. 學. survey.. ‧. In fact, several election predictions in Taiwan in recent years, home calls can still accurately predict the results of the election before the election. But eliminated without change.. y. Nat. sit. The big data system has improved, and almost all polling companies have begun to provide this. n. al. er. io. service with multiple reference information.. Ch. i Un. v. In the 2019 Taiwan Democratic Progressive Party’s inner-party presidential election, the. engchi. mobile phone survey was added to the primary polls for the first time, which provided another possibility for home call surveys. Is there any difference between this dual survey combination and the original surveys? Is it more accurate? Compared with the network volume by big data, what kind of information can be provided for political candidates? This study uses the results of Taiwan’s 2020 presidential election as a comparison base to explore the differences and characteristics of the above three survey methods, hoping to provide a different perspective for political opinion polls research.. Keywords: big data, city call polls, network volume, political communication, public opinion survey. DOI:10.6814/NCCU202100300.
(6) ⽬次 ⽬次…………………………………………………………………………………I 表次………………………………………………………………………………III 圖次…………………………………………………………………………………V 第⼀章 緒論 ………………………………………………………………………1 第⼀節 研究背景與動機 ………………………………………………………2. 政 治 大. 第⼆節 選舉調查⼯具演變 ……………………………………………………4. 立. 第三節 2020 年臺灣總統⼤選背景說明 ………………………………………5. ‧ 國. 學. 第四節 研究⽬的與問題 ………………………………………………………8. ‧. ………………………………………………………………9. y. Nat. al. n. 第⼆節 網路公共性. …………………………………………9. er. io. 第⼀節 政治傳播與選舉民意調查. sit. 第⼆章 ⽂獻探討. i Un. v. …………………………………………………………12. Ch. engchi. 第三節 選舉預測的多元⽅法 …………………………………………………17 第四節 ⼤數據在政治傳播應⽤案例 ………………………………………21 第五節 ⼩結 ……………………………………………………………………28 第三章 研究⽅法 …………………………………………………………………29 第⼀節 資料蒐集與分析⽅法 …………………………………………………29 第⼆節 市話民調調查⽅式 …………………………………………………31. I DOI:10.6814/NCCU202100300.
(7) 第三節 網路聲量資料庫設定 ………………………………………………34 第四章. 資料分析結果 …………………………………………………………43. 第⼀節. 市話民調與時間軸設定 ……………………………………………44. 第⼆節. 資料描述 ……………………………………………………………48. 第三節. 市話民調與網路⼤數據聲量之⽐較分析 …………………………62. 第四節. 市話加⼊⼿機加權調查 ……………………………………………74. 第五節. 市話加⼊⼿機加權調查與網路⼤數據聲量⽐較分析………………77. 第六節. 綜合討論:市話民調之有效性與多元選舉預測⽅法………………81. ‧ 國. 學. 第五章. 立. 政 治 大. 結論與建議 ………………………………………………………………85. ‧. 研究發現 ……………………………………………………………85. 第⼆節. 研究貢獻 ……………………………………………………………91. 第三節. 研究限制與建議 ……………………………………………………92. n. al. er. io. sit. y. Nat. 第⼀節. Ch. engchi. i Un. v. 參考⽂獻 …………………………………………………………………………97 附錄⼀、5 ⽉ 22 ⽇總統⼤選市話民調資料………………………………………102 附錄⼆、6 ⽉ 4-5 ⽇總統⼤選市話民調資料………………………………………114 附錄三、7 ⽉ 2-3 ⽇總統⼤選市話民調資料………………………………………119 附錄四、10 ⽉ 14-15 ⽇總統⼤選市話民調資料……………………………………125 附錄五、8 ⽉ 19-20 ⽇總統⼤選市話加⼊⼿機加權民調資料 ……………………129. II DOI:10.6814/NCCU202100300.
(8) 表次 表 2-4-1 歐巴⾺兩時期⼤數據應⽤的項⽬⽐較 …………………………………23 表 2-4-2 柯⽂哲競選⼤數據應⽤分析 ……………………………………………27 表 4-2-1 2019 年 5 ⽉ 22 ⽇總統選情評估市話調查結果 …………………………49 表4-2-2. 2020總統⼤選擬參選⼈⽀持度:蔡 V.S 韓. V.S 柯 ………………51. 表 4-2-3 2019 年 6 ⽉ 6 ⽇總統選情評估市話調查結果 ………………………52 表 4-2-4 2019 年 7 ⽉ 4 ⽇發佈總統選情評估市話調查結果 …………………54 表 4-2-5. 政 治 大 2019 年 10 ⽉ 16 ⽇發佈總統選情評估市話調查結果 …………………56 立. ‧ 國. 學. 表 4-2-6 2019 年 5 ⽉ 22 ⽇ 蔡英⽂與韓國瑜之網路⼤數據聲量表 ……………61 表 4-3-1 2019 年 5 ⽉ 22 ⽇總統選情評估市話調查結果 …………………………63. ‧. sit. y. Nat. 表 4-3-2 2019 年 5 ⽉ 22 ⽇ 總統候選⼈市話民調與網路正向聲量⽐較表………64. io. al. er. 表 4-3-3 2019 年 6 ⽉ 4-5 ⽇ 蔡英⽂與韓國瑜之網路⼤數據聲量表 ……………65. v. n. 表 4-3-4 2019 年 6 ⽉ 4-5 ⽇總統選情評估市話調查結果 ………………………66. Ch. engchi. i Un. 表 4-3-5 2019 年 6 ⽉ 4-5 ⽇ 總統候選⼈市話民調與網路正向聲量⽐較………67 表 4-3-6 2019 年 7 ⽉ 2-3 ⽇ 蔡英⽂與韓國瑜之網路⼤數據聲量表 ……………68 表 4-3-7 2019 年 7 ⽉ 2-3 ⽇總統選情評估市話調查結果 ………………………69 表 4-3-8 2019 年 7 ⽉ 2-3 ⽇ 總統候選⼈市話民調與網路正向聲量⽐較………70 表 4-3-9 2019 年 10 ⽉ 14-15 ⽇ 蔡英⽂與韓國瑜之網路⼤數據聲量表…………71 表 4-3-10 2019 年 10 ⽉ 14-15 ⽇總統選情評估市話調查結果 …………………72 表 4-3-11 2019 年 10 ⽉ 14-15 ⽇總統候選⼈市話民調與網路聲量表……………73. III DOI:10.6814/NCCU202100300.
(9) 表 4-4-1 2019 年 8 ⽉ 19-20 ⽇總統選情評估市話加⼊⼿機調查結果……………75 表 4-5-1 2019 年 8 ⽉ 19-20 ⽇ 蔡英⽂與韓國瑜網路⼤數據聲量表 ……………78 表 4-5-2 蔡英⽂與韓國瑜市話、⼿機加權與網路⼤數據聲量⽐較表……………79 表 4-5-3 室話調查與實際選舉得票率誤差⽐較表 ………………………………82. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. IV DOI:10.6814/NCCU202100300.
(10) 圖次 圖3-4-1. LOWI輿情監測系統主⾴⾯ ……………………………………………38. 圖3-4-2. LOWI輿情監測系統網路搜尋範圍設定 ………………………………39. 圖3-4-3. LOWI輿情監測系統搜尋時間範圍設定 ………………………………39. 圖3-4-4. LOWI輿情監測系統熱詞矩陣 …………………………………………40. 圖3-4-5. LOWI輿情監測系統關連聲量餅圖與直條圖 …………………………41. 圖3-4-6. 政 治 大 LOWI輿情監測系統聲量數據匯出Excel表格 …………………………42 立. ‧ 國. 學. 圖 4-2-1 2019 年 5 ⽉ 22 ⽇ 蔡英⽂網路聲量搜尋說明 …………………………58. ‧. 圖 4-2-2 2019 年 5 ⽉ 22 ⽇蔡英⽂網路聲量熱詞牆 ………………………………59. sit. y. Nat. 圖 4-2-3 2019 年 5 ⽉ 22 ⽇蔡英⽂網路⼤數據聲量視圖 …………………………59. n. al. er. io. 圖 4-2-4 2019 年 5 ⽉ 22 ⽇韓國瑜網路聲量熱詞牆 ………………………………60. Ch. i Un. v. 圖 4-2-5 2019 年 5 ⽉ 22 ⽇韓國瑜之網路⼤數據聲量 ……………………………60. engchi. V DOI:10.6814/NCCU202100300.
(11) 第⼀章. 緒論. 2019 年台灣總統⼤選,民進黨黨內初選⾸次在傳統民意調查過程中,加⼊了 ⼿機樣本,根基於統計學的傳統民意調查⼀向以家⼾市話為樣本,本次的民進黨 初選可以說是台灣民意調查史上,很重要的⼀個篇章,但是這個決定產⽣的結果, 迅速引發了正反兩派的意⾒,根據關鍵評論報導,今(29)⽇下午中執會以共 識決⽅式通過「⼿機市話各占 50%,納⼊柯⽂哲」並舉辦 1 場政⾒會,和賴. 政 治 大 陣營原本訴求不同,代表賴陣營的中執委林俊憲今(29)⽇依然表達不同意 立. ‧ 國. 學. ⾒並要求列⼊會議紀錄,不過最後中執會依然通過此結論(李秉芳、2019)。. ‧. 有⼈說納⼊⼿機樣本沒有前例,沒有經過驗證,可能影響初選結果,造成失. sit. y. Nat. 準,市話與⼿機加權的⽐例各⾃應該是多少,也沒有相關研究佐證,2017 年時. n. al. er. io. 張鐙⽂博⼠等學者提出⼀個基本結論:在顧及樣本代表性與預測有效性,市. Ch. i Un. v. 話搭配⼿機樣本中的純⼿機族,應該是最經濟⼜有效的⽅法。⽽進⼀步的問. engchi. 題則是這兩種樣本各⾃的⽐例應該是多少?曾憲⽴教授等⼈曾估計出 2015 年的純⼿機族約 29.2%,2016 年則是 26.8%。(林啟耀,2019) 按照上述⽐ 例,25~30%的⼿機加權樣本,是否就是合理的配⽐⽅式?另外⼿機民調跟 家⽤電話民調的受訪者的背景差距多⼤?假如真的背景有差距,是否會造 成政治上的影響?例如不同年齡層投票率也不同,是否會影響調查結果(王 宏恩,2019)?. 1. DOI:10.6814/NCCU202100300.
(12) 同意市話加⼊⼿機加權調查⽅式專家學者指出,台灣⼈尤其中年輕族群使⽤ ⼿機⽐例極⾼,同時也對傳統民調使⽤市話週查的⽅式,失去信⼼,到底傳統民 調在⾏動電話的時代是否失去了準確預測的價值?本研究擬針對 2020 台灣總統 ⼤選做出的多次民意調查結果,取出總統候選⼈之調查⽀持度百分⽐,對應⼤數 據資料庫的網路聲量,⽐對其結果異同,亦針對⼆個調查⽅式之數據與實際的投 票結果進⾏⽐對,試圖瞭解不同⼯具的準確性,及其帶來的影響。. 第⼀節 研究背景與動機. 學. ‧ 國. 立. 政 治 大. ‧. 近⼗年,基於網路快速發展,搜尋與搜集訊息,變成⼀種再容易不過的事情,. sit. y. Nat. 以前如果想要知道任何訊息、獲取正確的資訊與知識,我們可能要到圖書館,參. n. al. er. io. 閱許多書籍或請益相關專業⼈⼠,現在打開電腦上網輸⼊關鍵字,相關的所有資. i Un. v. 訊在短短的幾秒內出現,Google 做為搜尋引擎的美國企業⿓頭,從原本企業的名. Ch. engchi. 稱變成了搜尋動詞,資訊巨量、搜尋巨量,讓網路上主要的⼊⼝網站或⼤型網路 企業,可以透過搜尋的動作獲取所有訊息進⾏歸類與分析,甚⾄進⾏商業消費的 判斷依據,⼤數據或稱作巨量資訊(Big Data)成為顯學,⼤家試圖在茫茫的巨 量資料裡發掘有⽤的資訊與情報,掌握的精準訊息愈多,⼒量就愈⼤。許多⼤數 據分析⼯具應運⽽⽣,透過資料挖掘(Data Mining)的過程,可以瞭解網路上網 民們對事件的評價,哪些⼈引起關注?哪些事件被許多⼈討論?哪些物品是⼤家 有興趣的?應⽤⼤數據分析⼯具,都能夠清楚的看到聲量的變化。. 2. DOI:10.6814/NCCU202100300.
(13) 傳統市話民調近年來最常遇到的問題就是,當網路上開設普查變得很容易, 當⼤數據資料庫⼀次可以搜尋上萬筆的資訊做聲量分析,民意調查⼀千多份的樣 本的規模相較於數萬筆且迅速⼜便宜取得的資訊,是否還有信度與效度,當⼆個 ⼯具呈現出不同的調查結果時,我們是否還要相信那⼀千多筆的樣本所反應出的 結果。. 民意調查為基於統計學的學科,主要在於運⽤「科學⽅法」來「描述」、「解 釋」,以及「預測」事件。作為統計學所能達成的最後⼀項⽬的,「預測」在⽬. 政 治 大 前仍是任何奠基於統計學之學科最困難的部分,但同時也是所有的⾃然與⼈⽂社 立. ‧ 國. 學. 會科學最想達成的⽬標與克服的挑戰。其中「選舉預測」不但能夠⼀定時間內得. ‧. 知正確的結果,且也能在結果揭曉後去驗證其預測準確度及模型是否恰當。因此. sit. y. Nat. 本研究所欲探討的其中⼀個主題,即透過臺灣 2020 總統⼤選的結果,⽤傳統市. er. io. 話民調與網路聲量選前的預測,來⽐對選舉結果看其差異。. al. n. iv n C 另⼀個市話民調⾯臨的挑戰,同樣與科技發展有關,智慧型⼿機的普及與通 hengchi U 訊品質和速度的提升,讓⼿機不再是⼿機,成為了每個⼈隨⾝的⼩電腦,通訊軟 體取代了電話的功能,市話的重要性迅速降低,許多⼈甚⾄在家中取消了市話裝 置,對於依賴市話做為溝通⼯具的傳統民意調查,是否會因為這個變化失去原本 的精準度。2019 年臺灣在選舉調查中⾸次採⽤了市話加⼊⼿機加權後的民意調 查⽅式,運⽤於臺灣民主進步黨的黨內初選,但是市話調查加⼊⼿機後是否會⽐ 原本的市話調查準確?和網路⼤數據的聲量⼜有何差異?透過已知的 2020 臺灣 總統⼤選結果做⽐對,成為本研究的另⼀個重點。. 3. DOI:10.6814/NCCU202100300.
(14) 第⼆節 選舉調查⼯具演變 傳統「選舉預測」常⾒的⽅法有民意調查,以及專家座談及出⼝民調(⼜稱 票站調查)。民意調查是⼀種了解公眾對某些政治、經濟、社會問題的意⾒和態 度的調查⽅法,其⽬的在於通過對⼤量樣本的問卷調查,較為客觀、精確地反映 社會輿論或民意動向。臺灣選舉⼀向很依賴市話調查的結果,候選⼈會在決定參 選前透過民意調查瞭解⾃⼰與競爭對⼿的⽀持度、選民的結構以及中間選民的動. 政 治 大. 態,來決定是否參選,從宣佈參選到實際投票前,還會透過多次的調查了解競選. 立. 態勢,做為競選總部競選政策的發佈、選戰策略的調整,甚⾄做為危機處理或打. ‧ 國. 學. 擊對⼿痛點的參考資訊。. ‧. 隨著網路時代發展,新的選舉預測⽅式也⼀直推陳出新。「網路⼝碑,才是. y. Nat. er. io. sit. 真正的⼒量」,在政治傳播媒介中,隨著網路科技的進步,各類型社會團體紛紛 將關注焦點投射到網路媒介,試圖運⽤其優勢聯繫和動員群眾,引導群眾參與集. n. al. Ch. engchi. i Un. v. 體⾏動,並透過網路為傳播管道,宣傳活動理念,建⽴共識,並且將事件不同⾓ 度的報導內容傳播出去,以爭取更廣⼤的閱聽⼈注意(周芊、康⼒平,2014)。 在過去的世界裡,你的⼝碑會決定你交談的對象,以及他們會和你⼀起做或 為你做的事。現在,⼝碑的⼒量⽐任何時期都要強⼤。你的⼝碑將會無所不在、 永久保留,⽽且,不管你喜不喜歡,在全球各地都可以取得。無論你到哪裡,不 論 你 是 否 知 情 或 同 意 , 其 他 ⼈ 都 能 ⽴ 刻 取 得 你 個 ⼈ ⼝ 碑 的 資 訊 ( Fertik & Thompson , 林麗雪譯,2015:18-22)。. 4. DOI:10.6814/NCCU202100300.
(15) 台灣政治⼈物開始注意網路⼝碑,留意社群媒體的政治⾏銷使⽤,以及運⽤ ⼤數據資料庫截取網路聲量來預測與控制⾃⼰的⾏為和語⾔,然⽽網路聲量所反 應出的數據是否真的準確?在政治領域的運⽤上,是否真的具有參考價值? 在此前提下,本研究擬透過探討 2020 年台灣總統⼤選的民調與網路聲量之 關聯性,以選前預測結果和選後的得票率做⽐對,了解哪⼀種調查⽅式,更能夠 精準預測選舉結果,以此做為主要的研究動機。. 立. 政 治 大. ‧ 國. 學. 第三節 2020 年臺灣總統⼤選背景說明. ‧. 2020 年總統⼤選,由台灣民主進步黨候選⼈,爭取連任的蔡英⽂與與中國國. al. er. io. sit. y. Nat. 民黨候選⼈韓國瑜兩強相爭,最後由蔡英⽂取得勝利,順利連任。. n. 但是回顧選前態勢,當時韓國瑜因為在 2018 年的縣市⾧選舉中,從⼀介沒. Ch. engchi. i Un. v. 有⼈在乎的平民,逐步造勢,竟然逐漸翻轉選情,最終贏得⾼雄市⾧的選舉,瞬 間成為國民黨的救世共主,要知道南台灣向來是台灣民主進步黨的⼤本營,從 1998 年民進黨謝⾧廷擔任⾼雄市⾧開始,到後來的葉菊蘭、陳菊,⾧達 20 年的 時間,都是由民進黨在⾼雄當家。從國民黨的⾓度來看,收復⾼雄為⼀項難度極 ⾼,⼜極為渴求的任務,2018 年縣市⾧選舉前,國民黨當時的聲勢已經跌⼊⾕底。 民進黨與對岸中國保持距離,強調台灣主權的政策,符合多數台灣年輕⼈的民主 基本價值;國民黨向中國靠攏,經濟上的表現卻積弱不振的狀況下,在台灣政壇. 5. DOI:10.6814/NCCU202100300.
(16) 的影響⼒,逐步被民進黨鯨吞蠶⾷。在退無可退的情況下,⾼雄市⾧的⾓逐被視 為以卵擊⽯,韓國瑜在沒⼈看好的情況下,被國民黨推上前線,沒想到在沒有包 袱的情況下,⼀路過關斬將,竟然翻轉選情,當時所有媒體展開另類的造神運動, 台灣政壇刮起⼀陣韓流⾵潮,韓國瑜瞬間成為中國國民黨載浮⽔中要抓任的⼀根 稻草,成為國民黨的救世主。. 來到 2020 年的總統選舉,相較於民進黨黨內初選的內部態勢,國民黨裡⾯ 顯得更為詭局。. 立. 政 治 大. 民進黨黨內初選,由聲勢最⾼的 2 ⼈,尋求連任的蔡英⽂與被民眾稱為賴神. ‧ 國. 學. 的賴清德競選⾓逐,蔡英⽂挾著執政優勢,在民進黨黨內初選民調雙⽅協調的過. ‧. 程中,設定了某些優勢,從民意調查的⾓度來看,⼀旦賴清德同意這些初選調查. y. Nat. io. sit. 的條件,就已經注定了初選調查的結果,當時民進黨選擇了 5 家民意調查機構,. er. 做為民進黨初選的調查單位,最後 5 家公司做出來的調查結果數字極為雷同,媒. al. n. iv n C 體對結果產⽣懷疑。事實上民進黨初選的民調條件是由雙⽅會前討論議定的,初 hengchi U 選調查也是以民進黨黨員名冊做為樣本,由民進黨內部提供,在雙⽅候選⼈最終 同意的情況下進⾏調查,所以當然會產⽣ 5 家調查公司數字相近的結果,但初選 民調前進⾏調查的議訂協商,原本就是政治⾓⼒的⼀個環節。最終蔡英⽂在沒有 意外的情況下,順利贏得初選,代表民進黨⾓逐 2020 台灣總統⼤選。. 選前中國國民黨內的情勢極為複雜,在 2018 年縣市⾧選舉前,國民黨政壇 聲勢急墜,沒想到台灣民眾基於⼆黨制衡的前提下,在 2018 年縣市⾧選舉中,. 6. DOI:10.6814/NCCU202100300.
(17) 再給了國民黨⼀次機會,其中⼜以韓國瑜在⾼雄完成不可能的勝選,讓國民黨內 部情緒⾼昂,重新看到⼀絲希望,國民黨內部⾼層開始做起了總統⼤夢,當時國 民黨內包括想要競選卻遲未表態的黨主席吳敦義、前黨主席朱⽴倫,前⽴法院⾧ 王⾦平、民間聲勢極⾼的商⼈郭台銘,以及代表國民黨競選,成功收復⾼雄聲勢 當頭的市⾧韓國渝等,都有競選總統的野⼼,2018 年年底朱⽴倫宣佈再度參選總 統,2019 年 1 ⽉,台灣⼤學政治系教授張亞中宣佈參選,接著 2 ⽉份國民黨副主 席周錫瑋、王⾦平接連宣佈參選,4 ⽉份商界強⼈郭台銘也表達參選意願,2019. 政 治 大. 年 5 ⽉ 15 ⽇,國民黨中常會通過第⼗五任總統副總統選舉總統候選⼈提名特別. 立. 辦法、中央提名協調⼩組成員、提名作業時程暨作業要點等三案。初選全民調將. ‧ 國. 學. 委託 5 家民意調查機構執⾏,每家有效樣本數不得少於 3000 份,並以中華電信. ‧. 住宅電話隨機抽樣。. sit. y. Nat. n. al. er. io. 由於王⾦平評估國民黨初選民調機制對⾃⼰不利,退出國民黨初選,2019 年. i Un. v. 6 ⽉份韓國瑜正式宣佈加⼊國民黨初選,⾓逐總統⼤位,最終國民黨初選由朱⽴. Ch. engchi. 倫、周錫瑋、張亞中、郭台銘與韓國瑜,計 5 ⼈參與⾓逐。最終結果不意外,由 當時聲勢正旺引發政壇韓流的韓國瑜,以 44.8%⼤贏郭台銘 17 個百分點的超⼤ 勝幅,贏得國民黨⾓逐總統⼤選的機會。. 7. DOI:10.6814/NCCU202100300.
(18) 第四節 研究⽬的與問題 社群媒體當道,網路作為傳播的主要渠道,加速了傳統政治傳播理論所說的 「傳播速度」。同時也因為網路參與的限制逐年降低(從每⼾撥接上網到現在⼈ ⼿⼀機),以往運⽤傳統民調擬定策略的候選⼈,開始組織社群經營團隊,運⽤ 網路年輕化的特性,塑造⾃⼰與年輕⼈站在⼀起的形象,更有甚者組織網軍團隊, 在網路同溫層中帶⾵向,創造對⾃⼰有利的議題或觀點,營造主流意⾒氛圍與⼈. 政 治 大. 氣⾼漲的勝選氣氛,網路聲量成為候選⼈不得不關注的競選議題。. 立. ‧ 國. 學. ⽬前臺灣政治選舉,候選⼈並未捨棄市話民調顯⽰出的調查結果,但是部份 候選⼈也開始要求調查公司除市話調查外,提供網路聲量的⼤數據調查,獲取更. ‧. sit. y. Nat. 多對候選⼈的有效訊息。然⽽網路聲量的帶動,實際上與各⽅利害關係⼈透過議. io. al. er. 題設定進⾏網路⾏銷有關。但因為網路聲量有其「數量多」的特徵,也因為網路. v. n. 本⾝代有的「公共性」,導引了網路聲量本⾝「質」的變動,與「量」的可觀性,. Ch. engchi. i Un. 仍具備分析的價值。這份研究所要探討的是,當社群媒體訊息不完整或被操作的 情況下所獲得的網路⼤數據聲量對應市話民調的結果,試圖分析新與舊的途徑, 到達的⽬的地是否相同。據此,詳細研究⽬的如下:. ⼀、 傳統市話民調、⼿機加權民調以及網路聲量調查,三者結果之交叉⽐ 對,並試圖進⾏分析。. ⼆、以臺灣2020總統⼤選之實際結果,做為上述三種調查之⽐較基準。. 8. DOI:10.6814/NCCU202100300.
(19) 第⼆章. ⽂獻探討. 本研究以2020台灣總統⼤選為研究案例,探討傳統民調與網路⼤數據聲量對 ⽐選舉結果的的關連性。在⽂獻探討的部份透過政治傳播理論,試著解釋傳統民 意調查扮演的⾓⾊,接著從網路傳播與網路公共的特性分析⼤數據資料的限制與 優點,以及⼤數據在政治傳播實際上的運⽤案例,以及透過市話調查與⼤數據聲 量來解釋舉預測的多元⽅法。. 立. 政 治 大. ‧ 國. 學. 第⼀節 政治傳播與選舉民意調查. ‧ er. io. sit. y. Nat. 壹、界定政治傳播. 政治傳播是⼀種溝通的過程:Craig A. Smith (1990) 指出「透過談判協商過. n. al. Ch. engchi. i Un. v. 程,政治與傳播是⼈類社會⽣活最基本的活動,前者涉及到權威性的價值分配, 後者關係到符號與訊息的交換。」民主制度的成熟,使政治成為競賽的過程,在 臺灣,威權與獨裁式的政治形式被民主聲浪改變,從政者成為⼈民公僕,政策影 響⼈民好惡,成為是否繼續掌握政治資源的關鍵,選舉制度讓政治跨⼊政治⾏銷 的領域,Brian McNair( 1997) 提到「關於政治有⽬的之傳播,包括政治⼈物和政 治⾏為者達到特定⽬的所採取的各種形式的傳播;選民和專欄作家等⾮政治⼈物 所做的傳播;媒體有關政治⼈物及活動的報導、評論等的傳播。」換⾔之,從政. 9. DOI:10.6814/NCCU202100300.
(20) 者為了形塑政治形象和選民認同,除了政治表現,也必需運⽤傳播體系來達到宣 傳的⽬的。. 貳、民意調查 民意調查最早是街頭調查型式,始於1824年美國總統選舉,當時《哈⾥斯堡 賓州⼈報》〈Harisburg Pennsylvanian〉在街上隨機詢問路⼈,會投給哪⼀位美國. 政 治 大 總統候選⼈?經過統計後,成為「預⽰未來⼤勢的⼩事」(a straw in the wind) 立. ‧ 國. ‧. 彥,2013). 學. 之理論,亦即「模擬民調」(Straw Polls)的濫觴,⽤來預知選舉結果。(陳義. Nat. io. sit. y. 民意調查真正進⼊科學⽅式分析(scientific polling)是1936年,當時蓋洛普. er. (George H. Gallup)成⽴「美國民意調查所」(The American Institute of Public. al. n. iv n C Opinion),這是第⼀個獨⽴於媒體之外的專業性民調組織。(陳義彥,2013), hengchi U 也於當年預測了總統⼤選的結果,蓋洛普公司預測羅斯福總統勝選,基於統計學 中的「隨機抽樣理論」(Random Sampling Theory),著重樣本的代表性要能回 推母體,即整個調查範圍⼈的實際組成狀況,即使在⼩樣本的狀況下,也可反應 全體選民的意⾒分布,同時估算出誤差範圍。. 10. DOI:10.6814/NCCU202100300.
(21) ⼀直到現在台灣⾏之有年的市話調查,仍然根基於「科學民調」(scientific polling ),透過數學與統計學的科學⽅式進⾏調查,在最符合調查經費與精準度 的前提下,以百分之五的抽樣誤差範圍,呈現最終的調查結果。. 近年由於智慧⾏動通訊裝置普及,隨⾝的⾏動電話已經不再只是通訊功能, 更像是⼩型隨⾝電腦,協助⼈們處理⽣活中的⼤⼩事,民眾對⼿機的依附程度愈 來愈⾼,停⽤或不接聽市話的⽐例也逐年攀升,質疑傳統市話民調是否還具代表 性與準確度的聲浪沒有停息。越來越多民意調查加⼊市話樣本,到底加⼊⼿機樣. 政 治 大 本加權後的調查,其準確度與傳統市話調查⽐較有何差異性,也促成本研究的動 立 ‧. ‧ 國. 學. 機。. y. Nat. n. er. io. al. sit. 參、民意調查在選舉中的⾓⾊. Ch. i Un. v. 隨著網路科技的進步,各類型政治或社會團體紛紛將關注焦點投射到網路媒. engchi. 介,試圖運⽤其優勢聯繫和動員群眾,引導群眾參與集體⾏動,並透過網路為傳 播管道,宣傳活動理念,建⽴共識,並且將事件不同⾓度的報導內容傳播出去, 以爭取更廣⼤的閱聽⼈注意(周芊、康⼒平,2014)。民眾使⽤社群媒介已然成 為國內網路服務的主流趨勢,並隨著網路社群的興盛及⾏動裝置的普及,打破⼈ 們以往在地域及時間上的限制,使得⼈與⼈之間的互動更加活躍,進⽽帶動⼈們 對網路社群服務的需求⽇益增加。. 11. DOI:10.6814/NCCU202100300.
(22) ⽽民意調查或⼤數據聲量結果,即是⼀種最有效的政治傳播宣傳⼯具,⼀般 選民傾向⽀持可能當選的候選⼈,以彰顯代表⾃⼰選票的價值,領先的⽀持度與 聲量,正好形塑這樣的意⾒氛圍,⼀⽅⾯鞏固⽀持者避免跑票,另⼀⽅⾯也接收 游移中間選民的⽀持。. 第⼆節 網路公共性. 立. 壹、網路特性探討. 政 治 大. ‧ 國. 學. 當傳統⼤眾傳播媒介,被認為因為廣告公關、商業化、與政治⼒量的⼲預,. ‧. 使得民意無法⾃由的表達之餘。網路新興媒體的出現,開啟了另⼀個研究取向,. Nat. sit. y. 由於網際網路的特性,具有「即時性」、「主動參與性」、「互動性」、「超越. er. io. 時空性」、「匿名性」等特殊特性,不同於傳統媒介的特質,不少研究者提出,. n. al. ni Ch 網路是⼀種新型理想的公共領域(⽅惠宗,2006)。 U engchi. v. Andrew Chadwick ( 2006 ) 在 「 Internet Politics: State, Citizens, and New Communication Technologies」檢視了網際網路對於公民政治參與以及國家治理的 影響,包括了政黨動員、選舉參與、利益團體、社會運動、民主⼩選區制度、官 僚體制與全球治理等⾯向。Chadwick 對於網絡的政治效能給予正⾯積極肯定, 不過對於網絡匿名、偏鋒、造謠與激化等隱藏在虛擬實境,不時動搖現實世界的 許多問題,也提出他的看法。他指出,透過網際網路的網絡動員可以增加組織動. 12. DOI:10.6814/NCCU202100300.
(23) 員的彈性,即網際網路和新媒體所並聯的結構管道,在政治團體組織傳播中的機 制效能。因⽽⼤數據在資料探勘過程中是否注意這些現象,留意網絡匿名、偏鋒、 造謠與激化等隱藏在虛擬實境等問題,⾄為重要(Chadwick, 2006;轉引⾃何溢 誠,2014)。網路⼤數據聲量呈現出政治⼈物的動員與整合能⼒,但是聲量呈現 出的真實成份有多少?是否能真實反應出政治⼈物與選民之間的⽀持度與連結 關係。. 資訊時代的公共領域以網路為媒介,網路空間的特徵充分保證了參與者的匿. 政 治 大 名權,分散在世界各地的線民可以完全⾃主的選擇並決定⾃⼰以何種⽅式、⾝份 立. ‧ 國. 學. 甚⾄容顏加⼊或退出哪些討論組。因⽽在網際論壇中,膚⾊、種族、國籍、年齡. ‧. 和性別等先賦性的個⼈資訊就被完全的遮罩,消除既定社會中既有的偏⾒和歧視,. io. sit. y. Nat. 提供了更為理想的論辯環境,從⽽有助於「辯論共識」的達成(許英,2003)。. er. 然⽽,針對網際網路與不同概念的公共領域之間的關係,學者提出關於「功. al. n. iv n C 能性」探討的議題(Papacharissi, 2002) h e n。即網際網路具有形成公共領域、或是協 gchi U 助⼀個公共領域的功能,但是這並不是保證⼀定會產⽣⼀個公共領域的結果。. 相對的討論,同時也適⽤於網路上的社會實踐⾯向。由於網路參與者透過其 對某⼀特定議題的投⼊與經營,建⽴具⽬的性、對話性的討論群體,在這個程序 中,它們衝擊到舊有的社群連帶觀點。經由在網上直接的、商議的實踐對話,它 們建⽴的其實不只是⼀個虛擬的社群,⽽是真實⽽多元的討論社群,可稱之為「多 元的論述社群」,進⽽發展出當代直接民主意義之「多元論述的公共領域」。. 13. DOI:10.6814/NCCU202100300.
(24) Wilhelm(1997: 519-664)提出,虛擬政治公共領域的特徵如下:(1)地理 (Topography)空間:提供⼈們聚集以討論議題,形成意⾒和規劃⾏動的位置, 在其中藉由網路的匿名特性,讓網民可以平等⾃由參與公共論壇的機會;(2) 議題性(Topicality):強調對話的內容是主題與討論的內容;(3)涵蓋性 (Comprehensiveness):民眾⾜以議論(deliberate)政策議題機會的概念,實踐 公民參與機會;(4)設計性(Designability):透過促進與禁⽌討論的網絡建構, 使得網路的最終使⽤者,可成為資訊的⽣產者;(5)商議性(Deliberation):透. 政 治 大. 過網路的互動性機制,使得個⼈可以對公共議題產⽣辯論與對話。. 立. ‧ 國. 學. 此外,網際網路的出現,使得傳統社會運動也產⽣變化,Melucci(2012)指. ‧. 出,社會運動不再需要反映⼀個社會團體利益的集體⾏動,⽽是轉向更需要個⼈. sit. y. Nat. ⾝分和具有意義的⽂化資訊。因此,Melucci 提出「表意政治」 (identity politics) ,. er. io. 來解釋網路空間中的私⼈與公共性的使⽤(Melucci, 2012: 22)。. al. n. iv n C 線上公共領域提供了更理想的論辯情境,成為多元論述的公共領域,表現在 hengchi U 網際公共領域的參與者之間的論辯,被認為表現為理性的「思想交鋒」。⽽在社 會民主實踐上,網路具備地理空間、議題性、涵蓋性、設計性與商議性,透過網 路的互動性機制,使得個⼈可以對公共議題產⽣辯論與對話,呈現表意政治,突 顯「公共性」的實踐。. 14. DOI:10.6814/NCCU202100300.
(25) 貳、⼤數據在政治傳播應⽤1 ⼤數據⼀詞,近年來廣泛被討論,應⽤上觸及各領域,不再侷限於 IT 產業 ⾄政府公部⾨領域,逐漸開始重視鉅量資料的應⽤技術(⾦瑞,2015;王豐勝、 ⿈彥⽂,2013),政治傳播領域上,我們也無法容忽視網路社會動員帶來的影響, 在個⼈⾏動裝置的普及與便利優勢之下,藉由網路動員的新世代社會運動,必須 透過綿密的網絡運作,以及源源不斷進⼊的巨量資訊,將「感動⼈⼼」的訊息對. 政 治 大. 外傳佈,如此才能吸引廣⼤閱聽⼈的矚⽬,成功聚集強⼤社會運動能量,進⽽爭. 立. 取認同(周芊、康⼒平,2014)。. ‧ 國. 學. 然⽽,當⼤數據應⽤於政治傳播領域時,如何可以清楚了解到選民的態度?. ‧. 2012 年的美國總統⼤選。歐巴⾺的⼤數據分析團隊利⽤演算法分析與建⽴模型,. y. Nat. er. io. sit. 將選民分成多種不同屬性的族群,以了解每⼀類⼈群和每⼀個地區選民在任何時 刻的態度,準確預測出在各州勝出的可能性。透過⼤數據分析,在美國總統投票. n. al. Ch. engchi. i Un. v. 結果出爐前,即掌握歐巴⾺在哪些州會勝出,連任美國總統(⿈薇如,2014)。. 1. 轉引⾃劉幼琍編著,吳世豪、陳昱旗 (2016)。⼤數據與未來傳播,台北:五南圖書。185-. 186. 15. DOI:10.6814/NCCU202100300.
(26) 因此,應⽤於網路社群預測選舉選民議題關注與投票意向趨勢,進⽽提供候 選⼈在議題設定(agenda setting)2上,符合⼤多數民眾⼼中的期待,真正獲取最 終選票上的⽀持(Aragón et al., 2013)。. 綜合以上所述,⼤數據技術應⽤於政治傳播的選戰策略中,增加對候選⼈的 ⽀持率,來⾃於清楚掌握其資料屬性,以及明⽩資料探勘與萃取過程的侷限。成 功的⼤數據運⽤,帶來的效應為準確有效反應社群⾵向的趨勢,進⽽有效迅速回 應選民所期待議題,讓候選⼈與選民產⽣良好雙向互動,有效提升其⽀持率;缺. 政 治 大 乏即時掌握民意趨向的動能與警覺性,可能讓不當的發⾔與活動,成為選票流失 立 ‧. ‧ 國. 學. 的重要關鍵因素。. n. er. io. sit. y. Nat. al. 2. Ch. engchi. i Un. v. 議題設定理論的核⼼觀點在於議題顯著性的轉移(transfer of salience),多數議題設定相. 關研究在於探討媒體報導中的議題顯著性是否會與民眾所認知的議題顯著性有關(陳憶寧,2003) 。 理論創始⼈ Mccombs 將前者(what to think)稱為第⼀層級的議題設定理論(the first level of agenda setting ) , ⽽ 把 後 者 稱 為 第 ⼆ 層 級 的 議 題 設 定 理 論 ( McCombs & Shaw1972; McCombs,1995;McCombs, 1997)。. 16. DOI:10.6814/NCCU202100300.
(27) 第三節 選舉預測的多元⽅法 壹、傳統民調的問題與多元解決管道 民眾對公共政策意⾒的表達,是民主社會政府在公共政策制定過程重要的⼀ 環。近幾年⼿機與通訊軟體(如Skype、Line、WeChat)的普及,⼈們聯繫⽅式 逐漸改變,進⽽影響民眾參與政治與溝通表達的管道與習慣(Khan et al. 2014; Tufekci and Freelon 2013),現⾏的台灣社會,許多民眾回家時間不固定,尤其是. 政 治 大. 求學以及在外就業的年輕族群,許多⼈只使⽤智慧型⼿機沒有申請家⼾電話,成. 立. 為⼀般市話民意調查接觸不到的族群。. ‧ 國. 學. 學者指出,台灣的電話調查⼀向有嚴重的涵蓋率問題,市話號碼為抽樣底冊. ‧. 的電話調查涵蓋率⽇益縮⼩(洪永泰,2014;許勝懋,2015);從「台灣社會變. y. Nat. al. er. io. sit. 遷基本調查計畫」2010 與2015 調查結果來看,沒有家⽤電話號碼者從8.0% 提⾼. n. 到18.8%(章英華,2016;傅仰⽌,2016),受「唯⼿機族」因素影響⽽帶來的估. Ch. engchi. i Un. v. 計偏差為0.93%,可知已對調查結果產⽣⼀定的偏差,且影響⼒正持續提⾼(許 勝懋,2015)。除了唯⼿機族群的攀升,另⼀項威脅在於回應率(response rate), 不僅⽌臺灣,民意調查源起的美國,根據 The Pew Research Centre(2012)調查, 美國公共政策的家⼾電話調查回應率降為9%,換句話說10位受訪者中,只有不到 1位能成功受訪,訪問失敗的問題,增加了市話調查難度,市話調查成效受到嚴 重考驗。. 17. DOI:10.6814/NCCU202100300.
(28) 電腦輔助訪問系統的誕⽣並無法全然取代紙筆訪談所帶來的價值,如今蓬勃 的網路調查也無法完全取代電話訪問或⾯訪,正由於沒有任何⼀種研究⽅法可以 解決所有的研究問題,在可預⾒的未來,多種調查⽅式的混合使⽤仍將是⼀種趨 勢(Couper,2011)。. 貳、市話加⼊⼿機加權調查. 治 政 大 2020年總統⼤選前的2019年4⽉份,臺灣民主進步黨在總統候選⼈黨內初選 立 ‧ 國. 學. 民調中,⾸次加⼊了⼿機加權調查,這是臺灣第⼀次在全國性的重⼤議題上,改. 變了傳統市話調查的抽樣⽅式,⼀般⽽⾔,住宅電話受訪者年齡層較⾼(60 歲. ‧. 以上受訪者占20%以上);和住宅電話相較,⼿機調查⽐較容易接觸到男性受訪. y. Nat. er. io. sit. 者;⽽網路接觸對象多為40 歲以下,⼤專以上學歷受訪者,但不易吸引⾼年齡 者。(曾憲⽴,2018),多數學者認為,隨著使⽤⼿機的民眾⽐例逐年上升,單. n. al. Ch. engchi. i Un. v. 以電話調查結果做為民調結果的偏頗將越來越⼤,運⽤不同⽅式所蒐集的資料分 析後發現,所接觸到的樣本,不論是性別、年齡、教育程度都分別有⾼估或低估 的現象。因此,以市話民調加⼊⼊⼿機電話抽樣與加權雙底冊的調查⽅式,調整 民意蒐集⽅式。. 18. DOI:10.6814/NCCU202100300.
(29) 參、網路⼤數據聲量. 1930年代,有⼈開始對報紙內容進⾏研究,逐漸發展成了重要的研究⽅法之 ⼀,稱為內容分析法(content analysis),是對於傳播內容,做系統性客觀和量化 的歸類統計,進⾏敘述性的解說。與問卷調查法不同之處,在於內容分析法為「⾮ 介⼊性的研究(unobtrusive research)」有其特殊價值,隨著資訊科技的突⾶猛進, 原本習⽤於內容分析法的次數統計,由搜尋引擎與意⾒分析(opinion analysis). 政 治 大. 技術所取代,並且改以軟體系統,⼀致性地處理更⼤規模的內容資料。⽽新興的. 立. ⽂字探勘(text mining)與資料探勘(Data Mining)技術,能⾃動找出⾼品質的. ‧ 國. 學. 資訊,例如趨勢、關聯、新議題等,成為敘述解說的重要線索。. ‧. 臺灣⽬前商業上使⽤最多的⼤數據聲量探勘軟體,包含 OpView, LOWI 等. y. Nat. er. io. sit. 系統,原理上都是運⽤搜尋引擎與意⾒分析技術,以網路上的主要論壇、部落格、 新聞以及社群媒體,為主要資料搜集範圍,利⽤關鍵字在上述範圍中,找出⽂章. n. al. Ch. engchi. i Un. v. 中有相關⽂字的內容,運⽤數學,計算出⽂字內隱含的是對候選⼈善意或惡意的 評論,歸納出正向、負⾯或中⽴的聲量,運⽤到政治選舉的候選⼈⾝上,所有提 及候選⼈的正向聲量可視為對候選⼈的⽀持度。藉由⽐較不同選舉候選⼈的正向 聲量與總體聲量的⽐例,預測候選⼈的選舉優勢。⽬前網路⼤數據聲量資料庫所 做的選舉預測,準確度約到80%,達隨著計算AI智慧進步,以預⾒⼤數據聲量資 料庫系統的預測與分析能⼒將更加提升,成為另⼀種選舉預測⽅法。. 19. DOI:10.6814/NCCU202100300.
(30) 第四節 ⼤數據在政治傳播應⽤案例3 ⼤數據(Big Data:A Revolution That Will Transform How We Live, Work, and Think)⼀書的作者⿆爾荀伯格(Viktor Mayer-Schönberger)分析,⼤數據有三⼤ 特點:即資訊量龐⼤、巨量,然⽽,資訊來源雜亂、不精確,第三則是要抛開因 果概念,尋找數字背後隱含的各種相關性。⾸先,「巨量」是因為資料蒐集由類 ⽐⾛向數位,加上儲存分析資料技術⽇益精進,隨著科技發展,數據呈現爆炸性. 政 治 大 成⾧。⼈類歷史透過不斷探索,試圖瞭解⾃⼰的世界,過去蒐集資料必須耗費⼤ 立. ‧ 國. 學. 量時間⾦錢,效益⼗分有限,⽽新的⼤數據時代,帶來的是理解世界的嶄新⽅式。. ‧. 但也因為資訊量爆炸性的成⾧與無限制的流動,透過網絡的發散,資訊經過不斷. sit. y. Nat. 的⼆⼿傳佈、編寫與重製,很難要求精準與正確,不限於絕對精準的資訊;在海. n. al. er. io. 量撈取中判斷相對多數,同時抛開線性的因果關係,跳耀式的尋找出事物連結間. Ch. i Un. v. 的相關性,成為⼤數據應⽤最核⼼的概念。⿆爾荀伯格 2014 年 6 ⽉ 11 ⽇訪台時,. engchi. 曾經提及政治⼈物可以運⽤巨量資料分析,瞭解市民的⾏為、找出市民的需求, 並藉此設定出市政的核⼼議題。. 3. 轉引⾃劉幼琍編著,吳世豪、陳昱旗 (2016)。⼤數據與未來傳播,台北:五南圖書。185-. 193. 20. DOI:10.6814/NCCU202100300.
(31) ⽽提到⼤數據運⽤在政治傳播上,進⽽實際應⽤在選戰策略上,不能不提及 的,就是美國總統歐巴⾺的網路選戰團隊與 2015 年異軍突起的無黨藉台北市⾧ 候選⼈柯⽂哲的選舉網路團隊操作策略。. 壹、歐巴⾺(Obama)⽤⼤數據打贏⼤選. 政 治 大. 在 2008 年⼤選中,美國總統候選⼈歐巴⾺為打選戰推出社群平台 MyBO. 立. (my.barackobama.com) ,讓⽀持的選民們可以交流及籌備活動。這個線上組織總. ‧ 國. 學. 共有兩百萬名民眾加⼊,志⼯和線上⽤⼾競選期間共籌備了超過 20 場的線下活. ‧. 動、寫出 40 萬篇⽂章,還創⽴了 3 萬 5 千個志願者團體。當時美國臉書(Facebook). sit. y. Nat. 才成⽴ 4 年,推特(Twitter)成⽴ 2 年,歐巴⾺已經在臉書上累積了將近 3 百. n. al. er. io. 萬⽀持者,以及約 12 萬的推特追蹤者,分別是共和黨競選對⼿約翰‧⿆肯(John. Ch. i Un. v. McCain)的 3 倍和 23 倍之多。透過策略性的線上平台經營策略,歐巴⾺當年從. engchi. ⽀持者募得了約 6.4 億美⾦,其中⼤部分都是來⾃線上捐款,幫助他順利打贏選 戰。. 歐巴⾺競選團隊的成功,關鍵因素正是歐巴⾺找來了 Facebook 的共同創辦 ⼈ Chris Hughes,來經營 MyBO 競選網站的社群。甚⾄到了投票前⼀周,MyBO 也靠著社群機制發動百萬志⼯⼤⼒催票(王宏仁,2014)。. 21. DOI:10.6814/NCCU202100300.
(32) ⼀位參與過 2012 年歐巴⾺網路選戰的教授指出: 「透過社群不只是⽤來凝聚 已經表態的⽀持者,更重要的是從社群中找到沒有特定⽴場還未表態的未來⽀持 者。」歐巴⾺團隊⼤量分析臉書(Facebook) 、推特(Twitter)上的訊息來判斷潛 在的⽀持群眾,再透過社群的互動性與對⽅取得聯繫,最終靠著網路聲量發酵的 ⼒量,順利贏得勝選。. 回顧 2012 年,歐巴⾺爭取連任,當第⼀次總統⼤選電視辯論結束後,競選 團隊察覺到選民的投票傾向發⽣改變。藉由數據分析,數據團隊可以⽴即勾勒出. 政 治 大 輪廓,什麼樣的選民改變了態度、什麼樣的選民仍堅持原來的投票選擇。再者, 立. ‧ 國. 學. 每天晚間,分析團隊⽤⾼速電腦運算模擬⾼達 6.6 萬次的⼤選結果,涵蓋設計各. ‧. 種可能出現的危機與變數。隔天上午的選情會議上,可以⽴即提報出模擬的數據. sit. y. Nat. 分析,了解各種突發狀況下,影響各州勝出的可能性,從⽽進⾏最⼤效益的選戰. er. io. 資源分配(⾦瑞,2015)。. al. n. iv n C 這種根據數據分析的決策⽅式,在歐巴⾺成功連任的過程中發揮了重要作⽤, hengchi U 從前仰賴傳統預測經驗的競選專家,因為⼤數據的崛起,被善於利⽤⼤量數據分 析的專家和程式設計師所取代,政治領域裡,⼤數據的時代已經到來。. 歐巴⾺於 2012 年爭取連任,他收集與分析搜尋引擎數據、網路與移動社交 媒體數據做出即時的資訊反應與選戰策略調整。這也是歐巴⾺在 2012 年競選獲 得勝選最關鍵的選戰策略。. 22. DOI:10.6814/NCCU202100300.
(33) 在歐巴⾺競選的年代,⼤數據(Big Data)運作資料探勘(Data Mining)的 ⼯具極為昂貴,效能也不夠優異,如今這類型的⼤數據輿情分析⼯具,已經廣泛 運⽤於政治分析與商業⽤途,監控網路聲量成為普遍的⾏為。. 表 2-4-1 歐巴⾺兩時期⼤數據應⽤的項⽬⽐較 2008. 強化 Facebook、Twitter、. 類別 LinkedIn。. LinkedIn 相互連結。. 政府官⽅網站 data.com 的. 延續政府官⽅網站. sit. y. 網路視頻網(YouTube) data.com。. 為了有效開放儲存所有聯. n. al. 類別 邦公開可下載的資訊。. Ch. 2012 年 3 ⽉宣布投資兩億. er. 項⽬ 成⽴。 與. ‧. 網路視頻網(YouTube). io. 時期. Facebook、Twitter 、. Nat. 執政. 與. 學. 時期. 項⽬. 治 政 MyBO 社群網站的成⽴。 延續 大 MyBO 社群網站,強化 立 選民互動性與連結性功能。 ‧ 國. 競選. 2012. i Un. v. 美元,推動⼤數據之相關產. i e n g c h業,並將⼤數據之因應列為 國家戰略之⼀,明確宣⽰: ⼤數據涵蓋的規模、分析及 運⽤的能將成為⼀個國家的 核⼼資產。. 23. DOI:10.6814/NCCU202100300.
(34) 貳、柯⽂哲⽤⼤數據打贏市⾧選舉. 提到台灣⼤數據選舉上的應⽤,最具代表性的就是 2014 年競選台北市⾧獲 得勝選的柯⽂哲,其從政之路使於 1994 年民進黨籍陳⽔扁競選台北市⾧時,柯 ⽂哲為陳⽔扁的醫界後援會幹部。他提及之所以決定參選市⾧是因為當時台灣社 會發⽣⼀起醫療⼤事件,臺⼤醫院失誤移植愛滋病患器官案件,讓他決定投⾝公 職。. 治 政 大 柯⽂哲宣佈參選台北市⾧始初完全沒有⼈認真看待,台灣的重要市⾧選舉, 立 ‧ 國. 學. 向來由⼆⼤主要政黨國民黨與民進黨推舉出的候選⼈才能得到政治上的奧援,才 有可能勝選,柯⽂哲幾乎沒有政治資歷,為⼀界醫師,當時被媒體戲稱「政治素. ‧. ⼈」 ,⼀⽅⾯時勢造英雄,當時世界不約⽽同刮起⼀陣「⽩⾊旋⾵」 ,⼈民厭倦了. y. Nat. er. io. sit. 政治⾊彩操作,忽略真正關諸已⾝的權益,不帶有政治⾊彩,純淨的⽩⾊,變成 擁抱⼈民,站在同⼀陣線的象徵,另⼀⽅⾯,柯⽂哲在台北市市⾧競選上,⼤量. n. al. Ch. engchi. i Un. v. 啟⽤年輕⼈即「數位原民」 (digital native) ,他們從⼩⾝處數位環境,熟稔網路特 性,利⽤⼤數據對社群的分析與操作,讓柯⽂哲由不被看好的素⼈成為媒體焦點, 獲取到⼤多數中間選民的⽀持。. 回顧美國總統⼤選,歐巴⾺靠著社群網站擊敗對⼿,類似的劇碼,也發⽣在 2014 年㡳臺北市⾧的選戰上,雖然應⽤的⼿法與規模不盡相同,但本質都是透過 資訊科技(Information Technology)網絡延伸的⼒量,善⽤社群,發揮影響⼒。 當時柯⽂哲素⼈從政,對抗國民黨陣營連勝⽂為⾸的政治世家精英團隊,從無⼈. 24. DOI:10.6814/NCCU202100300.
(35) 看好到成為政治網紅,刮起強⼤的⽩⾊旋⾵,柯⽂哲的崛起,改變台灣政治⽣態 圈傳統的選戰模式,沒⼈、沒錢,沒有資源操作傳統媒體廣宣,柯⽂哲運⽤網路 ⼝碑⼒量,從年輕⼈同溫層擴散,創造出網路正向聲量,從⽽影響主流媒體不得 不追踪報導。2014 台北市⾧選舉後,所有臺灣參選的政治⼈物,不得不正視綱路 聲量帶來的龐⼤影響⼒。. 歐巴⾺競選美國總統時,臉書(Facebook)散佈規模仍不⾜以完整覆⼤蓋美 國廣⼤領⼟範圍,所以,歐巴⾺團隊選擇⾃⾏打造⼀個專屬的,具有更鮮明指向. 政 治 大 性的競選社群平臺。反觀 2014 立 年的臺灣,2300 萬⼈⼝中,有⾼達 1,400 萬個臉書. ‧ 國. 學. 使⽤者,FB(Facebook)為台灣⼈最常使⽤的社群媒體,覆蓋率驚⼈。所以,柯. ‧. ⽂哲團隊的重要選戰策略之⼀是,快速掌握臉書上的意⾒氣候,⽽背後操⼑協助. y. sit er. io. 團隊。. Nat. 柯 P 掌握臉友熱⾨競選話題的,正是⼀個以臉書塗鴉牆搜尋引擎起家的 Q Search. al. n. iv n C Q Search,原本只是⼀個利⽤hFacebook e n g cGraph h i UAPI,來提供臉書塗鴉牆歷史 訊息中⽂搜尋的 Chrome 瀏覽器外掛,⽽後,Q Search 團隊進⼀步發展成⼀個資 料分析平臺,將這樣的經驗擴⼤到搜尋全球臉書公開訊息,可以從使⽤者⾏為的 紀錄和發⾔,來歸納出當下最熱搜的話題。. 如同歐巴⾺團隊賦予社群⾼⼿找出潛在選民的任務⼀樣,Q Search 也同樣被 受命要找出年輕⼈感興趣的主題,來號召這群對政治冷感的年輕新世代,誘發年 輕⼈的集體認同,並轉化成⾏動,選擇攜⼿站出來⽀持柯⽂哲。. 25. DOI:10.6814/NCCU202100300.
(36) 柯⽂哲抛棄傳統競選路線,傳統政治候選⼈習慣⾛訪⼤型組織與⼯商團體, 覺得沒有效益的⼩活動、⾏程,通常不願意浪費時間參與。但是柯⽂哲反其道⽽ ⾏,願意花時間參與會引起年輕⼈話題的活動,例如跳街舞、打籃球、騎腳踏⾞ 等,⽽不只像傳統選戰例⾏公事般的掃街拜票、跑婚喪喜慶場⼦、拜碼頭等等, 最終決定選戰策略⾏為,都是透過⼤資料分析臉書資訊後,找出能吸引年輕⼈⼤ 舉按讚的⾏動(柯⽂哲,2015) 。每天研究 6 億個讚,算出討好網友的關鍵字,柯 ⽂哲的資訊科技 5 ⼈⼩組最重要的⼯作,就是從 1400 萬⼈次的台灣臉書⽤⼾所. 政 治 大. 按出 6 億個讚的海量數據中,監測網路輿論,進⽽對柯提出具體因應建議。團隊. 立. 固定⼀週向柯⽂哲報告⼀次,並提供策略分析,包括化危機為轉機的 MG149 帳. Roger Do 接受新加坡科技媒體《e27》採訪. sit. y. Nat. Q search 共同創辦⼈與 CEO,. ‧. ‧ 國. 學. ⼾事件。. n. al. er. io. 時表⽰,Q search 是鎖定社群媒體正在關注的特定議題,⽽不僅於⼈⼝統計學進. i Un. v. ⾏分析,他們的廣告分析⽐ Facebook 廣告要精準 16 倍(科技中⼼,2014)。. Ch. engchi. 依據⼤數據分析對應的⾏為,在選戰過程中影響選戰節奏,主要有以下幾個 關鍵點:例如鄉民好評關鍵字:「公開、透明、開放」做為競選⼝號與主軸、決 定正⾯迎擊 MG 149,不要冷處理,有些當初看起來的⼩事情,事後都⼤⼤的影 響了選戰的節奏。競選團隊很積極突顯柯⽂哲在中產階級⼼中的特⾊,因為選舉 過程中不只是要靠年輕⼈,更要靠廣⼤的中產階級,因為這些中產階級跟柯⽂哲 ⼀樣,沒有既得利益,沒有權勢可依附,每天都認真⼯作與⽣活。因⽽整個團隊 在思考⾏銷策略時,都想盡辦法要吸引廣⼤中產階級,進⽽去影響那些原本對政. 26. DOI:10.6814/NCCU202100300.
(37) 治不關⼼的⼈(柯⽂哲,2015;洪永泰,2015)。 表 2-4-2 柯⽂哲競選⼤數據應⽤分析 Facebook 競選時期. 項⽬與類別. 柯⽂哲個⼈官網成⽴ 網路視頻網(YouTube) 緊盯市政議題設定,掌握議題的 Data 投放. 執政時期. 項⽬與類別. 趨勢 Facebook 市政 Line ⼿機社群平台,提供即時回覆市民. 立. 政 治 大. 網路視頻網(YouTube). ‧ 國. 學. 在⼤數據治理⽅⾯,台北市⾧柯⽂哲上任屆滿三個⽉,不按牌理出牌,反其. ‧. 道⽽⾏,祭出「三漲三砍」,要公務員瘦⾝,⼜向市民討錢,還能⼈氣不減。. sit. y. Nat. io. al. er. 柯背後的「⼤戰略」及「數字觀」,是「柯 P 市政學」兩⼤治理秘訣;先訂. v. n. 核⼼⼤戰略,再讓數據說話;建⽴「⽤數據回答問題」的政府,當有反彈聲浪,. Ch. engchi. i Un. 以數字「撐腰」。幕僚說,「⼤戰略有了,剩下的就是專業問題,專業解決」。 因此,柯⽂哲認為他的優點就是講真話,但原因是講真話的時候,相信數字 與科學,他認為有⼀個⼤數據團隊,就可以隨時搜集並盯緊 Data,掌握議題的投 放,並成⽴即時市政 Line 平台回應市民,因此,依據數據科學分析,明確地做 出市民有感的的政策(柯⽂哲,2015)。. 27. DOI:10.6814/NCCU202100300.
(38) 第五節 ⼩結 檢視相關研究與⽂獻發現,從政者為了形塑政治形象和選民認同,除了政治 表現,也必需運⽤傳播體系來達到宣傳的⽬的,民意調查與網路聲量除了做為政 治⼈物整體⽀持度的判讀,也可做為政績的檢視,成為政治⼈物施政、形象塑造, 討好選民的依據。. 網路公共的特性,容易在短時間內,形聚⼤量的宣傳效應,它的「即時性」、. 政 治 大. 「主動參與性」、「互動性」、「超越時空性」、「匿名性」等特殊性,創造了. 立. 另⼀種全新的、虛擬的、未知的公共領域。. ‧ 國. 學 ‧. 從臺灣2014年台北市⾧柯⽂哲競選成功,到美國總統歐巴⾺⼤量使⽤社群集. sit. y. Nat. 結⽀持者⼈氣的經驗,顯⽰出綱路聲量是政治⼈物競選前必須正視甚⾄操作的⼯. n. al. er. io. 具,其影響⼒早就超越主流媒體,包含政治廣告、新聞報導所帶來的宣傳價值。. i Un. v. 然⽽聲量、調查數字與實際結果,是否能透過數據做更量化的分析,了解其影響 帶來的實質效應。. Ch. engchi. 本研究嘗試,透過⽐較臺灣2020總統⼤選⼆位主要候選⼈蔡英⽂與韓國瑜之 選舉投票結果,與選前三種調查⽅式,包含傳統市話民調、市話民調加⼊⼿機加 權調查以及透過網路⼤數據軟體搜集之聲量掘取結果,判讀三種調查⽅式之準確 度。. 28. DOI:10.6814/NCCU202100300.
(39) 第三章. 研究⽅法. 本章⾸先說明資料蒐集與分析⽅法,同時針對研究主題 2020 臺灣總統⼤選, 進⾏背景說明,同時針對市話民調的調查⽅式以及與其對⽐之⼤數據資料庫進⾏ 解說與進⾏數據挖掘之關鍵字設定進⾏說明。 研究採取之民意調查區間為 2020 年總統⼤選前半年,時間從 2019 年 5 ⽉ 22 ⽇到 2019 年 10 ⽉ 14 ⽇,合計 8 次市話調查,並於 2019 年 8 ⽉ 19 ⽇進⾏⼀次市. 政 治 大. 話與⼿機結合調查,研究分析傳統市話民調與網路聲量異同,同時也進⾏市話加. 立. ⼊⼿機加權後的民調與網路聲量之異同,同時⽐對傳統市話民調與市話加⼊網路. ‧ 國. 學. 民調和⼤數據之間是否有差異性。本章⾸先針對本研究之背景與動機進⾏說明,. ‧. 接著,闡述研究⽬的並提出研究問題。最後,說明研究流程,以及提出相關名詞. n. al. er. io. sit. y. Nat. 釋義與使⽤⽅式。. Ch. engchi. i Un. v. 第⼀節 資料蒐集與分析⽅法 壹、資料蒐集⽅法:次級資料 學者 Babbie(2012)訂定了次級資料法應⽤的標準化步驟,包含:研究⽬的 與問題的擬定(含研究觀點);選擇案例(單⼀組織、單⼀事件,或單⼀區域等); 蒐集相關內部與外部資料,並且形成假說。當中,次級資料(secondary data)是 指間接取得別⼈所整理的資料(第⼆⼿),例如:引⽤政府開放資料。次級資料. 29. DOI:10.6814/NCCU202100300.
(40) 是相對於初級資料所命名。次級資料⼀般分為「內部次級資料」與「外部次級資 料」,本研究之次級資料來源以「趨勢民調」公司之內部資料,以及 「LOWI3.0 輿情監測系統」之外部資料做為資料來源進⾏⽐對。. 貳、資料分析⽅法:量化與質性資料分析⽅法 ⼀、分析⽅法. 治 政 大 本研究⾸先從「趨勢民調」公司,選前半年做的多次民調出做出分類,其中 立 ‧ 國. 學. 七次為單純市話調查,另⼀次則為市話加⼊⼿機加權調查,在純市話調查中,由 於 6 ⽉頻䌓調查 3 次,為求時間間隔產⽣的變化,取出當⽉第⼀次為研究資料,. ‧. 同時為求對⽐基礎相同,我們找出每次調查中共有的題型,做為研究依據,最後. y. Nat. er. io. sit. 篩選出 4 次調查,分別於 2019 年 5 ⽉ 22 ⽇、6 ⽉ 6 ⽉、7 ⽉ 4 ⽇與接近選前最 後⼀次 10 ⽉ 14 ⽇的調查結果做為研究資料,同時此 4 次調查中,都有共有題. n. al. Ch. engchi. i Un. v. 型,即針對兩個臺灣主要政黨的總統候選⼈,蔡英⽂與韓國瑜進⾏⽀持度的調查。 在「LOWI3.0 輿情監測系統」⼤數據資料庫的部份,依據前述議題設定、時 間設定、關鍵字設定、簡化資料、建構類屬的結果,進⾏相同時間點內,對兩位 主要候選⼈網路聲量的⼤範圍搜尋,並截取出其中正向聲量,設定為⽀持度,與 市話民調及市話加⼊⼿機加權的單次民調進⾏雙向與三⽅的⽐對,⽐對結果進⾏ 資料引證、摘要分析,並嘗試將資料的分析結果與實際的總統⼤選結果進⾏對照。. 30. DOI:10.6814/NCCU202100300.
(41) ⼆、資料品質管控與研究步驟 在資料蒐集上,本研究採取⽅式為: 1. 資料來源依研究主題從專業民調公司取得。 2. 研究者⾃⾏蒐集與分析。 3. 關鍵字與時間軸之設定以研究者主觀詮釋,與指導教授討論後,選擇符 合研究⽬的,有效獲得實證資料之內容效度。. 政 治 大 4. 在資料搜集完成後,研究者將依研究架構檢視,並以時間軸與關鍵字區 立. ‧ 國. 學. 分概念與類別。. ‧. 5. 分析各調查資料之調查結果做⽐對,同時進⾏與本研究相關之議題分析。. n. er. io. sit. y. Nat. al. iv. 第⼆節C 市話民調調查⽅式 Un h. engchi. 壹、家⼾市話民調調查⽅式. 民意調查(Public Opinion Poll),⼜稱為輿論調查、民意測驗或民調,傳統 民調⽅式籍由家⼾電話,由專業的調查機構,對⼤量樣本的問卷做調查抽樣,同 時根基於統計學的原理進⾏數字分析,在誤差範圍內,取得事件意⾒的百分⽐, 做為了解公眾對於政治、經濟、社會政策的意⾒和態度。. 31. DOI:10.6814/NCCU202100300.
(42) 基於統計學正負95%的誤差範圍,民意調查樣本數要超過⼀千份,且依內政 部最新⼈⼝資料,針對⼾籍地、性別、年齡以及教育程度採⽤多重反覆加權 (Raking),以符合母體之分配。. ⼀般民調公司在執⾏市話電話民調時,抽樣的⽅式是根據中華電信提供的 市話資料庫篩選電話號,為求公平並保證每個電話都有被抽到的可能性,民調 公司從資料庫中隨機抽選的號碼會屏蔽尾數末2碼、甚⾄末4碼,再⽤隨機跳號的 ⽅式,組成新的號碼撥出,並且在確認為有效樣本後,於調查結果進⾏加樣,以. 立. 符合母體分配。. 政 治 大. ‧ 國. 學. 本次研究採取臺灣民調公司「趨勢民調」於2020總統⼤選前半年,即2019年. ‧. 5⽉份到10⽉底之間的多次調查,採每⽉取樣⼀次的⽅式,取出計4次調查結果和. y. Nat. io. sit. 網路⼤數據聲量進⾏⽐對,每次的有效樣本數超過⼀千份,並且以對應母體加. n. al. er. 權後的結果,做為研究對⽐資料。. Ch. engchi. i Un. v. 貳、家⼾市話加⼊⼿機調查⽅式. 市話加⼊⼿機調查⽅式,在討論之初包含⼿機樣本如何取得?樣本怎麼來? 由誰提供,有的⼈有⼆、三⽀⼿機,無法按抽樣地區分配,尤其花東與離島,是 否容易被系統性的邊緣化是⼤家關注的重點。加上市話加⼊⼿機的調查⽬前執⾏ 的⾮常少,是否成熟?準確度是否得到驗證?也是⼀⼤問題。. 32. DOI:10.6814/NCCU202100300.
(43) 以本研究為例,市話結合⼿機的民意調查,除了民進黨初選⼀次,民調公司 ⾃⾏或委託操作的也只有⼀次,民進黨初選執⾏的⼿機樣本號碼,是先經由民進 黨員內部篩選出樣本,和本研究調查為臺灣全體民眾範圍不同,無法進⾏研究上 的⽐對。. ⽽本研究所採取的市話加⼊⼿機加樣調查的資料,則是「趨勢民調公司」於 2019 年 8 ⽉ 19 ⽇與 20 ⽇,由民間委託於選舉前所做的總統⼤選⽀持度調查, 其中,市話共完成了 1,059 份的有效樣本,⽽⼿機則完成了 1,079 份有效樣本,其. 政 治 大 中唯⼿機族(完全不使⽤市話的⼈)有 454 份。 立. ‧ 國. 學. 本次調查中市話樣本的取樣⽅式與前述市話民調執⾏時的⽅式相同,⽽⼿機. ‧. 樣本的取得,則是採 NCC 每年公佈的五⼤電信業者號頭加上後⽅電腦系統隨機. y. Nat. io. sit. 產⽣的號碼進⾏播號調查,同樣的在確認為有效樣本後,最終仍然要經過加權計. er. 算對應母體,並沒有專家學者擔憂的邊緣化問題,但是由於研究資料過於單⼀,. al. n. iv n C 沒有更多的調查可以⽐對,加⼊⼿機調查是否產⽣影響準確度的正負⾯影響,仍 hengchi U 待更多的研究來證明。. 參、加權計算⽅法. ⽬前市話調查之加權⽅式,仍然有研究落差與限制,市場上的商業民調公司 使⽤之市話調查樣本來源為臺灣中華電信之市話資料庫,由於市話涵蓋範圍改變,. 33. DOI:10.6814/NCCU202100300.
(44) 為求盡量完全吻合全臺灣之⼈⼝分佈,所以開始加⼊⼿機加權之結合調查⽅式。. 市話加權的⽅式是以臺灣內政部公佈之⼈⼝資料做為加權來源,以新北市舉 例說明,⾸先設定調查範圍若為全新北市,依據全新北市之所有⾏政區之⼈⼝資 料,包括年齡結構、男⼥⽐例與教育程度之佔⽐,再依據佔⽐決定調查之有效樣 本數量,假設整體之調查樣本為⼀千份,依內政部資⼈⼝資料,三重地區 20 到 30 歲之⼈⼝佔⽐為百分之 6, 則有效樣本份數必須完成 60 通調查電話,通常整 體的調查份數為加權計算之 10 到 12 倍,亦即假設有效樣本為上述 60 份,則撥. 政 治 大 打三重區電話 600 到 720 通,最後完成 60 份有效樣本。 立. ‧ 國. 學. ⽽⼿機加權部份因為沒有上述之資料庫,所以⽬前的調查⽅式只能採取合併. ‧. ⽅式,⽤即有之⼈⼝資料庫做加權計算。. n. er. io. sit. y. Nat. al. Ch. i. e. i Un. v. ngch 第三節 網路聲量資料庫設定 本研究採取的⼤數據截取資料庫為 LOWI 輿情監測系統,為⽬前坊間⼤數 據商業應⽤上,較多⼈使⽤的資料掘取系統,透過關鍵字的搜尋,設定其搜尋的 時間範圍與搜尋範圍,可以找出相關網路世界裡與關鍵字具有關聯性的所有⽂字 資料。. 34. DOI:10.6814/NCCU202100300.
(45) 壹、網路聲量資料庫說明. 坊間⽬前較通⽤之網跟聲量資料庫或稱做輿情監測系統主要為 OpView 社群 ⼝碑資料庫與 LOWI 輿情監測系統,主要透過 AI(Artificial Intelligence) ⼈⼯ 智能語意分析技術與雲端架構,協助企業分析輿情,了解實際上的網路聲量,並 且透過軟體整理成易於分析之各種表格,協助判讀。不同系統之間的主要差別在 於使⽤介⾯、網路搜尋範圍,以及其⼈⼯智能對語意判讀關鍵技術之精準程度。. 治 政 大 ⼀、OpView 社群⼝碑資料庫說明: 立 ‧ 國. 學. 主要搜尋範圍分為四⼤類別. ‧. A. 社群網站:包含 FB、IG、YT 等臺灣主流之社群網站。. sit. y. Nat. n. al. er. io. B. 網路上之各⼤討論區,例如:Mobile01、Dcard、PPT。. Ch. engchi. i Un. v. C. 網路新聞媒體,例如:ETtoday、Line Today、CNEWS 匯流新聞。. D. 部落格:痞客邦、Blogger、Xuite 隨意窩。. 根據官⽅資料指出,OpView 的搜尋範圍⼤約 8 萬個網站,利⽤網路爬⽂技 術,對不同版型網站進⾏智慧解⽂,將內容統整到統⼀的雲端資料庫中,使⽤者 可以透過時間段結構,⾃⾏運⽤關鍵字尋找到相關訊息,所有的訊息經由 AI 技 術判別出其態度、情緒做出分類,了解網路世界對關鍵字議題之正負向聲量。. 35. DOI:10.6814/NCCU202100300.
相關文件
(Another example of close harmony is the four-bar unaccompanied vocal introduction to “Paperback Writer”, a somewhat later Beatles song.) Overall, Lennon’s and McCartney’s
To convert a string containing floating-point digits to its floating-point value, use the static parseDouble method of the Double class..
This study first uses the nine indicators of current domestic green architecture to examine those items needed to be considered in the air force base.. Then this study,
Based on the above concept, the purpose of this study was to explore the local residents’ perceptions and attitudes towards tourism development, whom have little or no
This paper aims to study three questions (1) whether there is interaction between stock selection and timing, (2) to explore the performance of "timing and stock
The purpose of this study is to analyze the status of the emerging fraudulent crime and to conduct a survey research through empirical questionnaires, based on
Therefore, this study uses Mainland Chian tourist as survey respondent to explore the relationships among store expertise, shopping satisfaction and share of wallet.. The study
Hoping that the results of this study can provide suggestions for educational authorities and supplement schools to elevate the quality of elementary supplement schools.. The