• 沒有找到結果。

第五章 結論與建議

第一節 研究發現

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

101

第五章 結論與建議

本章將分成三個小節依序說明,第一節研究發現,綜合前述第四章研究結果 分析進行研究發現與結論的整理;第二節根據研究發現提出理論面及實務面建議;

最後,第三節則從本研究的限制層面進行討論,包含次級資料及網路輿情分析方 法的限制。

第一節 研究發現

一、 民意調查方法層面

(一) 政府民意調查的劇變

隨著資通訊科技及 Web 2.0 的來臨,網路調查、手機調查及巨量資料分析快 速興起,上述這些蒐集方法逐漸對傳統民意蒐集方式產生影響。一方面,傳統民 意調查本身有其適用上的問題存在,如抽樣誤差及非抽樣誤差(Oberski, 2012),

另一方面,巨量時代的來臨,網路輿情逐漸對政府的治理帶來影響。然而,政府 機關對於新一波的網路輿情卻無法有即時掌握(陳俊明等,2015)。很大一部份 的原因來自政府目前缺乏一套主動機制來探詢網路輿情,特別是近期國內發生的 白衫軍事件及太陽花學運等事件。據此,國內學界開始提出應用巨量資料分析於 政府部門之可能(廖洲棚等,2013;蕭乃沂等,2014;陳敦源等,2016)。

除了巨量資料分析逐漸被受政府重視之外,新興的手機調查也開始成為另類 民意調查的方式,主要是因為手機使用的人數日益增加,政府必須藉由新管道來 接觸所謂的「唯手機族」(洪永泰等,2014)。朱斌妤等(2014)也指出,部份民 眾只使用手機通訊,故採用傳統有線電話調查,可能漏掉一部分的受訪者。

在上述民意環境的劇變下,政府必須正視傳統民調的不足。更重要的是,新 一波的輿情正在新媒體的催化下興起,政府應該如何面對社群網路上的民意及有 效掌握,本研究認為政府必須借助網路輿情分析的技術,讓政策機關可以即時了 解特定議題在網路發酵程度,妥善做好政策的議題管理。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

102

(二) 傳統民意調查與大數據分析之差異與調和

關於巨量資料分析與傳統民意調查的不同之處,本研究檢閱文獻分析結果發 現,學者提出七點不同,其一,在蒐集方法上,前者是探詢網民的使用行為,較 具主動性。後者則是藉由抽樣調查及問卷設計的方式來蒐集民意,較具被動性;

其二,在研究對象上,前者可以撈取所有的網路上公開發言的網民言論。後者則 是符合抽樣調查下的特定對象;其三,在時效性方面,前者是每天或隨時都在變 化,即時性高。而後者則是有特定的期間,屬於靜態的一次性分析;其四,在資 料品質方面,前者是電腦高度自動化的內容分析,減少人工的成本。後者則是存 在的抽樣及非抽樣誤差問題;其五,資料數量方面,前者數量龐大且複雜。後者 的數量上必須視研究調查而定,原則上,數量是無法與巨量資料相比;其六,在 觀點形成上,前者可運用文字探勘等技術進行意見的分析。後者僅能根據問卷制 式化的各種選項來進行量化統計;最後,在執行面,前者透過電腦自動化工具的 輔助,易執行。後者須設計訪談或問卷調查及訪員素質訓練,作業繁瑣。

進一步,也有學者綜合各項輿情調查方法中,比較常用的民意蒐集方式進行 整合比較(朱斌妤等,2014),然而在前述的研究中並未包含網路輿情分析的技 術在其中,因此本研究在其原先的調查方法基礎下,再加入網路輿情分析一同比 較。比較結果發現,網路輿情分析與其他輿情調查方法最大的差異之處在於,它 是針對套定關鍵字詞進行網民的聲量及情緒分析,且是撈取網路上所有公開發言 的言論,因此並未有樣本代表性的問題。此外,由於分析的對象是「網路言論」

而非「受訪者」,因此也無反應率的情形。

綜上所述,由於網路輿情的重要性日漸增長,已成為當前政府不容忽視的社 會輿論之一。值得注意的是,網路輿情並不完全等同社會的主流民意,也就是說,

並非所有人都會在網路的平台上發表其意見,甚至有更大部分的網路使用者是屬 於沉默的多數,僅有瀏覽而未發言的「潛水者」(李明穎,2012)。相較之下,

網路輿情所代表的可能僅限於少數發言活躍的意見領袖(Dahlberg, 2004)。進言之,

網路輿情僅能被視為眾多的社會輿情之一,其未必具有多數民意的正當性。對於 公部門的管理者而言,如何適當調整巨量資料分析(網路輿情分析)以及傳統民 調方法兩者的重視程度,本研究認為為了確保政府輿情分析的結果能夠具有代表 性,政府機關除了應用巨量資料分析來探詢另一波在網路上興起的輿情之外,其

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

103

它傳統的民意調查蒐集方法仍不可偏廢。一方面,傳統民意調查仍有助於了解網 路使用族群以外的對象,另一方面,巨量資料分析在代表性、因果關係的推論上 仍有待進一步驗證(陳敦源等,2016)。因此,政策機關可將網路輿情分析的結 果與其他輿情蒐集方式(如傳統電話調查、手機調查及網路調查)進行交叉對照,

將不同民意的觀點作為政府政策設計與回饋的重要參考。事實上,已經有研究嘗 試將巨量資料分析與其他民意調查方法進行比較,如朱斌妤等(2014)數位國家 治理(2):國情追蹤與方法整合的研究報告,有興趣者可進一步前往參閱。

二、 網路輿情方法層面

(一) 網路輿情分析技術面問題

目前政府部門應用網路輿情分析仍屬於初探階段,具代表性的研究包含周韻 采、陳俊明(2010)對死刑議題輿情的探究、廖洲棚等(2013)運用巨量資料分 析方法來探勘大量的網路民意、朱斌妤等(2014)則納入巨量資料分析的途徑與 其他民意調查途徑進行比較、蕭乃沂等(2014)以巨量資料分析的實際導入經驗,

探究政府機關內部的服務系統資料及其外部的網路輿情,以及陳敦源等(2016)

探究巨量資料分析應用於政策端帶來的落差。

就網路輿情分析技術面的部份,本研究發現目前尚缺乏足夠精確的檢測方法 來驗證分析結果的信度和效度。例如在內容相關性及情緒分析的部份,是否機器 會將不相關的言論視為相關,此部份可能也涉及關鍵詞的設定;或者在情緒的判 斷上,將正向情緒誤判為負向情緒等情形,皆產生許多疑慮。換言之,網路輿情 具備語意與情緒特質,不論是在語意或情緒的判斷上,利用演算法進行判斷仍不 免有誤判的情形(蕭乃沂等,2014)。為了對網路輿情品質進行檢測,前述計畫 的研究團隊初步設想出一套類似統計品管的程序來進行檢驗,結果發現不管是在 內容相關性分析或正負向情緒分析上,演算法在正負向情緒的檢測與人工檢測仍 有所落差。

這意味著情緒分析方面本身可能解讀上就存在某些錯誤率,雖然可辨識網民 對於特定議題的正負評價,但是要將這些正負評價單純等同於政策立場,仍有待 改善之處。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

104

(二) 網路輿情分析與人工判讀的混合

在網路輿情技術面的限制下,本研究認為必須經由人工的適當地介入相互搭 配下,才能避免機器判讀所產生的偏差。此外,大數據時代的來臨,傳統所依賴 的內容分析,也必須做適度的調整。一方面,傳統內容分析必須處理巨量資料的 效率問題,此部分可經由機器演算法來輔助;另一方面,網路資料背後的社會文 化環境的深層意涵,機器不易直接由詞語的外顯意義來判讀,必須仰賴人工的介 入才能確保資料的品質。因此,有學者提出結合人機混合途徑來發揮兩者最大的 效用(Lewis et al., 2013; Mahrt & Scharkow, 2013)。國內學者也開始比較機器的文 字探勘及人工判讀之差異(陳世榮,2015),然而研究上仍屬稀少。

在前述問題意識下,本研究以蕭乃沂等(2014)的次級資料作為基礎,嘗試 將機器與人工判讀進行結合。主要分成兩部分進行,其一是情緒分析,其二是立 場分析。前者是從次級資料中機器已經分析出來正負情緒強度數值進行篩選,後 者是以人工內容分析編碼的方式將所挑選的各篇言論進行立場分析。由於蕭乃沂 等(2014)的研究在網路輿情分析的產出主要是以網路上的聲量分析及情緒分析 為主,尚未完整在政策立場分析有太多討論。因此,本研究則另將「立場的分析」

納入討論,其目的是想探知情緒分析是否能進一步解讀為立場來看待。

本研究發現以人工判讀是有助於進一步檢視機器判讀的成效,機器所產生的 技術面限制,可經由人工介入適時進行釐清。人工判讀的優勢在於,其一,藉由 兩者相互對照的結果,可將人工編碼的分析成果,作為未來機器訓練的詞庫,提 供機器學習之用。並且將人工判讀的結果與機器一致性進行檢驗。其二,因編碼 員在正式分析前已受過前測訓練及信度一致性檢測,因此兼具專業性及可性度。

然而,本研究也發現以人工編碼的方式也會帶來以下限制,其一,分析的數量上 無法太多,雖然有機器撈取大量的資料,然而龐大的資料量,僅以有限的編碼員 進行處理,會增加其時間成本;其二,編碼在進入正式分析之前,還必須經過反 覆的前測訓練,直到信度達一定標準才可進入正式分析,此過程中也會耗盡許多 人力及時間花費。對於政策變化的複雜性及迫切性,也會產生分析數量的限制。

除了本研究所提出的人機混同模式之外,陳敦源等(2016)也嘗試運用群眾

除了本研究所提出的人機混同模式之外,陳敦源等(2016)也嘗試運用群眾