• 沒有找到結果。

第三章 研究方法

3.2 研究設計

3.2.9 文件極性計算

其中 ot(opinion term)代表意見詞或意見片語,polarity(𝑜𝑡𝑖)表示意見語彙所 屬的意見極性傾向,若意見語彙極性是正向,則分數計算為 1;反之則為-1。如 果新聞標題的意見詞彙出現在新聞內容中,則給予加權 3。d(document)代表新聞 文件,n 代表文章𝑑𝑗中意見詞彙之個數,positive_score(𝑑𝑗)為𝑑𝑗新聞文件的正向

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

26 3.2.10 群集結果與輿情分析

本研究將整體政治新聞意見趨勢圖與群集事件意見趨勢圖,與民意調查公布 的結果進行相似度分析。透過文獻中提到的(O'Connor et al., 2010)學者,利用每 日意見趨勢圖進行時間區間的平滑以及相關調整,與民調結果做敏感度分析計算,

再進一步深入探討相關結果。

本研究意見趨勢民意調查趨勢

圖 3-2 相似度比較概念圖

資料來源:修改自(O'Connor et al., 2010)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

27

第四章 研究結果

本研究擷取 2013 年 6 月 10 日至 2014 年 5 月 6 日共 14,729 篇中央通訊社的 政治類新聞。在經過資料前處理步驟後,利用新聞偵測追蹤演算法配合第二階段 分群的 k-means 演算法將新聞分群歸類,且進行意見詞萃取與意見分數計算得到 文件極性,最後得到的分群結果進行事件輿情分析。

將研究結果分成兩個部分,第一為事件輿情與民意關聯,探討負面事件群集 並以民意調查資料進行相關比對。第二為輿情趨勢關聯,利用民意調查滿意度趨 勢配合整體新聞輿情趨勢線,進行相似度分析與探討。

4.1 事件輿情與民意關聯

研究結果分出來的群集數量有 208 群,由於事件群集數量眾多,且其中有許 多群集只包含個位數的文件,故本研究挑出群集內文件數大於平均值且負向比例 大於 50%的群集來討論。下表 4-1 是挑選出來的群集資訊:

表 4-1 負向文件群集資訊

群集編號 文件數量 正向文件數量 負向文件數量 正向比例(%) 負向比例(%)

140002 94 16 78 17.02 82.98

59 254 84 169 33.07 66.54

41000191 608 206 401 33.88 65.95 330001 807 300 506 37.17 62.70 410002 1499 589 908 39.29 60.57 1150001 230 94 134 40.87 58.26

100 209 93 116 44.50 55.50

61 113 53 60 46.90 53.10

58 140 67 73 47.86 52.14

570001 235 114 121 48.51 51.49 資料來源:本研究自行整理

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

28

本研究認為一件新聞事件至少會持續一個禮拜以上,所以利用計算出該事件 群集某一日期至前六個日期(包含當下的日期)的文件成長數量之斜率,斜率越高 代表那一週此事件群集的文件成長數量越多,也代表該週此事件的熱門程度越大。

此外,取出高於平均的斜率值,來找出該事件發生的熱門週期區間。最後本研究 再把高於平均的斜率值取平均值,作為該群集的事件熱門程度。以下就依照事件 熱門程度由高到低來分析各個事件輿情。將該群集內 TF-IDF 總和前十高的新聞 標題列出,作為該群集的代表新聞文件,進而觀察其新聞內容,將該群集命名。

如下表 4-2。

表 4-2 負面事件群集名稱與熱門程度 群集編號 群集名稱 事件熱門程度 41000191 太陽花學運 15.5767

410002 九月政爭 11.3436 330001 洪仲丘 10.7760 1150001 軍事國軍 4.4890

59 食安風波 3.9285 570001 服貿議題 3.1576 100 大埔事件 2.4188 58 財政預算相關 2.0344 140002 N/A 1.9323 61 N/A 1.4555

資料來源:本研究自行整理

10.4801 10.3923 10.3462 9.6419

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

31

2014/4/1 32 403 17.57143

2014/4/2 20 423 19.42857

2014/4/3 31 454 20.71429

2014/4/4 6 460 16.42857

2014/4/5 7 467 15.71429

2014/4/6 15 482 15.85714

2014/4/7 41 523 17.14286

2014/4/8 12 535 16

2014/4/9 10 545 13

2014/4/10 14 559 14.14286

2014/4/11 8 567 14.28571

2014/4/12 2 569 12.42857

2014/4/13 3 572 7

2014/4/14 1 573 5.428571

資料來源:本研究自行整理

從表 4-4 中,我們找出連續且不中斷超過一週的時間區間,結果為 2014/3/19 至 2014/4/14,所以太陽花學運的熱門週期約為四個禮拜。

以 TVBS 民意調查中心的民調資料作為標準,我們可以發現在 2014/3/24 時 有最高的峰波值 25.85714,參照 TVBS 民調中心在 103 年 03 月 24 日發表的學生 佔領行政院事件民調與 103 年 03 月 21 日發表的兩岸服務貿易協議及學生佔領立 院事件民調,可以發現相關性。第二高的波峰值為 2014/4/3 的 20.71429,參照 TVBS 在 103 年 04 月 03 日發布的「反反服貿」前進立院後,反服貿學運民調。

陸續的波峰值對照 103 年 04 月 08 日學生宣佈退出立法院議場服貿民調、103 年 04 月 10 日太陽花學運退場民調,以上皆可發現其時間上的相關性。

410002

九月政爭

12.8659 10.7863 9.7794

挑選連續且不中斷超過七日的時間區間,為 2013/9/8 至 2013/10/26,其中 11/4 與 10/26 超過七日時間所以中斷,九月政爭的熱門持續期間約為七個禮拜。

在 2013/9/14 有斜率最高值 20,TVBS 民調中心分別在 102 年 09 月 13 日發 表王金平關說風波:民眾對特偵組看法民調、102 年 09 月 11 日發表國民黨撤銷 王金平黨籍事件民調以及在 102 年 09 月 09 日發表王金平涉關說柯建銘案民調。

觀察斜率趨勢圖,可以發現在 2013/10/4 又有一頂峰值為 17.28571,對照 TVBS 在 102 年 10 月 02 日發表的特偵組監聽立法院事件及馬總統滿意度民調。而又在 2013/10/15 可以發現一頂峰值為 18.28571,對照 TVBS 在 102 年 10 月 14 日發表 的倒閣案民調。

以上眾多數值皆符合九月政爭的相關重大內容之時間點。九月政爭事件群集 中有一定水準反映出真實情況。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

38

2013/7/28 11 281 12.57143

2013/7/29 6 287 11.28571

2013/7/30 6 293 10.42857

2013/7/31 19 312 10.85714

2013/8/1 15 327 9.857143

2013/8/2 21 348 11.14286

2013/8/3 9 357 10.85714

2013/8/4 22 379 13.14286

2013/8/5 20 399 15.14286

2013/8/6 24 423 15.85714

2013/8/7 19 442 16.42857

2013/8/8 11 453 15

2013/8/9 4 457 14.28571

2013/8/11 1 458 11.28571

2013/8/12 9 467 9.714286

2013/8/13 2 469 6.571429

2013/8/14 1 470 4

2014/1/25 19 679 4

2014/1/26 5 684 4.428571

2014/1/27 1 685 4.428571

2014/1/28 2 687 4.571429

2014/1/29 3 690 4.714286

2014/1/30 5 695 5

資料來源:本研究自行整理

觀察洪仲丘事件的時間區間,可得從 2013/7/14 至 2013/8/14,持續了四個禮 拜。

在 2013/7/20 時候有著第一次最高的斜率 16.42857,日期也大約與 TVBS 在 102 年 07 月 25 日所進行的洪仲丘事件及軍人形象調查有著相關性。

10.8335 8.9118

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

41

2013/8/9 3 139 5.285714

2013/8/11 1 140 3.571429

2013/8/12 2 142 3.142857

2013/8/13 4 146 3.285714

2013/8/15 8 159 3.285714

2013/8/16 2 161 3.142857

2013/8/18 1 162 3.142857

2013/8/22 2 164 3.142857

2013/8/23 3 167 3

2013/8/24 2 169 2.571429

資料來源:本研究自行整理

觀察時間區間,可得 2013/7/23 至 8/24,此事件持續約為四個禮拜。

此群集類似洪仲丘事件群集,但主要是從軍方的角度去探討洪仲丘事件以及 其他軍事相關議題,其熱門週期也因洪仲丘事件影響。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

44

2013/11/7 5 124 3.428571

2013/11/8 3 127 3.714286

2013/11/9 1 128 3.428571

2013/11/10 1 129 3

2013/11/11 2 131 2.571429

2013/11/12 9 140 3

2013/11/13 2 142 2.571429

2013/11/14 3 145 2.571429

2013/11/17 1 146 2.571429

2013/11/18 1 147 2.571429

2013/11/19 2 149 2.571429

2013/12/25 3 196 2.571429

2013/12/31 2 198 2.714286

2014/1/28 10 229 2.857143

2014/2/6 1 230 2.857143

2014/2/11 2 232 2.571429

2014/3/4 1 233 2.571429

2014/3/5 2 235 2.714286

2014/3/8 2 237 2.571429

資料來源:本研究自行整理

挑出日期不間斷超過一個禮拜的時間區間,為 2013/10/22 到 2013/11/19,約 為四個禮拜。

斜率最高值為 7.142857 發生在 2013/10/25,而 TVBS 在 2013/10/30 日進行 主題為食用油事件與外食族調查之民意調查,可見其相關性。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

47

2014/3/24 9 180 4.285714

2014/3/25 7 187 4.571429

2014/3/26 21 208 7.142857

2014/3/27 3 211 7.142857

2014/3/29 2 213 7.142857

2014/4/1 1 214 6.142857

2014/4/2 2 216 5.142857

2014/4/3 3 219 4.571429

2014/4/4 4 223 2.142857

2014/4/10 3 227 2

2014/4/16 4 231 2.428571

2014/4/18 1 232 2.285714

2014/4/21 1 233 2

資料來源:本研究自行整理

以同樣的方式觀察,可得 2014/3/20 至 2014/4/21,高峰區間為四個禮拜。

與前述的太陽花學運群集不同之處在於,此群集主要在談兩岸服務貿易議題,

在 2013 年 6 月下旬就陸續有服務貿易議題開始出現,在 2014 年 3 月下旬開始因 為太陽花學運的關係討論得更熱烈。

(2014/3/19 至 2014/4/14)

410002 九月政爭 11.3436 約七個禮拜

(2013/9/8 至 2013/10/26)

330001 洪仲丘 10.7760 約四個禮拜

(2013/7/14 至 2013/8/14)

(2013/7/23 至 2013/8/24)

59 食安風波 3.9285 約四個禮拜

(2013/10/23 至 2013/11/19)

570001 服貿議題 3.1576 約四個禮拜

(2014/3/20 至 2014/4/21)

100 大埔事件 2.4188 約三個禮拜

(2013/7/5 至 2013/7/27)

58 財政預算相關 2.0344 N/A

12.8659 9.7794

最長的區間自 2013/9/17 至 2013/10/23,約為五個禮拜。最高斜率值發生在 2013/10/15,與 TVBS 民調中心在 102 年 10 月 14 日發布的倒閣案民調時間點相

10.7863 9.7655 9.5009 9.3567

觀察時間區間可得 2013/9/10 至 2013/10/13,約為四個禮拜的熱門週期。最 大斜率值在 2013/9/13 的 17.4285714,對照 TVBS 民調中心在 102 年 09 月 13 日

(2014/3/20 至 2014/4/21) 2013/6/27

大埔事件 2.4188 約三個禮拜

(2013/7/5 至 2013/7/27) 2013/7/5

洪仲丘 10.7760 約四個禮拜

(2013/7/14 至 2013/8/14) 2013/7/14

軍事國軍 4.4890 約四個禮拜

(2013/7/23 至 2013/8/24) 2013/7/23 九月政爭之

監聽關說 8.0321 約四個禮拜

(2013/9/10 至 2013/10/13) 2013/9/10 九月政爭之

倒閣案 6.7050 約五個禮拜

(2013/9/17 至 2013/10/23) 2013/9/17

食安風波 3.9285 約四個禮拜

(2013/10/22 至 2013/11/19) 2013/10/22

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

61

太陽花學運 15.5767 約四個禮拜

(2014/3/19 至 2014/4/14) 2014/3/19 資料來源:本研究自行整理

4.2 輿情趨勢關聯

將整體 14,729 篇中央社政治新聞,時間區間從 2013/6/10 至 2014/5/6 日共 330 天的文件,將文件極性轉換成以每日為單位的情緒趨勢,與台灣指標調查研 究股份有限公司,簡稱「台灣指標民調」(TISR),所公布的「台灣民心動態調 查、總統與內閣評價」民意調查資料進行相關性比較,該民調資料是每個月做上 下旬兩次的調查,利用調查項目其中的「馬英九總統任內行政院長滿意度趨勢資 料」部分,擷取 2013 年 6 月上旬到 2014 年 4 月下旬的行政院長不滿意度趨勢進 行比較。

圖 4-21 行政院長不滿意度趨勢 資料來源:修改自台灣指標民調

但情緒趨勢的波動過於頻繁密集(圖 4-22),所以利用移動平均法將情緒線做

30 35 40 45 50 55 60 65 70

不滿意度(%)

行政院長不滿意度

此外,採用皮耳森相關係數(Pearson correlation coefficient)分別測試 15 日以內的 情緒移動平均線與行政院長不滿意度的相關程度,如圖 4-23 所示。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

63

其最高相似係數在 10 日移動平均有 r=0.5330,相關程度普遍不高。經由本 研究所設計的正向門檻值後,將文件分為正向、負向與中立,在整體研究資料中,

正負文件數量比例為 8028 篇比 6669 篇,故將每篇負面文件極性權重乘以 1.2 倍,

同樣將加權後的情緒線進行 15 日以內的移動平均與行政院長不滿意度的相關程 度,如圖 4-24 所示。

圖 4-24 不滿意度與加權後情緒移動平均之趨勢 資料來源:本研究自行整理

在加權過後,可以發現整體相似度都提高許多,且在 11 日移動平均時,有 最高的相關係數 r=0.7347。

最後,將 15 日情緒移動平均趨勢與行政院長不滿意度趨勢疊合呈現於下圖 4-25。

0.3 0.35 0.4 0.45 0.5 0.55 0.6 0.65 0.7 0.75 0.8

2 3 4 5 6 7 8 9 10 11 12 13 14 15

相關係數

移動平均天數

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

64

圖 4-25 行政院長不滿意度與加權後 15 日情緒移動平均線趨勢 資料來源:本研究自行整理

其相似係數有 r=0.7146。由結果可得知,新聞輿情趨勢對行政院長不滿意度 有著高於七成的相關性。為了證明其樣本顯著性,使用成對樣本 T 檢定在顯著

水準α=0.05 下,檢定這兩變數是否有相關性,建立統計假設:

𝐻0:兩變數不相關(ρ=0)

𝐻1:兩變數相關(ρ≠0)

|𝑡| > 𝑡𝛼 2,⁡⁡⁡𝑛 −1= | -3.53191328| ˃ 2.093024054 故拒絕𝐻0,接受𝐻1

也可利用ρ 值檢定,計算出來其 ρ = 0.002227931 < α =0.05,故拒絕𝐻0,接受𝐻1。 可得新聞輿情與行政院長不滿意度有顯著的相關性。

30 35 40 45 50 55 60 65 70 75 80

情緒移動平均 行政院長江宜樺不滿意度

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

65

第五章 結論與未來展望

5.1 結論與建議

本研究以新聞偵測追蹤方式,撰寫程式自動撈取 2013 年 6 月 10 日至 2014 年 5 月 6 日的中央社政治類新聞,進行新聞文件分群歸類以及意見情感分析,並 用傳統民意調查資料驗證,提出一種在資料科學時代觀察民情民意的方向。

在研究結果第一部分,我們可以藉由事件極性與數量趨勢圖,來回顧事件的 樂觀悲觀波動與生命週期,也可以利用事件成長數量的高峰(斜率)找出事件中的 熱門關鍵點發生了甚麼重大內容。此外,本研究以 TVBS 民意調查中心的民調資 料與分群分類結果的負面事件群集與民調資料相互比對,可以發現在時間點上與 事件輿情方面都有相關性,也間接證明了本研究的分群分類方式能夠有效的將新 聞事件分門別類,讓大眾能夠快速方便了解事件的來龍去脈。在九月政爭部分,

本研究再一次分群將其分為兩個事件群集,對照民調資料也能夠將九月政爭的子 事件有效拆解出來。

透過計算事件熱門時間區間,發現政治類的負面事件熱門週期皆持續約四個 禮拜左右,我們能夠在事件熱門程度之斜率超過一定的門檻後,提早做接下來的 時程規劃與相關措施。

研究結果第二部分,利用台灣指標民調發布的行政院長不滿意度,與本研究

研究結果第二部分,利用台灣指標民調發布的行政院長不滿意度,與本研究

相關文件