Twitter 的分析工具 - 新聞事件於社群媒體之發展歷程的視覺化分析工具―以Twitter為例

國

立政治大學

‧

Na tiona

l Ch engchi University

第四步的繪圖。最後再透過介面與使用者互動，瞭解資料的各種面向。

圖 1. 視覺化流程圖

2.2 Twitter 的分析工具

對於 Twitter，Kraft 等人所開發的 Geo and Temporal Association Creator(GTAC)[10]

專門處理 Twitter 上的資料，透過互動式視覺化的介面，顯示出 4W(Who, When, Where, and What)事件指標，簡單清楚呈現了資料在時間及空間上的分佈。最後透過實際案例證明了他們的系統具有近即時(near real-time)的分析能力。然而，

該系統並無法觀察資料集的原始推文，如想進一步探索事件脈絡較為困難。另外，

Bosch 等人所開發出來的 ScatterBlog2[11]雖然也是分析 Twitter 的視覺化分析系統，但他們加入了以使用者為導向的過濾器(filter)來篩選推文，使用者能自行增刪或載入既有的過濾器並調整其門檻，並觀察顯示出來的內容是不是自己想要見到的。

而 Borra 等人所開發的 Digital Methods Initiative Twitter Capture and Analysis

‧

Toolset (DMI-TCAT)[12]工具集，除了抓取 Twitter 推文資料外，亦提供各種分析數據，包含了推文總數、URL、照片、co-hashtag、user-mention 等。匯出後的資料可進一步提供使用者做後續的統計或者網絡圖分析。雖然此工具集提供了收集和匯出分析數據的功能，但目前並不支援中文語系推文的收集。在 Lin 等人的研究[13]中，就利用到 DMI-TCAT 來蒐集資料，並設計一個以輔助記者探索 Twitter 上的事件、挖掘新聞主題為目標的系統。該研究分析了推文的文本內容以建立關鍵字主題模型與名詞共字模型，接著結合視覺化的介面來協助使用者找出想看的內容，但尚未分析推文內含網址的內容。

Meng 等人的研究[14]則利用 Twitter 資料找出以主題為導向的意見總結 (opinion summary)。為了找出具有關鍵訊息的推文，他們做了 insightful tweet 及 opinionated tweet 的分類，前者從英文的語法結構進行，再依關鍵字作分類；後者則比較推文內情緒詞正反面的個數，來判斷該推文針對某個主題是支持、反對或中立的立場。只可惜上述兩項研究皆無視覺化的工具來協助呈現結果。

在 Phuvipadawat 等人的研究[15]中，他們設計了一套流程去收集、分群、評分並追蹤 Twitter 上是即時新聞（breaking news）的推文，依照推文的發文時間、

轉推數（retweet）、發文者追蹤數（follower）等指標來為每一群推文評分。而我們參考該研究中推文分群（grouping）的演算法，協助我們將資料集中的推文分群，演算法的實作細節留在第 4.3 節說明。

針對 Twitter 與傳統新聞媒體的資料，Zhao 等人[16]利用主題模型來比較了兩者間的異同，只可惜大都是數值統計上的分析。本研究做完文本處理後，將字詞間關係利用網絡圖做視覺化的呈現，以期能更深入地比較推文與網址內容上的差異。

由此可知，目前已有不少針對 Twitter 的分析工具以及資訊視覺化的相關研

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

究，但尚未有一個較為完整的事件探索輔助系統，我們希望開發出的系統，可以引導使用者探索事件的發展歷程。

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

第3章系統架構與設計

本章將分為三個部分來說明系統的架構與設計：第一部分為系統架構說明、

第二部分為資料來源，第三部分為系統的介面設計。

在文檔中新聞事件於社群媒體之發展歷程的視覺化分析工具―以Twitter為例 - 政大學術集成 (頁 14-17)

Twitter 的分 析工具

國

立 政 治 大 學

‧

2.2 Twitter 的分析工具

‧

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

第3章 系統架構與設計

Twitter 的分析工具

立政治大學

立政治大學

立政治大學

第3章系統架構與設計