• 沒有找到結果。

立 政 治 大 學

Na tiona

l Ch engchi University

6

第四步的繪圖。最後再透過介面與使用者互動,瞭解資料的各種面向。

圖 1. 視覺化流程圖

2.2 Twitter 的分析工具

對於 Twitter,Kraft 等人所開發的 Geo and Temporal Association Creator(GTAC)[10]

專門處理 Twitter 上的資料,透過互動式視覺化的介面,顯示出 4W(Who, When, Where, and What)事件指標,簡單清楚呈現了資料在時間及空間上的分佈。最後 透過實際案例證明了他們的系統具有近即時(near real-time)的分析能力。然而,

該系統並無法觀察資料集的原始推文,如想進一步探索事件脈絡較為困難。另外,

Bosch 等人所開發出來的 ScatterBlog2[11]雖然也是分析 Twitter 的視覺化分析系 統,但他們加入了以使用者為導向的過濾器(filter)來篩選推文,使用者能自行增 刪或載入既有的過濾器並調整其門檻,並觀察顯示出來的內容是不是自己想要見 到的。

而 Borra 等人所開發的 Digital Methods Initiative Twitter Capture and Analysis

Toolset (DMI-TCAT)[12]工具集,除了抓取 Twitter 推文資料外,亦提供各種分析 數據,包含了推文總數、URL、照片、co-hashtag、user-mention 等。匯出後的資 料可進一步提供使用者做後續的統計或者網絡圖分析。雖然此工具集提供了收集 和匯出分析數據的功能,但目前並不支援中文語系推文的收集。在 Lin 等人的研 究[13]中,就利用到 DMI-TCAT 來蒐集資料,並設計一個以輔助記者探索 Twitter 上的事件、挖掘新聞主題為目標的系統。該研究分析了推文的文本內容以建立關 鍵字主題模型與名詞共字模型,接著結合視覺化的介面來協助使用者找出想看的 內容,但尚未分析推文內含網址的內容。

Meng 等人的研究[14]則利用 Twitter 資料找出以主題為導向的意見總結 (opinion summary)。為了找出具有關鍵訊息的推文,他們做了 insightful tweet 及 opinionated tweet 的分類,前者從英文的語法結構進行,再依關鍵字作分類;後 者則比較推文內情緒詞正反面的個數,來判斷該推文針對某個主題是支持、反對 或中立的立場。只可惜上述兩項研究皆無視覺化的工具來協助呈現結果。

在 Phuvipadawat 等人的研究[15]中,他們設計了一套流程去收集、分群、評 分並追蹤 Twitter 上是即時新聞(breaking news)的推文,依照推文的發文時間、

轉推數(retweet)、發文者追蹤數(follower)等指標來為每一群推文評分。而我 們參考該研究中推文分群(grouping)的演算法,協助我們將資料集中的推文分 群,演算法的實作細節留在第 4.3 節說明。

針對 Twitter 與傳統新聞媒體的資料,Zhao 等人[16]利用主題模型來比較了 兩者間的異同,只可惜大都是數值統計上的分析。本研究做完文本處理後,將字 詞間關係利用網絡圖做視覺化的呈現,以期能更深入地比較推文與網址內容上的 差異。

由此可知,目前已有不少針對 Twitter 的分析工具以及資訊視覺化的相關研

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

8

究,但尚未有一個較為完整的事件探索輔助系統,我們希望開發出的系統,可以 引導使用者探索事件的發展歷程。

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

9

第3章 系統架構與設計

本章將分為三個部分來說明系統的架構與設計:第一部分為系統架構說明、

第二部分為資料來源,第三部分為系統的介面設計。

相關文件