• 沒有找到結果。

第一章 緒論

1.4 論文章節架構

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

3

1.3 論文貢獻

本論文嘗試將時變資料視覺化與階層資料視覺化兩種視覺化呈現互相整合,

產生能夠更多元表達階層資料隨時間變化的視覺化結果,本論文的方向主要可以 分為以下三大部分,各部分內容簡單敘述如下:

 探討如何利用兼顧簡潔與清楚表達資料隨時間變化的時變資料視覺化來 表達資料特性。

 探討如何利用階層資料視覺化能適時表達使用者所關心的資料階層變化 與資料特性。

 探討如何將時變資料視覺化與階層資料視覺化進行有效率的排版與結合,

並設計互相關聯之直覺式互動。

1.4 論文章節架構

在第二章中,本論文將會介紹與本論文相關的研究背景知識,第三章為主要 的研究方法與步驟,第四章為實驗結果呈現與分析比較討論,第五章為結論與未 來研究。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

4

第二章 相關研究

在此章節本論文將會整理與本論文的研究背景知識所相關之論文,依視覺 化種類分為時變資料與階層資料兩個部分進行相關研究之探討,並在第三部分 探討時變資料與階層資料其資料結構上如何搭配與設計等相關研究。

2.1 時變資料圖形生成與應用

2008 年,Byron 與 Wattenberg 統整 Stacked Graph 排版演算法的設計,對 stacked graph 的發展進行系統性的整理 [3],其中包含已被社會大眾廣泛使用於 日常生活中圖形報表的 Traditional Stacked Graph,與具有突顯 layer 間隨著時間 序列變化之勢力消長情形的 ThemeRiver Graph。該研究對於 Stacked Graph 如 何透過電腦演算法進行設計立下良好的研究基礎,且針對排版提出改良方法,減 少 slope 過於急驟的上升與下降,使 layer 隨著時間序列的變化情況更能貼近 原始資料的情形,並將改良過後的設計命名為 Streamgraph ,由於 ThemeRiver Graph 與 Streamgraph 能以簡單的視覺設計傳達直觀的訊息,至今已被廣泛應用 在探討社群網絡 (social network) 下族群間交互影響情形,並透過探索式資料分 析 (exploratory data analysis) 之方式比較在時間因素的介入下特定族群的聲量傳 播差異。

圖 1 Stacked Graph 四種分類:(a.)Traditional Stacked Graph、(b.)ThemeRiver Graph、(c.)最佳化 wiggle function 之 Stacked Graph、(d.)Streamgraph [3]

virtual tangibility 之目標,且更進一步地定義手勢操作來強化傳統 stacked graph 之功能性,透過基本的縮放與點擊手勢,讓 stacked graph 能間接呈現階層式資

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

6

圖 2 DimpVis 將傳統時間軸與視覺化結合及其隱含軌跡之設計 [5]

針對故事、書籍劇情進行分析是一個研究已久的領域,當故事劇情複雜時,

人物角色與故事中的場景隨著時間變化與敘述方式的不同常有穿插出現的情形 發生,而各種人物角色在故事中所遭遇的事件跟故事場景的關係也常具有階層式 架構的型態,2013 年,Liu 等人提出 StoryFlow,提供了基於 Storyline 來追尋 劇情發展的視覺化方法 [8],以線表示人物角色,contour 表示故事場景,並加以 考量故事中事件發生的順序,來設計視覺化所能忠實表達結果之資料結構,再透 過視覺化設計上的改良,考慮線段交疊問題與 stacked graph 之排版設計準則,

StoryFlow 在 case study 上得到很高的評價,並且可將資料擴展至社群媒體上,

可進行分析 Twitter 上的資料,透過視覺化的結果分析不同的意見領袖與議題隨 時間序列的演變。

圖 3 StoryFlow 設計準則與互動機制之配合 [8]

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

7

2013 年,Xu 等人以兩個 Streamgraph 作為不同顏色之上下層,搭配文字雲 (Word Cloud)相互輔佐,並邀請專業之傳播學者進行合作,針對社群媒體(Social Media)上所討論的議題隨時間序列的變化之勢力角逐情形進行視覺化 [9],該研 究以傳播學的理論基礎來探究社群媒體議題關係複雜程度,得到了社群媒體上的 議題關係通常是 multiple-type 且 dynamic 之結論,導致易讀、直觀的視覺化結 果製作上有其困難度,表達出現今社會雖然已強烈依賴社群媒體作為傳達意見的 重要媒介,但由於傳播學理論與視覺化技術並沒有相對應的成熟度,使得相關研 究並不多見,透過傳播學理論的基礎考量後,該研究之視覺化結果在繪製區域之 底層呈現議題在時間變化上的競爭與關注程度之消長,並在每個互相角逐大眾關 注程度的議題上視覺化意見領袖族群在時間變化上對於該議題關注的變化,該研 究是近年社群媒體視覺化中具有代表性之例子,能以直觀的方式觀察意見領袖如 何操作一個社群媒體上的議題被大眾關注的程度。

圖 4 分析社群媒體上的資料來進行勢力消長情形之視覺化 [9]

2.2 階層資料之隱性表達方式改良

Stasko 等人在 2000 年針對 Sunburst 提出一套改良方法 [10],使得較為零 碎的階層資料能夠得到更有效率的關注程度,Sunburst 屬於階層資料視覺化中隱 性表達的一個顯著例子,而資料的階層性常見於生活與資訊科學領域中,譬如公 司組織、族譜或者是電腦檔案結構都是階層資料的例子,而最常見的階層資料視 覺化方式是以顯性表達方式中的樹狀結構來呈現,樹狀結構繪圖演算法能清晰表

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

8

達 parent-child 結構,但隱性表達方式如 Treemap [22] 視覺化其優勢在於能夠 比顯性表達方式更清楚的呈現樹狀結構中各節點的屬性,例如各節點類型或者是 資訊量高低,且能夠較有效率地進行比較。

而對於資訊量偏低的節點,在 Sunburst 中的呈現卻有其缺點,起因於其幾 何區域擴張角度會被其他資訊量相對高之節點壓縮,導致擴張角度較小而 Sunburst 中會出現部分零碎區域的情況,該篇論文即對此情況提出三種改良方法,

使得使用者在使用隱性階層資料視覺化時,能夠更有效地觀察並與資訊量相對較 低的訊息互動。

圖 5 針對 Sunburst 零碎區域視覺化之改良方法其一 [10]

2.3 時間序列與階層式資料結構化標準

Rind 等人在 2013 年提出 TimeBench,該研究致力於解決設計時間關聯性資 料視覺化過程中會碰到的問題 [6],由於時間是一種特殊的維度,不同於一般計 量所使用的維度,時間擁有各式各樣的粒度,導致開發者在設計視覺化演算法時 需要耗費大量的時間成本針對少數研究上所關注的案例重新設計特定的解決方 法 (ad-hoc),且無法有彈性地活用在其他案例上,以諸多會運用到時間序列資料 之領域為例,常見的有電子醫療紀錄、網路流量紀錄等,再者,在缺乏一套結構 化標準的情況下,開發者往往會因為無法透過一套標準輔助來互相與其他研究合

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

9

作或進行比較,故 TimeBench 設計了一套針對時間關聯性資料視覺化的資料結 構與演算法設計方式,對時間維度定義三種重要的模型與結構-時間粒度 (granularities)、時間元素(time primitives)、時間不確定性 (determinacy),希望能 基於對時間定義其設計準則,進而推廣到演算法與資料結構的設計考量上,使往 後針對時間關聯性資料視覺化之研究能有一套標準可以參考,減少開發上所耗費 的時間成本。

圖 6 時間維度上的粒度與時間元素之關係 [6]

2013 年,Dou 等人提出 HierarchicalTopics [7],表達出在這個資訊爆炸,

且社群媒體已成為人們生活中不可或缺接收或傳達資訊的重要媒介,資訊產生的 速度非常迅速,導致大量的資訊對分析上也造成一定程度的困難性,但這些巨量 資料的背後隱藏未被發掘且豐富的研究價值,該研究著重在如何高效率地分析資 料,並提出三個期望高效率分析所會面臨的設計問題-如何有效率地將各自分散 之議題組織成主題、如何透過視覺化結果表達主題所要傳達之訊息,並允許使用 者進行互動式操作依照需求對主題之組織進行更改、如何分析議題中隱含的訊息,

改進組織主題的結構能夠表達更明確的視覺化結果。該研究針對上述設計提出 Topic Rose Tree ( TRT )演算法,能夠自動地將議題產生階層式架構,並且能透過 使用者改變視覺化間接更改 TRT 演算的結果,並採用 stacked graph 的呈現方 式表達主題之間隨時間變化所隱含的訊息。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

10

圖 7 Topic Rose Tree (TRT) 演算法的三種主要操作 [7]

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

11

第三章 研究方法與步驟 3.1 系統架構

圖 8 系統流程圖

本論文目前利用 ThemeRiver Graph 呈現時變資料視覺化,由於時變資料視 覺化需要時變性資料配合方能進行呈現,而本論文主要研究之資料集來自於 Facebook Graph API , 並 希 望 呈 現 Facebook 上 粉 絲 專 頁 與 其 貼 文 之 評 論 (comments)資料行為隨時間變化之情形,但除了評論資料本身與回覆所發布之時 間外,按讚資料並無時間記錄,故在 ThemeRiver Graph 上之呈現,本論文採用每 筆評論資料當前即時之按讚數做為 ThemeRiver Graph 所呈現之 layers 其中之一,

並以當前即時之回覆數做為另一層 layer 使得使用者能夠在時變資料視覺化上觀 察兩者之關係。

而針對階層資料視覺化,本論文利用 Sunburst 呈現 Facebook 上行為中的聲 量比例,聲量代表某些議題得到大眾關注的廣度,而在社群網路中,按讚是其中 最能代表 Facebook 特色的社群行為,當一位 Facebook 使用者想對一則評論表 達同意與支持,成本最低之方式能透過按讚來表現,故聲量的大小能以得到的按 讚數量來代表,本論文將按讚數進而轉換為 Sunburst area 的大小與顏色深淺,

並藉由 Sunburst 屬於階層資料隱性表達的特性,有效地利用環狀排列的特色易

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

14

上二者可直接決定 Stacked Graphs 呈現方式的不同,且能大致區分為三類:

Traditional Stacked Graph、ThemeRiver Graph、Streamgraph,為了精確表達 Stacked Graphs 在數學上之繪製方式,我們將時間序列資料設計成 n 個非負實數值函式 f1, …, fn以代表n個類型資料隨時間所形成之時間序料資料,本論文將n設為2表示 一位貼文評論者於Facebook貼文上得到之按讚與回覆行為之計數,並涉及m個經 前處理過後所要進行視覺化呈現之評論者,其數學模型由公式(1)所示,並定義 Stacked Graphs 底部線條為 baseline function g0 ,與位於 Stacked Graphs 頂部第 i 個時間序列資料 fi 為 gi,可定義以下公式(2):

Traditional Stacked Graph、ThemeRiver Graph、Streamgraph,為了精確表達 Stacked Graphs 在數學上之繪製方式,我們將時間序列資料設計成 n 個非負實數值函式 f1, …, fn以代表n個類型資料隨時間所形成之時間序料資料,本論文將n設為2表示 一位貼文評論者於Facebook貼文上得到之按讚與回覆行為之計數,並涉及m個經 前處理過後所要進行視覺化呈現之評論者,其數學模型由公式(1)所示,並定義 Stacked Graphs 底部線條為 baseline function g0 ,與位於 Stacked Graphs 頂部第 i 個時間序列資料 fi 為 gi,可定義以下公式(2):