第三章 系統平台與分析
3.5 系統設計
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
顯著的現實世界中的意義9。並根據圖 3.5 顯示,我們利用在 gephi 中提供了排序(Ranking) 功能將本論文所設計的相似度演算法計算出來的數值進行排序,該功能可以將每個節點 的分數做排序分類,再利用 gephi 中提供的網絡模組演算法(modularity class)將我們的資 料分類後,進行分隔(Partition)比較。發現兩者之間,除了在模組(module)間的分類後所 產生的數量有所差異,但在節點的分佈上,相似度非常的接近。由此可知,本系統設計 的相似度模組的演算法與目前常用的網絡演算法相當一致。
圖 3.5 gephi’s modularity class(網絡模組分類)與本研究中定義的相似度模型比較
3.5 系統設計
在上一章節中,說明了資料分析方法,也定義了相似度模型計算公式。接下來,則是針 對本研究目標(1)提供相片故事版型檢索方法、(2)藉由電腦與使用者互動輔助敘事創作,
說明系統設計方式。
9 http://wiki.gephi.org/index.php/Modularity
27
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
3.5.1 故事版型與故事型態
因為本論文所提出的應用是將相片與互動敘事創作結合,所以我們參考 Brooks[19]所提 到的故事框架(Story Framework)的概念,此概念是為使用者提供一個典型的故事架構,
讓使用者可以在故事創作時的輔助,不需要憑空創作。所以本論文提出以”故事版型”的 概念作為輔助使用者創作以及檢索相片。故事版型是指我們將標籤屬性做不同的組合,
組出一個特定主題的相片故事框架,協助使用者利用此框架中所推薦的主題相片,來進 行一連串的敘事創作。故事型態的概念是根據故事版型所設定的故事主題的特徵方向來 區分;而我們設定特徵方向是為了與相似度模型演算法之間做結合。當故事版型的主題 傾向於用關鍵字描述所需的故事框架時,我們會將故事型態設定為關鍵字型態,系統根 據此設定,就會將故事版型以關鍵字相似度模型做為主要的計算方法。因此,我們將故 事型態以相似度模組設成互相對應的型態。這樣的設計方式可以達到多樣化的故事版型 設計,也可以讓系統可以判斷每個故事版型所對應的模組計算方法。
3.5.2 相片檢索方法
本系統是利用相似度模型比較進行相片檢索,為了讓故事版型能設定以哪種相似度模型 做為主要的計算方法,我們提供給使用者的檢索故事版型分成三種型態:關鍵字型態、
空間型態、時間型態。根據 3.5.1 小節的說明,故事版型與故事型態是多對一的關係,
即可以有多個故事版型設定為相同的故事型態。而故事型態與相似度模型則是權重大小 的關係。所謂的權重大小是指該故事型態與三種相似度之間的相依性(式 3-12)。例如,
故事型態為關鍵字型態,則在 3.3 小節中所提到關鍵字模型中的相似度(式 3-1)相依性很 高。所以給予這個模型的相似度比重較高,也較能突顯該型態所希望過濾的相片屬性。
如圖 3.6 中,各種型態下與各種相似度模型連結的箭頭粗細不同,粗箭頭所指的模組代 表權重較高,虛線箭頭則是代表其他兩個相似度模型所計算出來的相似度的權重較低。
28
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
所以當不同的故事版型(檢索條件)進入系統檢索時,系統會根據該故事版型的型態,給 予不同的相似度模組權重以進行資料檢索,推薦適合說故事的相片。
圖 3.6 相片檢索設計概念圖
接著,我們利用下面四個步驟說明系統如何定義上述的相片檢索設計。
步驟1. 首先,將每張照片的特徵屬性定義為空間向量,相當於高維空中的一個點的座 標。
在圖 3.6中有個照片屬性向量資料庫(Photos Attribute Vector),裡面儲存的是我們根據每 張照片的特徵屬性所定義的座標。但基於特徵定義的型別不同,我們根據3.3小節中定 義的3個相似度模型,將每張照片依照模型定義點座標,並將這些座標儲存於資料庫中。
下列分別是三種模型對於每張照片的點座標定義。
29
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
關鍵字模型
此模型總共有29個關鍵字(人、事、物、感情四個特徵中的屬性),順序為表 3-1 中編號1到29個關鍵字,每個關鍵字代表1個維度,維度型別為布林,0代號無此 屬性,1代表有此屬性。
𝑉𝑉𝑘𝑘 = (a1, a2, … , a𝑛𝑛−1, a𝑛𝑛)
(式 3-9) 𝑛𝑛 = 29
a𝑛𝑛 = 0 or 1
空間模型
此模型將每張照片的GPS的位置記錄成二維向量。維度型別為double,經緯度以 十進位的度數表示(-49.50;-123.50)10
V𝑡𝑡 = (𝑙𝑙1 , 𝑙𝑙2 )
(式 3-10) 𝑙𝑙1 = Latitude, 𝑙𝑙2 = Longitude
時間模型
此模型是將每張照片的拍攝時間的維度型別設為datetime,日期格式為 yyyy/MM/dd HH:mm:ss(西元年/月/日 時:分:秒)
V𝑡𝑡 = (𝑡𝑡)
(式 3-11) 𝑡𝑡 = 照片拍攝時間
10 "Geograpic coordinate system zh-wiki," in
http://zh.wikipedia.org/wiki/%E7%B6%93%E7%B7%AF%E5%BA%A6 30
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
步驟2. 接下來,根據設定好的故事版型參考點與資料庫中的照片屬性向量所代表的點 座點套入3.3小節中定義的三種相似度公式加以計算,並根據不同的故事型態給予不同 相似度模型的權重,最後將其加總成為該相片的總合相似度。但為了使系統能根據與使 用者的互動而變化,系統會加入每張照片的遞減函數(δ𝑝𝑝)來調整每張相片的相似度權重。
如(式 3-12)所示。
S𝑝𝑝 = �𝑤𝑤𝑎𝑎𝑁𝑁𝑆𝑆𝑎𝑎+ 𝑤𝑤𝑔𝑔𝑁𝑁𝑆𝑆𝑔𝑔+ 𝑤𝑤𝑡𝑡𝑁𝑁S𝑡𝑡�δ𝑝𝑝
(式 3-12) S𝑝𝑝 = 故事版型照片及參考點比較後計算出來的相似度
𝑁𝑁𝑆𝑆𝑎𝑎 = 正規化後的關鍵字模型相似度 𝑁𝑁𝑆𝑆𝑔𝑔 = 正規化後空間模型相似度 𝑁𝑁𝑆𝑆𝑡𝑡 = 正規化後時間模型相似度 δ𝑝𝑝代表該相片目前的遞減函數
𝑤𝑤𝑎𝑎 = 關鍵字模型權重 , 𝑤𝑤𝑔𝑔 = 空間模型權重, 𝑤𝑤𝑡𝑡 = 時間模型權重
在此步驟裡,我們將每張照片各自設定一個遞減函數(δ𝑝𝑝),每張照片的遞減函數起始值 為1,該函數會隨著相片出現的次數遞減,以調整由系統計算推薦的相似度分數,如圖 3.7。本研究設計此函數的目的在於,符合版型條件的高相似度相片若一直未被使用者 採用,該相片元素或許不符合使用者故事的需求,利用此函數的特性將其照片的相似度 分數降低後,則可推薦更多元的相片給使用者作為敘事的元素。若系統設計照片不可重 覆推薦,當照片被使用者選取後,則將此照片的遞減函數設為0,則該照片不會再出現 於推薦候選相片之中。
31
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖 3.7 各相片遞減函數示意圖
步驟3. 再依照步驟2中計算出的每張相似度S𝑝𝑝由大到小排序。
排序的目的在於系統設定相似度愈高的相片與故事版型參考點愈相近,代表與故事版型 愈符合,所以必須將其排序,以進行下一步驟的篩選。
步驟4. 將排序後的照片取出相似度臨界點(下限)的相片數後,即為檢索結果。
此步驟的目的是為了建立此故事版型的網絡圖,推薦敘事相片給使用者說故事的候選相 片。我們希望在所有資料庫中的相片必須要有一定程度以上的相似度才可當作檢索結果。
為了使檢索結果符合相似度程度在一個水準之上,就必須定義一個符合系統需求的臨界 點相片數。所以我們利用3.4.1過濾分析小節裡提到的,設定一個(α)值當作下限條件。
此下限條件的定義在於,若不足某一水準(α)下相似度的相片一律不採用,例如:當(α)等 於該相片的平均相似度時,小於平均相似度的相片不採用。
3.6 互動敘事創作方法設計