3.1 最短路徑的暴露所帶來的威脅
社會網絡權重圖形中,最短路徑可以代表朋友間友誼的輕重、商業網絡的交 易量、或是聯繫的成本等等,是十分重要且敏感的。當最短路徑成為了攻擊者掌 握的背景知識時,受害者的交友資訊或是企業的決策,會立即受到巨大的威脅。
透過最短路徑,在友誼的網絡之中,可以了解誰是受害者最親近的朋友,除了受 害者的人身安全,亦或是朋友的安全,皆無法受到保障。在商業的交易網絡之中,
最短成本路徑被競爭對手知曉時,可能會影響到企業間策略的實行,導致計劃無 法成功,進而增加成本或是損失,若可以防範最短路徑的隱私被揭露,不論是友 誼的網絡,甚至是商業的網絡,都可以使得敏感資訊受到妥善的保護。過去,針 對社會網絡權重圖形上的最短路徑,並沒有有效防範的實際策略,使得最短路徑 之資訊暴露在危險的環境之中。本研究將提供 k-anonymous path privacy,用以解決 最短路徑資訊暴露在社會網絡上的問題。
3.2 圖形符號與定義
本研究中,假設社會網絡無方向圖形(undirected graph)中的元素集合為 V,
V={v1, v2, v3, …, vi},i>0,代表所有圖形上所存在的點,點與點之間形成眾多的邊 形成集合 E,代表元素間的關聯,eij代表點 vi與 vj間的關聯所形成的一條邊,使 得 E={e12, e13, …, eij},i, j>0,i≠j。所有邊上擁有的資訊權重形成集合 W,可代表 不同的意義,如:交易流量、友誼輕重等,wij代表 vi與 vj所連結之邊上存在的資 訊流量,使得 W={w12, w13, …, wij},i, j>0,i≠j。D={d1, d2, d3, ..., di},i>0,表示 所有圖形終點的度數,di則表示點 vi所連結的邊數。PVij用來表示點 vi、vj此固定 配對節點在圖形之中的最短路徑之集合。
3.2.1 最短路徑資訊之隱匿-k-anonymous path privacy
保護最短路徑之隱私,以直覺與基礎的想法,就是將圖形內的路徑資訊化為 k 個相同的最短路徑資訊,使得攻擊者能判斷出原始最短路徑的機會降低至 1/k 以下。
除此之外,保護隱私的同時,本論文也考量確保即使圖形經過保護後,原始的最 短路徑也不會受到更變,並且更改的權重數量將盡可能地接近原始圖形,使隱匿
15
過後的圖形也可以保留實用性。圖 3.1 內,若攻擊者想揭發點 V1與 V6間的最短路 徑,如圖所示,隱匿前圖形的紅色虛線即為最短路徑,PV16={[V1 →V3 →V4 →V6]}。
經過隱匿後,最短路徑P’V16={[V1 →V3 →V4 →V6], [V1 →V2 →V3 →V4 →V6]},透 過 k-anonymous path privacy 之保護,攻擊者能夠判斷原始最短路徑的機率降低至 1/2。
為了達成最少的權重更動與形成 k 條最短路徑為目的,k-anonymous path privacy 直覺的想法即是尋找第二最短路徑,由於第二最短路徑與最短路徑之權重 差距最小,使修改的權重數量符合本研究更動最小之主旨。因此,在隱匿原始圖 形之最短路徑前,我們必須找到前 k 條最短路徑,並修改他們,使得最短路徑達 成隱匿的保護。
在過去,對於固定配對之兩節點於點數為 v、邊數為 e 之圖形 G 中,尋找其 k 條最短路徑之排名,Yen (1971)擁有許多的貢獻。透過尋找第一條最短路徑偏離點
(deviation)的方式,用以找到下一條最短路徑,是 Yen 之演算法之特性。而 Martins 與 Pascoal (2003)對 Yen 所發明的演算法提出了改良,雖然演算法的最差時間複雜 度同 Yen 之演算法為 O(Kv(e + vlogv)),但是在平均時間複雜度上,較 Yen 的方法 快速。因此本研究採用 Martins 等人所提出之改良方法,尋找圖形中固定配對節點 之前 k 條最短路徑並更動權重,使圖形符合本研究達成 k-anonymous path privacy 之目的。
然而,即使知曉了最短路徑之排名,若隨意更動其路徑上的權重,可能會使 原始的最短路徑也遭受更改。為了保護原始最短路徑,本研究將邊的種類分為三 個部分:Never-Visited、All-Visited 與 Partial-Visited。如圖 3.2 中,以 V1 、V6為配 對節點之最短路徑為 V1 →V3 →V4 →V6,而第二最短路徑則是 V1 →V2 →V3 →V4
→V6,e12、e13、e23皆為兩條路徑不重複經過之邊,在此我們稱為 Partial-Visited edge
隱匿前原始圖形 隱匿後修改圖形
圖 3.1 隱匿前後之圖形比較(k=2)
(PV),而兩條路徑皆通過 e34與 e46兩邊,因此稱為 All-Visited edge(AV),剩餘 尚未被路徑經過的邊,本研究以 Never-Visited edge(NV)稱之。由於邊的類型不 同,也會影響修改邊的選擇,我們可以發現,少量修改 NV 的權重,並不會對原始 路徑造成任何衝擊。若 AV 遭受修改,則會使全體通過之最短路徑的權重總和改變。
本研究將不考慮修改 PV,由於 PV 的更動只會對部分的通過路徑有影響,原始最 短路徑可能會因此更動。
本研究之方法,針對 NV 與 AV+NV 兩種情況修改路徑上之權重,並且提供不同的 隱私層級之實驗結果,來進行討論與比較。下一章節,我們將介紹 k-anonymous path privacy 詳細的演算法,並說明本方法之時間複雜度。
圖 3.2 圖形上邊之類型比較
17