第一章 緒論
1.1 研究背景
許多現實世界的應用都可以轉化為有權重或無權重的圖形,例如社群網路、
交通網路、通訊網路和商業交易網路等等。以運輸網路為例,圖形上的節點為運 輸地點,連結為兩地點之間所經過道路。圖形節點上可儲存運輸地點的相關資訊,
如店家名稱、地址等,而連結上可儲存經過兩個地點所需要的時間、石油成本等,
因此可運用相關圖形理論來進行計算,得到此運輸網路的相關特性,如計算最短 路徑或尋找有關連的群體等。但是這些圖形網路通常數量龐大且結構複雜,要進 行相關圖形運算通常需要耗費大量時間。
而近年來興起的雲端運算提供可集中操作的儲存運算平台,雲端運算在客戶 端和資料中心之間創造了計算、儲存資源池,讓使用者利用雲端服務提供的計算、
儲存資源,快速地存取儲存在雲端的資料和應用程序。從成本和性能兩方面考慮,
這是一種很好的誘因讓使用者利用雲端運算來管理大量的圖形資料,並且有效率 地處理複雜的圖形操作運算,例如計算最短路徑。
無論如何,這些服務關注的重點之一是隱私洩漏所帶來的負面影響,例如客 戶可能會害怕敏感數據暴露,而不願意發佈他們的資料庫。目前研究表示在隱匿 處理後的圖形公布資料,有四種常見的隱私類型被侵犯:
(1) 身份揭露: 在圖形中的節點被辨識的威脅,攻擊者利用可辨識個人身份 的資訊,例如社會安全號碼,來辨識圖形資料上的特定節點,並獲得該節點的相 關個人資訊。(2) 連結的揭露: 節點之間關係的威脅,例如,辨識出 Ada 和 Bob 彼此互相認識。(3) 屬性的揭露: 節點或連結的屬性被辨識的威脅,例如辨識出 Ada 和 Bob 彼此是同事關係。(4) 連結權重的揭露:連結的權重被辨識的威脅,例 如辨識出 Ada 和 Bob 親密度很高,兩人經常互動,因此擁有較高的權重。另外
2
透過這些被辨識的連結權重,攻擊者可以計算任意兩個節點的最短路徑,即辨識 出透過哪些節點可以最快接觸到另一位受害者。
為了保護公開資料中用戶的隱私,目前已經提出多種技術來隱匿公開資料中 用戶的資訊,例如(1) 移除所有可辨識的個人資料,如個人身份證字號、居住地 址等,使攻擊者沒有可用來辨識的相關資料。(2) 加入額外的假節點或連結屬性、
修改圖形中節點、連結的屬性等,使得每樣屬性至少有 k 個重複的值來混淆攻擊 者。(3) 調整連結權重並擾亂權重排序,使攻擊者無法得到正確的權重排序,進 一步使任意兩點的最短路徑無法被辨識等等。
1.2 研究動機與目的
近年圖形相關的隱匿技術不斷地發展,而雲端運算環境中計算最短路徑距離 的議題在近年受到注意。Gao et al., (2011) [5] 提出 1- Neighborhood-d-Radius 隱 私概念。該方案中,資料擁有者將圖形轉化為連結圖(link graph)和數張外包圖 (outsourced graph),其中連結圖保存在客戶端(資料擁有者),數張外包圖則分別 儲存在不同雲端伺服器。最短路徑距離透過同時使用這兩種圖形可以被正確地計 算出來,並保護儲存在雲端伺服器上子圖節點的 1- Neighborhood-d-Radius 隱私。
但是,為了得到符合 1-Neighborhood-d-Radius 隱私概念的外包圖,該方案 必須事前計算出所有最短路徑,然後隨機選擇數條最短路徑合併一張子圖,並移 除鄰居節點才能轉換為一張外包圖,再儲存到雲端伺服器上。然而,事前計算所 有最短路徑,可能會消耗大量的計算時間,利用數條最短路徑形成子圖,會導致 子圖之間的大量重疊,也需要消耗大量時間進行調整。
因此,本研究提出以下三個方案: (1) 擴充 1-neighborhood 隱私的概念,提出 較靈活的 k-skip 最短路徑隱私保護,資料擁有者可自行決定隱匿 k 層以內鄰居資 訊,並且可避免事前計算所有最短路徑,縮短事前處理時間。(2) 提出新的隱私 保護,稱為敏感路徑隱私 (sensitive path privacy),讓特定敏感路徑的起點、終點
3
必須分散到不同雲端伺服器,避免敏感節點的最短路徑在同一張子圖上出現,使 攻擊者無法直接在雲端伺服器上辨識出該條最短路徑距離。(3) 提出利用節點階 層技術和由下而上之圖形切割方法,能有效率地進行圖形轉換與子圖切割工作。
當資料擁有者給定一張有權重的無向圖,本研究提出之方案能快速地將圖形轉換 成 p 張子圖分散儲存到 p 台雲端伺服器中,並能有效率地計算任意起點、終點的 正確最短路徑距離。
1.3 研究架構
本研究架構共分為六章,以下敘述各章節之步驟:
第一章為緒論,初步描述本研究欲解決的隱私保護問題與期望之研究結果。
第二章為文獻探討,介紹圖形資料上隱匿技術之演變,從圖形結構隱匿、連 結權重隱匿、最短路徑隱匿,一直到近年受關注之雲端運算最短距離計算與隱匿 技術,並討論此技術與本研究之相關性。
第三章為雲端中最短路徑查詢隱匿之問題描述,說明目前雲端中最短路徑隱 私保護之問題,然後定義本研究提出之兩種隱私保護: (1) k-skip 最短路徑隱私、
(2) 敏感路徑隱私,並且詳細描述兩種隱私保護方法的保護效果。
第四章介紹本研究提出之四階段處理步驟,分別為(1) 建立 k-skip 隱匿圖 (2) 調整敏感路徑起終點 (3) 建立節點階層 (4) 由下而上之圖形切割。依此步驟完 成之外包子圖,可滿足本研究定義之 k-skip 最短路徑隱私與敏感路徑隱私,並可 有效率地計算任意兩點之正確最短路徑距離。
第五章為實驗結果與分析,利用 3 組不同規模之人工圖形資料集,透過改變 參數觀察對建立時間、查詢時間等變化,瞭解本研究提出之演算法特性。
第六章為結論與未來研究方向,總結本研究之實驗結果,並且提出兩點雲端 中最短路徑隱私保護之未來研究方向。
4