緒論 - 雲端中最短路徑之隱匿

第一章緒論

1.1 研究背景

許多現實世界的應用都可以轉化為有權重或無權重的圖形，例如社群網路、

交通網路、通訊網路和商業交易網路等等。以運輸網路為例，圖形上的節點為運輸地點，連結為兩地點之間所經過道路。圖形節點上可儲存運輸地點的相關資訊，

如店家名稱、地址等，而連結上可儲存經過兩個地點所需要的時間、石油成本等，

因此可運用相關圖形理論來進行計算，得到此運輸網路的相關特性，如計算最短路徑或尋找有關連的群體等。但是這些圖形網路通常數量龐大且結構複雜，要進行相關圖形運算通常需要耗費大量時間。

而近年來興起的雲端運算提供可集中操作的儲存運算平台，雲端運算在客戶端和資料中心之間創造了計算、儲存資源池，讓使用者利用雲端服務提供的計算、

儲存資源，快速地存取儲存在雲端的資料和應用程序。從成本和性能兩方面考慮，

這是一種很好的誘因讓使用者利用雲端運算來管理大量的圖形資料，並且有效率地處理複雜的圖形操作運算，例如計算最短路徑。

無論如何，這些服務關注的重點之一是隱私洩漏所帶來的負面影響，例如客戶可能會害怕敏感數據暴露，而不願意發佈他們的資料庫。目前研究表示在隱匿處理後的圖形公布資料，有四種常見的隱私類型被侵犯:

(1) 身份揭露: 在圖形中的節點被辨識的威脅，攻擊者利用可辨識個人身份的資訊，例如社會安全號碼，來辨識圖形資料上的特定節點，並獲得該節點的相關個人資訊。(2) 連結的揭露: 節點之間關係的威脅，例如，辨識出 Ada 和 Bob 彼此互相認識。(3) 屬性的揭露: 節點或連結的屬性被辨識的威脅，例如辨識出 Ada 和 Bob 彼此是同事關係。(4) 連結權重的揭露:連結的權重被辨識的威脅，例如辨識出 Ada 和 Bob 親密度很高，兩人經常互動，因此擁有較高的權重。另外

透過這些被辨識的連結權重，攻擊者可以計算任意兩個節點的最短路徑，即辨識出透過哪些節點可以最快接觸到另一位受害者。

為了保護公開資料中用戶的隱私，目前已經提出多種技術來隱匿公開資料中用戶的資訊，例如(1) 移除所有可辨識的個人資料，如個人身份證字號、居住地址等，使攻擊者沒有可用來辨識的相關資料。(2) 加入額外的假節點或連結屬性、

修改圖形中節點、連結的屬性等，使得每樣屬性至少有 k 個重複的值來混淆攻擊 者。(3) 調整連結權重並擾亂權重排序，使攻擊者無法得到正確的權重排序，進一步使任意兩點的最短路徑無法被辨識等等。

1.2 研究動機與目的

近年圖形相關的隱匿技術不斷地發展，而雲端運算環境中計算最短路徑距離 的議題在近年受到注意。Gao et al., (2011) [5] 提出 1- Neighborhood-d-Radius 隱 私概念。該方案中，資料擁有者將圖形轉化為連結圖(link graph)和數張外包圖 (outsourced graph)，其中連結圖保存在客戶端(資料擁有者)，數張外包圖則分別儲存在不同雲端伺服器。最短路徑距離透過同時使用這兩種圖形可以被正確地計 算出來，並保護儲存在雲端伺服器上子圖節點的 1- Neighborhood-d-Radius 隱私。

但是，為了得到符合 1-Neighborhood-d-Radius 隱私概念的外包圖，該方案 必須事前計算出所有最短路徑，然後隨機選擇數條最短路徑合併一張子圖，並移除鄰居節點才能轉換為一張外包圖，再儲存到雲端伺服器上。然而，事前計算所有最短路徑，可能會消耗大量的計算時間，利用數條最短路徑形成子圖，會導致子圖之間的大量重疊，也需要消耗大量時間進行調整。

因此，本研究提出以下三個方案: (1) 擴充 1-neighborhood 隱私的概念，提出 較靈活的 k-skip 最短路徑隱私保護，資料擁有者可自行決定隱匿 k 層以內鄰居資 訊，並且可避免事前計算所有最短路徑，縮短事前處理時間。(2) 提出新的隱私保護，稱為敏感路徑隱私 (sensitive path privacy)，讓特定敏感路徑的起點、終點

必須分散到不同雲端伺服器，避免敏感節點的最短路徑在同一張子圖上出現，使攻擊者無法直接在雲端伺服器上辨識出該條最短路徑距離。(3) 提出利用節點階層技術和由下而上之圖形切割方法，能有效率地進行圖形轉換與子圖切割工作。

當資料擁有者給定一張有權重的無向圖，本研究提出之方案能快速地將圖形轉換 成 p 張子圖分散儲存到 p 台雲端伺服器中，並能有效率地計算任意起點、終點的 正確最短路徑距離。

1.3 研究架構

本研究架構共分為六章，以下敘述各章節之步驟:

第一章為緒論，初步描述本研究欲解決的隱私保護問題與期望之研究結果。

第二章為文獻探討，介紹圖形資料上隱匿技術之演變，從圖形結構隱匿、連結權重隱匿、最短路徑隱匿，一直到近年受關注之雲端運算最短距離計算與隱匿技術，並討論此技術與本研究之相關性。

第三章為雲端中最短路徑查詢隱匿之問題描述，說明目前雲端中最短路徑隱 私保護之問題，然後定義本研究提出之兩種隱私保護: (1) k-skip 最短路徑隱私、

(2) 敏感路徑隱私，並且詳細描述兩種隱私保護方法的保護效果。

第四章介紹本研究提出之四階段處理步驟，分別為(1) 建立 k-skip 隱匿圖 (2) 調整敏感路徑起終點 (3) 建立節點階層 (4) 由下而上之圖形切割。依此步驟完 成之外包子圖，可滿足本研究定義之 k-skip 最短路徑隱私與敏感路徑隱私，並可 有效率地計算任意兩點之正確最短路徑距離。

第五章為實驗結果與分析，利用 3 組不同規模之人工圖形資料集，透過改變參數觀察對建立時間、查詢時間等變化，瞭解本研究提出之演算法特性。

第六章為結論與未來研究方向，總結本研究之實驗結果，並且提出兩點雲端中最短路徑隱私保護之未來研究方向。

在文檔中雲端中最短路徑之隱匿 (頁 5-8)

緒論

第一章 緒論

1.1 研究背景

1.2 研究動機與目的

1.3 研究架構

第一章緒論