• 沒有找到結果。

第四章、 研究方法與架構

4.3 不同資料來源的分析與優勢

4.3.2 PBQ 分析與優勢

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

44

的技術事先讓 A 醫院的醫生知道病患在 B 醫院的治療情況,像是住院天數、血 壓…等,這樣對醫生和病患都是有益的,可以讓醫生在診治時作為參考的依據。

圖 17、找到單一資料源沒有的資料

4.3.2 PBQ 分析與優勢

本研究主要是分析相同 Domain 的情況下,資料來自不同資料來源時,對於 使用者在查詢使用上或結果分析上,以及資料保護的安全性,與資料來自於相同 來源之間的差異。

在 PBQa∧ PBQb的查詢條件下,以分析結果來說,不單僅僅增加了樣本數,

提高了分析的可信度,更可以得到更豐富的結果加以運用。這裡提出一個情境為 例,假設 A 醫院與 B 醫院皆有相同種類的癌症病患,當使用者欲分析藥物上的 治療對於相同癌症的藥效差異性,而針對 A 醫院與 B 醫院進行資料查詢;假設 A 醫院可能使用藥物 A 來進行此種癌症病患的治療;B 醫院可能使用藥物 B 來 進行相同種類癌症病患的治療,經由資料交換的查詢,我們不僅僅可以分析出哪 些治療藥物相對來說比較有效,更可以經由匿名性雜湊函數的概念進行資料的交 叉比對得知同時使用藥物 A 與藥物 B 的病患有多少人,這是單一資料來源各別 查詢無法達成的。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

45

圖 18、可以交叉比對

另外,在 PBQ 的查詢條件下,以資料保護而言,與單一資料來源不同的地 方在於,使用者經過授權後可以到 A 醫院進行資料的查詢,假設使用者查詢 Birthday、Gender 和 Disease,這三項要素不需要有 Microdata 隱私保護即可揭露;

另一位使用者經過授權後可以到 B 醫院進行資料的查詢,假設使用者查詢 ZIP、

Gender 和 Disease,相同的,這三項要素也不需要有 Microdata 隱私保護即可揭 露;但是若將 A 醫院與 B 醫院倆便個別查詢出來的資料經過比對,我們同時會 發現有四項要素存在 Birthday、Gender、ZIP 和 Disease,其中 Birthday、Gender、

ZIP 為 Quasi-identifiers,再加上 Disease 為 Data Attribute 這些資訊是可以識別唯 一人的,這樣的狀況是我們不希望發生的,如圖 19。所以就資料保護而言,本 研究資料交換的好處在於可以避免上述各別查詢然後在人工比對的狀況發生,當 使用者欲查詢 Birthday、Gender、ZIP 和 Disease 這四項要素時,會知道已違反了 Quasi-identifiers 與 Data Attribute 共同存在的問題發生,所以系統會經由 SDC 選 擇適合的保護方式來揭露資料。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

46

圖 19、各別查詢違反隱私

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

47

第五章

模擬驗證 5.1 模擬架構

本研究目標是在雲端環境上以醫療資料為主要情境,在個人資料不違反個人 資料保護法的狀況下,可以相互對應、流通,達到給適當的人適當的資料。透過 資料交換與語意網的技術來實行,落實資料提供者所期待的隱私保護,幫助使用 者以不違反隱私期待的前提下尋找適當的資料。

5.2 模擬驗證之環境需求

為了驗證我們本研究假設的真實性,我們使用了模擬驗證的方式來加強我們 假設的可靠度。在模擬驗證上使用工具 Protégé[24]做為編輯本體論的工具,使用 PROMPT 來進行 ACP 與 DHP 的整合,SWRL 落實推論的式子,另外再透過 Jess 推論引擎來推理 SWRL 的規則。使用的工具都可在 Protégé 工具完成,其元件說 明如下:

• Protégé OWL Plugin:Protégé 是一種本體論建構與開發的開放式環境平台,

擁有大量的 plugin 來支援本體論的推論與分析。

• Jess:一套以 java 語言為基礎的規則推論引擎,使用 Rete 演算法來處理規則;

JessTab 是 Protégé 的 plug-in,其允許一同使用 Jess 及 Protégé。它擴展 Jess 額外的功能,來允許對映 Protégé 知識庫至 Jess facts(classes 及 individuals)。

• SWRL Tab Plug-in:可以掛載在 Protégé 平台上來進行規則的撰寫,亦可以當 作 Referenced Libraries 導入至 Eclipse 平台上進行程式的開發。SWRL 規則 語言可以來編寫規則和推論,其中所有的詞彙皆來自於我們所建構的本體論 中,此外可以採用 Jess 推論器來推論轉寫的規則。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

48

• PROMPT: 可以掛載在 Protégé 平台上將兩個本體論合併起來。PROMPT 外 掛有四種模式,分別是比較 (Compare)、移動 (Move)、合併 (Merge)及萃取 (Extract)。在此我們只介紹實作將會使用合併 (Merge)模,合併模式則是將 兩個本體論合併出一個新的本體論。在合併模式下選擇要合併的兩個本體論 之後,執行合併模式,接著便會進入合併模式的選單。在選單中 PROMPT 演算法會自動判斷兩個本體論之間哪些類別是相似或完全相同,並提出建議,

使用者可以依據 PROMPT 提出的建議來合併類別、屬性與實例,完成兩個 本體論的合併。

5.3 Protégé 實作本體論與規則

本研究採用 Protégé 作為本體論的開發工具,版本為 Protégé3.4.4,建立模擬 驗證所需要的情境資料與各種 Policies(ACP/DHP/DRP),圖 20。

圖 20、使用 Protégé 3.4.8 模擬 ACP、DHP、DRP

根據章節四步驟說明,先利用 ACP 做身分和查詢型態判斷,如圖 21。可以知道 每一個需求是哪一種查詢型態。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

49

圖 21、ACP 推論圖

在使用進行 PROMPT 將兩邊的 DHP 做整合,如圖 22。

圖 22、DHP 整合圖

整合完成後,將透過 SWRL 的推論,可以得到兩間醫院的醫療資訊,如圖 23。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

50

圖 23、Protégé SWRL Tab 推論 Data Handling Policy 的規則畫面

最後,可經由 DRP 判斷是否會違反隱私,若有則會顯示違反哪一個隱私規則。

圖 24、Protégé SWRL Tab 推論 Data Release Policy 的規則畫面

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

51

第六章

結論與未來展望

本研究以語意化的技術結合了資料隱私存取控管的規範,並運用資料交換的 技術,避免進行不同資料來源查詢時,因外來資料的加入而造成個人資料被 Re-Identification 發生,也運用雜湊函數的特性實現個人匿名性資料的對應問題。

本研究利用醫療資訊來說明此概念,但其實只要是將個人資料存放在於雲端資料 庫上的領域皆可以使用此架構達成上述目的,例如校園資訊系統、金融資訊系統 等等都足以適用,只要依照不同的情境類別分類與動態的加入在領域規範的描述 即可。

而在未來的研究中,可以使用本研究之方法,擴充在不同雲端環境上,不同 資料來源的運用,以不違反法律的條件下,讓此方式可以運用在不同領域環境上,

探討不同領域環境上的可行性,同時對隱私資訊的釋放也需要一併考量。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

52

參考資料:

[1] Eberhart, A. et al., "Semantic Technologies and Cloud Computing." In

Foundations for the Webof Information and Services, Fensel, D., Ed.; Springer, 2011, pp. 239–251.

[2] 新北市政府資訊中心,新北市打造雲端檔案櫃省紙減碳節省公帑千萬,2012 http://www.imc.ntpc.gov.tw/web/News?command=showDetail&postId=262250 [3] Bill Claybrook. "Differences Explained: Private vs. Public vs. Hybrid Cloud

Computing."Sponsored by: HP & INTEL, 2011.

[4] R. Fagin , et al.," Data Exchange: Semantics and Query Answering", Lecture Notes in Computer Science, vol.2572, pp.207-224, 2003.

[5] A. Hernich, et al.," Logic and Data Exchange: Which Solutions Are “Good”

Solutions?", Lecture Notes in Computer Science, vol.6006,pp.61-85, 2010.

[6] A. Y. Levy, et al., "Querying Heterogeneous Information Sources Using Source Descriptions," Presented at the Proceedings of the 22th International

Conference on Very Large Data Bases, 1996.

[7] R. Herold, "European Union (EU) Data Protection Directive of 1995 Frequently Asked Questions " Computer Security Institute,2002.

[8] R. Popp, et al.," Countering Terrorism Through Information and Privacy Protection Technologies", IEEE Security and Privac, vol.4,pp.18-27, 2006.

[9] V. Ciriani, S. Capitani di Vimercati, et al., "Microdata Protection," in Secure Data Management in Decentralized Systems. vol. 33, 2007, pp. 291-321.

[10] L. Sweeney, et al.," k-Anonymity: A Model for Protecting Privacy", International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems,vol.10,pp.557-570,2002.

[11] D. Calvanese and G. D. Giacomo, "Data Integration: A Logic-Based Perspective," AI Magazine, vol. 26, pp. 59-70, 2005.

[12] Y. Kalfoglou and M. Schorlemmer, "Ontology Mapping: The State of The Art", The Knowledge Engineering Review, vol. 18, pp. 1-31, 2003.

[13] J. Euzenat and P. Valtchev, "Similarity-Based Ontology Alignment in OWL-Lite", ECAI , 2004.

[14] N. F. Noy and M. A. Musen, "The PROMPT Suite: Interactive Tools for Ontology Merging and Mapping," International Journal of Human-Computer Studies, vol. 59, pp. 983-1024, 2003.

[15] R.L.Rivest.," The MD5 message digest algorithm ", RFC 1321, 1992.

[16] L. Sweeney, "Achieving k-anonymity privacy protection using generalization and suppression." International Journal on Uncertainty, Fuzziness and Knowledge-based Systems, 2002.

[17] 鄭國平, "雲端委外語意式資料保護," 碩士, 資訊科學學系,國立政治大 學,2013.

[18] C.A. Ardagna, et al., "A Privacy-Aware Access Control System," J. Comput.

Secur., vol. 16, pp. 369-397, 2008.

[19] C. A. Ardagna, J. Camenisch, et al., "Exploiting cryptography for

privacy-enhanced access control: A result of the PRIME Project," J. Comput.

Secur., vol. 18, pp. 123-160, 2010.

[20] Ian Horrocks, Peter F. Patel-Schneider, Harold Boley, Said Tabet , Benjamin Grosof , Mike Mike Mike Dean(2004). ”SWRL: A Semantic Web Rule Language Combining OWL and RuleML”,

http://www.w3.org/Submission/SWRL/

[21] OECD定義Quasi-identifiers

http://stats.oecd.org/glossary/detail.asp?ID=6961

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

54

[22] 楊竣展, "整合資料在雲端環境上的分享與隱私保護-以電子病歷資料為例,"

碩士, 資訊科學學系,國立政治大學,2011.

[23] J. Mateo-Sanz, A. Martínez-Ballesté, et al., "Fast Generation of Accurate Synthetic Microdata," in Privacy in Statistical Databases. vol. 3050, 2004, pp.

298-306.

[24] Knublauch, H., M. A. Musen, and A. L. Rector(2004). “Editing description logics ontologies with the Protégé OWL plugin”, International Workshop on Description Logics., Vol.104.

相關文件