• 沒有找到結果。

雲端資料跨域整合與保護

N/A
N/A
Protected

Academic year: 2021

Share "雲端資料跨域整合與保護"

Copied!
60
0
0

加載中.... (立即查看全文)

全文

(1)

行政院國家科學委員會專題研究計畫 期末報告

雲端資料跨域整合與保護(第 2 年)

計 畫 類 別 : 個別型 計 畫 編 號 : NSC 100-2221-E-004-011-MY2 執 行 期 間 : 101 年 08 月 01 日至 102 年 07 月 31 日 執 行 單 位 : 國立政治大學資訊科學系 計 畫 主 持 人 : 胡毓忠 計畫參與人員: 碩士班研究生-兼任助理人員:鄭國平 碩士班研究生-兼任助理人員:黃雅玲 碩士班研究生-兼任助理人員:鄭迪嶸 大專生-兼任助理人員:薛元昊 大專生-兼任助理人員:鍾佳樺 大專生-兼任助理人員:謝濟謙 博士班研究生-兼任助理人員:吳穩男 報 告 附 件 : 出席國際會議研究心得報告及發表論文 公 開 資 訊 : 本計畫涉及專利或其他智慧財產權,2 年後可公開查詢

中 華 民 國 102 年 10 月 01 日

(2)

中 文 摘 要 : 我們在這二年期計畫案「雲端資料跨域整合與保護」

(2011/08/01-2013/07/31)執行期間完成以語意網本體論與 規則(ontologies and rules) OWL-DL+Datalog 知識系統技 術於 OpenTC 雲端運算平台來表達並執行雲端資料跨域整合與 保護的電腦規範自動化管理系統。本計畫的第一年我們完成 一個具有語意式電腦法律規範(Law-as-a-Service, LaaS)的 雲端服務架構平台。在這個 LaaS 的雲端法律規範架構平台 之上,個人資料保護法與國家安全保護法的兩種型態的法律 規範概念可以運用本體論與規則結合的語意式電腦規範語言 來加以表示與自動化落實。LaaS 的雲端法律規範架構平台是 以 OWL-DL 本體論來表示資料保護的核心概念,並且以 Datalog 的規則來進行本體論資料的查詢與保護, 在第二年除饹強化上述已有的雲端資料保護自動化管理系統 架構,我們進一步透過 Stratified Datalog with Negation 來提供符合法規規範例外個案的處理。另外為了實現委外雲 端資料被保護的目的,我們將運用資料庫欄位切割與加密的 方式來避免資料被雲端提供的第三者窺視與濫用。資料的使 用分成兩種型態:Subject-Based, Pattern-Based Queries。Subject-Based Query 提供完整個人資料的查詢和 使用,而 Pattern-Based Query 則提供條件式查詢,因此可 用在海量資料(Big Data)的統計分析的應用。 本研究使用語意網的本體論與規則的技術來彈性表達與落實 雲端架構上資料的收集、存放、分享、整合、使用、與保護 所需要的電腦式規範。我們建構一個具有高透通性 (transparent)的雲端資料管理與使用的平台,不論是資料的 擁有者或使用者都可以因為需要進行資料整合與保護的目的 來使用電腦化規範達成自動化資料的流通、整合、使用與保 護。資料擁有者因此可以在雲端平台之上選擇其所希望的資 料存放、使用與保護的偏好與條件來進行,系統也可以追蹤 或告知其個人資料被使用的狀況來完成一個具有隱私權保護 的存取控管系統。而資料的使用者也可以透過自動化規範的 解讀與執行來達成雲端資料整合與使用。倘若資料無法提供 給資料使用者,我們的系統則可以透過系統推論方式適時的 找出原因並提供給使用者瞭解。當實體的資料保護法規與管 理作業流程有所改變時,語意式規範管理架構能夠讓規範設 計者與資料管理者即時且有效的來進行電腦化規範的更新與 整合。

(3)

中文關鍵詞: 語意網、雲端資料整合、雲端資料保護、雲端資料交換、電 腦規範、 雲端資料跨域

英 文 摘 要 : In this NSC two years' project

(2011/08/01-2013/07/31) of Data Integration and Protection for the Inter-Domain Data Cloud (NSC 100-2221-E-004-011-MY2), we have implemented an automatic computer-based policy management system by using a combination of ontologies and rules, OWL-DL + Datalog on the OpenTC cloud computing platform. In the first year, we have built a Law-as-a-Service (LaaS) cloud service

platform. Two types of laws, data protection and national security, have been encoded as a combination of ontologies and rules, which can be enacted on the LaaS. OWL-DL ontologies are used to represent core concepts of the above two laws. Furthermore,

Datalog rules provide ontology query and data protection capabilities.

In the second year, we have re-enforced the automatic computer-based policy management systems.Moreover, we have used stratified Datalog with negation to

represent the policy's exception handlings. In addition, we have used data fragmentation and

encryption techniques to ensure data outsourcing in the cloud without leaking data or abusing usage to curious but honest cloud service providers. Two types of data queries are supported: Subject-Based and Pattern-Based Queries. On the one hand, Subject-Based Query provides a complete personal data usage. On the other hand, Pattern-Based Query provides conditional data retrieval, which is suitable for applications of big data analytics.

We have built a highly transparent platform for data management in the cloud. A data owner or a data user enables computer-based policies to ensure data

management services followed by the governance rules for data collection, store, sharing, integration, use, and protection. A data owner can select

appropriate rules for the data retention, use, and protection. Furthermore, a data owner can track or be

(4)

notified the data usage by using a privacy-aware access control system. A data user can use automatic policy interpretation and enforcement of data

integration and use. This privacy-aware system gives explanations to a data user by automatic reasoning when a data request is rejected. Once data protection laws or processes are revised, this semantics-enabled policy management framework allows a data user or a data owner to update and integrate computer policies to reflect the updated status.

英文關鍵詞: Semantic Web, Data Integration for the Cloud, Data Protection for the Cloud, Cloud-Based Data Exchange, Computer-Based Policy, Inter-domain Data Cloud

(5)

行政院國家科學委員會補助專題研究計畫成果報告

雲端資料跨域整合與保護

Data Integration and Protection for the Inter-Domain Data Cloud

計畫類別:■ 個別型計畫 □ 整合型計畫

計畫編號:NSC 100-2221-E-004-011-MY2

執行期間:2011 年 08 月 01 日至 2013 年 07 月 31 日

計畫主持人:胡毓忠

計畫參與人員:吳穩男、鄭迪嶸、黃雅玲、鄭國平、

薛元昊、鐘佳樺、謝濟謙

成果報告類型(依經費核定清單規定繳交):□精簡報告 ■完整報告

本成果報告包括以下應繳交之附件:

□赴國外出差或研習心得報告一份

□赴大陸地區出差或研習心得報告一份

■出席國際學術會議心得報告及發表之論文各一份

□國際合作研究計畫國外研究報告書一份

處理方式:除產學合作研究計畫、提升產業技術及人才培育研究計畫、

列管計畫及下列情形者外,得立即公開查詢

■涉及專利或其他智慧財產權,□一年■二年後可公開查詢

執行單位:國立政治大學資訊科學系

中 華 民 國 102 年 09 月 13 日

(6)

摘要

關鍵字:語意網、雲端資料整合、雲端資料保護、雲端資料交換、電腦規範、 雲端資料跨域

我們在這二年期計畫案「雲端資料跨域整合與保護」(2011/08/01-2013/07/31)執行期間 完成以語意網本體論與規則(ontologies and rules) OWL-DL+Datalog 知識系統技術於 OpenTC 雲端運算平台來表達並執行雲端資料跨域整合與保護的電腦規範自動化管理系統。 本計畫的第一年我們完成一個具有語意式電腦法律規範(Law-as-a-Service, LaaS)的雲端 服務架構平台。在這個 LaaS 的雲端法律規範架構平台之上,個人資料保護法與國家安全 保護法的兩種型態的法律規範概念可以運用本體論與規則結合的語意式電腦規範語言來加 以表示與自動化落實。LaaS 的雲端法律規範架構平台是以 OWL-DL 本體論來表示資料保護 的核心概念,並且以 Datalog 的規則來進行本體論資料的查詢與保護, 在第二年除饹強化上述已有的雲端資料保護自動化管理系統架構,我們進一步透過 Stratified Datalog with Negation 來提供符合法規規範例外個案的處理。另外為了實現 委外雲端資料被保護的目的,我們將運用資料庫欄位切割與加密的方式來避免資料被雲端 提供的第三者窺視與濫用。資料的使用分成兩種型態:Subject-Based, Pattern-Based Queries。Subject-Based Query 提供完整個人資料的查詢和使用,而 Pattern-Based Query 則提供條件式查詢,因此可用在海量資料(Big Data)的統計分析的應用。 本研究使用語意網的本體論與規則的技術來彈性表達與落實雲端架構上資料的收集、存放、 分享、整合、使用、與保護所需要的電腦式規範。我們建構一個具有高透通性(transparent) 的雲端資料管理與使用的平台,不論是資料的擁有者或使用者都可以因為需要進行資料整 合與保護的目的來使用電腦化規範達成自動化資料的流通、整合、使用與保護。資料擁有 者因此可以在雲端平台之上選擇其所希望的資料存放、使用與保護的偏好與條件來進行, 系統也可以追蹤或告知其個人資料被使用的狀況來完成一個具有隱私權保護的存取控管系 統。而資料的使用者也可以透過自動化規範的解讀與執行來達成雲端資料整合與使用。倘 若資料無法提供給資料使用者,我們的系統則可以透過系統推論方式適時的找出原因並提 供給使用者瞭解。當實體的資料保護法規與管理作業流程有所改變時,語意式規範管理架 構能夠讓規範設計者與資料管理者即時且有效的來進行電腦化規範的更新與整合。

(7)

Abstract

Key Words: Semantic Web, Data Integration for the Cloud, Data Protection for the Cloud, Cloud-Based Data Exchange, Computer-Based Policy, Inter-domain Data Cloud

In this NSC two years’ project (2011/08/01-2013/07/31) of Data Integration and Protection for

the Inter-Domain Data Cloud (NSC 100-2221-E-004-011-MY2), we have implemented an

automatic computer-based policy management system by using a combination of ontologies and rules, OWL-DL + Datalog on the OpenTC cloud computing platform. In the first year, we have built a Law-as-a-Service (LaaS) cloud service platform. Two types of laws, data protection and national security, have been encoded as a combination of ontologies and rules, which can be enacted on the LaaS. OWL-DL ontologies are used to represent core concepts of the above two laws. Furthermore, Datalog rules provide ontology query and data protection capabilities.

In the second year, we have re-enforced the automatic computer-based policy management systems.Moreover, we have used stratified Datalog with negation to represent the policy’s exception handlings. In addition, we have used data fragmentation and encryption techniques to ensure data outsourcing in the cloud without leaking data or abusing usage to curious but honest cloud service providers. Two types of data queries are supported: Subject-Based and Pattern-Based Queries. On the one hand, Subject-Based Query provides a complete personal data usage. On the other hand, Pattern-Based Query provides conditional data retrieval, which is suitable for applications of big data analytics.

We have built a highly transparent platform for data management in the cloud. A data owner or a data user enables computer-based policies to ensure data management services followed by the governance rules for data collection, store, sharing, integration, use, and protection. A data owner can select appropriate rules for the data retention, use, and protection. Furthermore, a data owner can track or be notified the data usage by using a privacy-aware access control system. A data user can use automatic policy interpretation and enforcement of data integration and use. This privacy-aware system gives explanations to a data user by automatic reasoning when a data request is rejected. Once data protection laws or processes are revised, this semantics-enabled policy management framework allows a data user or a data owner to update and integrate computer policies to reflect the updated status.

(8)

一、

前言

雲端運算(cloud computing)在最近幾年因為現有知名資訊大廠如 Google, eBay, Amazon, IBM,Sun 等大力推動與開發[Vaga09],儼然已經成為資訊界電腦軟硬體和網路資源提供服 務的主要平台[Dika09][Soto09]。相對的,一些系統與應用軟體與服務也因為雲端環境的 便利性與經濟效益等因素將會不斷的被開發出來並且放置在雲端環境中供使用者來租用。 我們同時也看到了世界知名的學界機構進入到雲端運算研究的領域來找出可能的學術研究 議題以強化現有雲端運作環境的可靠性和安全性[Armb09]。 存在雲端運算環境中為數甚為可觀的伺服器可以在 Web 使用者不知其詳細運作機制情況下 來提供電腦、網路、與服務的資源,而各類的使用者也可以更進一步的將其自身想要開放 與分享的資料放到雲端運算環境之中以達到使用方便性及經濟效益滿足的目標。雲端運算 和先前對等式(P2P)環境最大不同之處的是分散在地球各個區域的雲端伺服器可以和現有 的 Web 架構相結合,因此現有 web 的使用者可以更方便且有效的來使用雲端運算環境來整 合與使用來自於四面八方的資料。但是接踵而來的挑戰將會是如何確保存放在雲端環境中 的眾多資料集(datasets)可以在滿足各雲端區域的法治或原有資料擁有者隱私偏好和其服 務單位所選擇的內規來進行授權與使用,以合乎規範使用條件來達成資料和隱私權保護的 目標[Brue09][Jage10]。因此在端環境上的資料收集、流通、分享、整合和使用還是需要 落實資料保護法準則以及資料用者其對於隱私保護的合理期待和個人偏好以免侵犯到個人 隱私權保護。 但是資料一旦上到雲端的整合性環境就很容易被放在不同法治區的伺服器來加以收集、存 放、和使用,有必要這些資料也會以跨機構與法治區的方式來進行資料的整合和使用。從 雲端環境資源提供者而言,以有效且符合經濟效益的方式來進行電腦軟硬體資源的分配與 使用當為首要目標,但是這個目標必須要在不違反資料擁有者和雲端服務提供者所事先簽 訂的服務等級協議(service level agreement, SLA)以及相關法治區的法規下來進行。 因此雲端環境平台應該提供資料擁有者與使用著在不違反規範的情況下,以高透通性 (transparent)且有效的方式來使用這個虛擬資訊空間。而所有的資料管理和使用規範卻 可以讓資料的擁有者在事先來加以設定。 對於存在於跨國不同法治區的雲端環境而言,其特有的資料保護法治規範才正開始被加以 討論,因此我們延續過去執行單一區域內的雲端資料共享與保護計畫(計畫期間: 2010/08/01-2011/07/31)在過去這兩年的計畫期間掌握電腦技術和法治規範整合的發展趨 勢,並且充分運用語意網本體論與規則兩大知識系統的技術來設計電腦規範語言以表示相

(9)

對應的資料整合與保護的電腦規範,使其可以被對應到相關的法治規範上,並且具體落實 雲端資料保護以確保雲端環境中資料的流通、整合和使用都能夠在符合資料擁有者意願與 法規的條件下來運作。

二、

研究目的

在這二年期間計畫案每一期所完成的目標如下:

 

 第一年(2011-2012)雲端資料跨域整合 我們設計整合語意網本體論和規則兩大知識系統於現有的雲端計算環境中的資料整合平台。 透過本體論知識系統我們用它來具體描繪雲端計算環境資料的跨域存放、流通、與整合的 結構與概念,並且更進一步設計結合規則知識庫系來設計這些雲端跨域資料在時所需要在 雲端電腦上的使用和保護規範。因此在緊接的第二年(2012-2013)完成了結合本體論和規 則兩大知識系統來實做此電腦執行規範於既有雲端架構的混合雲的虛擬機器平台(Virtual Machine Platform)之上,並且更進一步具體找出有哪一部份人類所制訂的雲端運算資料整 合與管控法規可以用電腦宣告式語意網語言來表示及自動正確的解讀。我們使用一個具體 電子病歷資料(Electronic Health Record, EHR)整合與使用的範例來說明我們架構運作的 原理和可行性。

 第二年(2012-2013)雲端資料跨域保護

我們具體的建構並利用雲端開放式電腦軟體於歐盟開放式雲端軟體平台 Open Trusted Computing (OpenTC)(see http://www.opentc.net/ )來直接落實(enforce)雲端資料保護 的電腦式規範於跨域雲端運算環境中以實踐新版的「個人資料保護法」的隱私權個人資料 保護規範。我們更進一步的找出並且化解資料跨域整合、使用和保護時對於不同型態規範 整合,如個人資料保護法與國家安全法,所面臨的可能衝突點。基於現有人類法治規範在 處理雲端資料控管之不足,尤其是在跨法治區域時所面臨的規範協商和整合的問題,因此 我們希望能夠參考最新歐盟與美國的國際法制規範概念於我們所提出的語意規範架構與系 統中具體來表達雲端資料跨法治區域控管概念與規範執行。 隨著海量資料分析與保護研究議題的日漸重要,我們在第計畫案的第二年的研究重點增加 海量資料集的統計分析的議題,並且在雲端運算的平台建置上從原有的 OpenTC 轉換到廣為 大眾所使用的開放式雲端系統 Hadoop/MapReduce,配合開放式統計分析軟體 R 的結合來進 行海量資料分析效益與保護的最佳化。因此我們在 102 年度審核通過的國科會計畫案:「語 意式資料雲上如何來巧控海量資料分析效益與保護間的平衡」為本研究議題的繼續延伸。

(10)

三、 文獻探討

A. 語意式電腦規範語言與架構

語意網(Semantic Web)在過去幾年的發展之下已經有一些具體的成果,透過 Webizing 的 概念我們可以將散佈在 Web 環境之上的資源以 URI 定址的方式快速的獲得[Hend08]。因此 以語意網的技術來研究資源的控管規範與運作機制已經具有不錯的研究結果[Bona06]。和 現有其它的 web 資料保護規範與架構相比較,我們考慮利用語意網核心技術的本體論語言 (ontology language)如 OWL-DL 及 Datalog 為基礎的規則語言(rule language)如 RIF 或 整合式本體論與規則語言如來表示雲端運算環境中資料保護的電腦規範[Brui09][Grau08], 我們將利用本體論語言來描述雲端環境中資料的存放、流通、整合與使用的概念,並且更 進一步的來表示資料保護的概念,最後再加入規則語言的條件式判斷與檢驗機制來具體落 實資料保護的執行機制。

現今已經存有以本體論語言為主的電腦規範系統如 Rein, KAoS,也有一些以 Horn-based 規 則語言為主的電腦規範系統如 EPAL, Protune[Duma07]。另外也有一些不具有任何語意表 達能力的 XML 控管語言架構如 XACML, P3P, ODRL, XrML 等[Mazz08]。整體而言,這些早 期提出的電腦規範語言與架構並未考量雲端運算的概念,因此它們並未能直接引用到雲端 環境中來表示及落實資料使用與控管規範。雖然 MIT 的 AMORD In RDF (AIR)是一個同時結 合 RDF(S)本體論語言與 productionrules 規則語言的電腦規範語言與架構,但是否可以直 接 應 用 到 雲 端 運 算 環 境 來 規 範 其 資 料 流 通 和 使 用 的 控 管 機 制 則 還 有 待 評 估 [Kaga06][Weit07]。使用 AIR 的另外一個考量問題就是其以 RDF(S)為主的本體論語言模組 並未充分運用現有新版 OWL2 本體論語言的特性,因此對於 property 的表達和處理能力較 為薄弱。所以如何在雲端運算的環境中引入具有語意表達與處理能力的本體論和規則兩大 知識系統,以及選擇哪一種的語意網 web 3.0 系統的表達語言與架構來達成有效整合存在 於各種雲端的資料集(datasets)將會是一項重要的研究挑戰。我們初步的構想是以結合第 二代本體論語言和規則語言的 OWL2-RL 來表示我們的電腦式規範語言的語意結構,並且運 用現有 XML 為主的規範語言與架構如 XACML 來表示我們在雲端上的資料整合與保護的規 範語言(policy language),希望能夠用它來表示雲端資料跨域整合與保護的概念與執行程 序。

B. 雲端資料跨域整合

企業間資料整合有其重大商機存在[Bern08]。Halevy 指出早在 10 多年前就有以關連式資

(11)

料庫架構來進行資料(或資訊)的整合[Hale06]。透過不同的資料庫 schema 對應方式如 Global As View (GAV), Local As View (LAV), GLAV 我們可以將分佈在不同地點且各自 獨立產生的關連式資料庫來加以彙整,並且以單一的入口使用平台來查詢這些分散且各自 獨立的資料庫。好處是我們不用透過各別而冗長的方式來進行整體資料的查詢,並且也可 以適度的隱藏需要保護且不需被揭露的資料。幾年前有些學者們甚至想到利用接近人類抽 象思維的本體論邏輯的資料架構來進行彙整平台的設計[Levy01][Ullm00]。最近幾年羅馬 大學的 Calvanese, D.等人則以語意網的 description logic 為基礎來建構一個整合式資 料查詢平台以取代傳統關連式整合平台[Calv98] [Calv02] [Calv05] [Lenz02]。我們將在 這個研究基礎之上來進行雲端資料跨域整合的規範設計與落實。我們認知到不論是現有 Web 架構上的資料整合或是正在發展中的雲端環境的資料整合,除了要考量現有關連式資料庫 彙整的問題之外,也必須要能夠運用語意網的新科技來強化底層關連式資料庫彙整時如何 在上層的入口平台以接近人性化思維的方式將分佈在底層的資料有效來收集,並且更進一 步確保資料在整合使用時的正確性(sounds)與完整性(complete)[Hu10c],也就是在單一入 口平台的查詢時所獲得的整體資料和分別到各個資料源所查詢出來資料的整合要相同。除 此之外,我們希望透過這個彙整平台的資料查詢也可以確保資料與隱私權保護的目的 [Clif04][Nash07]。

C. 雲端資料跨域保護

雲端資料整合的意義在於來自於多重資料不論是在私有雲,公有雲或混合雲都可以在此概 念之下來進行整合,並且可以不限地點和時間來進行資料的蒐集、存放、處理、和使用。 對於資料擁有者或使用者而言,他們可以在完全透通的情況下來進行但是必須要讓資料擁 有者可以透過語意式電腦規範所提供的友善介面來設定資料蒐集、存放、處理和使用的範 圍與條件。而資料的使用者則可以在這些語意式電腦規範的運作之下來進行資料整合後的 使 用 。 存 放 及 流 通 在 雲 端 環 境 中 的 資 料 保 護 將 逐 漸 成 為 一 個 重 要 的 研 究 議 題 [Cree09][Pear09]。基於雲端環境很可能是整合各種雲端架構如混合雲並且跨越多個法治 地區,使得傳統隱私權保護法規如歐盟的隱私權架構 EU Data Protection Directive 將 不能直接適用在雲端運算的環境中[Fors09]。因為直接參照這個嚴格的法規,將會有很多 的資料無法直接在雲端環境中來進行歐盟境外流通和使用。另外其它關於醫療資訊保護的 HIPAA 或是財務 Gramm-Leach-Bliley 等的個人資料保護法規是否適用於雲端運算跨域的 環境也將面臨同樣的挑戰[Anto04]。電腦科技的發展往往比人類所需的法律規範走的快, 但是當後來適當人類資料保護法規如雲端環境上個人資料保護被制訂出來之後,提供資料 保護且可以被電腦語言表示與自動執行的電腦式規範則勢必要能夠適時和上述新修訂的法 規相呼應,並進一步達成遵守(comply)法規準則的要求,否則所有的人類法律規範的執行 將只有在行為違反其法規之際才走一般性司法的訴訟程序,如此一來不但曠日廢時且也將

(12)

無法真正有效的解決虛擬世界中的違法問題。 因此本研究將以雲端計算環境資料整合與保護當作議題來探索電腦式規範和人類法規兩者 之間的相關性。我們希望在雲端計算資料保護法規草擬及討論之際能夠建構出相對應電腦 語言可以表達的電腦式規範與可執行的運作平台,以便於讓後續真正適用於雲端資料分享 平台的人類法規完成時可以一併帶入相對應的本體論與規則兩種語意網宣告式語言所對應 的電腦規範,並且讓電腦自動解讀這些電腦規範,以縮短人類法規和電腦規範之間的語意 與結構性落差,更進一步解決電腦執行人類法規所產生的時效性延後的問題。在面臨台灣 新版的個人資料保護法在立法院剛通過,而施行細則正在研擬之際本研究案更有其深層的 意義。至於目前國內所積極推動的雲端環境是否可以透過現有剛通過的新版個人資料保護 法來加以規範其資料跨域(含機構與法治跨域)的流通、使用和保護於實際雲端資訊系統 中進行雲端資料跨域保護則需要再研究。

四、 研究方法

我們在這二年期計畫案「雲端資料跨域整合與保護」(2011/08/01-2013/07/31)。執行期間 希望完成以語意網本體論與規則(ontologies and rules)知識系統來表達並落實自動化執 行雲端資料跨域整合與保護電腦規範的目的。在計畫執行的第一年我們完成雲端資料跨域 整合與保護的 LaaS 架構平台與語意式電腦規劃的設計與實做。在計畫執行的第二年我們根 據第一年的 LaaS 架構來完成符合個人資料保護法與國家安全法在雲端環境的資料跨域整 合與保護。雲端資料跨域(inter-domain)管理所面臨的挑戰是資料在雲端不同區域之間的 流通、分享、整合、與使用。而雲端資料跨域管理可以是在單一的法治區但不同的機構之 間來進行,當然也可能在不同的法治區單一機構或多重機構之間來進行。 第一年度的研究是在自行建構的私有雲端環境中加入了語意結構化的模組,我們運用 OpenTC 的開放式雲端架構平台將語意網具語意式表達與處理能力的電腦式規範透過本體論 語言如 OWL-DL 所表示的本體論與 Stratified Datalog with Negation 規則語言所表示的 資料處理(data handling policy)與存取控管(data handling policy)兩類規範植入到 OpenTC Trusted Virtual Domain (TVD) 之上。我們如果直接將語意式架構與運作機制建 構於底層的 IaaS 則整個語意式雲端運算軟體與下層的系統模組則需要完整的自己來建置, 因此我們有較大發展空間來選擇語意網底下的軟體系統平台。反之將語意式架構與運作機 制結合至比較上層的 Software-as-a-Service (SaaS),則可以將本體論塑模的資料和其使 用與管控資料的電腦規範以上層的服務軟體型態來描述與宣告來落實本計畫的研究目標: 雲端資料跨域保護。我們所採用的 LaaS 是以 SaaS 的概念來提供 Security-as-a-Service (SaaS)的雲端服務,並且更進一步擴充此服務為具有法律規範表示與判讀能力的服務模

(13)

組。

透過本計畫的執行,第一年度我們運用 OpenTC 的信任虛擬域的 TVD 的兩層基礎設施架構 概念,我們因此建構出具可信任的 IaaS 環境研究平台,並於此 OpenTC TVD 平台完成使用 本體描述隱私保護法律互相影響或衝突模型(如國家安全法與個人資料保護法),完成語意 隱私保護政策設計,讓我們可以依角色與情境,利用語意網技術語言透過推論得到當事人 個人識別資訊(Personally Identifiably Information, PII)於隱私保護與國家安全兩種法律的 整合,來要求 OpenTC TVD 內的 VM 資料庫達成資料揭露與保護的目的。

我們建立一個 IaaS 實體層 VM 間可信賴的語意式隱私保護模式管理架構(LaaS)來解決隱私 保護法律互相影響或衝突問題,並將此項研究結果論文以 Semantics-enabled Policies for Information Sharing and Protection in the Cloud 為主題,發表於 Singapore Management University 主 辦 的 The Third International Conference on Social Informatics (SocInfo'11, 6 - 8 October, 2011)(請參考[Hu11b]研討會,與會中我們的研究有別於 目前 Social Network 領域中以使用偏好為中心的統計分析方向,而以使用者隱私保護與法 律等為主軸,與會學者多方詢問與研討本論文的觀點。此論文中,我們正式提出三層的可 信賴的語意隱私保護模式管理架構,以確保個人隱私資訊在社會雲端網路數據共享中避免 違反隱私保護法律。 本論文中我們將我國的「個人資料保護法」和「國家安全法」相關研究,建模 Cloud Legalized Domain (CLD)層,利用本體和規則的相結合,來完成的資訊共享和保護的政策,此 CLD 目 的在解決多個司法管轄區的法律和政策之間可能發生的衝突。我們運用本體和規則語言完 成一個信任的法律領域(Trusted Legal Domain, TLD)新概念,TLD 目的在表現和執行「個 人資料保護法」和「國家安全法」的原則。例如在本論文中,在 TLD 的使用環境中,國安 人員必須提出正確的證據才可取得當事人隱私資訊。當 CLD 層發現使用者違反「個人資料 保護法」時,將經 CVD 層限制 CMD 層中的雲端實體資料的揭露,以可達成法律尊重的個人 資訊保護原則與避免侵犯隱私的問題;Cloud Virtual Domain (CVD) 層將分散於 internet 間的雲端資源群組成為一個可信的虛擬域(Trusted Virtual Domain , TVD) ,TVD 可視為 屬於特定客戶的私有雲或因應特殊需要形成的信任雲(如法律或政府組織要求等) 。我們可 依 CLD 層的推論結果,來完成 CVD 隱私保護政策與法律安全要求,其可控制的 CMD 範圍內 容包括虛擬機、網路、存儲、權限控制和資源能力等;Cloud Machine Domain (CMD)層為 伺服器、虛擬機與資料庫等組合完成的如數據中心實體結構,我們 CMD 層可因應不同客戶 與 CVD 要求,可程式調配各 IT 基礎設施的資源與 VLAN 交換器完成信任連接,達成信任區 網域的隱私資料庫分割、加密保護與個人識別資訊揭露遮蔽(匿名)等要求。

(14)

我們將 Semantics-enabled Policies for Information Sharing and Protection in the Cloud 論 文 中 的 語 意 隱 私 保 護 模 式 延 伸 , 提 出 一 個 適 合 真 實 雲 端 環 境 的 超 級 節 點 (super-peer) 資 訊 整 合 和 保 護 架 構 。 並 將 此 項 研 究 結 果 論 文 以 Semantics-enabled Policies for Super-Peer Data Integration and Protection 為 主 題 , 發 表 於 International Journal of Computer Science & Applications 期刊(請參考[Hu11a])。 本文論述在任何一個 super-peer domains(SPD) 的可信任用戶可以與其他 SPD 映射,促成 新的整合數據與組合模式。每個 SPD 基本上是一個 agent 為基礎的數據集成系統。SPD 中 的 super-peer 運用本地語意映射完成一個本地本體架構來管理內層的 peer,並經由 Local-as-View (LAV)共享與整合 peer 資料庫數據。當然 super-peer 間也可利用全球語意 映射管理達到 super-peer 互聯,完成一個全球性的本體架構,其可為多個本地本體架構合 併而成,並運用 global-local-as-view (GLAV)來完成資料共享與整合交換。我們設計一 個超級對等域的數據整合和讀取控制服務只授權 super-peer 來完成,所以在 virtual platform (VP)中,super-peer 代理通過的語意功能的隱私保護政策,必須經 super-peer 透過 view-based queries,來完成用戶的隱私資訊整合與保護。

我們運用上述法律意識的語意政策與雲端平台基礎,研究相關文獻,發展出一個擁有數據 保護法律意識的法律服務架構平台,提供 CSP 與其客戶實施雲端服時滿足其隱私資料安全 和法律需求,此稱此法律服務架構平台為 Law-as-a-Service (LaaS)。我們將此項研究結 果 論 文 Towards Law-Aware Semantic Cloud Policies with Exceptions for Data Integration and Protection , 發 表 於 University of Craiova, Romania 主 辦 的 International Conference on Web Intelligence, Mining and Semantics (WIMS'12)研 討會(請參考[Hu12c])。

本論文成果為在超級節點自動啟用 LaaS,使 CSP 與其客戶在部署的雲資源和服務時遵守法 律的語意法律政策,無需擔心違法。用戶可以在 SPD 的 super-peer 查詢數據,每個查詢經 LaaS 得到是否符合法律要求,其推論結果可控制的 CMD 範圍內容包括虛擬機、網路、存儲、 權限控制和資源能力等。其中運用為 OWL-DL ontologies 和 Stratified Datalog with Negation rules 來處理例外與否定政策。最後,我們以流感疫情情境,來證明 LaaS 架構 概念可被實現。我們將此研究成果發表論文:Semantic legal policies for data exchange and protection across super-peer domains in the cloud", Special Issue: "Semantic Interoperability and Knowledge Building"於 Future Internet 期刊(請參考[Hu12b])。

最後為了因應海量資料(Big Data)研究的發展趨勢,我們將雲端資料跨域整合與保護的研 究主題和海量資料的保護與分析效益相結合,發表論文:Crafting a Balance between Big

(15)

Data Utility and Protection in the Semantic Data Cloud"於西班牙馬德里大學所舉辦 的 International Conference on Web Intelligence, Mining and Semantics (WIMS13)。 另外也投稿論文:Semantic Big Data Integration and Exchange in the Data Cloud", 於 Encyclopedia of Information Science & Technology, 3rd Edition,預計將出版於 2014 年 IGI 的專書篇章。在這兩篇論文中為了實現雲端資料委外時被保護的目的,我們運用資 料庫欄位切割與加密的方式來避免資料被雲端提供的第三者窺視與濫用。資料的使用分成 兩種型態:Subject-Based, Pattern-Based Queries。Subject-Based Query 提供完整個 人資料的查詢和使用,而 Pattern-Based Query 則提供條件式查詢,因此可用在海量資料 (Big Data)的統計分析的應用。我們同時運用了語意網中的本體論和規則兩大知識系統表 達方式來建構出三種資料保護的規範:Access Control Policy (ACP), Data Handling Policy (DHP),以及 Data Releasing Policy (DRP)的整合和執行來達成 Microdata 釋放給 資料分析者時可以同時達成個人資料保護的目的。詳細本體論與規範的設計與系統的實做 架構請參考文獻[Hu13][Hu14]。

五、結果與討論

本兩年期的研究計畫案是延續過去數年的研究成果,主要是以語意網的技術來表示雲端運 算環境上資料的保護。本研究案是一個跨領域的研究成果。因為我們融入了個人資料與隱 私保護的概念於語意式個人資料保護的規範中。希望這些語意式的電腦規範可以被清楚的 表達與落實。我們所選擇的開放式雲端平台OpenTC雖然是過去歐盟FP6所開發的架構,但是 其普及性不如現有的Hadoop/MapReduce的架構,考量我們研究觸角將延伸到海量資料保護 與分析效益平衡的議題,因此我們在新的國科會計畫案中已經完成了Hadoop/MapReduce架 構的建置。而原有的三種型態的語意式電腦資料保護規範,Access Control Policy, Data Handling Policy,以及Data Releasing Policy所設計的本體論結構與資料存取的語意式規 則,因為是獨立建構在下層雲端運算之上,因此影響不大。未來新的研究挑戰在於運用語 意式社會網路(Social Semantic Web)的個人資料保護來進行有效的海量資料分析。這一部 份所面臨的研究挑戰度將會更高,因為社會網路的個人資料結構與人與人相互之間的關係 將不同於單純關連式資料庫以表格方式所存放的個人資料結構,而進行海量資料的存取控 管所進行社會網路個人資料匿名化處理也不同於原有關連式資料庫之下個人資料檔的匿名 化。而我們所提出的兩種資料查詢方式的落實:Subject-Based Query and Pattern-Based Query目的上的不同也必須要一併考量進來。

六、 計畫成果自評

透過本國科會年度計畫的執行,我們於語意隱私保護模型提供的語意雲端合法化的數據整 合和保護服務研究中,提出了一個語意 Web 技術的隱私法律解決方案,如三層的可信賴的 語意隱私保護模式管理架構、super-peer 資訊整合和保護架構與 Law-as-a-Service (LaaS) 架構等,並將研究成果撰述多篇論文發表。我們發現這些研究結果已將雲端資料跨域整合

(16)

與保護等議題,克服隱私法律保護和資料使用的障礙並逐漸接近真實雲端服務運用環境, 可提供業者推展雲端服務商務時參考(如 Cloud Service Providers, CSPs) 。我們建構一 個 LaaS 平台語意式電腦規範互通的架構, 在這個 LaaS 的規範架構平台,電腦的規範可以 運用結合本體論與規則兩種知識系統的語意式規範語言來加以表示與自動化落實。我們利 用 LaaS 的規範架構平台(法律的規範)來提供法規規範之間衝突時的例外的化解並且實現 雲端委外保護。我們也將此架構運用到最新的開放式分散式系統平台 Hadoop/MapReduce, 並且透過開放式統計套件 R 的使用來進行海量資料尤其是線上社會網路如 Facebook, Twitter 等資料集的分析與保護。這些新發展的研究議題是我們未來國科會計畫研究重點。 已經有下面四位已經畢業的碩士生論文和本研究有直接相關。另外一位博士生吳穩男同學 繼續相關性雲端資料委外保護的研究。 [指導碩士學生已經畢業論文] 楊竣展 - 整合資料在雲端環境上的分享與隱私保護-以電子病歷資料為例 (2011) 楊協達 - 結合本體論與案例式推理之合理使用推薦 (2012) 梁世麒 - 本體論為基礎的統計資訊整合-以政府公開資訊為例 (2013) 黃雅玲 - 在語意式雲端環境上資料交換的保護 -以醫療病例為例 (2013) 鄭國平 - 雲端委外語意式資料保護 (2013) [已發表的研究論文]

[Hu14]Hu, Y. J. , "Semantic Big Data Integration and Exchange in the Data Cloud", Book Chapter in Encyclopedia of Information Science & Technology, 3rd Edition, IGI, 2014 (under review).

[Hu13]Hu, Y. J., K. P. Cheng, Y. L. Huang, "Crafting a Balance between Big Data Utility and Protection in the Semantic Data Cloud", International Conference on Web Intelligence, Mining and Semantics (WIMS13), June 12-14, 2013, Madrid, Spain, ACM, ACM.

[Hu12a]Hu, Y. J. and S. C. Liang. , "Challenges of Access and Reuse Open Government's Statistical Public Data", Session "National and Regional Policies on Data and Information" , 23rd International CODATA Conference (CODA2012), Oct. 28-31, 2012, Academia Sinica, Taipei, Taiwan.

[Hu12b]Hu, Y. J., W. N. Wu, K. P. Cheng , and Y. L. Huang, "Semantic legal policies for data exchange and protection across super-peer domains in the cloud", Special Issue: "Semantic Interoperability and Knowledge Building", Future Internet (ISSN 1999-5903), MDPI, Oct. 2012.

[Hu12c]Hu, Y. J., W. N. Wu, D. R. Cheng, "Towards Law-Aware Semantic Cloud Policies with Exceptions for Data Integration and Protection ", International Conference on Web Intelligence, Mining and Semantics (WIMS12), June 13-15, 2012, Craiova,

(17)

Romania, ACM.

[Hu11a] Hu, Y. J., W. N. Wu, J. J. Yang, "Semantics-enabled Policies for Super-Peer Data Integration and Protection", International Journal of Computer Science and Applications (IJCSA), Vol. 9, No. 1, pp. 23-49, 2011.

[Hu11b]Hu, Y. J., W. N. Wu, J. J. Yang, "Semantics-enabled Policies for Information Sharing and Protection in the Cloud", 3rd Int. Conference on Social Informatics (SocInfo2011), Oct. 6-8, 2011, Singapore, LNCS 6984, Springer, pp. 198-211.

[相關參考文獻]

A. 雲端計算 (Cloud Computing):

[Armb09]Armbrust, M. et al., Above the Cloud: A Berkeley View of Cloud Computing. Tech.ReportUCB/EECS-2009-28.

[Clou09]Security Guidance for Critical Areas of Focus in Cloud Computing V2.1. Cloud Security Alliance, Dec. 2009 .

[Dika09]Dikaiakos, D. M. Guest Editors, Cloud Computing: Distributed Internet Computing for IT and Scientific Research. IEEE Internet Computing, Sep./Oct. 2009.

[Jage10]Jager, T. P., et al., Cloud Computing and Information Policy: Computing in a Policy Cloud? Journal of Information Technology and Politics (JITP), 5(3), 2010.

[Nuri09]Nurmi, D. et al., The Eucalyptus Open-Source Cloud-Computing System, Proc. Of 9th Int. Symposium on Cluster Computing and the Grid, Shanghai, China, 2009.

[Roch09]Rochwerger, B., et al., The RESERVOIR Model and Architecture for Open Federated Cloud Computing. IBM System Journal, 2009.

[Soto09]Sotomayor, B. et al., Virtual Infrastructure Management in Private and Hybrid Clouds. IEEE Internet Computing, Sep./Oct. 2009, pp. 14-22.

[Vagu09]Vagueri. M. L., et al., A Break in the Clouds: Towards a Cloud Definition. ACM SIGCOMM Computer Communication Review. 39(1), Jan. 2009, pp. 50-55.

B. 語意網與規範 (Semantic Web and Policy):

[Arda08]Ardagna, A. C. et a;., A privacy-aware access control system. Journal of Computer Security. 16, 2008, pp. 369-397.

[Arda10]Ardagna, A. C. et al., Exploiting cryptography for privacy-enhanced access control: A result of PRIME Project. JCS, 18, 2010, pp. 123-160.

[Bend06]Bender, D. and L. Ponemn. Binding Corporate Rules for Cross-Border Data Transfer. Rutgers Journal of Law&Urban Policy, 3(2), 2006.

[Bona02]Bonatti, P. et al., An Algebra for Composing Access Control Policies. ACM Trans. On Information and System Security, 5(1), Feb. 2002, pp. 1-35.

(18)

[Bona06]Bonatti, P., et al., Semantic Web Policies – A Discussion of Requirements and Research Issues. ESWC 2006, Budva, Montenegro, 2006.

[Eite08]Eiter, T. and et al., Rules and Ontologies for the Semantic Web. Reasoning Web: 4th International Summer School, 2008, pp. 1-53.

[Grau08]Grau, C. B., et al., OWL 2: The next step for OWL. Journal of Web Semantics: Science, Services and Agents on the World Wide Web 6 (2008) 309-322.

[Gros03]Grosof, N. B. et al., Description Logic Programs: Combining Logic Programs with Description Logic. World Wide Web 2003, Budapest, Hungary, 2003, pp. 48-65.

[Hend08]Hendler, J. and F. van Harmelen, The Semantic Web: Webizing Knowledge Representation. Handbook of Knowledge Representation, Elsevier, 2008.

[Hu10a]Hu, Y.J., "Unifying Semantic Privacy Protection Web Policies for Digital Rights Management (DRM) System",(Book Chapter), iConcept, 2010.

[Hu10b]Hu, Y. J. and H. Boley, SemPIF: A Semantic Meta-Policy Interchange Format for Multiple Web Policies, 2010 IEEE Web Intelligence (WI) Conference, Aug. 31-Sep.

3, 2010.

[Hu10c]Hu, Y. J. and Jiun-Jan Yang , "A Semantic Privacy-Preserving Model for Data Sharing and Integration", International Conference on Web Intelligence, Mining and

Semantics (WIMS'11)), Norway, ACM Press .

[Hu09]Hu, Y. J. et al., Challenges for Rule Systems on the Web, RuleML 2009, Las Vegas, Neveda, USA, Nov. 5-7, 2009, Springer-Verlag, LNCS 5858.

[Hu07]Hu, Y. J., Semantic-Driven Enforcement of Rights Delegation Policies via the Combination of Rules and Ontologies, Workshop on Privacy Enforcement and

Accountability with Semantics, ISWC+ASWC 2007, Busan Korea, 2007, CEUR-WS Vol-320 [Hitz09]Hitzler, P. et al., Foundations of Semantic Web Technologies. CRC Press, 2009.

[Kaga06]Kagal, L. et al., Using Semantic Web Technologies for Policy Management in the Web. 21st National Conference on Artificial Intelligence (AAAI), 2006.

[Lemb09]Lembo, D. and R. Rosati, Semantic Technologies for Data Integration Using OWL2 QL,ESWC 2009 Tutorial.

[Mazz08]Mazzoleni, P. XACML Policy Integration Algorithms. ACM Trans. on Information and System Security, 11(1), Feb. 2008.

[Pate07]Patel-Schneider, F. P. and I. Horrocks, A Comparison of Two Modelling Paradigms in the Semantic Web. Journal of Web Semantics: Science, Services and Agents on the World Wide Web 5, 2007, pp. 240-250.

[Sama09]Samarati, P. Editor, First research report on research on next generation policies. PrimeLife Deliverable Report, D5.2.1, Feb. 27, 2009.

(19)

[Vime07]Vimercati, S. De Capitani di et al., Access Control Policies and Languages in Open Environments. Secure Data Management in Decentralized Systems, Springer,

2007, pp. 21-58.

C. 隱私權保護 (Privacy Protection):

[Anto04]Anton, i. A. et al., Financial Privacy Policies and the Need for Standardization.IEEE Security & Privacy, pp. 36-45, 2004.

[Duma07]Duma, C. et al., Privacy in the Semantic Web: What Policy Languages Have to Offer. 8th IEEE POLICY'07, 2007.

[Hu08]Hu, Y. J., Semantic Enforcement of Privacy Protection Policies via the Combination of Ontologies and Rules", IEEE International Workshop on Ambient Semantic Computing (ASC2008) , Taichung, Taiwan, June 12, 2008

[Karj02]Karjoth, G. et al., Platform for Enterprise Privacy Practices: Privacy-enabled Management of Customer Data. 2nd Workshop on Privacy Enhancing Technologies, LNCS Springer, 2002.

[Kohl07]Kohl, U. Jurisdiction and the Internet. Cambridge University Press, Cambridge, 2007. [Raab09]Raab, D. C., The Future of Privacy Protection. Cyber Trust & Crime Prevention Project, 2004.

[Spie09]Spiekermann, S. and L. F. Cranor, Engineering Privacy. IEEE Trans. On Software Engineering, 35(1), Jan./Feb., 2009.

D. 雲端運算與資料保護 (Cloud Computing and Data Protection):

[Brue09]Bruening J. P. and B. C. Tracy, Privacy & Security Law: Cloud Computing Privacy,Security Challenges. Bureau of National Affairs (BNA), Inc., 2009.

[Cree09]Creese, S. and et al., Data Protection-Aware Design for Cloud Computing. CloudCom 2009, Springer, LNCS. Dec. 2009, pp. 119-130.

[Fors09]Forsheit, T. Legal Implications of Cloud Computing – Part One (The Basics and Framing the Issues), Part Two (Privacy and the Cloud), Part Three (Relationships

in the Cloud), Part Four (E-Discovery and Digital Evidence), 2009.

[Nyre09]Nyre, A. A. et al., Privacy in a Semantic Cloud: What's Trust Got to Do with It?CloudCom 2009, Springer, LNCS. Dec. 2009, pp. 107-118.

[Pear09]Pearson, S. and A. Charlesworth, Accountability as a Way Forward for Privacy Protection in the Cloud. CloudCom 2009, Springer, LNCS. Dec. 2009, pp. 131-144.

E. 資料整合 (Data Integration):

[Bern08]Bernstein, A. P. and L. M. Haas, Information Integration in the Enterprise. Comm. Of ACM, July, 2008.

(20)

[Calv02]Calvanses, D. et al.,Description Logics for Information Integration. Computational Logic, Springer LNAI 2408, 2002, pp. 41-60.

[Calv05]Calvanese, D. and G. De Giacomo, Data Integration: A Logic-Based Perspective.AI Magazine, 26(1), 2005, pp. 59-70.

[Calv98]Calvanese, D. et al. Description Logic Framework for Information Integration. Int. Conf. on Principles of Knowledge Representation and Reasoning, Morgan Kaufmann, 1998,

[Clif04]Clifton, C et al., Privacy-Preserving Data Integration and Sharing. Data Mining and Knowledge Discovery, ACM, 2004, pp. 19-26.

[Hale06]Halevy, A. et al., Data Integration: The Teenage Years. VLDB'06, ACM, 2006. [Lenz02]Lenzerini, M., Data Integration: A Theoretical Perspective. PODS, ACM, 2002.

[Levy01]Levy, Y. A.,Logic-based Techniques in Data Integration. Logic-based Artificial Intelligence, Kulwer,2001, pp. 1-27.

[Nash07]Nash, A. and A. Deutsch, Privacy in GLAV Information Integration. ICDT 2007,LNCS 4353, Springer, 2007, pp. 89-103.

[Pogg08]Poggi, A. et al., Linking Data to Ontologies. Journal on Data Semantics X,4900, Springer, 2008.

[Ullm00]Ullman, D. J.,Information Integration using Logical Views. Theoretical ComputerScience, Elseview, 239(2), 2000, pp. 189-210.

(21)

出席國際學術會議心得報告

附件一:Hu, Y. J., W. N. Wu, J. J. Yang, "Semantics-enabled Policies for Information Sharing and Protection in the Cloud", 3rd Int. Conference on Social Informatics (SocInfo2011), Oct. 6-8, 2011, Singapore, LNCS 6984, Springer, pp. 198-211.

(22)

國科會補助專題研究計畫項下出席國際學術會議心得報告

日期:99 年 10 月 30 日

一、參加會議經過

本研討會於 2011 年 10 月 6-10 月 8 日於 Singapore Management University 舉行。它 位處在新加坡市中心,是個繁華的城市,並且各個學院分處在市中心各角落,是沒有 圍籬的學校。本次研討會形式包括專題演講、論文發表、Posters & Demons 與 Tutorial。 研討會演講與發表內容包括 Network analysis, eGovernance and knowledge

management, Applications of network analysis, Community dynamics, Trust, privacy & security, Peer-production 等在 Social Informatics 領域涵蓋面非常的 廣,但是主要著重的還是 Network analysis 以及 Applications of network analysis;

計畫編

NSC 100-2221-E-004-011-MY2

計畫名

雲端資料跨域整合與保護

出國人

員姓名

胡毓忠 吳穩男

服務機

構及職

國立政治大學資訊科學系教授 國立政治大學資訊科學系博士班研 究生

會議時

2011 年 10 月 6 日 至 2011 年 10 月 8 日

會議地

Singapore Management University

會議名

(中文) 第三屆國際社會資訊會議

(英文) The Third International Conference on Social Informatics (SocInfo'11)

發表論

文題目

(中文) 運用語意規範達成雲端資訊共享和保護

(英文) Semantics-enabled Policies for Information Sharing and Protection in the Cloud

(23)

我們此次參與 6 日的 Poster/Demo Session 與 7 日的 Paper Session F4: Trust, Privacy & Security 的論文發表。最後一日參與 Hsinchun Chen 與 Sue Moon 的專題演講,題目 分別為 Predicting Market Movements: From Breaking News to Emerging Social Media 與 Analysis of Twitter Unfollow: How Often do People Unfollow in Twitter and Why? 。

二、與會心得

這次 SocInfo'2011 研討會主要的投稿來源包含歐洲、印度、南韓、日本、大陸、美國 和英國,有來自四面八方的學者,整體來說是一個國際的學術研討場合。我們發現 Singapore Management University 是一個很新的學校,校內建設方面十分注意學生的 實用性,有多處的小形討論的場所與電腦電源,如戶外的討論椅子下;本次研討會的 論文主要議題還是在 Network Analysis、Knowledge Management 與 Behavior Analysis 等面向。但本次我們發表的內容為利用語意網技術來保護雲端資料分享為研究目的, 與會學者認為此在 Social Science 中頗為新鮮是一項尚未被深入研究的方向。就此所 以於會議中,我們也瞭解與學習到更多新的研究方法與知識,如 Social Science 中的 Trust 就與我們有許多不同的觀點。我們此次 Demons.的成果有獲得大會 Travel Support 的獎金鼓勵。

三、考察參觀活動(無是項活動者略)

無。

四、建議

這幾年隨著大陸經濟起飛與國際化學習意願的提升,於 Singapore Management University 發現大陸留學生很多,並大量留學研究生參與學習。他們在過去幾年在 Singapore 求學之後定居於當地形成一個有利的學術網絡之外,大陸的內陸研究生只要 有意願並且經費許可的情況之下會選擇 Singapore 而不是選擇來台灣為出國留學地點, 這是我們台灣學者必須要體認到的一項事實。

五、攜回資料名稱及內容

SocInfo'11 論文集

(24)

附件二: Hu, Y. J., W. N. Wu, D. R. Cheng, "Towards Law-Aware Semantic Cloud Policies with Exceptions for Data Integration and Protection ", International Conference on Web Intelligence, Mining and Semantics (WIMS12), June 13-15, 2012, Craiova, Romania,ACM.

(25)

出國報告(出國類別:國際會議)

參 加 國 際 電 腦 研 討 會

「 International Conference

on Web

Intelligence, Mining and Semantics

(WIMS’12)」發表論文

並訪問義大利波隆納大學資訊與

法律研究中心(CIRSFID)

服務機關:國立政治大學

姓名職稱:胡毓忠教授

派赴國家:羅馬尼亞與義大利

出國期間:101 年 6 月 10 日至 101 年 6 月 20 日

報告日期:101 年 9 月 10 日

 

 

 

(26)

1  

(27)

摘        要 

 

本次出國的主要目的有二:首要目的是參加由羅馬尼亞 Craiova 大學舉辦並且國 際 計 算 機 學 會  Association  for  Computing  Machinery  (ACM) 認 證 的  International Conference on Web Intelligence, Mining and Semantics (WIMS'12)國際研討會,並在此 WIMS'12 國際研討會中發表論文:Towards Law-Aware Semantic Cloud Policies with Exceptions for Data Integration and Protection。另外的目的則是順道訪問義大利波隆 納大學法學資訊研究中心 CIRSFID,這項行程則是由 Monica  Palmirani 教授負責 接待並且協助指導其博士生的研究。WIMS'12 國際研討會的宗旨是提供研究全球 資訊網(Web) Web 智能、資訊探勘、與語意瞭解等研究學者一個研究成果交流與 互動的機會。這是一個新的研究趨勢,因此第二屆 WIMS'12 是接續去年 WIMS'11 在挪威 Sogndal。而第三屆 WIMS'13 將在西班牙首都馬德里市、第四屆 WIMS'14 將在法國里昂市舉辦。整體來說這個研討會將以年度的方式在歐洲幾個國家的城 市由知名的當地大學輪流舉辦。因為本研討會被接受的論文將被收錄在知名的 ACM  電子期刊,所以吸引不少投稿論文,因此接受率不是很高,具有挑戰性。 本次出國的另外一個目的則是順道過境義大利並且到波隆納大學(University  of Bologna)的法學資訊研究中心 CIRSFID 進行學術交流與訪問。除了將 上 述 所 發 表在  WIMS'12  的論文以演講的方式和此資訊法學中心的學者分享之外,也順便 協助指導此資訊法學中心教授 Monica  Palmirani 的博士生們。本次出國費用含機 票、研討會報名費、與相關生活費是由國科會研究案:Data Integration and Protection for the Inter-Domain Data Cloud (NSC 100-2221-E- 004-011-MY2) (2011/08/01-2013/07/31)和在政治大學資訊科學系碩士在職專班的「鼓勵參與學術 活動」的獎勵辦法下支助,在此一並加以致謝。

2   

(28)

I. 目的 為了提升國內大學在世界的競爭力,我們必須要提升研究與教學的品質。因此在 大學任教的資訊科學教授必須要進行持續最新資訊學理與技術的研究,並將研究 的成果發表在國際知名的研討會與期刊。如此可以讓世界其它國家的學者瞭解到 台灣在資訊科技特定領域的研究發展現況與成果。台灣出國的學者也可以透過國 際學術研討會相互交流與討論的機會,瞭解到其他國家學者對於資訊科技相同領 域研究的最新觀點。因此本次出國參與國際學術研討會的論文發表與學術交流則 是為落實上述目的來執行。 本人從民國 92 年起進行語意網與資訊安全、隱私權保護的相關研究,並且在過 去十多年來連續通過國科會個人專題計畫案審核與補助來進行此領域的相關性 的研究,並且陸續將研究成果發表在國際知名的研討會與期刊。除此之外本人過 去幾年也是這些國際知名研討會,如 WIMS, WI, RuleML, SocInfo 的議程委員,協 助這些國際研討會的議程規劃,審稿與研究學門的推動。相關的完整資訊請參考 本人的全球資訊網頁:http://www.cs.nccu.edu.tw/~jong  。 本次的出國主要是參與在羅馬尼亞由 Craiova 大學所舉辦的 WIMS'12 資訊科技國 際學術研討會並且發表論文:Towards Law-Aware Semantic Data Cloud Policies with Exceptions for Data Integration and Protection。具體的達成國科會專題計畫的研究目 標。除此之外,本次的出國也訪問了鄰近的義大利波隆納資訊法律研究中心 CIRSFID,並且和此中心的學者有不錯的互動和學術交流。最後這次參與研討會 所發表的論文在回國之後,經過原有論文的修正與加強後被瑞士洛桑 MDPI 出版 社的 Future Internet (ISSN 1999-5903)期刊所接受。將論文以 Semantic legal policies for data exchange and protection across super-peer domains in the cloud 名稱於 101 年 10 月 17 日發表於此期刊的 Semantic Interoperability and Knowledge Building 專輯(請 參考:http://www.mdpi.com/1999-5903/4/4/929  )。 II. WIMS'12 研討會參加與波隆納大學參訪過程 1. WIMS'12 研討會過程  (06/13-06/15) 這次的出國學術訪問共計為 11 天,從 2012 年 6 月 13 日晚上 11:10 搭乘荷蘭航 空(KLM)的 KL0808 班機先到荷蘭阿姆斯特丹專機,接著飛往羅馬尼亞首都布加 勒斯特  (Bucharest)在此停留一晚之後,隔天搭乘火車到達研討會的目的地: Craiova。Craiova  是一個比較小的大學城,但是當地的建築物非常具有歐洲的特 色如教堂,大學的主建築物等。羅馬尼亞的特產是水晶和銀器製品,因此價格比 其它國家便宜。當地的居民非常友 3   

(29)

。 善,雖然不方便用英文來溝通,但是在大學之內或住的酒店和當地人與櫃臺人員 之間的溝通應該沒有問題。在羅馬尼亞 Craiova 酒店的價格也遠比首都布加勒斯 特或其它西歐國家如英國、法國、義大利、德國、挪威等國家便宜很多。 今年的  WIMS'12  研討會在由  University  of  Craiova  主辦,會期一共為期三天 (2012/06/13 -06/15)。羅馬尼亞算是東歐國家和一般西歐國家如法、德、英等比 較起來較為落後。計程車司機會主動到機場或火車站拉客。這些主動招攬客人計 程車的車資會高出當地人熟悉的車行出車所收的費用高出許多。其它生活費的水 平整體來說則較為低廉。羅馬尼亞原屬於蘇聯時代的共產國家成員,但是蘇聯瓦 解之後,已經於 2005 加入成為歐盟成員國之一。因此雖然她不是申根免簽證的 國家,但是台灣中華民國國民還是可以享有一年少於 90 天停留歐洲免簽證的福 利。至於平時民間的消費貨幣則是使用羅馬尼亞的自身貨幣 LEU 而非歐元。 本研討會的論文主軸涵蓋有 Web 的智能分析、探勘、與語意表示與落實等,另 外相關的議題則是最新發展的串連式開放資料(Linked Open Data, LOD)、社會網路 分析、自然語言處理、資訊檢索與電子化學習等。大體上來說和另外一個有中國 學者籌劃的 Web Intelligence (WI)國際研討會相類似。差別是 WI 研討會的成員主 要以研究 Web 科技的中國大陸和其海外學者為主。而 WIMS 研討會主要是在歐 洲舉辦所以是以歐盟成員國研究  Web  科技的學者為主,例如第一屆  WIMS'11 (2011)是在挪威 Sogndal 舉行、第二屆的 WIMS'12 (2012)是在羅馬尼亞的 Craiova 舉行、第三屆的  WIMS'13  (2013)則預計在西班牙的馬德里市舉行、而第四屆的 WIMS'14 (2014)年則預計在法國的里昂市舉行。本人因為去年也參加了在挪威 Sogndal 舉行的第一屆 WIMS'11,因此今年看到了不少去年也參加並且發表論文 的學者,並且和他們有不錯的互動。 本人論文的報告被安排在第一天(06/13)的下午 Session 3 (Room 443D): Reasoning and  Semantics 的場次(請參考 http://software.ucv.ro/Wims12/program-v1.pdf)。論文 報告時間為 17:20-17:40。這次論文 Towards Law-Aware Semantic Cloud Policies with Exceptions for Data Integration and Protection(請參考附錄一)的報告內容主要是分 享國科會兩年計畫的部分研究成果(請參考 Data Integration and Protection for the Inter-Domain Data Cloud (NSC 100-2221-E-004-011-MY2)(2011/08/01-2013/07/31)) 論 文的全文則是刊登在 ACM 電子資料庫(http://dl.acm.org/citation.cfm?id=2254129  ), 至於報告的投影片請參考(http://www.cs.nccu.edu.tw/~jong/pub/17hu(slides).pdf  )。 本論文的具體成果是利用語意網的本體論(ontologies)與規則(rules)兩種知識表 達的整合來表示與落實在雲端平台之上的資料保護法概念,如此可以確保個人隱 私可以在跨域不同法治區之間進行資料的分享、整合、與交換。我們的雲端平台 主 要 是 利 用 剛 結 案 的 歐 盟  FP6  計 畫 所 提 供 的 開 放 式 雲 端 運 算 平 台  OpenTC (  http://www.opentc.net/  )。雖然  OpenTC  有提供可信式虛擬平台(Trusted  Virtual 4   

(30)

Domain)來設定同一個區域內的虛擬雲端機器(virtual  machines)之間的可信關係與 資料安全保護的機制,但是 OpenTC 並無法完整的來表示雲端之上資料與隱私權 保護的合法概念。我們所運用的語意網本體論技術正可以用來表示此資料與隱私 權保護抽象概念並且透過規則來具體來落實資料的使用與分享。 我們更進一步探索雲端平台跨不同法治區時所面臨的法律規範對於資料保護與 使用相衝突議題的化解議題。例如國安人員執行國安法來落實反恐與犯罪的打擊 需要在雲端的特定資料中心進行資料的要求與使用,而資料中心卻被另外的個人 資料保護法的遮罩所保護。當國安人員在符合法律的程序如傳票或搜索票取得後 對於特定可疑對象進行部分資料的揭露使用要求將可以用個人資料保護法例外 處理的方式來核准。而這種概念在電腦技術的表示上就必須要運用 non-monotonic reasoning 的方式來加以化解國安法和個資法之間的衝突。我們具體將這些概念用 語意網的本體論與規則兩大邏輯來表示落實。 這次研討會報告者主要是來自於歐洲的幾個國家的學者、包括了有挪威、德國、 法國、西班牙、義大利、希臘等。因為是在羅馬尼亞舉辦所以鄰近的東歐國家如 塞爾維亞、立陶宛、拉脫維亞、保加利亞、俄羅斯等有都有論文發表。這些讓我 覺得非常訝異,想不到智能 Web 科技的研究,已經延展到非傳統的歐洲各國。 本研討會 06/14 晚上安排到一個具有東歐色彩的餐廳進行晚宴,晚宴之中也安排 了他們當地的歌舞,整合歌舞看起來非常雄壯和東方如中國或日本的風格完全不 一樣。主辦單位也安排去參訪一個被收為國有的古城堡。城堡雖然正在整修,但 是還是可以看出當時住在這裡大戶人家的氣派。本研討會的最後一天,主辦單位 安 排 了 一 次 坐 車 約  3-4  小 時 路 程 的 參 訪 。 目 的 地 是 當 地 的 一 個 修 道 院 (http://www.manastirea-tismana.go.ro/tismana-eng.htm  ),這個 TISMANA 修道院已經 有非常長遠的歷史是由 St. Nicodim 所創建,據說和南歐的希臘也有一脈相傳的關 連性。裡面住了一些修士。感覺起來非常的清幽。非常適合沈思的地方。中午在 當地附近的一個農場用餐  (  http://www.casadinpadure.ro/  )。這個農場所提供的 餐點非常美味可口,類似於匈牙利餐點,有米飯、烤乳豬、炸魚等。我個人認為 口味非常適合我們東方中國人的口味。可以說是賓主盡歡。 2. 到義大利 University of Bologna 資訊法學中心的學術訪問(06/16-06/20) 從羅馬尼亞 Craiova 到義大利的 Bologna 應該不算是很遠,因為我搭乘的 Carpatair 航空 V32385 航班於 2012 年 6 月 16 日早上 07:45 從 Craiova 小機場出發,中間 經過羅馬尼亞西部大城 Timisoara 到達義大利的波隆納(Bologna)古城是當地的 時間 10:30。這次到 Bologna 大學資訊法學中心的交流訪問是出發前安排好的。 因為該中心的 Monica Palmirani 教授最近於 OASIS 的資訊學們非營利組織正在推 5   

(31)

動 LegalRuleML。本人過去非常的積極參與 RuleML 的技術,除了參與 RuleML 年 度國際研討會議程委員工作之外,並且在 2009 年到加拿大國科會(NRC)進行四個 月的學術訪問。當時是由 Harold Boley 教授負責接待。並且同時由台灣的國科會 支助四個月的生活費。而 Monica 也參與 RuleML 的組織活動。基於這一層的關係, 所以就藉這次研討會到羅馬尼亞的機會順便到 Bologna 大學訪問。Bologna 大學 是一個歷史非常久遠的大學、而整合大學是融入到 Bologna 這個古城當中。這個 城市類似一個蜘蛛網的架構,整個城市的建築物看起來就是具有悠久的歷史。它 們的資訊法律中心在全世界也是非常的知名。我到這個中心參訪時,他們正在整 修中心的主體建築物。中心除了進行法學與資訊整合的研究之外,也收了不少博 士生。因此我到此訪問的工作主要完成兩項任務:1.  進行一場演講題目和我在 WIMS'12 資訊科技國際學術研討會所發表的論文演講(演講公告請參考附錄二)。 這個題目因為是跨領域的議題,所以我希望能夠聽一聽法律學者們的意見,以當 作未來加強的參考。2.  協助這個資訊法學中心教授 Monica 指導她的博士生約 4-5 位。他們一一的上台報告自己的研究計畫與方法,我則提出個人的看法與評論。 因此這一次的 Bologna 大學資訊法學中心的學術訪問非常具體,也具有正面的效 益。這是一個雙向交流與互惠的訪問。在此次波隆納大學訪問的空檔,本人搭乘 義大利的火車到附近知名的觀光景點比薩斜塔參觀。因為行程緊湊的關係,無法 另外抽空到附近的佛羅倫斯古城參觀。本人於 2012 年 6 月 20 號  17:40 搭乘荷蘭 航空(KLM)  KL1592 班機下午 05:40 於波隆納機場起飛並於台灣時間 6 月 21 日 下午 02:45 到達台灣桃園國際機場。 III.   心得及建議 本次出國訪問期間因為是剛好在個人七年教授年休期間間,因為時間較為充裕, 不用考慮學校的補課安排,所以可以運用參加羅馬尼亞  WIMS'12  國際研討會與 發表論文的機會,順道訪問和本人研究目標吻合的義大利 Bologna 資訊法學中心 進行雙向交流。建議未來有類似的學術會議的論文發表,在經費與時間允許之下, 可以鼓勵國內學者進行類似的行程安排,因為這是一個兩全其美的安排。主要原 因是從台灣到歐洲的任何一個國家,單趟旅行時間(含等機時間)都要在 20 小 時以上,能夠在完成研討會主要任務之後,在花費不多的情況之下順道訪問當地 或鄰近國家的學術機構,除了可以進行面對面的雙向交流之外,也可以增加未來 學術合作的機會,如在歐洲就可以進行類似 FP7 歐盟計畫面對面的討論。並且進 行自身研究方向的調整與改進。如此可以將出國經費的運用成本效益發揮。因為 出國到歐美的訪問,機票動則台幣 4 到 5 萬元,其佔總體出國經費支出的最大宗。 而搭乘歐洲大陸內國與國之間的航班通常可以在 200 歐元之內完成。 本次義大利波隆納大學的訪問,本人和相關學者的互動能夠接手  RuleML-2012 Challenge 在法國舉辦的國際研討會主辦的工作。而原來在 WIMS'12 發表的論文, 6   

(32)

也因為在和當地學者的交流與建議下,能夠將其改進並且擴充為另外一篇期刊論 文,預計發表在 2012 年 10 月份 Future Internet 國際期刊的 Semantic Interoperability and Knowledge Building 專輯。整體來說本人因為長時間參與 Web 科技國際知名的 研討會除了投稿論文進行論文發表之外並且也擔任這些研討會的議程委員,因此 更能夠掌握這項科技發展的趨勢與研討會論文發表主軸。所以能夠持續的在這這 個 Web 科技的領域將國科會專題計畫的研究成果發表在這些研討會。這些學術 上的成果都需要長期的耕耘才會有研究成果的收穫。 附錄、到波隆納大學法學資訊研究中心(CIRSFID)演講公告 7    9   

(33)

ALMA MATER STUDIORUM – UNIVERSITÀ DI BOLOGNA Seminari della Scuola di dottorato in Scienze Giuridiche DOTTORATO DI RICERCA IN DIRITTO E NUOVE TECNOLOGIE Informatica Giuridica

Prof.

 Yuh-Jong Hu

National Chengchi University (Taiwan)

TOWARDS LAW-AWARE SEMANTIC

CLOUD POLICIES WITH EXCEPTIONS

FOR DATA INTEGRATION AND

PROTECTION

19 Giugno 2012

Ore 14.30-16

presso

CIRSFID – Sala Bertrand Russell

Via Galliera 3 – Bologna

(34)

附件三:Hu, Y. J., K. P. Cheng, Y. L. Huang, "Crafting a Balance between Big Data Utility and Protection in the Semantic Data Cloud", International Conference on Web Intelligence, Mining and Semantics (WIMS13), June 12-14, 2013, Madrid, Spain, ACM, ACM.

(35)

出國報告(出國類別:國際會議)

參 加 國 際 電 腦 研 討 會

「 International Conference on Web

Intelligence, Mining and Semantics

(WIMS'13)」發表論文

服務機關:國立政治大學

姓名職稱:胡毓忠教授

派赴國家:西班牙馬德里

出國期間:102 年 6 月 11 日至 102 年 6 月 16 日

報告日期:102 年 9 月 10 日

參考文獻

相關文件

In this section we define a general model that will encompass both register and variable automata and study its query evaluation problem over graphs. The model is essentially a

Srikant, Fast Algorithms for Mining Association Rules in Large Database, Proceedings of the 20 th International Conference on Very Large Data Bases, 1994, 487-499. Swami,

"Extensions to the k-Means Algorithm for Clustering Large Data Sets with Categorical Values," Data Mining and Knowledge Discovery, Vol. “Density-Based Clustering in

Classifying sensitive data (personal data, mailbox, exam papers etc.) Managing file storage, backup and cloud services, IT Assets (keys) Security in IT Procurement and

Know how to implement the data structure using computer programs... What are we

• Recorded video will be available on NTU COOL after the class..

In our AI term project, all chosen machine learning tools will be use to diagnose cancer Wisconsin dataset.. To be consistent with the literature [1, 2] we removed the 16

2 machine learning, data mining and statistics all need data. 3 data mining is just another name for