在不受信任的雲端基礎建設上建構 DRA4WfMS

儲存在 DRA4WfMS 雲端系統的 DRA4WfMS 文件通常帶有重要的資料。將重要資料放在雲端儲存通常伴隨著一些安全風險。服務提供者可以洩漏敏感資料、

修改資料或者回傳給使用者不一致的資料。這些問題可能會因為程式臭蟲、當機、

操作錯誤或者是配置錯誤而發生。此外，比起偶然發生的意外，防範惡意的安全性攻擊更加困難，其比起意外也更具有破壞性。外部的對手可能會非法地訪問雲端儲存服務提供者營運的伺服器，或者雲端服務提供者的員工可能會從內部攻擊。

即使雲端儲存服務提供者實現了強大的安全性措施，這些安全性的漏洞還是可能存在的。

沒有任何一個現今的雲端儲存服務在他們的服務層級協議 (Service-Level Agreements, SLAs) 中有提供安全性保證。舉例來說，Amazon S3 [38] 以及 Azure [39] 的服務層級協議只保證可用性：如果可用性低於 99.9%，客戶可以得到契約上所約定的賠償。元素式加密法以及鏈狀 CER 讓 DRA4WfMS 滿足身分認證、資料保密性、資料完整性以及不可否認性等安全性要素。即使儲存工作流程程序實例的伺服器無法被公司所控制，公司也不需要去擔心工作流程程序的安全性問題。然而，客戶仍然不能確保他們存放在 DRA4WfMS 文件池中的資料不會遺失。面對這個問題的基本想法是不信任雲端伺服器以及將重要資料備份 [22, 23, 24, 25]。從市場的角度來看，伺服器提供者們不可能同意用

一個簡單且標準的方法去存取他們的服務，因為這會帶給客戶完全的自由，讓他們可以隨意更換服務提供者，導致更多的開放以及與其他提供者的直接競爭。

我們認為，對一個公司來說，他們不情願將他們的工作流程管理系統放在雲端，

除非該公司可以自行遷移及備份他們的工作流程程序實例，而不需要雲端服務提供者的支援。

首先，如果一間公司不滿意某個雲端服務提供者所提供的服務，該公司應該有完全的控制權可以把自己的資料轉換到另一個雲端服務提供者。為了轉換，

公司通常需要遷移正在執行的以及已經完成的工作流程程序實例，因為未完成的工作流程程序必須要繼續執行，以及已經完成的工作流程程序裡通常包含了重要的資料。其次，即使服務提供者提供某種的服務層級協議，像是可用性。

顧客可能仍然感覺在任何狀況下，任何工作流程程序實例的遺失，包含未完成或是已完成的工作流程程序，是不能接受的。由於在圖三.1 中的架構，參與者可以在流程活動執行期間自己透過 AEA 從一些商業的雲端儲存伺服器中進行備份以得到完整的 DRA4WfMS 文件。工作流程程序實例的複製很簡單，而且可以不需要原本的服務提供者協助。因為我們有所有 DRA4WfMS 文件的備份，我們可以簡單的將其遷移到其他的服務提供者。

第六章實作與實驗結果

在此章，我們將展示我們的實驗結果。我們根據圖三.1 的模式來實現 DRA4WfMS 文件池以及入口伺服器。DRA4WfMS 文件池以 Hadoop 來實做。

入口伺服器是一個 Apache server，讓可以 AEA 透過 HTTP 協定跟入口伺服器溝通。我們進行了以下實驗：(1) 在 DRA4WfMS 文件池中進行提取、儲存、

搜尋文件等操作的執行時間。(2) 在入口伺服器處理 DRA4WfMS 文件的執行時間。(3) 系統的同步處理能力。

我們建構了兩個 Hadoop 集群來實做 DRA4WfMS 文件池。一個叫做

“ICLAB cluster”，由五台 PC、五個節點組成。每個節點都有 3.0GHz Intel Core 2 Quad processor 的 CPU、2 GB 的記憶體、500 GB 的硬碟空間、Ubuntu 10.04 LTS 的作業系統以及 Java Development Kit 6。另一個叫做 “CSIE cluster”，由三十六台虛擬機器、三十六個節點組成，這些虛擬機器分佈在三台實體機器上。

每個節點都有 Intel(R) Xeon(R) CPU E5-2620 @ 2.00GHz 的 CPU、1 GB 的記憶體、18 GB 的硬碟空間、CentOS release 6.3 的作業系統以及 Java Development Kit 6。DRA4WfMS 文件的大小範圍在 7,304 bytes 與 47,591 bytes 之間。我們進行實驗去評估若DRA4WfMS 文件池中存放不同數量的文件時，系統的執行效能為何。

首先，我們計算從 DRA4WfMS 文件池中提取一份文件的執行時間。在這個狀況下，參與者已經根據他所收到的通知訊息，而獲得了他要提取的 DRA4WfMS 文件的列名，也就是圖四.1 裡的 “Row”。這就是圖中的步驟 (1) 或 (4)。提供列名，系統直接訪問 DRA4WfMS 文件池而不需要搜尋所有文件池中的文件。我們設定 DRA4WfMS 文件池中存有的文件數量分別為 10、100、

1000、10000 以及 100000 份文件。根據圖六.1，“ICLAB cluster” 獲得文件需要花費不到一秒的時間，而 “CSIE cluster” 獲得文件需要花費一秒到三秒的時間。由此可知，不管 DRA4WfMS 文件池中存有多少數量的文件，系統都可以在幾乎固定的時間內取得文件。我們可以發現流程活動 C_0 跟 C_1 會花較多的時間提取文件。這是因為流程活動 C_0 跟 C_1 必須要從 DRA4WfMS 文件池中提取兩份文件。

圖六.1. 文件池中存有不同數量的文件時，提取文件的時間 (詳細數據請參考附錄表 A-1)

實驗的第二部分，我們去量測執行圖三.1 中的步驟 (2) 或 (5) 需要多少時間。其包含了三個子步驟：(1) 入口伺服器驗證參與者上傳的 DRA4WfMS 文

件。(2) 將時間戳嵌入驗證過的文件中。 (3) 將擁有時間戳的文件存進 DRA4WfMS 文件池中。根據圖六.2 跟圖六.3，我們分別展示了在 DRA4WfMS