第二章、 研究背景
2.2. 桌機格網
2.2.2 桌機格網與格網(Grid)的比較
在桌機格網被提出以前,先有格網的概念,格網最早被提及是在 1995 年,
名為 I-WAY 的實驗中。經由這個實驗,北美的 17 部高階主機,透過高速網路在 很短的時間內相連接,彼此可以很容易的互相存取資源,形成最早的電腦格網。
而這種資源分享的概念與電力格網(Electric Power Grid)很相似,之後格網(Grid) 一詞便出現了。桌機格網與格網有許多的不同點,在此依照資源(resource)、連接
(Application Model)
屬於高生產量
10
一般在於資源選擇(Resource selection) 機制做各種調整以改善整體的效能,主要 分為三大類:
資源優先性(Resource Prioritization):此方法會依工作端回傳的 clock rate 等 資訊,將各工作端排序以得各優先順序,然後,有新工作將會優先分配到表現優 良的工作端以改善效能。
資源排除性(Resource Exclusion):此方法會依工作端回傳的資訊或者各種預 測計算,將可能已有工作執行的工作端不再分配到工作。
工作重複分配(Task Replication):由於擔心某個工作在某些機器不預期地拉 長執行時間,所以,在於資源充足的條件,可以將相同工作分配到多台的工作端
11
異質性(Heterogeneity) :
桌機格網都會面臨到不同工作端有不同的資源性質,比如不同作業系統、記 憶體大小、CPU 能力等,伺服器就必需提供資源發掘(Resource Discovery) 的機 制,BOINC 及 Condor 都有提供類似的功能,可以依工作對於資源需求而做適當 的分配。
另一種針對異質性的作法,是將虛擬機器(Virtual machines) 應用在格網計算 上,以減少工作端的異質環境條件,比如 VMPlant 及 Entropia Virtual Machine 分
重複及表決(Replication and voting):又稱為 double check 或 majority voting,
主要的方法即每個工作會分配給二個不相關的工作端,並比較兩個回傳的結束是 否一致,或不一致的話,會再分配給第三個工作端,多數表決回傳結果哪一個為 正確結果。
取樣(Sampling technique):重複及表決的方法會造成資源重複計算的問題,
取樣的方式即會針對新加入的工作端做測詴的機制,可能事前提供一些有正確結 果的工作分配給這些工作端,觀察這些新加入的工作端是否為惡意機器。
查核點確認(checkpoint-based verification):每個工作端每隔一段時間將當下 工作的狀態儲存下,產生 hash 值並傳回伺服器;伺服器則會不定期取出某一時 間點的查核點加以計算到下一個時間點的查核點,伺服器任會要求工作端的也從 該時間的查核點,計算相同的工作並回傳伺服器,伺服器會依其回傳結果是否相 同來判斷是否為惡意工作端。
12
可靠度(Reliability) :
可靠度的問題不論什麼系統都會遭遇到的問題,不外乎硬體錯誤(比如機器 當掉、網路斷掉等)、軟體錯誤(memory leak, numerical exception 等)以及其他情 形(使用者重新開機、機器 CPU 負荷過重等)。這分為兩方面,一是監測錯誤 (failure detection)的機制,另一個為錯誤恢復(failure recovery)的機制。監測錯誤 機制最簡單的方法即是每個工作端機器會定期回傳訊息(又稱為 heartbeat),若有 錯誤時,即不回傳,在伺服器端有一接收程式來判斷是工作端是否有錯誤發生; Desktop Grid,如何將工作分配這兩種不同的系統,將是其重點。
管理性(Manageability) : 生產量(High Throughput)導向。
13