第二章 網格服務與穩定度
2.3 穩定度模型和網格服務的分析
小規模的分散式程式/系統已經被廣泛的研究[7,9,11,13,14,16]。然 而,這些常見的模型有共通的假設: (1) 由實體連結(電纜)和節點(訊號處理機) 來組成網路拓撲是靜態的,而不用考慮原件的動態改變和邏輯結構。(2) 節點和 連結的操作特性是固定的,而不用考慮頻寬和資訊的論點。這些假設不適用於網 格服務可靠度模型,因此需要被適當的修正。
在一個網格系統中,在遙遠的兩端點間交流可以在理論上被中斷,雖然他們 之間存在實體連結,但是一些遠端資源的使用權利也許會變卦。舉例說明,電腦 A是一台伺服器,和電腦B(個人電腦)是相連的。但在現實生活中,有可能因為某 些因素,譬如網路線的損毀,或者電腦A改變了電腦B登入的權限而拒絕電腦B進 入伺服器。而導致電腦A、B雖然實際上是相連接,但彼此卻不相通。為了解決這
些問題,我們的數學模型使用虛擬結構來取代實體結構,將現實生活中的不確定
點的工作時間應該被包含在裡面。因此,模型結合這些條件會更接近真實的網格 環境而且可以用來處理易變的廣大區域通訊。我們的模型是基於假設在這些節點 與連結失敗的發生滿足Poisson process [17]。
Poisson process是隨機程序的一種,是以事件的發生時間來定義的。
它滿足以下條件:
1. 在兩個互斥(不重疊)的區間內所發生的事件的數目是互相獨立的隨機 變數。
2. 在區間[t,t + τ]內發生的事件的數目的機率分佈為:
其中λ是一個正數,是固定的參數,通常稱為抵達率(arrival rate)或強 度(intensity)。是單位時間(或單位面積)內隨機事件的平均發生率。當λ 或τ 越小,發生事件的機率越低。因此在論文中,網格系統為了完成服務,經由連結 來交換所需的資源,能成功的運作,代表就是未發生失敗的事件,即是k=0。因 此可靠度P[(N(t+τ)−N(t))=0]=e−λτ ,λ 在這裡代表的是失敗率,可靠度會隨 著失敗率λ 和運作時間τ 的減少而增加。
因此起初失敗的發生會隨著失敗率的參數呈指數分佈。而且,我們的模型也 假設不同項的失敗彼此間是獨立的。這是一個在大規模網格系統中真實的論點,
是一個好的近似。因為資源被配置在節點上,大部份彼此節點是相距遙遠的。
在細節上,為了特定的服務,RM 站可以在不同資源中交換各種數量的資訊。
這些程式和資源也許會分散在不同的網點上,藉由網際網路的相連,由網格上可 靠的運算元件和經由通訊通道來交換資訊而完成程式的運算。在處理程式時,失 敗的發生也許會在運算處理器上或通訊的通道上。網格運算系統的結構,一般如 圖 3.所示。
在圖 3.中,假設 M 筆程式P P1, 2,K,PM散佈在網格運算系統上。每筆程式相 對的所需處理時間為 (1), (2),t t K, (t M)。這些程式也許會交換資訊以得到所需的 資源來協助完成運算。這些資源為R R1, 2,K,Rh,K,RH。N個節點(節點 1 到節點 N)經由網際網路相連。每個節點相當於運算元件,也許會運算一組程式或包含 一組資源。"RES−n"代表一組資源在節點n上。"PRG−n"代表一組程式在節點
n上運作 (n=1, 2,K,N)。
更多的通訊時間,則會使任務失敗的機率更大。不同的程式可能會在相同資源上 交換不同量的資訊。更詳細的說,資源管理站為了完成特定的服務而可以從不同 節點收集各種所需的資源,其中 Dh是在一個資源管理站與資源Rh (h=1, 2,⋅⋅⋅,H) 爲了執行服務而交換的總資訊量。
依照圖 4.,在節點 i 與節點 j 之間的通訊時間,由符號 ( , )T i j 來表示。經由c 連結 ( , )L i j 交換總資訊量,由符號D i j 來表示。連結的平均速度,由符號 ( , )( , ) S i j 來表示。 ( , )T i j 可以由c D i j 與 ( , )( , ) S i j 推導得到,如下式
( , )T i jc =D i j( , ) / ( , )S i j (1) 可 以 假 設 失 敗 發 生 在 節 點 上 , 節 點 n (n=1, 2,K,N) , 連 結 ( , )
L i j ( ,i j=1, 2,K,N),各自均滿足在運作階段的 Poisson processes[12-13]。
節點n的失敗率,由符號λn來表示,而連結 ( , )L i j 的失敗率,由符號λi j, 來表示。
在連結時,不論是連結或是連結的兩節點,當中任何一處發生失敗,就代表此連 結是失敗的。因此在節點 i 和節點 j 之間,經由連結 ( , )L i j 成功連結的機率可以 表示如下式
R i jc( , )=exp{ (− λ λ λi+ j+ i j, )⋅T i jc( , )} (2) 其中 ( , )T i j 可以經由(1)式運算求得。 c
同樣地,程式執行時,在執行程式的節點上發生任何失敗將讓所提供的服 務失敗。節點n上的程式P 在時間m t m 內能運算成功的機率 ( )
R m np( , )=exp{− ⋅λn t m( )} (3) 在圖 2.link L i j 用來交換資訊的可靠度可以由下式表達 ( , )
R i jL( , )=exp{−λi j, ⋅T i jc( , )} (4) ( , )
T i j 可以經由(1)式求得。因此,節點c G 的總通訊時間可以由下式表達 j ( ) ( , )
j
c i D
T j T i j
∈
=
∑
(5) D 在這裡指的是在 MRST 裡與節點j G 通訊的節點。因此節點j G 在通訊上的可靠j 度方程式可以由下式表達R jc( )=exp{− ⋅λj T j( )} (6) 最終,節點n上,程式P 在處理時間m t m 內能成功執行的可靠度,可以經由(3)( ) 式得到。
由於每個RM站特性的不同,不同RM站(RN)在控制相同的服務時,甚至可能有不同 的處理時間和失敗率。在節點上的處理時間能被加在通訊時間上,然後上述(6) 式可以被直接用於計算節點的可靠度。上述情況是爲了考慮不同節點的差異性和 RM站在網格中因不同的失敗率,處理時間,通訊時間和其它變數的影響。這裡我
們相信,會比單一假設(0.9)更接近實際情況[18]。
基於以上所描述的網格運算系統。定義網格服務可靠度如下:
網格服務可靠度:資源管理系統收到使用者的所要求的服務,蒐集遠端資源來協 助完成,能成功執行程式在網格環境中的機率。換句話說,RN在網格運算環境中 管理使用者所要求的服務,能成功地執行而不會失敗;任何一組資源(用來完成 服務)在工作時是可靠的;連結在通訊時也是可靠的。