穩定度模型和網格服務的分析

第二章網格服務與穩定度

2.3 穩定度模型和網格服務的分析

小規模的分散式程式/系統已經被廣泛的研究[7，9，11，13，14，16]。然而，這些常見的模型有共通的假設： (1) 由實體連結(電纜)和節點(訊號處理機) 來組成網路拓撲是靜態的，而不用考慮原件的動態改變和邏輯結構。(2) 節點和連結的操作特性是固定的，而不用考慮頻寬和資訊的論點。這些假設不適用於網格服務可靠度模型，因此需要被適當的修正。

在一個網格系統中，在遙遠的兩端點間交流可以在理論上被中斷，雖然他們之間存在實體連結，但是一些遠端資源的使用權利也許會變卦。舉例說明，電腦 A是一台伺服器，和電腦B(個人電腦)是相連的。但在現實生活中，有可能因為某些因素，譬如網路線的損毀，或者電腦A改變了電腦B登入的權限而拒絕電腦B進入伺服器。而導致電腦A、B雖然實際上是相連接，但彼此卻不相通。為了解決這

些問題，我們的數學模型使用虛擬結構來取代實體結構，將現實生活中的不確定

點的工作時間應該被包含在裡面。因此，模型結合這些條件會更接近真實的網格環境而且可以用來處理易變的廣大區域通訊。我們的模型是基於假設在這些節點與連結失敗的發生滿足Poisson process [17]。

Poisson process是隨機程序的一種，是以事件的發生時間來定義的。

它滿足以下條件：

1. 在兩個互斥（不重疊）的區間內所發生的事件的數目是互相獨立的隨機變數。

2. 在區間[t,t + τ]內發生的事件的數目的機率分佈為：

其中λ是一個正數，是固定的參數，通常稱為抵達率（arrival rate）或強度（intensity）。是單位時間(或單位面積)內隨機事件的平均發生率。當λ 或τ 越小，發生事件的機率越低。因此在論文中，網格系統為了完成服務，經由連結來交換所需的資源，能成功的運作，代表就是未發生失敗的事件，即是k=0。因此可靠度P[(N(t+τ)−N(t))=0]=e⁻^λτ ，λ 在這裡代表的是失敗率，可靠度會隨著失敗率λ 和運作時間τ 的減少而增加。

因此起初失敗的發生會隨著失敗率的參數呈指數分佈。而且，我們的模型也假設不同項的失敗彼此間是獨立的。這是一個在大規模網格系統中真實的論點，

是一個好的近似。因為資源被配置在節點上，大部份彼此節點是相距遙遠的。

在細節上，為了特定的服務，RM 站可以在不同資源中交換各種數量的資訊。

這些程式和資源也許會分散在不同的網點上，藉由網際網路的相連，由網格上可靠的運算元件和經由通訊通道來交換資訊而完成程式的運算。在處理程式時，失敗的發生也許會在運算處理器上或通訊的通道上。網格運算系統的結構，一般如圖 3.所示。

在圖 3.中，假設 M 筆程式P P₁, ₂,K,P_M散佈在網格運算系統上。每筆程式相對的所需處理時間為 (1), (2),t t K, (t M)。這些程式也許會交換資訊以得到所需的資源來協助完成運算。這些資源為R R₁, ₂,K,R_h,K,R_H。N個節點(節點 1 到節點 N)經由網際網路相連。每個節點相當於運算元件，也許會運算一組程式或包含一組資源。"RES−n"代表一組資源在節點n上。"PRG−n"代表一組程式在節點

n上運作 (n=1, 2,K,N)。

更多的通訊時間，則會使任務失敗的機率更大。不同的程式可能會在相同資源上交換不同量的資訊。更詳細的說，資源管理站為了完成特定的服務而可以從不同節點收集各種所需的資源，其中 D_h是在一個資源管理站與資源R_h (h=1, 2,⋅⋅⋅,H) 爲了執行服務而交換的總資訊量。

依照圖 4.，在節點 i 與節點 j 之間的通訊時間，由符號 ( , )T i j 來表示。經由_c 連結 ( , )L i j 交換總資訊量，由符號D i j 來表示。連結的平均速度，由符號 ( , )( , ) S i j 來表示。 ( , )T i j 可以由_c D i j 與 ( , )( , ) S i j 推導得到，如下式

( , )T i j_c =D i j( , ) / ( , )S i j (1) 可以假設失敗發生在節點上，節點 n (n=1, 2,K,N) ，連結 ( , )

L i j ( ,i j=1, 2,K,N)，各自均滿足在運作階段的 Poisson processes[12-13]。

節點n的失敗率，由符號λ_n來表示，而連結 ( , )L i j 的失敗率，由符號λ_{i j}_, 來表示。

在連結時，不論是連結或是連結的兩節點，當中任何一處發生失敗，就代表此連 結是失敗的。因此在節點 i 和節點 j 之間，經由連結 ( , )L i j 成功連結的機率可以 表示如下式

R i j_c( , )=exp{ (− λ λ λ_i+ _j+ _{i j}_, )⋅T i j_c( , )} (2) 其中 ( , )T i j 可以經由(1)式運算求得。 _c

同樣地，程式執行時，在執行程式的節點上發生任何失敗將讓所提供的服務失敗。節點n上的程式P 在時間_m t m 內能運算成功的機率 ( )

R m n_p( , )=exp{− ⋅λ_n t m( )} (3) 在圖 2.link L i j 用來交換資訊的可靠度可以由下式表達 ( , )

R i j_L( , )=exp{−λ_{i j}_, ⋅T i j_c( , )} (4) ( , )

T i j 可以經由(1)式求得。因此，節點c G 的總通訊時間可以由下式表達 _j ( ) ( , )

c i D

T j T i j

∈

∑

(5) D 在這裡指的是在 MRST 裡與節點j G 通訊的節點。因此節點_j G 在通訊上的可靠_j 度方程式可以由下式表達

R j_c( )=exp{− ⋅λ_j T j( )} (6) 最終，節點n上，程式P 在處理時間_m t m 內能成功執行的可靠度，可以經由(3)( ) 式得到。

由於每個RM站特性的不同，不同RM站(RN)在控制相同的服務時，甚至可能有不同的處理時間和失敗率。在節點上的處理時間能被加在通訊時間上，然後上述(6) 式可以被直接用於計算節點的可靠度。上述情況是爲了考慮不同節點的差異性和 RM站在網格中因不同的失敗率，處理時間，通訊時間和其它變數的影響。這裡我

們相信，會比單一假設(0.9)更接近實際情況[18]。

基於以上所描述的網格運算系統。定義網格服務可靠度如下：

網格服務可靠度：資源管理系統收到使用者的所要求的服務，蒐集遠端資源來協助完成，能成功執行程式在網格環境中的機率。換句話說，RN在網格運算環境中管理使用者所要求的服務，能成功地執行而不會失敗；任何一組資源(用來完成服務)在工作時是可靠的；連結在通訊時也是可靠的。

在文檔中求取網格運算最大可靠度的資源配置演算法 (頁 16-21)

第二章 網格服務與穩定度

2.3 穩定度模型和網格服務的分析

∑

第二章網格服務與穩定度