範例 2

第五章範例

5.2 範例 2

假設一機構想要提供新的網格服務而需要配置 4 種資源(R1，R2，R3，R4) 在網格上，在此網格上有 6 個 accessible nodes(N1，N2，…，N6)，當中包含兩個資源管理裝置(N1，N3)，可以收到使用者的要求來管理服務。此虛擬網路架

表 6. 節點的失敗率

為 0.9845，花費為 137K(NTD)。雖然可靠度低於原本約 0.003，但執行時間為 93.234 秒，節省了約 400 倍的時間。

第六章結論

在廣域分散式系統中，網格技術是很重要的發展方向。如何在有限的預算下，使資源有效的配置在網格系統中，讓網格服務可靠度最佳化也是很重要的問題。本篇論文討論網格服務可靠度模型和演算法的估算，使用 GA 來有效地找出資源最佳化配置，然後呈現了一個經由配置後，可以使網格服務可靠度最大化的最佳化模型。再來提出了修正方法和使用 OO 來找出數筆資源配置，雖然減少了些許的網格服務可靠度，但有效的節省工作時間。最後，使用兩個範例來說明與比較執行結果。

附錄 A.

我們在附錄 A 中，詳細地說明如何找尋能完成服務的 MRST 的演算法，包含演算法程序與範例。

Algorithm 1. 開始於給定的初始節點，沿著可能的連結去搜尋在其他節點上所需的資源和紀錄搜尋路徑，直到所有所需資源被找到，MRST 即找到，紀錄 MRST。

假設圖形裡有配置好的

n

個節點，m種資源。

I. 名詞解釋

1. TV (Track vector)

用來記錄完成 MRST 的路徑。

TV = (t t_{1 2}

L

t_n⁾

未拜訪過的節點設為 d， TV = (dd_Ld)

起始節點設為 0

t 拜訪其鄰近且尚未拜訪過的節點i t ， _j t (parent)= _i t (new) _j

若起始節點為t ， TV = (0d₁ _Ld)

t 拜訪其鄰近且尚未拜訪過的節點1 t ， TV=(01d₂ _Ld) t 拜訪其鄰近且尚未拜訪過的節點₂ t ， TV=(01d2d₄ _Ld) 依此類推。

Delete(TV) 將紀錄的追蹤路徑刪除掉 2. RV (Resource vector)

用來判斷是否找到完成 MRST 所需要的資源。

RV = (r r_{1 2}

L L

r_j r_m⁾

若所需找尋的資源為

r

則

r

_j 設為 1，其餘設為 0， RV = ( 00 1 0L L ) 在拜訪節點 V_i時，檢查 V_i上是否有所需的資源

r

_j 。

若存在

r

_j ，則

r

_j設為 0。

當 RV = (00_L0)，則完成 MRST 的找尋。

若不存在

r

_j ，則往 V_i連接的鄰近且未拜訪過的節點尋找

r

_j。

RV(TV) 追蹤的路徑上所搜尋到的資源。

II. 詳細描述

給定起始節點V ，更新 TV，RV，j = 0。 _i

拜訪V 的所有相鄰且未拜訪過的節點_i V ,_a K, V_e。記錄每條路徑且檢查是否收集到所有所需資源。

V_a若收集到所需資源，則完成 MRST 的搜尋，i=i+1。

V_b若未收集到所需資源，照 V_i的方式，沿著 V_b繼續往下搜尋。

若 V_b不存在未拜訪過的相鄰節點，則搜尋失敗，此路徑無法得到 MRST。

若 i>=K 或搜尋完所有從 V_i出發的 MRST，則找到最多 K 條 MRST。

III. 執行步驟

Procedure MRST(V，E)

Step1. 輸入起始節點 V_i，求得 TV 並置入佇列。 j=0。

Step2. N =TV_front; //令佇列首的 TV 為 N Delete(TV_front); //釋放(刪除)TV_front

RV(N); //依紀錄的路徑而所得到的資源

Step3. 檢查路徑是否收集到所有所需資源

若未收集到， go to Step4。

說明:

使用者對 RN(N )要求服務(執行₁ P )，執行₁ P 需要資源₁ R R R 來協助完成 ₁, ₂, ₃ 找尋可以完成執行P 的 MRST ₁

1. TV=( ddddd )， RV=( 1111 ) //將 TV，RV 初始化

2. 輸入起始節點(N )，記錄 TV=(0dddd)， ₁ 放入佇列(queue) //TV_queue [(0dddd)]

N=TV_front(0dddd)，刪除TV_front(0dddd) // TV_queue []

3. RV(N)=(0010)，欠缺資源R ₃

4. 拜訪N 的所有相鄰且未拜訪過的節點₁ N N ₂, ₃ 並依序紀錄路徑 (01ddd)， (0d1dd)

依序存入佇列(queue) //TV_queue [(01ddd)，

(0d1dd)]

N=TV_front(01ddd)，刪除TV_front(01ddd) // TV_queue [(0d1dd)]

5. RV(N)=(0000)，找尋到 MRST， i=1

N=TV_front(0d1dd)，刪除TV_front(0d1dd) // TV_queue []

6. RV(N)=(0010)，欠缺資源R ₃

7. 拜訪N 的所有相鄰且未拜訪過的節點₃ N N N ₂, _4, ₅ 並依序紀錄路徑 (031dd)，(0d13d)，(0d1d3)

依序存入佇列(queue) //TV_queue [(031dd)，(0d13d)，

(0d1d3)]

N=TV_front(031dd)，刪除TV_front(031dd) // TV_queue [(0d13d)，(0d1d3)]

8. RV(N)=(0000)，找尋到 MRST， i=2

N=TV_front(0d13d)，刪除TV_front(0d13d) // TV_queue [(0d1d3)]

9. RV(N)=(0000)，找尋到 MRST， i=3

N=TV_front(0d1d3)，刪除TV_front(0d1d3) // TV_queue []

10. RV(N)=(0010)，欠缺資源R ₃

11. N 不存在相鄰且未拜訪過的節點 ₅ 佇列(queue)為空，終止搜尋 MRST 12. MRST ：1->2 ₁

MRST ：1->3->2 ₂ MRST ：1->3->4 ₃

附錄 B.

我們在附錄 B 中，詳細地說明如何計算Pr(E₁Λ Λ ⋅⋅⋅E₂ E_i₋₁ E_i)的演算法，包含演算法程序與範例。

Algorithm 2. 計算Pr(E₁Λ Λ ⋅⋅⋅E₂ E_i₋₁ E_i)

I. 名詞解釋

1. EV(Element Vector)

用來記錄完成 TV 所用到的元件(節點與連結)。

EV=(e e_{1 2}⋅⋅⋅e_n)

1 代表相對應的元件被包含在已搜尋過的路徑中，0 則不是。

初始值 EV= (00⋅⋅⋅ 0)

2. WV(Operating time Vector)

用來記錄相對應 EV 上每個元件所需的工作時間 WV=(w w₁, ₂,⋅⋅⋅,w_n)

初始值 WV= (0, 0, , 0)⋅⋅⋅

3. MRSTE[ , ]j k

當找尋到 MRST 時，MRSTE=EV

4. MRSTW[ , ]j k

用來記錄相對應 MRSTE 上每個元件所需的工作時間

5. CEV(Conditional Elemt Vector )

用來記錄使MRST₁,⋅⋅⋅,MRST_i₋₁其中一條失敗，而MRST 成功運作的條件元件 _i

6. CV

用來記錄條件元件結果 [1, ]

k∈ m

CV[ ] 0k = 代表條件元件運作失敗

CV[ ] 1k = 代表條件元件運作成功

7. OV

用來記錄相對應 CV 運作結果 k∈[1, ]m

OV[ ] 0k = 代表MRST 運作失敗 _k OV[ ] 1k = 代表MRST 運作成功 _k

II. 詳細描述

找出所有使MRST_j (j=1, 2,⋅⋅⋅ − 失敗，而,i 1) MRST 能成功運作的條件要素。 _i 經由 Algorithm 1 找出MRST後，記錄MRSTE j k 和[ , ] MRSTW j k ，[ , ] (j=1, 2,⋅⋅⋅, ;i

1, 2, , , )

k= ⋅⋅⋅ K ，其中 K 是在網格系統中，元件(節點和連結)的總數。

在MRST₁,⋅⋅⋅,MRST_i₋₁中，將與MRST 相同且工作時間大於_i MRST 的元件，記_i 錄下來。在這些相同元件中，依工作時間，由小到大依序排序並記錄之。滿足這些條件的元件，稱為條件元件(能使MRST₁,⋅⋅⋅,MRST_i₋₁其中一條失敗，而MRST 成_i 功運作)。

假設條件元件共有 m 個，其中MRST 的元件 j ，工作時間為_i w 。若_{i j}_,

1, 2

i i

MRST₋ MRST₋ 的元件 j 的工作時間分別為 w_i₋_1,_j ， w_i₋_2,_j 均大於 w_{i j}_, ，且

2, 1,

i j i j

w₋ >w₋ 。我們使用下面的圖 11.來幫助說明

wi_, j

wi₋₁_,

wi₋₂_,

圖 11. MRST ,_i MRST_i₋₁,MRST_i₋₂的元件 j 的工作時間

完成MRST ，_i MRST_i₋₁ 和MRST_i₋₂ 運作的元件 j 的個別工作時間分別為

, , 1,

i j i j

w w₋ 和w_i₋_2,_j。因為MRST 是成功運作的，因此在_i w 這段工作時間內，元件_{i j}_, j 是成功運作的。而在(w_i₋_1,_j −w_{i j}_, )這段時間內，元件 j 有可能運作失敗而導致

−1

MRSTi 和MRST_i₋₂運作失敗。因此起始時間T_b =w_{i j}_, ，終止時間T_e=w_i₋_1,_j，條件元件的可靠度R m( )=e⁻^λ^{( )(}^{j T}^e⁻^T^b⁾。接下來 m=m+1，而在(w_i₋_2,_j −w_i₋_1,_j)這段時間內，

元件 j 有可能運作失敗而導致MRST_i₋₂運作失敗。 T_b =w_i₋_1,_j，T_e=w_i₋_2,_j，依此類推，直到求出所有 ( )R m 。

使用二元搜尋樹來搜尋這些條件元件可以使MRST₁,⋅⋅⋅,MRST_i₋₁失敗而 MRST 成功的所有可能組合，將所求得的機率累加起來，即為i

1 2 1

Pr(EΛ Λ ⋅⋅⋅E E_i₋ E_i)。

III. 執行步驟

Procedure Pr(E₁Λ Λ ⋅⋅⋅E₂ E_i₋₁ E_i)

Step1. 記錄 MRSTE[j，k]和 MRSTW[j，k] (j=1, 2,⋅⋅⋅, ;i k =1, 2, ,⋅⋅⋅,K)，其中 K 是 在網格系統中，元件(節點和連結)的總數。

Step2. m=0。 k∈[1,K] // K 是在 CEV 裡，條件元件的總數 OS=(MRSTW[j，k] | (j=1, 2,⋅⋅⋅ ) , )i

//OS 是記錄MRST_j (j=1, 2,⋅⋅⋅ ，第, )i k個元件的工作時間。

Step3. n=0。 t∈OS且t>MRSTW i k[ , ]

Step4. m=m+1， n=n+1

( )T m_b =t m( − // (0)1) t =MRSTW i k[ , ] ( )T m_e =t m( )

R m( )=e⁻^λ^{( )(}^{k T}^e⁻^T^b⁾

CEV m[ ]←{ ,k T m T m R m_b( ), _e( ), ( )}

If t∈OS且t>MRSTW i k[ , ]， go to Step3。 Else， go to Step5。

Step5. 將 Y,CV,OV 初始化 Y=0

CV[1,⋅⋅⋅, ] [m = dd⋅⋅⋅ d] OV[1,⋅⋅⋅ − =,i 1] [11⋅⋅⋅ 1]

1 2 1 1

Pr(EΛ Λ ⋅⋅⋅E E_i₋ E )=Y

Step6. BinaryTree (CV,OV,z) z=0

CV [ ]_l z = CV [ ] 1,0, _r z = OV [_l Fail z( )]= 0 If OV[1,⋅⋅⋅ − =,i 1] [00⋅⋅⋅ 0]

Y=Y+PR(CV)

Else if CV[1,⋅⋅⋅, ] [11m = ⋅⋅⋅ 1]

Stop

Else z=z+1

Function PR(CV) 1

x= [1, ] k∈ m

If CV k[ ] 1= ( ) x= ×x R k

Else if CV k[ ]= 0 (1 ( )) x= × −x R k PR=x

IV. 範例說明

考慮一個網格系統如圖 12.所示,當中包含了四個節點和五條連結，有四種資源配置在節點上，收集所需的資源來執行程式。表 10-12 是網格運算系統所需的資訊。

1, 2 R R

1, 4 R R

2, 3

R R

1 P

3 R

1 P

圖 12. 四個節點的網格系統

表 10. 每個連結的速度與失敗率

0.9915

0.9778

參考文獻

[1] I. Foster, C. Kesselman and S. Tuecke, The anatomy of the grid: enabling scalable virtual organizations, Int J High Perform Comput Appl 15 (2001), pp. 200–222.

[2] S.K. Das, D.J. Harvey and R. Biswas, MinEX: a latency-tolerant dynamic partitioner for grid computing applications, Future Generat Comput Syst 18 (2002), pp. 477–489.

[3] Dai, YS, Xie M, Poh KL. Reliability analysis of grid computing systems. In: IEEE Pacific Rim international symposium on dependable computing (PRDC2002). 2002. p.

97–104.

[4] I. Foster and C. Kesselman, The grid: blueprint for a new computing infrastructure, Morgan-Kaufmann, San Francisco, CA (1998).

[5] I. Foster, C. Kesselman, J.M. Nick and S. Tuecke, Grid services for distributed system integration, Computer 35 (2002), pp. 37–46.

[6] K. Krauter, R. Buyya and M. Maheswaran, A taxonomy and survey of grid resource management systems for distributed computing, Software—Practice Experience 32 (2002), pp. 135–164.

[7] V.K.P. Kumar, S. Hariri and C.S. Raghavendra, Distributed program reliability analysis, IEEE Trans Software Eng SE-12 (1986), pp. 42–50.

[8] A. Kumar, S. Rai and D.P. Agarwal, On computer communication network reliability under program execution constraints, IEEE J Select Area Commun 6 (1988), pp.

1393–1400.

[9] D.J. Chen and T.H. Huang, Reliability analysis of distributed systems based on a fast reliability algorithm, IEEE Trans Parallel Distribute Syst 3 (1992), pp. 139–154.

[10] A. Kumar and D.P. Agrawal, A generalized algorithm for evaluating distributed-program reliability, IEEE Trans Reliab 42 (1993), pp. 416–424.

[11] D.J. Chen, R.S. Chen and T.H. Huang, A heuristic approach to generating file spanning trees for reliability analysis of distributed computing systems, Comput Math Appl 34 (1997), pp. 115–131.

[12] M.S. Lin, M.S. Chang and D.J. Chen, Efficient algorithms for reliability analysis of distributed computing systems, Inform Sci 117 (1999), pp. 89–106.

[13] M.S. Lin, M.S. Chang, D.J. Chen and K.L. Ku, The distributed program reliability analysis on ring-type topologies, Comput Oper Res 28 (2001), pp. 625–635.

[14] Y.S. Dai, M. Xie, K.L. Poh and G.Q. Liu, A study of service reliability and availability for distributed systems, Reliab Eng Syst Saf 79 (2003), pp. 103–112.

[15] M. Livny and R. Raman, High-throughput resource management, The grid: blueprint for a new computing infrastructure, Morgan-Kaufmann, San Francisco, CA (1998), pp.

311–338.

[16] M. Xie, Y.S. Dai and K.L. Poh, Computing systems reliability: models and analysis, Kluwer Academic Publishers, New York (2004).

[17] B. Yang and M. Xie, A study of operational and testing reliability in software reliability analysis, Reliab Eng Syst Saf 70 (2000), pp. 323–329.

[18] C.D. Lai, M. Xie, K.L. Poh, Y.S. Dai and P. Yang, A model for availability analysis of distributed software/hardware systems, Inform Software Technol 44 (2002), pp.

343–350.

[19] Y. S. Dai and X. L. Wang, “Optimal resource allocation on grid systems for maximizing service reliability using a genetic algorithm,” Reliability Engineering and System Safety, vol. 91, no. 9, pp. 1071–1082,2006.

[20] A. Kumar, R. Pathak and Y. Gupta, Genetic algorithm-based reliability optimization for computer network expansion, IEEE Trans Reliab 44 (1995), pp. 63–72.

[21] D. Coit and A. Smith, Reliability optimization of series-parallel systems using genetic algorithm, IEEE Trans Reliab 45 (1996), pp. 254–266.

[22] Z. Yangping, Z. Bingquan and W. Dongxin, Application of genetic algorithm to fault diagnosis in nuclear power plants, Reliab Eng Syst Saf 67 (2000), pp. 153–160.

[23] M. Marseguerra, E. Zio and M. Cipollone, Designing optimal degradation tests via multi-objective genetic algorithms, Reliab Eng Syst Saf 79 (2003), pp. 87–94.

[24] G. Levitin, Y.S. Dai, M. Xie and K.L. Poh, Optimizing survivability of multi-state systems with multi-level protection by multi-processor genetic algorithm, Reliab Eng Syst Saf 82 (2003), pp. 93–104.

在文檔中求取網格運算最大可靠度的資源配置演算法 (頁 37-55)

第五章 範例

5.2 範例 2

第六章 結論

附錄 A.

n

I. 名詞解釋

L

L L

r

r

r

r

r

r

r

II. 詳細描述

III. 執行步驟

Procedure MRST(V，E)

附錄 B.

I. 名詞解釋

II. 詳細描述

III. 執行步驟

IV. 範例說明

參考文獻

第五章範例

第六章結論