本研究的架構如圖 6 所示,首先透過文獻探討瞭解現有軟體可靠度成長模型 之類型,並找出可運用的參數作為模型建構之參考依據。模型建構完成後,即透 過實際失效數據進行測試,並利用參數估計法來估計模型之參數,進而取得其與 失效數據之間的適配度(Goodness of Fit)。最後,將所提出的模型和現有模型進行 評量,以觀察所提出的模型是否較能有效預測軟體的失效行為。
圖 6 研究架構
3.2 資料來源
模型建構完成後,為了有效應用並估計模型(包含現有模型與本研究提出的 模型)之參數,必須透過實際的軟體失效數據進行分析。因此,本研究利用三組 資料集(Data Set)藉以估計各模型之參數值與適配度,資料集之來源為引用自過 去專家學者們已公開發表的論文中使用之數據(如表 2),而各資料集之內容將於 後續第 4.3.2 小節中進行詳盡的說明。
確認模型參數 模型建構 參數估計 模型評量
表 2 實際失效數據來源
資料集 失效數據來源 引用文獻
一 即時指揮與控制系統 Ohba(1984)
二 Tandem Computers 之產品 Pham 和 Zhang(2003)
三 無線網路交換中心 Jeske 和 Zhang(2005)
3.3 參數估計法
藉 由 將 實 際 失 效 數 據 代 入 至 模 型 中 , 即 可 估 計 出 該 模 型 的 所 有 參 數
(Parameters)值,而最常用於估計參數的兩種方式分別為:最小平方估計法(Least Squares Estimation, LSE)與最大概似估計法(Maximum Likelihood Estimation, MLE),以下將針對此兩種方法進行說明。
1. 最小平方估計法
最小平方估計法(Least Squares Estimation, LSE)是使樣本觀察值與估計值的 差異之平方和為最小的估計方法(林惠玲、陳正倉,2008)。其公式如下
∑
∑
= ==
= n
i
i i
n i
i
i y y x
y
1
2 1
2 ( - ˆ- ˆ )
ˆ ) -(
SSE α β (3.1)
其中,x 與i y 分別為第i i 個觀察值的自變數與依變數;yˆ 為第i i 個估計值;αˆ為迴 歸模型之截距(Intercept)的估計值;βˆ 為迴歸模型之斜率(Slope)的估計值。透
過微分方法對αˆ、βˆ 進行微分,並令微分方程式等於零,即可求得迴歸模型之參 數值。
2. 最大概似估計法
最大概似估計法(Maximum Likelihood Estimation, MLE)的應用在於一般母 體之參數θ 皆未知,因此,若能從母體抽出的隨機樣本中找到一估計值θˆ,且使此
組樣本發生之可能性為最大時,則此估計值θˆ即為最大概似估計值(程大器,
2012)。
假 設(X1,X2,...,Xn)為 抽 自 母 體 f(x;θ) 之 一 組 隨 機 樣 本 , 則 其 概 似 函 數
(Likelihood Function)即為此n個隨機變數的聯合機率分配 f(x1,x2,...,xn;θ)。因 參數θ未知,故將此概似函數寫為
∏
==
⋅⋅
⋅⋅
⋅
⋅
=
= n
i i n
n f x f x f x f x
x x x f L
1 2
1 2
1, ,..., ; ) ( ; ) ( ; ) ( ; ) ( ; ) (
)
(θ θ θ θ θ θ (3.2)
透過對概似函數L(θ)進行微分,並令微分方程式等於零且d2L(θ)/dθ2 <0,即可求 得估計值θˆ。
由於最小平方估計法可簡便地求得未知的估計值,並令所求得的估計值和實 際值之間誤差的平方和為最小,此外,Pham(2007)在其所著的書中也提到,要 求解曲線適配度之問題,最常採用的方法為最小平方估計法。因此,本研究主要 透過最小平方估計法來求解模型之參數,並進一步獲得模型與各資料集之間的曲 線適配度。
3.4 模型評量準則
軟體可靠度模型主要透過:(1)模型與實際錯誤數據間的適配度和(2)模型是否 可有效預測未來錯誤行為這兩者來判斷其性能。但在建構完成一新的軟體可靠度 模型時,還必須與現有的模型進行比較,以評估所提出的模型是否較現有模型更 能有效預測軟體的失效行為。
早期專家學者們用來評量模型好壞的準則是以隨機差異(Sum of Squares Due to Error, SSE)和 Akaike 訊息標準(Akaike Information Criterion, AIC)兩者為主,
後續則有均方差(Mean Square-Error, MSE)、多元判定係數(Coefficient of Multiple
Determination, R2)、相對誤差(Relative Error, RE)、乖離率(Bias Ratio, Bias)、變 量(Variation)和均方根預測誤差(Root Mean Square Prediction Error, RMSPE)等。
由於評量準則的種類繁多,本小節僅介紹五種評量模型之方式,作為後續模型比 較之參考。
1. 均方差
均方差(Mean Square-Error, MSE)主要是透過預測值(mˆ(ti))與實際觀察數
據(y )之間的誤差作為測量標準,其公式如下 i
∑
== k
i
i i
k y t m
1
)2
-) ˆ(
MSE ( (3.3)
若 MSE 的值愈低,代表模型的適配度愈好(Kapur et al., 1999)。
2. 多元判定係數
為了衡量解釋變數的解釋能力或迴歸方程式的適配度,將多元判定係數
(Coefficient of Multiple Determination, R2)定義為可解釋的差異(Sum of Squares Due to Regression, SSR)占總差異(Sum of Squares Total, SST)的比例。其公式如 下
SST -SSE SST 1
R2 =SSR = (3.4)
其中,SSR 代表可解釋的差異,SSE 代表隨機差異,SST 則為總差異。若 R2的值 愈大,代表模型的解釋能力愈好(Kapur et al., 1999)。
3. 乖離率
在任意時間i 下,實際失效次數與預測失效次數之間的差異,即稱為預測誤差
(Prediction Error, PE)PE 。而預測誤差的平均值即為乖離率(Bias Ratio, Bias)。i 若 Bias 的值愈小,代表模型的適配度愈好(Pillai & Nair, 1997)。
4. 變量
預測誤差的標準差即稱為變量(Variation),其公式如下
∑
= (1/ -1) ( -Bias)2
Variation N PEi (3.5)
若 Variation 的值愈小,代表模型的適配度愈好(Pillai & Nair, 1997)。
5. 均方根預測誤差
均方根預測誤差(Root Mean Square Prediction Error, RMSPE)是用來測量預 測值與觀察值之間的接近程度,主要透過乖離率與變量兩者加以求得,其公式如 下
) Variation (Bias
RMSPE= 2 + 2 (3.6)
若 RMSPE 的值愈小,代表模型的適配度愈好(Pillai & Nair, 1997)。