• 沒有找到結果。

本研究的架構如圖 6 所示,首先透過文獻探討瞭解現有軟體可靠度成長模型 之類型,並找出可運用的參數作為模型建構之參考依據。模型建構完成後,即透 過實際失效數據進行測試,並利用參數估計法來估計模型之參數,進而取得其與 失效數據之間的適配度(Goodness of Fit)。最後,將所提出的模型和現有模型進行 評量,以觀察所提出的模型是否較能有效預測軟體的失效行為。

圖 6 研究架構

3.2 資料來源

模型建構完成後,為了有效應用並估計模型(包含現有模型與本研究提出的 模型)之參數,必須透過實際的軟體失效數據進行分析。因此,本研究利用三組 資料集(Data Set)藉以估計各模型之參數值與適配度,資料集之來源為引用自過 去專家學者們已公開發表的論文中使用之數據(如表 2),而各資料集之內容將於 後續第 4.3.2 小節中進行詳盡的說明。

確認模型參數 模型建構 參數估計 模型評量

表 2 實際失效數據來源

資料集 失效數據來源 引用文獻

一 即時指揮與控制系統 Ohba(1984)

二 Tandem Computers 之產品 Pham 和 Zhang(2003)

三 無線網路交換中心 Jeske 和 Zhang(2005)

3.3 參數估計法

藉 由 將 實 際 失 效 數 據 代 入 至 模 型 中 , 即 可 估 計 出 該 模 型 的 所 有 參 數

(Parameters)值,而最常用於估計參數的兩種方式分別為:最小平方估計法(Least Squares Estimation, LSE)與最大概似估計法(Maximum Likelihood Estimation, MLE),以下將針對此兩種方法進行說明。

1. 最小平方估計法

最小平方估計法(Least Squares Estimation, LSE)是使樣本觀察值與估計值的 差異之平方和為最小的估計方法(林惠玲、陳正倉,2008)。其公式如下

= =

=

= n

i

i i

n i

i

i y y x

y

1

2 1

2 ( - ˆ- ˆ )

ˆ ) -(

SSE α β (3.1)

其中,x 與i y 分別為第i i 個觀察值的自變數與依變數;yˆ 為第i i 個估計值;αˆ為迴 歸模型之截距(Intercept)的估計值;βˆ 為迴歸模型之斜率(Slope)的估計值。透

過微分方法對αˆ、βˆ 進行微分,並令微分方程式等於零,即可求得迴歸模型之參 數值。

2. 最大概似估計法

最大概似估計法(Maximum Likelihood Estimation, MLE)的應用在於一般母 體之參數θ 皆未知,因此,若能從母體抽出的隨機樣本中找到一估計值θˆ,且使此

組樣本發生之可能性為最大時,則此估計值θˆ即為最大概似估計值(程大器,

2012)。

假 設(X1,X2,...,Xn)為 抽 自 母 體 f(x;θ) 之 一 組 隨 機 樣 本 , 則 其 概 似 函 數

(Likelihood Function)即為此n個隨機變數的聯合機率分配 f(x1,x2,...,xn;θ)。因 參數θ未知,故將此概似函數寫為

=

=

⋅⋅

⋅⋅

=

= n

i i n

n f x f x f x f x

x x x f L

1 2

1 2

1, ,..., ; ) ( ; ) ( ; ) ( ; ) ( ; ) (

)

(θ θ θ θ θ θ (3.2)

透過對概似函數L(θ)進行微分,並令微分方程式等於零且d2L(θ)/dθ2 <0,即可求 得估計值θˆ

由於最小平方估計法可簡便地求得未知的估計值,並令所求得的估計值和實 際值之間誤差的平方和為最小,此外,Pham(2007)在其所著的書中也提到,要 求解曲線適配度之問題,最常採用的方法為最小平方估計法。因此,本研究主要 透過最小平方估計法來求解模型之參數,並進一步獲得模型與各資料集之間的曲 線適配度。

3.4 模型評量準則

軟體可靠度模型主要透過:(1)模型與實際錯誤數據間的適配度和(2)模型是否 可有效預測未來錯誤行為這兩者來判斷其性能。但在建構完成一新的軟體可靠度 模型時,還必須與現有的模型進行比較,以評估所提出的模型是否較現有模型更 能有效預測軟體的失效行為。

早期專家學者們用來評量模型好壞的準則是以隨機差異(Sum of Squares Due to Error, SSE)和 Akaike 訊息標準(Akaike Information Criterion, AIC)兩者為主,

後續則有均方差(Mean Square-Error, MSE)、多元判定係數(Coefficient of Multiple

Determination, R2)、相對誤差(Relative Error, RE)、乖離率(Bias Ratio, Bias)、變 量(Variation)和均方根預測誤差(Root Mean Square Prediction Error, RMSPE)等。

由於評量準則的種類繁多,本小節僅介紹五種評量模型之方式,作為後續模型比 較之參考。

1. 均方差

均方差(Mean Square-Error, MSE)主要是透過預測值(mˆ(ti))與實際觀察數

據(y )之間的誤差作為測量標準,其公式如下 i

=

= k

i

i i

k y t m

1

)2

-) ˆ(

MSE ( (3.3)

若 MSE 的值愈低,代表模型的適配度愈好(Kapur et al., 1999)。

2. 多元判定係數

為了衡量解釋變數的解釋能力或迴歸方程式的適配度,將多元判定係數

(Coefficient of Multiple Determination, R2)定義為可解釋的差異(Sum of Squares Due to Regression, SSR)占總差異(Sum of Squares Total, SST)的比例。其公式如 下

SST -SSE SST 1

R2 =SSR = (3.4)

其中,SSR 代表可解釋的差異,SSE 代表隨機差異,SST 則為總差異。若 R2的值 愈大,代表模型的解釋能力愈好(Kapur et al., 1999)。

3. 乖離率

在任意時間i 下,實際失效次數與預測失效次數之間的差異,即稱為預測誤差

(Prediction Error, PE)PE 。而預測誤差的平均值即為乖離率(Bias Ratio, Bias)。i 若 Bias 的值愈小,代表模型的適配度愈好(Pillai & Nair, 1997)。

4. 變量

預測誤差的標準差即稱為變量(Variation),其公式如下

= (1/ -1) ( -Bias)2

Variation N PEi (3.5)

若 Variation 的值愈小,代表模型的適配度愈好(Pillai & Nair, 1997)。

5. 均方根預測誤差

均方根預測誤差(Root Mean Square Prediction Error, RMSPE)是用來測量預 測值與觀察值之間的接近程度,主要透過乖離率與變量兩者加以求得,其公式如 下

) Variation (Bias

RMSPE= 2 + 2 (3.6)

若 RMSPE 的值愈小,代表模型的適配度愈好(Pillai & Nair, 1997)。

第四章 模型建構

相關文件