第二章 文獻探討
第三節 測驗層次選模準則
為了使模型能夠更加符合資料的特性,因此評估模型的正確性是非常重要 的,而模型的選擇便成了一個令人關注的焦點。一般傳統模型檢定的方法多半是 靠一些訊息準則,有兩個常用的準則分別為:1. Akaike (1974) 提出的 AIC(Akaike information criterion)、2. Akaike (1978) 提出的 BIC(Bayesian information
criterion)。但 AIC 與 BIC 準則的懲罰參數是固定的,也因此常會面臨過度配適或 過於精簡的問題。而只使用其中的一種準則通常只能在一些情況下表現較好(蘇育 正,2011)。到了 1980 年後,學者開始研究不同選模方法的性質與異同,最重要 的性質是有效性(efficiency)和一致性(consistent)的探討。在實際的應用上應該使用 具有效性的選模方法,還是一致性呢?事實上,這種選擇是非常主觀的,必須根 據不同的研究目的來做取捨。因此本研究加入了 Bozdogan (1987) 提出
CAIC(consistent Akaike information criterion),試圖提昇選擇模型時的有效性與一 致性。以下針對 AIC、BIC 與 CAIC 進行探討:
壹、AIC(Akaike information criterion)
係由日本統計學家Akaike (1973) 首先創立與發展的,是衡量統計模型擬合優 良性的一種標準,其值是根據 Kullback-Leibler discrepancy 所定義出來的,其優 點是具有有效性,也就是它會選擇具有最小MSE(meansquared error)分配的模型作 為適配模型,但是卻容易有過度適配(over-fitting)的問題。這是因為相較於其他選 模準則,AIC 的懲罰函數(penalty function)較小所致。不過當樣本數增加,過度 適配的問題就可以得到改善。同時比較多個模型,且考慮到描述的準確性和簡約 性,AIC 是較常使用的方法;但在模型中AIC並不是一個統計檢定法,它只是一 個選擇模式的準則,例如:給定一組資料,根據AIC 選模準則之下,可以把一些 模型排列出來,以AIC 值最小的模型當作最佳模型。其中AIC 基本架構理念為:
1. 模型適合度的預測使用、2. 採用自然對數期望概似值作為基本準則。
因為樣本的大小並不會直接包含在其計算中(Ostini & Nering, 2005; Schwarz, 1978; Sclove, 1987),因此,AIC 指標較利於用在大樣本的飽和模型中(Janssen &
De Boeck, 1999)。AIC 定義如公式11。
AIC = -2logL + 2‧ npar
其中 L 表示概似函數,npar 表示參數個數。
貳、BIC(Bayesian information criterion)
BIC 是 Akaike (1978) 由貝氏的觀點所提出來的,是一個具有一致性的選模 法,也就是當候選模式包含真正的模型時,BIC 所選出之模式為正確模式的機率 趨近於 1,反之,也不會有過度適配的問題,原因是 BIC 的懲罰函數的係數為 log N,一般都會大於 AIC 懲罰函數的係數 2。當樣本數多時,BIC 指標傾向於選擇 較簡單的模式,換句話說,相較於 AIC 指標,BIC 指標易選擇參數較少的模式。
BIC 定義如公式12。
BIC= -2logL + log(N) ‧npar
其中 L 表示概似函數,N 表示有效樣本數,npar 表示參數個數。
参、CAIC(Consistent Akaike information criterion)
Bozdogan (1987) 為了讓 AIC 訊息準則更有一致性,因此提出 CAIC,他將 AIC 的懲罰項係數由一個比 2 更大的樣本數函數來替代。在樣本數較小或衡量變 數較少時,AIC 指標通常有低估的情形出現,而 CAIC 則改善了這項缺點(Cudeck
& Browne, 1983)。CAIC 定義如公式 13。
CAIC = -2logL +[1 + log (N )] ‧ npar
其中L表示概似函數,N表示有效樣本數,npar表示參數個數。
肆、本節文獻對本研究的啟示
由以上文獻分析中,可知模型評估的過程是複雜且重要的,模型選擇對於之 後的推論具有重要影響,因為忽略模型選擇的步驟導致無效推論,容易造成認知
(11)
(13)
(12)
診斷模型估計產生的誤差。最好的方式除了提供足夠觀測數據,還必須以最少的 複雜性,或等價方式獲取最多的訊息。因此,本研究採用三種選模準則透過Ox 程式軟體分析與統計方法,從分析結果中選出與本研究最佳適配的認知診斷模 型,以作為後續研究的依據。