測驗層次選模準則

第二章文獻探討

第三節測驗層次選模準則

為了使模型能夠更加符合資料的特性，因此評估模型的正確性是非常重要的，而模型的選擇便成了一個令人關注的焦點。一般傳統模型檢定的方法多半是靠一些訊息準則，有兩個常用的準則分別為：1. Akaike (1974) 提出的 AIC(Akaike information criterion)、2. Akaike (1978) 提出的 BIC(Bayesian information

criterion)。但 AIC 與 BIC 準則的懲罰參數是固定的，也因此常會面臨過度配適或過於精簡的問題。而只使用其中的一種準則通常只能在一些情況下表現較好(蘇育正，2011)。到了 1980 年後，學者開始研究不同選模方法的性質與異同，最重要的性質是有效性(efficiency)和一致性(consistent)的探討。在實際的應用上應該使用具有效性的選模方法，還是一致性呢？事實上，這種選擇是非常主觀的，必須根據不同的研究目的來做取捨。因此本研究加入了 Bozdogan (1987) 提出

CAIC(consistent Akaike information criterion)，試圖提昇選擇模型時的有效性與一致性。以下針對 AIC、BIC 與 CAIC 進行探討：

壹、AIC(Akaike information criterion)

係由日本統計學家Akaike (1973) 首先創立與發展的，是衡量統計模型擬合優良性的一種標準，其值是根據 Kullback-Leibler discrepancy 所定義出來的，其優點是具有有效性，也就是它會選擇具有最小MSE(meansquared error)分配的模型作為適配模型，但是卻容易有過度適配(over-fitting)的問題。這是因為相較於其他選模準則，AIC 的懲罰函數(penalty function)較小所致。不過當樣本數增加，過度適配的問題就可以得到改善。同時比較多個模型，且考慮到描述的準確性和簡約性，AIC 是較常使用的方法；但在模型中AIC並不是一個統計檢定法，它只是一個選擇模式的準則，例如：給定一組資料，根據AIC 選模準則之下，可以把一些模型排列出來，以AIC 值最小的模型當作最佳模型。其中AIC 基本架構理念為：

1. 模型適合度的預測使用、2. 採用自然對數期望概似值作為基本準則。

因為樣本的大小並不會直接包含在其計算中（Ostini & Nering, 2005; Schwarz, 1978; Sclove, 1987），因此，AIC 指標較利於用在大樣本的飽和模型中（Janssen &

De Boeck, 1999）。AIC 定義如公式11。

AIC = -2logL + 2‧ npar

其中 L 表示概似函數，npar 表示參數個數。

貳、BIC(Bayesian information criterion)

BIC 是 Akaike (1978) 由貝氏的觀點所提出來的，是一個具有一致性的選模法，也就是當候選模式包含真正的模型時，BIC 所選出之模式為正確模式的機率趨近於 1，反之，也不會有過度適配的問題，原因是 BIC 的懲罰函數的係數為 log N，一般都會大於 AIC 懲罰函數的係數 2。當樣本數多時，BIC 指標傾向於選擇 較簡單的模式，換句話說，相較於 AIC 指標，BIC 指標易選擇參數較少的模式。

BIC 定義如公式12。

BIC= -2logL + log(N) ‧npar

其中 L 表示概似函數，N 表示有效樣本數，npar 表示參數個數。

参、CAIC(Consistent Akaike information criterion)

Bozdogan (1987) 為了讓 AIC 訊息準則更有一致性，因此提出 CAIC，他將 AIC 的懲罰項係數由一個比 2 更大的樣本數函數來替代。在樣本數較小或衡量變數較少時，AIC 指標通常有低估的情形出現，而 CAIC 則改善了這項缺點(Cudeck

& Browne, 1983)。CAIC 定義如公式 13。

CAIC = -2logL +[1 + log (N )] ‧ npar

其中L表示概似函數，N表示有效樣本數，npar表示參數個數。

肆、本節文獻對本研究的啟示

由以上文獻分析中，可知模型評估的過程是複雜且重要的，模型選擇對於之後的推論具有重要影響，因為忽略模型選擇的步驟導致無效推論，容易造成認知

（11）

（13）

（12）

診斷模型估計產生的誤差。最好的方式除了提供足夠觀測數據，還必須以最少的複雜性，或等價方式獲取最多的訊息。因此，本研究採用三種選模準則透過Ox 程式軟體分析與統計方法，從分析結果中選出與本研究最佳適配的認知診斷模型，以作為後續研究的依據。

在文檔中試題層次與測驗層次之認知診斷模型適合度分析-以國小四年級面積單元診斷測驗為例 (頁 29-32)

第二章 文獻探討

第三節 測驗層次選模準則