實徵資料分析成效之比較

第四章研究結果

第六節實徵資料分析成效之比較

一、模式指標之效能分析

表 4-21 是利用臺灣學生學習成就評量資料庫(Taiwan Assessment of Student Achievement，簡稱 TASA)2006 小四數學科的實徵資料並採用 HIRT 模式所獲得之估計參數以進行模式驗證之模擬研究的結果。表中呈現模擬 50 次的結果，其中模擬用的模式為 HIRT 模式，並分別利用 UIRT、MIRT 與 HIRT 模式進行模擬資料的分析，利用 Akaike’s information coefficient(AIC)、 Bayesian information coefficient(BIC)與 deviance information coefficient(DIC)指標進行模式選擇，探討哪一個模式針對該模擬研究的資料是較為恰當的。表 4-21 結果顯示：在模擬的架構是 HIRT 模式的情況下，AIC、BIC 與 DIC 三個指標呈現 50 次模擬過程中，

均以選擇 HIRT 模式進行資料分析的檢驗過程較為正確。模擬的結果確認 AIC、

BIC 與 DIC 三個指標用在區辨 UIRT、MIRT 與 HIRT 三個模式架構於資料分析過程是有效的，因此，透過 AIC、BIC 與 DIC 針對 TASA2006 小四數學科資料可獲得如表 4-22 的結果。表 4-22 顯示：TASA2006 小四數學科的實徵資料應採用 HIRT 模式為分析資料用之模式。

表 4-21

TASA2006 小四數學科模擬分析情況

分析模式資料名稱指標名稱 UIRT MIRT HIRT HIRT 模擬資料

AIC 0 0 50 BIC 0 0 50 DIC 0 0 50

表 4-22

TASA2006 小四數學科實徵模式選取表

分析模式

指標名稱 UIRT MIRT HIRT

AIC 210021.635 206339.775 204813.862 BIC 210749.403 207193.503 205604.609 DIC 215972.465 215412.931 215246.437

由於實徵資料分析的結果無法透過與真值比較驗證參數估計結果的精準程度，因此各模式針對測驗資料的估計結果之成效改採用 de la Torre 與 Song (2009)

的研究中所使用的評估方法─領域量尺之間的相關與各量尺的估計標準誤之平

均作為評估準則。表 4-23 為 UIRT 與 MIRT 模式針對 TASA2006 小四數學科測驗資料所分析的結果，表 4-24 為 HIRT 模式針對 TASA2006 小四數學科測驗資料所分析的結果。

表 4-23

TASA2006 小四數學科 UIRT 和 MIRT 模式估計標準誤

UIRT MIRT

數學能力數與計算量與實測幾何統計與機率代數試題參數 0.413 0.501 0.462 0.593 0.678 0.632 0.055 透過 HIRT 所獲得的結果如下所示：

表 4-24

TASA2006 小四數學科 HIRT 模式估計標準誤

數學能力數與計算量與實測幾何統計與機率代數試題參數 0.409 0.415 0.442 0.572 0.494 0.485 0.054

透過表 4-23 與表 4-24 的估計標準誤比較顯示：採用 UIRT 和 MIRT 模式進行資料分析，估計出來的參數的估計標準誤會高一點。可以間接說明，使用 HIRT 模式分析這筆資料，可以獲得較為穩定且精準的估計結果，這樣的結果與先前的模擬研究的結果相同。

表 4-25

參數估計效果提升比值

數學能力數與計算量與實測幾何統計與機率代數試題參數 1.010 1.207 1.045 1.036 1.373 1.30 1.01

此外，利用 HIRT 模式獲得的估計標準誤除以 UIRT 與 MIRT 模式獲得的估計標準誤的比值，如表 4-25 的 HIRT 模式參數提升效果的比值，顯示 HIRT 模式更可以『適當』的解釋 TASA2006 小四數學科測驗資料。這樣的結果，可以作為後續分析 TASA2006 小四數學科之測驗資料時的一個依據；而非使用 UIRT 模式來分析獲得總體量尺分數，或是僅透過 MIRT 模式分析獲得領域量尺分數！

二、小結

綜合上述， AIC、BIC 與 DIC 模式選取指標可有效的替具備階層能力結構的測驗資料選出較為正確的資料分析模式─HIRT 模式；而避免採用 UIRT 與 MIRT 模式架構下進行資料分析。此外透過實徵資料分析過程中的參數估計標準誤的比較，透過 HIRT 模式進行資料分析可以提高估計的效能與較低的參數估計標準誤差，而獲得較為精確的參數估計之結果。

在文檔中階層式試題反應理論模式及其等化估計方法 (頁 67-70)

第四章 研究結果

第六節 實徵資料分析成效之比較

第四章研究結果

第六節實徵資料分析成效之比較