第四章 研究結果
第六節 實徵資料分析成效之比較
一、模式指標之效能分析
表 4-21 是利用臺灣學生學習成就評量資料庫(Taiwan Assessment of Student Achievement,簡稱 TASA)2006 小四數學科的實徵資料並採用 HIRT 模式所獲得 之估計參數以進行模式驗證之模擬研究的結果。表中呈現模擬 50 次的結果,其 中模擬用的模式為 HIRT 模式,並分別利用 UIRT、MIRT 與 HIRT 模式進行模擬 資料的分析,利用 Akaike’s information coefficient(AIC)、 Bayesian information coefficient(BIC)與 deviance information coefficient(DIC)指標進行模式選擇,探討 哪一個模式針對該模擬研究的資料是較為恰當的。表 4-21 結果顯示:在模擬的 架構是 HIRT 模式的情況下,AIC、BIC 與 DIC 三個指標呈現 50 次模擬過程中,
均以選擇 HIRT 模式進行資料分析的檢驗過程較為正確。模擬的結果確認 AIC、
BIC 與 DIC 三個指標用在區辨 UIRT、MIRT 與 HIRT 三個模式架構於資料分析過 程是有效的,因此,透過 AIC、BIC 與 DIC 針對 TASA2006 小四數學科資料可 獲得如表 4-22 的結果。表 4-22 顯示:TASA2006 小四數學科的實徵資料應採用 HIRT 模式為分析資料用之模式。
表 4-21
TASA2006 小四數學科模擬分析情況
分析模式 資料名稱 指標名稱 UIRT MIRT HIRT HIRT 模擬資料
AIC 0 0 50 BIC 0 0 50 DIC 0 0 50
表 4-22
TASA2006 小四數學科實徵模式選取表
分析模式
指標名稱 UIRT MIRT HIRT
AIC 210021.635 206339.775 204813.862 BIC 210749.403 207193.503 205604.609 DIC 215972.465 215412.931 215246.437
由於實徵資料分析的結果無法透過與真值比較驗證參數估計結果的精準程 度,因此各模式針對測驗資料的估計結果之成效改採用 de la Torre 與 Song (2009)
的研究中所使用的評估方法─領域量尺之間的相關與各量尺的估計標準誤之平
均作為評估準則。表 4-23 為 UIRT 與 MIRT 模式針對 TASA2006 小四數學科測驗 資料所分析的結果,表 4-24 為 HIRT 模式針對 TASA2006 小四數學科測驗資料 所分析的結果。
表 4-23
TASA2006 小四數學科 UIRT 和 MIRT 模式估計標準誤
UIRT MIRT
數學能力 數與計算 量與實測 幾何 統計與機率 代數 試題參數 0.413 0.501 0.462 0.593 0.678 0.632 0.055 透過 HIRT 所獲得的結果如下所示:
表 4-24
TASA2006 小四數學科 HIRT 模式估計標準誤
數學能力 數與計算 量與實測 幾何 統計與機率 代數 試題參數 0.409 0.415 0.442 0.572 0.494 0.485 0.054
透過表 4-23 與表 4-24 的估計標準誤比較顯示:採用 UIRT 和 MIRT 模式進 行資料分析,估計出來的參數的估計標準誤會高一點。可以間接說明,使用 HIRT 模式分析這筆資料,可以獲得較為穩定且精準的估計結果,這樣的結果與先前的 模擬研究的結果相同。
62
表 4-25
參數估計效果提升比值
數學能力 數與計算 量與實測 幾何 統計與機率 代數 試題參數 1.010 1.207 1.045 1.036 1.373 1.30 1.01
此外,利用 HIRT 模式獲得的估計標準誤除以 UIRT 與 MIRT 模式獲得的估 計標準誤的比值,如表 4-25 的 HIRT 模式參數提升效果的比值,顯示 HIRT 模式 更可以『適當』的解釋 TASA2006 小四數學科測驗資料。這樣的結果,可以作為 後續分析 TASA2006 小四數學科之測驗資料時的一個依據;而非使用 UIRT 模式 來分析獲得總體量尺分數,或是僅透過 MIRT 模式分析獲得領域量尺分數!
二、小結
綜合上述, AIC、BIC 與 DIC 模式選取指標可有效的替具備階層能力結構 的測驗資料選出較為正確的資料分析模式─HIRT 模式;而避免採用 UIRT 與 MIRT 模式架構下進行資料分析。此外透過實徵資料分析過程中的參數估計標準 誤的比較,透過 HIRT 模式進行資料分析可以提高估計的效能與較低的參數估計 標準誤差,而獲得較為精確的參數估計之結果。