第四章 研究結果與討論
第四節 固定違反試題局部獨立性程度
一、 試題參數估計情形
(一) RMSE ( 如圖 38、圖 39、圖 40、圖 41、圖 42 所示)
RMSE-(0,0)
0 0.1 0.2 0.3 0.4
20 40 80
B-100 B-300 B-900
H-100 H-300 H-900
RMSE-(0,2)
0 0.1 0.2 0.3 0.4
20 40 80
B-100 B-300 B-900
H-100 H-300 H-900
圖 38 試題參數-RMSE-(0,0) 圖 39 試題參數-RMSE-(0,2)
RMSE-(0,8)
0 0.1 0.2 0.3 0.4
20 40 80
B-100 B-300 B-900
H-100 H-300 H-900
RMSE-(2,2)
0 0.1 0.2 0.3 0.4
20 40 80
B-100 B-300 B-900
H-100 H-300 H-900
RMSE-(2,8)
0 0.1 0.2 0.3 0.4
20 40 80
B-100 B-300 B-900
H-100 H-300 H-900
1. 兩軟體的 RMSE 會隨著樣本數的增加,而估計更為精準,但兩個不同樣本數 之間精準度的差距,會隨著違反試題局部獨立程度的增加而縮小,表示參數若 因違反試題局部獨立性而產生偏誤,當試題越多會使得偏誤越大。
圖 40 試題參數-RMSE-(0,8) 圖 41 試題參數-RMSE-(2,2)
圖 42 試題參數-RMSE-(2,8)
2. 當兩個題組皆不存在違反試題局部獨立性時,兩軟體的參數估計精準度會隨著 試題數的增加而些微的提高,且 BILOG-MG 的表現情形皆比 HLM6.03 軟體好 一些,表示 BILOG-MG 在試題為局部獨立時表現良好。
3. 當單一題組存在違反試題局部獨立性時,兩軟體的參數估計精準度不會隨著試 題數的不同而有明顯的變化,且 BILOG-MG 與 HLM6.03 軟體的表現情形相 似。但當試題數為 40 題、樣本數為 900 人且違反試題局部獨立程度 (0,2) 的 情況下,BILOG- MG 的表現情形較 HLM6.03 佳;而當試題數為 20 題、樣本 數為 100 人且違反試題局部獨立程度 (0,8) 的情況下,HLM6.03 軟體的表現 情形較 BILOG- MG 佳。
4. 當兩個題組皆存在違反試題局部獨立性時,可以發現兩軟體皆會因為試題數的 增加而估計越不精準,這種趨勢會隨著違反試題局部獨立程度的變大而更為明 顯,表示參數若因違反試題局部獨立性而產生偏誤,當試題越多會使得偏誤越 大。大致上而言,HLM6.03 軟體的估計皆較 BILOG-MG 精準。
(二) BIAS (如圖 43、圖 44、圖 45、圖 46、圖 47 所示) BIAS-(0,0)
0 0.1 0.2 0.3 0.4
20 40 80
B-100 B-300 B-900
H-100 H-300 H-900
BIAS-(0,2)
0 0.1 0.2 0.3 0.4
20 40 80
B-100 B-300 B-900
H-100 H-300 H-900
圖 43 試題參數-BIAS-(0,0) 圖 44 試題參數-BIAS-(0,2)
BIAS-(0,8)
0 0.1 0.2 0.3 0.4
20 40 80
B-100 B-300 B-900
H-100 H-300 H-900
BIAS-(2,2)
0 0.1 0.2 0.3 0.4
20 40 80
B-100 B-300 B-900
H-100 H-300 H-900
BIAS-(2,8)
0 0.1 0.2 0.3 0.4
20 40 80
B-100 B-300 B-900
H-100 H-300 H-900
圖 45 試題參數-BIAS -(0,8) 圖 46 試題參數-BIAS-(2,2)
圖 47 試題參數-BIAS -(2,8)
1. 當兩個題組皆沒有違反試題局部獨立性時,兩軟體的表現情形皆會隨著樣本數 與試題數的增加,而 BIAS 更精準。整體來說,BILOG- MG 的表現情形較 HLM6.03 軟體佳。
2. 當單一題組存在違反試題局部獨立性時,兩個軟體的表現情形並不會隨著樣本 數或試題數有太大的變化,且兩軟體的估計情形相近,尤其在違反試題局部獨 立程度較小的情況下。
3. 當兩個題組皆存在違反試題局部獨立性時,兩軟體會因試題數的增加,使個整 體的估計更不精準,表示參數若因違反試題局部獨立性而產生偏誤,當試題越 多會使得偏誤越大。大致來說,HLM6.03 軟體的估計表現較 BILOG-MG 佳。
(三) MCSE ( 如圖 48、圖 49、圖 50、圖 51、圖 52 所示) MCSE-(0,0)
0 0.1 0.2 0.3
20 40 80
B-100 B-300 B-900
H-100 H-300 H-900
MCSE-(0,2)
0 0.1 0.2 0.3
20 40 80
B-100 B-300 B-900
H-100 H-300 H-900
圖 48 試題參數-MCSE-(0,0) 圖 49 試題參數-MCSE-(0,2)
MCSE-(0,8)
0 0.1 0.2 0.3
20 40 80
B-100 B-300 B-900
H-100 H-300 H-900
MCSE-(2,2)
0 0.1 0.2 0.3
20 40 80
B-100 B-300 B-900
H-100 H-300 H-900
MCSE-(2,8)
0 0.1 0.2 0.3
20 40 80
B-100 B-300 B-900
H-100 H-300 H-900
1. 當兩個題組皆沒有存在違反試題局部獨立性時,兩軟體估計的一致性皆受樣本 數影響,樣本數越大則估計越一致,而 BILOG-MG 的表現情形,與 HLM6.03 圖 50 試題參數-MCSE-(0,8) 圖 51 試題參數-MCSE-(2,2)
圖 52 試題參數-MCSE-(2,8)
軟體非常接近。
2. 當單一題組存在違反試題局部獨立的情況時,兩軟體估計的一致性亦受樣本數 影響,樣本越大則估計越一致。大致上,兩軟體估計的一致性並無太大差異,
但在試題數 40 題、樣本數 900 人且違反局部獨立程度 (0,2)情形下,BILOG-MG 的表現情形較 HLM6.03 軟體佳,而在試題數 20 題、樣本數 100 人且違反局部 獨立程度 (0,8)情形下,HLM6.03 軟體的表現情形較 BILOG-MG 佳。
3. 當兩個題組皆存在違反試題局部獨立性時,兩軟體估計的一致性皆受樣本數影 響,樣本數越大則估計越一致;亦會受到試題數的些微影響,題數越多則越一 致。大致上,BILOG-MG 的表現情形,稍微較 HLM6.03 軟體好一些。
二、 能力參數估計情形
(一) RMSE ( 如圖 53、圖 54、圖 55、圖 56、圖 57 所示)
RMSE-(0,0)
0 0.3 0.6 0.9 1.2 1.5
20 40 80
B-100 B-300 B-900
H-100 H-300 H-900
RMSE-(0,2)
0 0.3 0.6 0.9 1.2 1.5
20 40 80
B-100 B-300 B-900
H-100 H-300 H-900
圖 53 能力參數-RMSE-(0,0) 圖 54 能力參數-RMSE-(0,2)
RMSE-(0,8)
0 0.3 0.6 0.9 1.2 1.5
20 40 80
B-100 B-300 B-900
H-100 H-300 H-900
RMSE-(2,2)
0 0.3 0.6 0.9 1.2 1.5
20 40 80
B-100 B-300 B-900
H-100 H-300 H-900
RMSE-(2,8)
0 0.3 0.6 0.9 1.2 1.5
20 40 80
B-100 B-300 B-900
H-100 H-300 H-900
圖 55 能力參數-RMSE-(0,8) 圖 56 能力參數-RMSE-(2,2)
圖 57 能力參數-RMSE-(2,8)
1. 當兩個題組皆沒有存在違反試題局部獨立性時,兩軟體在能力參數的 RMSE,
並不會受到樣本數的影響而有所不同,而會受到試題數的增加,使得估計較精 準些。 HLM6.03 軟體在估計精準度上的表現情形,會隨著試題數增加,而明 顯地較 BILOG- MG 好。
2. 當單一題組存在違反試題局部獨立的情況時,兩軟體估計的 RMSE 並不會因 為樣本數或試題數而影響其表現情形。大致上,兩軟體估計的 RMSE 並無太 大差異,但在試題數 80 題時, HLM6.03 軟體的表現情形較 BILOG-MG 好一 些。
3. 當兩個題組皆存在違反試題局部獨立的情況時,兩軟體估計的 RMSE 並不會 因為樣本數或試題數而影響其表現情形。大致上,兩軟體估計的 RMSE 並無 太大差異,但在樣本數為 900 人、試題數 20 題,和樣本數 900 人、試題數 20 題時, HLM6.03 軟體的估計情形,明顯地較 BILOG-MG 精準。
(二) MAD (如圖 58、圖 59、圖 60、圖 61、圖 62 所示)
MAD-(0,0)
0 0.3 0.6 0.9 1.2
20 40 80
B-100 B-300 B-900
H-100 H-300 H-900
MAD-(0,2)
0 0.3 0.6 0.9 1.2
20 40 80
B-100 B-300 B-900
H-100 H-300 H-900
圖 58 能力參數-MAD-(0,0) 圖 59 能力參數-MAD-(0,2)
MAD-(0,8)
0 0.3 0.6 0.9 1.2
20 40 80
B-100 B-300 B-900
H-100 H-300 H-900
MAD-(2,2)
0 0.3 0.6 0.9 1.2
20 40 80
B-100 B-300 B-900
H-100 H-300 H-900
MAD-(2,8)
0 0.3 0.6 0.9 1.2
20 40 80
B-100 B-300 B-900
H-100 H-300 H-900
圖 60 能力參數-MAD-(0,8) 圖 61 能力參數-MAD-(2,2)
圖 62 能力參數-MAD-(2,8)
1. 當兩個題組皆沒有存在違反試題局部獨立性時,兩軟體在能力參數的 MAD,
並不會受到樣本數的影響而有所不同,而會受到試題數的增加,使得估計較精 準些。 HLM6.03 軟體在估計精準度上的表現情形,會隨著試題數增加,而明 顯地較 BILOG- MG 好。
2. 當單一題組存在違反試題局部獨立的情況時,兩軟體估計的 MAD 並不會因為 樣本數或試題數而影響其表現情形。大致上,兩軟體估計的估計情形並無太大 差異,但在試題數 80 題時,HLM6.03 軟體的表現情形較 BILOG-MG 好一些。
3. 當兩個題組皆存在違反試題局部獨立的情況時,兩軟體估計的 MAD 並不會因 為樣本數或試題數而影響其表現情形。大致上,兩軟體估計的表現情形並無太 大差異,但在樣本數為 900 人、試題數 20 題,和樣本數 900 人、試題數 20 題時, HLM6.03 軟體的估計情形,明顯地較 BILOG-MG 佳。