• 沒有找到結果。

固定違反試題局部獨立性程度

第四章 研究結果與討論

第四節 固定違反試題局部獨立性程度

一、 試題參數估計情形

(一) RMSE ( 如圖 38、圖 39、圖 40、圖 41、圖 42 所示)

RMSE-(0,0)

0 0.1 0.2 0.3 0.4

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

RMSE-(0,2)

0 0.1 0.2 0.3 0.4

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

圖 38 試題參數-RMSE-(0,0) 圖 39 試題參數-RMSE-(0,2)

RMSE-(0,8)

0 0.1 0.2 0.3 0.4

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

RMSE-(2,2)

0 0.1 0.2 0.3 0.4

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

RMSE-(2,8)

0 0.1 0.2 0.3 0.4

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

1. 兩軟體的 RMSE 會隨著樣本數的增加,而估計更為精準,但兩個不同樣本數 之間精準度的差距,會隨著違反試題局部獨立程度的增加而縮小,表示參數若 因違反試題局部獨立性而產生偏誤,當試題越多會使得偏誤越大。

圖 40 試題參數-RMSE-(0,8) 圖 41 試題參數-RMSE-(2,2)

圖 42 試題參數-RMSE-(2,8)

2. 當兩個題組皆不存在違反試題局部獨立性時,兩軟體的參數估計精準度會隨著 試題數的增加而些微的提高,且 BILOG-MG 的表現情形皆比 HLM6.03 軟體好 一些,表示 BILOG-MG 在試題為局部獨立時表現良好。

3. 當單一題組存在違反試題局部獨立性時,兩軟體的參數估計精準度不會隨著試 題數的不同而有明顯的變化,且 BILOG-MG 與 HLM6.03 軟體的表現情形相 似。但當試題數為 40 題、樣本數為 900 人且違反試題局部獨立程度 (0,2) 的 情況下,BILOG- MG 的表現情形較 HLM6.03 佳;而當試題數為 20 題、樣本 數為 100 人且違反試題局部獨立程度 (0,8) 的情況下,HLM6.03 軟體的表現 情形較 BILOG- MG 佳。

4. 當兩個題組皆存在違反試題局部獨立性時,可以發現兩軟體皆會因為試題數的 增加而估計越不精準,這種趨勢會隨著違反試題局部獨立程度的變大而更為明 顯,表示參數若因違反試題局部獨立性而產生偏誤,當試題越多會使得偏誤越 大。大致上而言,HLM6.03 軟體的估計皆較 BILOG-MG 精準。

(二) BIAS (如圖 43、圖 44、圖 45、圖 46、圖 47 所示) BIAS-(0,0)

0 0.1 0.2 0.3 0.4

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

BIAS-(0,2)

0 0.1 0.2 0.3 0.4

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

圖 43 試題參數-BIAS-(0,0) 圖 44 試題參數-BIAS-(0,2)

BIAS-(0,8)

0 0.1 0.2 0.3 0.4

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

BIAS-(2,2)

0 0.1 0.2 0.3 0.4

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

BIAS-(2,8)

0 0.1 0.2 0.3 0.4

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

圖 45 試題參數-BIAS -(0,8) 圖 46 試題參數-BIAS-(2,2)

圖 47 試題參數-BIAS -(2,8)

1. 當兩個題組皆沒有違反試題局部獨立性時,兩軟體的表現情形皆會隨著樣本數 與試題數的增加,而 BIAS 更精準。整體來說,BILOG- MG 的表現情形較 HLM6.03 軟體佳。

2. 當單一題組存在違反試題局部獨立性時,兩個軟體的表現情形並不會隨著樣本 數或試題數有太大的變化,且兩軟體的估計情形相近,尤其在違反試題局部獨 立程度較小的情況下。

3. 當兩個題組皆存在違反試題局部獨立性時,兩軟體會因試題數的增加,使個整 體的估計更不精準,表示參數若因違反試題局部獨立性而產生偏誤,當試題越 多會使得偏誤越大。大致來說,HLM6.03 軟體的估計表現較 BILOG-MG 佳。

(三) MCSE ( 如圖 48、圖 49、圖 50、圖 51、圖 52 所示) MCSE-(0,0)

0 0.1 0.2 0.3

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

MCSE-(0,2)

0 0.1 0.2 0.3

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

圖 48 試題參數-MCSE-(0,0) 圖 49 試題參數-MCSE-(0,2)

MCSE-(0,8)

0 0.1 0.2 0.3

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

MCSE-(2,2)

0 0.1 0.2 0.3

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

MCSE-(2,8)

0 0.1 0.2 0.3

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

1. 當兩個題組皆沒有存在違反試題局部獨立性時,兩軟體估計的一致性皆受樣本 數影響,樣本數越大則估計越一致,而 BILOG-MG 的表現情形,與 HLM6.03 圖 50 試題參數-MCSE-(0,8) 圖 51 試題參數-MCSE-(2,2)

圖 52 試題參數-MCSE-(2,8)

軟體非常接近。

2. 當單一題組存在違反試題局部獨立的情況時,兩軟體估計的一致性亦受樣本數 影響,樣本越大則估計越一致。大致上,兩軟體估計的一致性並無太大差異,

但在試題數 40 題、樣本數 900 人且違反局部獨立程度 (0,2)情形下,BILOG-MG 的表現情形較 HLM6.03 軟體佳,而在試題數 20 題、樣本數 100 人且違反局部 獨立程度 (0,8)情形下,HLM6.03 軟體的表現情形較 BILOG-MG 佳。

3. 當兩個題組皆存在違反試題局部獨立性時,兩軟體估計的一致性皆受樣本數影 響,樣本數越大則估計越一致;亦會受到試題數的些微影響,題數越多則越一 致。大致上,BILOG-MG 的表現情形,稍微較 HLM6.03 軟體好一些。

二、 能力參數估計情形

(一) RMSE ( 如圖 53、圖 54、圖 55、圖 56、圖 57 所示)

RMSE-(0,0)

0 0.3 0.6 0.9 1.2 1.5

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

RMSE-(0,2)

0 0.3 0.6 0.9 1.2 1.5

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

圖 53 能力參數-RMSE-(0,0) 圖 54 能力參數-RMSE-(0,2)

RMSE-(0,8)

0 0.3 0.6 0.9 1.2 1.5

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

RMSE-(2,2)

0 0.3 0.6 0.9 1.2 1.5

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

RMSE-(2,8)

0 0.3 0.6 0.9 1.2 1.5

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

圖 55 能力參數-RMSE-(0,8) 圖 56 能力參數-RMSE-(2,2)

圖 57 能力參數-RMSE-(2,8)

1. 當兩個題組皆沒有存在違反試題局部獨立性時,兩軟體在能力參數的 RMSE,

並不會受到樣本數的影響而有所不同,而會受到試題數的增加,使得估計較精 準些。 HLM6.03 軟體在估計精準度上的表現情形,會隨著試題數增加,而明 顯地較 BILOG- MG 好。

2. 當單一題組存在違反試題局部獨立的情況時,兩軟體估計的 RMSE 並不會因 為樣本數或試題數而影響其表現情形。大致上,兩軟體估計的 RMSE 並無太 大差異,但在試題數 80 題時, HLM6.03 軟體的表現情形較 BILOG-MG 好一 些。

3. 當兩個題組皆存在違反試題局部獨立的情況時,兩軟體估計的 RMSE 並不會 因為樣本數或試題數而影響其表現情形。大致上,兩軟體估計的 RMSE 並無 太大差異,但在樣本數為 900 人、試題數 20 題,和樣本數 900 人、試題數 20 題時, HLM6.03 軟體的估計情形,明顯地較 BILOG-MG 精準。

(二) MAD (如圖 58、圖 59、圖 60、圖 61、圖 62 所示)

MAD-(0,0)

0 0.3 0.6 0.9 1.2

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

MAD-(0,2)

0 0.3 0.6 0.9 1.2

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

圖 58 能力參數-MAD-(0,0) 圖 59 能力參數-MAD-(0,2)

MAD-(0,8)

0 0.3 0.6 0.9 1.2

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

MAD-(2,2)

0 0.3 0.6 0.9 1.2

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

MAD-(2,8)

0 0.3 0.6 0.9 1.2

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

圖 60 能力參數-MAD-(0,8) 圖 61 能力參數-MAD-(2,2)

圖 62 能力參數-MAD-(2,8)

1. 當兩個題組皆沒有存在違反試題局部獨立性時,兩軟體在能力參數的 MAD,

並不會受到樣本數的影響而有所不同,而會受到試題數的增加,使得估計較精 準些。 HLM6.03 軟體在估計精準度上的表現情形,會隨著試題數增加,而明 顯地較 BILOG- MG 好。

2. 當單一題組存在違反試題局部獨立的情況時,兩軟體估計的 MAD 並不會因為 樣本數或試題數而影響其表現情形。大致上,兩軟體估計的估計情形並無太大 差異,但在試題數 80 題時,HLM6.03 軟體的表現情形較 BILOG-MG 好一些。

3. 當兩個題組皆存在違反試題局部獨立的情況時,兩軟體估計的 MAD 並不會因 為樣本數或試題數而影響其表現情形。大致上,兩軟體估計的表現情形並無太 大差異,但在樣本數為 900 人、試題數 20 題,和樣本數 900 人、試題數 20 題時, HLM6.03 軟體的估計情形,明顯地較 BILOG-MG 佳。

相關文件