固定違反試題局部獨立性程度

第四章研究結果與討論

第四節固定違反試題局部獨立性程度

一、試題參數估計情形

(一) RMSE ( 如圖 38、圖 39、圖 40、圖 41、圖 42 所示)

RMSE-(0,0)

0 0.1 0.2 0.3 0.4

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

RMSE-(0,2)

0 0.1 0.2 0.3 0.4

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

圖 38 試題參數－RMSE－(0,0) 圖 39 試題參數－RMSE－(0,2)

RMSE-(0,8)

0 0.1 0.2 0.3 0.4

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

RMSE-(2,2)

0 0.1 0.2 0.3 0.4

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

RMSE-(2,8)

0 0.1 0.2 0.3 0.4

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

1. 兩軟體的 RMSE 會隨著樣本數的增加，而估計更為精準，但兩個不同樣本數之間精準度的差距，會隨著違反試題局部獨立程度的增加而縮小，表示參數若因違反試題局部獨立性而產生偏誤，當試題越多會使得偏誤越大。

圖 40 試題參數－RMSE－(0,8) 圖 41 試題參數－RMSE－(2,2)

圖 42 試題參數－RMSE－(2,8)

2. 當兩個題組皆不存在違反試題局部獨立性時，兩軟體的參數估計精準度會隨著試題數的增加而些微的提高，且 BILOG-MG 的表現情形皆比 HLM6.03 軟體好一些，表示 BILOG-MG 在試題為局部獨立時表現良好。

3. 當單一題組存在違反試題局部獨立性時，兩軟體的參數估計精準度不會隨著試題數的不同而有明顯的變化，且 BILOG-MG 與 HLM6.03 軟體的表現情形相似。但當試題數為 40 題、樣本數為 900 人且違反試題局部獨立程度 (0,2) 的情況下，BILOG- MG 的表現情形較 HLM6.03 佳；而當試題數為 20 題、樣本數為 100 人且違反試題局部獨立程度 (0,8) 的情況下，HLM6.03 軟體的表現情形較 BILOG- MG 佳。

4. 當兩個題組皆存在違反試題局部獨立性時，可以發現兩軟體皆會因為試題數的增加而估計越不精準，這種趨勢會隨著違反試題局部獨立程度的變大而更為明顯，表示參數若因違反試題局部獨立性而產生偏誤，當試題越多會使得偏誤越大。大致上而言，HLM6.03 軟體的估計皆較 BILOG-MG 精準。

(二) BIAS (如圖 43、圖 44、圖 45、圖 46、圖 47 所示) BIAS-(0,0)

0 0.1 0.2 0.3 0.4

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

BIAS-(0,2)

0 0.1 0.2 0.3 0.4

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

圖 43 試題參數－BIAS－(0,0) 圖 44 試題參數－BIAS－(0,2)

BIAS-(0,8)

0 0.1 0.2 0.3 0.4

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

BIAS-(2,2)

0 0.1 0.2 0.3 0.4

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

BIAS-(2,8)

0 0.1 0.2 0.3 0.4

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

圖 45 試題參數－BIAS －(0,8) 圖 46 試題參數－BIAS－(2,2)

圖 47 試題參數－BIAS －(2,8)

1. 當兩個題組皆沒有違反試題局部獨立性時，兩軟體的表現情形皆會隨著樣本數與試題數的增加，而 BIAS 更精準。整體來說，BILOG- MG 的表現情形較 HLM6.03 軟體佳。

2. 當單一題組存在違反試題局部獨立性時，兩個軟體的表現情形並不會隨著樣本數或試題數有太大的變化，且兩軟體的估計情形相近，尤其在違反試題局部獨立程度較小的情況下。

3. 當兩個題組皆存在違反試題局部獨立性時，兩軟體會因試題數的增加，使個整體的估計更不精準，表示參數若因違反試題局部獨立性而產生偏誤，當試題越多會使得偏誤越大。大致來說，HLM6.03 軟體的估計表現較 BILOG-MG 佳。

(三) MCSE ( 如圖 48、圖 49、圖 50、圖 51、圖 52 所示) MCSE-(0,0)

0 0.1 0.2 0.3

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

MCSE-(0,2)

0 0.1 0.2 0.3

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

圖 48 試題參數－MCSE－(0,0) 圖 49 試題參數－MCSE－(0,2)

MCSE-(0,8)

0 0.1 0.2 0.3

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

MCSE-(2,2)

0 0.1 0.2 0.3

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

MCSE-(2,8)

0 0.1 0.2 0.3

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

1. 當兩個題組皆沒有存在違反試題局部獨立性時，兩軟體估計的一致性皆受樣本數影響，樣本數越大則估計越一致，而 BILOG-MG 的表現情形，與 HLM6.03 圖 50 試題參數－MCSE－(0,8) 圖 51 試題參數－MCSE－(2,2)

圖 52 試題參數－MCSE－(2,8)

軟體非常接近。

2. 當單一題組存在違反試題局部獨立的情況時，兩軟體估計的一致性亦受樣本數影響，樣本越大則估計越一致。大致上，兩軟體估計的一致性並無太大差異，

但在試題數 40 題、樣本數 900 人且違反局部獨立程度 (0,2)情形下，BILOG-MG 的表現情形較 HLM6.03 軟體佳，而在試題數 20 題、樣本數 100 人且違反局部獨立程度 (0,8)情形下，HLM6.03 軟體的表現情形較 BILOG-MG 佳。

3. 當兩個題組皆存在違反試題局部獨立性時，兩軟體估計的一致性皆受樣本數影響，樣本數越大則估計越一致；亦會受到試題數的些微影響，題數越多則越一致。大致上，BILOG-MG 的表現情形，稍微較 HLM6.03 軟體好一些。

二、能力參數估計情形

(一) RMSE ( 如圖 53、圖 54、圖 55、圖 56、圖 57 所示)

RMSE-(0,0)

0 0.3 0.6 0.9 1.2 1.5

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

RMSE-(0,2)

0 0.3 0.6 0.9 1.2 1.5

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

圖 53 能力參數－RMSE－(0,0) 圖 54 能力參數－RMSE－(0,2)

RMSE-(0,8)

0 0.3 0.6 0.9 1.2 1.5

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

RMSE-(2,2)

0 0.3 0.6 0.9 1.2 1.5

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

RMSE-(2,8)

0 0.3 0.6 0.9 1.2 1.5

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

圖 55 能力參數－RMSE－(0,8) 圖 56 能力參數－RMSE－(2,2)

圖 57 能力參數－RMSE－(2,8)

1. 當兩個題組皆沒有存在違反試題局部獨立性時，兩軟體在能力參數的 RMSE，

並不會受到樣本數的影響而有所不同，而會受到試題數的增加，使得估計較精準些。 HLM6.03 軟體在估計精準度上的表現情形，會隨著試題數增加，而明顯地較 BILOG- MG 好。

2. 當單一題組存在違反試題局部獨立的情況時，兩軟體估計的 RMSE 並不會因為樣本數或試題數而影響其表現情形。大致上，兩軟體估計的 RMSE 並無太大差異，但在試題數 80 題時， HLM6.03 軟體的表現情形較 BILOG-MG 好一些。

3. 當兩個題組皆存在違反試題局部獨立的情況時，兩軟體估計的 RMSE 並不會因為樣本數或試題數而影響其表現情形。大致上，兩軟體估計的 RMSE 並無太大差異，但在樣本數為 900 人、試題數 20 題，和樣本數 900 人、試題數 20 題時， HLM6.03 軟體的估計情形，明顯地較 BILOG-MG 精準。

(二) MAD (如圖 58、圖 59、圖 60、圖 61、圖 62 所示)

MAD-(0,0)

0 0.3 0.6 0.9 1.2

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

MAD-(0,2)

0 0.3 0.6 0.9 1.2

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

圖 58 能力參數－MAD－(0,0) 圖 59 能力參數－MAD－(0,2)

MAD-(0,8)

0 0.3 0.6 0.9 1.2

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

MAD-(2,2)

0 0.3 0.6 0.9 1.2

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

MAD-(2,8)

0 0.3 0.6 0.9 1.2

20 40 80

B-100 B-300 B-900

H-100 H-300 H-900

圖 60 能力參數－MAD－(0,8) 圖 61 能力參數－MAD－(2,2)

圖 62 能力參數－MAD－(2,8)

1. 當兩個題組皆沒有存在違反試題局部獨立性時，兩軟體在能力參數的 MAD，

2. 當單一題組存在違反試題局部獨立的情況時，兩軟體估計的 MAD 並不會因為樣本數或試題數而影響其表現情形。大致上，兩軟體估計的估計情形並無太大差異，但在試題數 80 題時，HLM6.03 軟體的表現情形較 BILOG-MG 好一些。

3. 當兩個題組皆存在違反試題局部獨立的情況時，兩軟體估計的 MAD 並不會因為樣本數或試題數而影響其表現情形。大致上，兩軟體估計的表現情形並無太大差異，但在樣本數為 900 人、試題數 20 題，和樣本數 900 人、試題數 20 題時， HLM6.03 軟體的估計情形，明顯地較 BILOG-MG 佳。

在文檔中違反試題局部獨立性之參數估計－BILOG-MG與HLM軟體的比較 (頁 65-77)

第四章 研究結果與討論

第四節 固定違反試題局部獨立性程度

第四章研究結果與討論

第四節固定違反試題局部獨立性程度