固定樣本數

第四章研究結果與討論

第三節固定樣本數

一、試題參數估計情形

(一) RMSE ( 如圖 23、圖 24、圖 25 所示) RMSE-100人

0 0.1 0.2 0.3 0.4

(0,0) (0,2) (0,8) (2,2) (2,8)

B-20 B-40 B-80

H-20 H-40 H-80

RMSE-300人

0 0.1 0.2 0.3 0.4

(0,0) (0,2) (0,8) (2,2) (2,8)

B-20 B-40 B-80

H-20 H-40 H-80

圖 23 試題參數－RMSE－100 人圖 24 試題參數－RMSE－300 人

RMSE-900人

0 0.1 0.2 0.3 0.4

(0,0) (0,2) (0,8) (2,2) (2,8)

B-20 B-40 B-80

H-20 H-40 H-80

1. 在一個題組與兩個題組違反試題局部獨立下，無論試題數為 20、40 或 80 題，

兩軟體的 RMSE 皆會隨著違反試題局部獨立程度增加而降低。

2. 無論試題數為 20、40 或 80 題，當兩個題組皆沒有違反試題局部獨立性時，

BILOG-MG 的 RMSE 之表現情形稍微較 HLM 6.03 軟體佳，BILOG-MG 在試題無違反局部獨立性的情形下，估計的表現相當穩健。

3. 無論試題數為 20、40 或 80 題，當單一題組違反試題局部獨立性時，兩軟體的 RMSE 之表現情形沒有太大差異。但 HLM6.03 軟體在樣本數 100 人、試題數 20 題且違反試題局部獨立程度 (0,8) 情形下較 BILOG-MG 好，而 BILOG-MG 在樣本數 900 人、試題數 40 題且違反試題局部獨立程度 (0,2) 情形下較 HLM6.03 軟體好，此結果可能與研究中所設定的複製次數 50 次有關。

4. 當兩個題組皆違反試題局部獨立性時，無論試題數為 20、40 或 80 題，HLM 軟體的表現情形皆比 BILOG- MG 好，在上述的結果中可看出 HLM6.03 軟體所受到違反試題局部獨立性的影響較小。

圖 25 試題參數－RMSE－900 人

(二) BIAS (如圖 26、圖 27、圖 28 所示) BIAS-100人

0 0.1 0.2 0.3 0.4

(0,0) (0,2) (0,8) (2,2) (2,8)

B-20 B-40 B-80

H-20 H-40 H-80

BIAS-300人

0 0.1 0.2 0.3 0.4

(0,0) (0,2) (0,8) (2,2) (2,8)

B-20 B-40 B-80

H-20 H-40 H-80

BIAS-900人

0 0.1 0.2 0.3 0.4

(0,0) (0,2) (0,8) (2,2) (2,8)

B-20 B-40 B-80

H-20 H-40 H-80

圖 26 試題參數－BIAS －100 人圖 27 試題參數－BIAS－300 人

圖 28 試題參數－BIAS －900 人

1. 在一個題組與兩個題組違反試題局部獨立下，無論試題數為 20、40 或 80 題，

兩軟體的 BIAS 皆會隨著違反試題局部獨立程度增加而降低。

2. 兩軟體在 BIAS 上的表現，當沒有試題違反局部獨立性時，會隨著試題數有些微的變化，當試題數越多，表現較好；當只有一個題組違反試題局部獨立時，

並不會因為試題數的不同而有太大的變化；當兩個題組皆違反試題局部獨立性，試題數越多，表現則越差，推測可能是因為試題因存在違反局部獨立而參數估計產生偏誤，若試題數增加，會使得參數估計有更大的偏誤。

3. 無論試題數為 20、40 或 80 題，當兩個題組皆沒有違反試題局部獨立性時，

BILOG-MG 在 BIAS 指標上的表現情形稍微較 HLM6.03 軟體軟體佳。

3. 無論試題數為 20、40 或 80 題，當單一題組違反試題局部獨立性時，兩軟體在 BIAS 指標上的表現情形沒有太大差異。

4. 當兩個題組皆違反試題局部獨立性時，無論試題數為 20、40 或 80 題，HLM 軟體在 BIAS 指標上的表現情形皆比 BILOG-MG 好。

(三) MCSE (如圖 29、圖 30、圖 31 所示) MCSE-100人

0 0.1 0.2 0.3

(0,0) (0,2) (0,8) (2,2) (2,8)

B-20 B-40 B-80

H-20 H-40 H-80

MCSE-300人

0 0.1 0.2 0.3

(0,0) (0,2) (0,8) (2,2) (2,8)

B-20 B-40 B-80

H-20 H-40 H-80

圖 29 試題參數－MCSE－100 人圖 30 試題參數－MCSE－300 人

MCSE-900人

0 0.1 0.2 0.3

(0,0) (0,2) (0,8) (2,2) (2,8)

B-20 B-40 B-80

H-20 H-40 H-80

1. 兩軟體的估計一致性，不會隨著試題數的不同而有太大的差異，大致上而言，

試題數越多表現的情形較一致。

2. 兩軟體的估計一致性，並不會因違反試題局部獨立性程度的不同而明顯地不同。

3. 當樣本數為 100 人時，無論試題數為 20、40 或 80，BILOG-MG 的表現情形均稍微較 HLM6.03 好，除了在試題數 20 題且違反試題局部獨立程度 (0,8) 情形下，HLM6.03 軟體表現較佳外。

4. 當樣本數為 300 人時，無論試題數為 20、40 或 80，BILOG-MG 的表現情形均與 HLM6.03 軟體相近。

5. 當樣本數為 900 人時，無論試題數為 20、40 或 80，BILOG-MG 的表現情形均與 HLM 相近，但在試題數 40 題且違反試題局部獨立程度 (0,2)，與試題數 20 題且違反試題局部獨立 (2,8)的情形下，HLM6.03 軟體表現的一致性較差，這結果可能與研究中所設定的複製次數 50 次有關。

圖 31 試題參數－MCSE－900 人

二、能力參數估計情形

(一) RMSE (如圖 32、圖 33、圖 34 所示)

RMSE-100人

0 0.3 0.6 0.9 1.2 1.5

(0,0) (0,2) (0,8) (2,2) (2,8)

B-20 B-40 B-80

H-20 H-40 H-80

RMSE-300人

0 0.3 0.6 0.9 1.2 1.5

(0,0) (0,2) (0,8) (2,2) (2,8)

B-20 B-40 B-80

H-20 H-40 H-80

RMSE-900人

0 0.3 0.6 0.9 1.2 1.5

(0,0) (0,2) (0,8) (2,2) (2,8)

B-20 B-40 B-80

H-20 H-40 H-80

圖 32 能力參數－RMSE－100 人圖 33 能力參數－RMSE－300 人

圖 34 能力參數－RMSE－900 人

1. 兩軟體在能力參數的估計精準度，皆會隨著試題數增加，估計的表現情形較精準一些，這與許多研究結果相同。

2. 兩軟體在能力參數的 RMSE，在一個題組與兩個題組違反試題局部獨立下，無論試題數為 20、40 或 80 題，皆隨著違反試題局部獨立程度變大而降低。

3. 無論樣本數為 100、300 或 900 人，當試題數為 20 題時，兩軟體的 RMSE 非常相近，但當試題數為 40 或 80 題時，HLM6.03 軟體的參數估計稍微較 BILOG-MG 精準。

4. 當樣本數為 900 人且違反試題局部獨立程度 (2,8) 時，在試題數 20 題與 40 題的情況下，HLM6.03 軟體的估計精準度，明顯地較 BILOG-MG 佳，表示違反試題局部獨立程度越大，BILOG-MG 的參數估計越容易受到影響。

(二) MAD (如圖 35、圖 36、圖 37 所示) MAD-100人

0 0.3 0.6 0.9 1.2

(0,0) (0,2) (0,8) (2,2) (2,8)

B-20 B-40 B-80

H-20 H-40 H-80

MAD-300人

0 0.3 0.6 0.9 1.2

(0,0) (0,2) (0,8) (2,2) (2,8)

B-20 B-40 B-80

H-20 H-40 H-80

圖 35 能力參數－MAD－100 人圖 36 能力參數－MAD－300 人

MAD-900人

0 0.3 0.6 0.9 1.2

(0,0) (0,2) (0,8) (2,2) (2,8)

B-20 B-40 B-80

H-20 H-40 H-80

1. 兩軟體在能力參數的 MAD 指標上，皆會隨著試題數增加，估計的表現情形較精準一些。

2. 兩軟體在能力參數的 MAD 指標上，在一個題組與兩個題組違反試題局部獨立下，無論試題數為 20、40 或 80 題，皆隨著違反試題局部獨立程度變大而降低。

3. 無論樣本數為 100、300 或 900 人，當試題數為 20 題時，兩軟體的 MAD 非常相近，但當試題數為 40 或 80 題時， HLM6.03 軟體的參數估計稍微較 BILOG-MG 精準。

4. 當樣本數為 900 人且違反試題局部獨立程度 (2,8) 時，在試題數 20 題與 40 題的情況下，HLM6.03 軟體在能力參數之 MAD 的表現情形，明顯地較 BILOG-MG 佳。

圖 37 能力參數－MAD－900 人

在文檔中違反試題局部獨立性之參數估計－BILOG-MG與HLM軟體的比較 (頁 57-65)

第四章 研究結果與討論

第三節 固定樣本數

第四章研究結果與討論

第三節固定樣本數