• 沒有找到結果。

受試者不同單點能力值下比較結果

第四章 研究結果與討論

第二節 受試者不同單點能力值下比較結果

一、 題庫P1-t360 結果

(一) 能力估計效能

題庫 P1-t360 不同單點能力值下,各選題法的 RMSE 於表 4-21,mi 法在不同單點力值下均較小,ab 法在不同單點能力值下均較大;nn 法和 inn 法次之,而 inn 法的 RMSE 在受試者能力點除了-3 均小於 nn 法的 RMSE。

(二) 曝光率控制效能評估指標 1、 試題曝光率的均勻度

題庫P1-t360 不同單點能力值下,各選題法的試題曝光率的均勻度由

表4-22 可知在受試者能力點 0、1、-1 下 ab 法的曝光率的均勻度均為最 佳, inn 法曝光率的均勻度次之,在受試者能力點 2、-2、3、-3 下 inn 法的曝光率的均勻度均為最佳, nn 法曝光率的均勻度次之,而 mi 法的 曝光率的均勻度在不同單點能力值下均為最差。

2、 最大曝光率

題庫 P1-t360 不同單點能力值下各選題法的試題最大曝光率由表 4-23 可 ab 法的最大曝光率均為最低。

3、 題庫中未使用試題

題庫 P1-t360 不同單點能力值下各選題法的未使用試題由表 4-24 中 inn 法的未使用試題為最少,在 ab 法和 nn 法次之, mi 法的均為最高。

表4-21 不同單點能力值下題庫 P1-360 的 RMSE

-3 -2 -1 0 1 2 3 inn 0.324 0.221 0.155 0.146 0.150 0.193 0.284

mi 0.316 0.210 0.149 0.130 0.137 0.188 0.275 nn 0.320 0.231 0.172 0.154 0.161 0.204 0.293 ab 0.477 0.299 0.233 0.197 0.213 0.253 0.302

表4-22 不同單點能力值下題庫 P1-t360 的χ2

-3 -2 -1 0 1 2 3 inn 207.84 197.48 167.40 122.07 140.98 184.06 200.05

mi 270.58 259.58 267.52 239.40 248.72 259.69 275.41 nn 291.28 257.22 178.87 107.19 134.27 212.16 298.94 ab 231.16 207.75 90.99 44.78 86.78 156.06 275.74

表4-23 不同單點能力值下題庫 P1-t360 的rmax

-3 -2 -1 0 1 2 3 inn 1.000 0.999 0.994 0.993 0.994 1.000 1.000

mi 1.000 1.000 1.000 1.000 1.000 1.000 1.000 nn 1.000 0.999 0.965 0.897 0.921 1.000 1.000 ab 0.999 0.991 0.757 0.445 0.665 0.887 1.000

表4-24 不同單點能力值下題庫 P1-t360 的未使用試題

-3 -2 -1 0 1 2 3 inn 44 42 39 36 35 39 38

mi 279 283 278 262 286 289 300 nn 284 256 230 165 208 272 301 ab 187 193 115 80 144 203 257

二、 題庫P2-t360 結果

(一) 能力估計效能

題庫 P2-360 不同單點能力值下,各選題法的 RMSE 於表 4-25,mi 法在不同單點能力值下均較小,inn 法在不同單點能力值下均次之,nn 法在不同單點能力值下均第三,ab 法在不同單點能力值下均較大。

(二) 曝光率控制效能評估指標 1、 試題曝光率的均勻度

題庫P2-t360 不同單點能力值下,各選題法的試題曝光率的均勻度由 表4-26 可知在受試者能力點 0、1、-1 下 ab 法的曝光率的均勻度均為最 佳, inn 法曝光率的均勻度次之,在受試者能力點 2、-2、3、-3 下 inn 法的曝光率的均勻度均為最佳, ab 法曝光率的均勻度次之,而 mi 法的 曝光率的均勻度在在受試者能力點0、1、-1 均為最差,nn 法的曝光率的 均勻度在在受試者能力點2、-2、3、-3 均為最差。

2、 最大曝光率

題庫P2-360 不同單點力值下各選題法的試題最大曝光率由表 4-27 可 ab 法的最大曝光率均為最低。

3、 題庫中未使用試題

題庫 P2-t360 不同單點能力值下各選題法的未使用試題由表 4-28 中 inn 法的未使用試題為最少,在 ab 法和 nn 法次之, mi 法的均為最高。

表4-25 不同單點能力值下題庫 P2-t360 的RMSE

-3 -2 -1 0 1 2 3 inn 0.357 0.182 0.129 0.102 0.115 0.163 0.258

mi 0.355 0.179 0.126 0.097 0.111 0.159 0.264 nn 0.358 0.189 0.137 0.111 0.129 0.168 0.264 ab 0.442 0.230 0.172 0.151 0.157 0.178 0.260

表4-26 不同單點能力值下題庫 P2-t360 的χ2

-3 -2 -1 0 1 2 3 inn 220.90 224.50 198.84 173.63 181.29 226.18 205.61

mi 261.95 268.06 249.63 238.64 251.49 272.50 247.70 nn 294.27 281.49 180.14 127.19 173.33 288.81 302.81 ab 261.96 235.92 121.11 63.96 113.36 253.69 292.31

表4-27 不同單點能力值下題庫 P2-t360 的rmax

-3 -2 -1 0 1 2 3 inn 0.999 0.999 0.997 0.998 0.999 1.000 1.000

mi 1.000 1.000 1.000 1.000 1.000 1.000 1.000 nn 1.000 0.999 0.944 0.917 0.984 1.000 1.000

表4-28 不同單點能力值下題庫 P2-t360 的未使用試題

-3 -2 -1 0 1 2 3 inn 47 50 47 45 37 40 39

mi 272 279 278 270 278 290 295 nn 280 278 226 176 223 294 306 ab 206 183 132 107 135 242 286 三、 題庫P1-t1440 結果

(一) 能力估計效能

題庫P1-t1440 不同單點能力值下,各選題法的 RMSE 於表 4-29,mi 法在不同單點能力值下均較小,ab 法在不同單點能力值下均較大;nn 法 和 inn 法次之,而 inn 法的 RMSE 在受試者能力點除了 2、3 均大於 nn 法的RMSE。

(二) 曝光率控制效能評估指標 1、 試題曝光率的均勻度

題庫 P1-t1440 不同單點能力值下,各選題法的試題曝光率的均勻度 由表4-30 可知在受試者能力點 0、1、-1、2、-2 下 ab 法的曝光率的均勻 度均為最佳, inn 法曝光率的均勻度次之,在受試者能力點 3、-3 下 inn 法的曝光率的均勻度均為最佳, ab 法曝光率的均勻度次之,而 mi 法的 曝光率的均勻度在在受試者能力點 0、1、-1、2、-2 下為最差、nn 法的 曝光率的均勻度在在受試者能力點3、-3 下為最差。

2、 最大曝光率

題庫 P1-t1440 不同單點能力值下各選題法的試題最大曝光率由表 4-31 可 ab 法的最大曝光率均為最低。

3、 題庫中未使用試題

題庫P1-t1440 不同單點能力值下各選題法的未使用試題由表 4-32 中

inn 法的未使用試題為最少,在 ab 法和 nn 法次之, mi 法的均為最高。

表4-29 不同單點能力值下題庫 P1-t1440 的RMSE

-3 -2 -1 0 1 2 3 inn 0.242 0.157 0.137 0.135 0.138 0.157 0.258

mi 0.233 0.138 0.116 0.112 0.117 0.141 0.242 nn 0.241 0.156 0.130 0.123 0.131 0.160 0.261 ab 0.325 0.238 0.199 0.181 0.187 0.207 0.289

表4-30 不同單點能力值下題庫 P1-t1440 的χ2

-3 -2 -1 0 1 2 3 inn 779.81 595.20 343.61 280.67 353.96 552.70 727.98

mi 1073.60 1018.90 962.43 926.09 962.09 1091.20 1155.80 nn 1167.10 687.37 401.21 363.45 396.40 627.58 1157.80 ab 846.21 357.73 110.27 70.43 137.92 426.73 1007.90

表4-31 不同單點能力值下題庫 P1-t1440 的rmax

-3 -2 -1 0 1 2 3 inn 0.999 0.988 0.945 0.927 0.981 0.983 1.000

mi 1.000 1.000 0.999 0.999 1.000 1.000 1.000 nn 0.999 0.953 0.738 0.688 0.738 0.954 1.000 ab 0.991 0.646 0.275 0.228 0.428 0.662 1.000

表4-32 不同單點能力值下題庫 P1-t1440 的未使用試題

-3 -2 -1 0 1 2 3 inn 339 315 263 227 222 256 284

mi 1353 1352 1333 1329 1334 1353 1367 nn 1283 1246 1048 914 1011 1209 1311 ab 884 781 616 530 754 1060 1205

四、題庫P2-t1440 結果

(一) 能力估計效能

題庫P2-t1440 不同單點能力值下,各選題法的 RMSE 於表 4-33,mi 法在不同單點能力值下均較小,inn 法在不同單點能力值下均次之,nn 法在不同單點能力值下均第三,ab 法在不同單點能力值下均較大。

(二) 曝光率控制效能評估指標 1、 試題曝光率的均勻度

題庫 P2-t1440 不同單點能力值下,各選題法的試題曝光率的均勻度 由表4-34 可知在受試者能力點 0、1、-1、2、-2 下 ab 法的曝光率的均勻 度均為最佳, nn 法曝光率的均勻度次之,在受試者能力點 3、-3 下 inn 法的曝光率的均勻度均為最佳, ab 法曝光率的均勻度次之,而 mi 法的 曝光率的均勻度在在受試者能力點 0、1、-1、2、-2 均為最差,nn 法的 曝光率的均勻度在在受試者能力點3、-3 均為最差。

2、 最大曝光率

題庫 P2-t1440 不同單點能力值下各選題法的試題最大曝光率由表 4-35 可 ab 法的最大曝光率均為最低。

3、 題庫中未使用試題

題庫P2-t1440 不同單點能力值下各選題法的未使用試題由表 4-36 中 inn 法的未使用試題為最少,在 ab 法和 nn 法次之, mi 法的均為最高。

綜合上述資料當在受試者能力點靠近兩端時,inn 法的 RMSE 和曝光 率的均勻度優於nn 法,且 inn 法的未使用試題為較少;當在受試者能力 點靠近能力值0 時,inn 法和 nn 法的 RMSE 和曝光率的均勻度各有優劣,

但inn 法的未使用試題為較少。

表4-33 不同單點能力值下題庫P2-t1440的RMSE

-3 -2 -1 0 1 2 3 inn 0.222 0.116 0.090 0.085 0.091 0.127 0.220

mi 0.222 0.110 0.087 0.077 0.086 0.122 0.217 nn 0.235 0.128 0.100 0.093 0.106 0.136 0.228 ab 0.278 0.182 0.152 0.145 0.150 0.178 0.233

表4-34 不同單點能力值下題庫P2-t1440的χ2

-3 -2 -1 0 1 2 3 inn 838.67 826.72 644.35 591.30 753.20 812.08 925.63

mi 1085.30 1091.40 1010.50 1014.30 1122.90 1075.50 1203.60 nn 1137.30 733.23 423.32 394.75 387.46 696.96 1176.20 ab 876.39 469.50 136.12 102.70 150.41 493.06 1014.40

表4-35 不同單點能力值下題庫P2-t1440的rmax

-3 -2 -1 0 1 2 3 inn 0.998 0.997 0.978 0.987 0.995 0.999 1.000

mi 0.999 1.000 0.997 0.999 1.000 1.000 1.000 nn 0.997 0.973 0.771 0.786 0.773 0.913 1.000 ab 0.997 0.857 0.400 0.322 0.333 0.903 1.000

表4-36 不同單點能力值下題庫P2-t1440的未使用試題

-3 -2 -1 0 1 2 3 inn 474 484 430 386 434 479 503

mi 1319 1324 1322 1341 1341 1354 1375 nn 1263 1207 1077 1016 1053 1236 1310 ab 968 820 693 601 826 1111 1231

相關文件