• 沒有找到結果。

第四章 研究結果與討論

第一節 初始階段選題策略比較

一、RMSE 值與χ2值之比較

表 4-1-1 至表 4-1-24 中縱向為題庫種類、橫向為初始階段之選題策 略,共九種(表 3-1-1)。

(一)就題庫 P1(表 4-1-1 至表 4-1-8)中資料 A5_3 與 A5_5 的 值為各 項方法中最低,而 A5_3 在對能力估計精準度耗損情形比 A5_5 小。

χ2

(二)就題庫 P2(表 4-1-9 至表 4-1-16)中資料 A5_3 與 A5_5 的 值為 各項方法中最低,但 A5_3 與 A5_5 中只有 MI 在 A5_3 的情形下對 能力估計精準度影響最小,其餘方法皆有能力估計精準度降低的情 形。

χ2

(三)就題庫 P3(表 4-1-17 至表 4-1-24)中資料 A5_3 與 A5_5 的 值為 各項方法中最低,但 A5_3 與 A5_5 中只有 B 能力估計精準度影響 不變,其餘方法皆有能力估計精準度降低的情形。

χ2

(四)綜合題庫 P1、P2、P3 結果,測驗初期採用 b 值分層隨機選取法(A5_3 與 A5_5)能有效控制題目曝光率的均勻度;若在後期選題法採用 MI 作為選題策略對能力估計精準度耗損影響最小。

表 4-1-1 B 選題法在題庫 P1 的 RMSE 值比較

RMSE A1 A2_3 A2_5 A3_3 A3_5 A4_3 A4_5 A5_3 A5_5 P1-300 0.26 0.24 0.26 0.25 0.25 0.25 0.26 0.24 0.25 P1-600 0.25 0.25 0.25 0.25 0.26 0.25 0.25 0.25 0.26 P1-1200 0.25 0.26 0.25 0.26 0.25 0.26 0.26 0.25 0.27

表 4-1-2 KL 選題法在題庫 P1 的 RMSE 值比較

RMSE A1 A2_3 A2_5 A3_3 A3_5 A4_3 A4_5 A5_3 A5_5 P1-300 0.23 0.22 0.23 0.25 0.23 0.23 0.23 0.23 0.24 P1-600 0.23 0.22 0.24 0.21 0.22 0.22 0.22 0.23 0.23 P1-1200 0.24 0.23 0.24 0.22 0.22 0.23 0.24 0.24 0.24

表 4-1-3 MI 選題法在題庫 P1 的 RMSE 值比較

RMSE A1 A2_3 A2_5 A3_3 A3_5 A4_3 A4_5 A5_3 A5_5 P1-300 0.19 0.19 0.19 0.20 0.19 0.19 0.19 0.19 0.19 P1-600 0.18 0.19 0.18 0.18 0.18 0.19 0.18 0.18 0.19 P1-1200 0.18 0.19 0.18 0.19 0.19 0.20 0.21 0.18 0.20

表 4-1-4 NN 選題法在題庫 P1 的 RMSE 值比較

RMSE A1 A2_3 A2_5 A3_3 A3_5 A4_3 A4_5 A5_3 A5_5 P1-300 0.21 0.25 0.25 0.25 0.25 0.20 0.21 0.21 0.21 P1-600 0.21 0.26 0.27 0.25 0.26 0.23 0.21 0.21 0.22 P1-1200 0.21 0.25 0.26 0.26 0.25 0.22 0.20 0.21 0.21

表 4-1-5 B 選題法在題庫 P1 的 值比較 χ2

A1 A2_3 A2_5 A3_3 A3_5 A4_3 A4_5 A5_3 A5_5 P1-300 43.18 22.04 13.20 11.90 10.03 12.16 12.78 7.46 6.75 P1-600 76.54 35.59 27.74 22.62 22.25 22.60 25.89 13.85 11.74 P1-1200 153.71 83.54 66.24 55.66 52.57 57.49 55.88 37.10 30.52

表 4-1-6 KL 選題法在題庫 P1 的 值比較 χ2

A1 A2_3 A2_5 A3_3 A3_5 A4_3 A4_5 A5_3 A5_5 P1-300 95.51 92.21 87.52 85.09 84.92 92.18 98.97 64.48 57.36 P1-600 187.26 158.57 148.63 151.00 143.00 163.28 177.07 109.90 90.45 P1-1200 323.17 295.09 276.63 258.48 245.27 272.53 303.94 179.36 143.60

表 4-1-7 MI 選題法在題庫 P1 的 值比較 χ2

A1 A2_3 A2_5 A3_3 A3_5 A4_3 A4_5 A5_3 A5_5 P1-300 71.75 66.48 63.81 65.86 63.68 71.45 81.21 49.26 44.84 P1-600 135.57 121.26 114.45 116.66 113.81 129.28 147.40 87.20 73.80 P1-1200 246.01 213.33 198.94 204.90 192.21 228.75 265.52 149.95 126.06

表 4-1-8 NN 選題法在題庫 P1 的 值比較 χ2

A1 A2_3 A2_5 A3_3 A3_5 A4_3 A4_5 A5_3 A5_5 P1-300 35.89 43.85 44.55 15.10 15.54 28.04 34.69 16.57 14.24 P1-600 79.50 76.55 77.69 29.30 28.45 49.41 55.72 29.61 24.54 P1-1200 166.43 153.48 151.87 65.93 64.45 88.78 97.45 60.62 47.13

表 4-1-9 B 選題法在題庫 P2 的 RMSE 值比較

RMSE A1 A2_3 A2_5 A3_3 A3_5 A4_3 A4_5 A5_3 A5_5 P2-300 0.32 0.31 0.32 0.31 0.32 0.32 0.31 0.31 0.31 P2-600 0.31 0.33 0.35 0.33 0.33 0.31 0.33 0.32 0.35 P2-1200 0.30 0.32 0.32 0.30 0.31 0.30 0.32 0.31 0.32

表 4-1-10 KL 選題法在題庫 P2 的 RMSE 值比較

RMSE A1 A2_3 A2_5 A3_3 A3_5 A4_3 A4_5 A5_3 A5_5 P2-300 0.28 0.28 0.28 0.27 0.28 0.29 0.29 0.28 0.28 P2-600 0.27 0.27 0.27 0.27 0.29 0.28 0.28 0.28 0.29 P2-1200 0.27 0.27 0.28 0.26 0.27 0.28 0.28 0.27 0.27

表 4-1-11 MI 選題法在題庫 P2 的 RMSE 值比較

RMSE A1 A2_3 A2_5 A3_3 A3_5 A4_3 A4_5 A5_3 A5_5 P2-300 0.23 0.23 0.23 0.24 0.24 0.24 0.25 0.23 0.26 P2-600 0.23 0.23 0.23 0.22 0.22 0.24 0.23 0.23 0.24 P2-1200 0.22 0.22 0.22 0.22 0.22 0.24 0.23 0.22 0.25

表 4-1-12 NN 選題法在題庫 P2 的 RMSE 值比較

RMSE A1 A2_3 A2_5 A3_3 A3_5 A4_3 A4_5 A5_3 A5_5 P2-300 0.26 0.32 0.31 0.31 0.30 0.28 0.26 0.27 0.27 P2-600 0.26 0.32 0.34 0.34 0.30 0.26 0.27 0.26 0.28 P2-1200 0.25 0.30 0.30 0.31 0.30 0.25 0.25 0.26 0.26

表 4-1-13 B 選題法在題庫 P2 的 值比較 χ2

A1 A2_3 A2_5 A3_3 A3_5 A4_3 A4_5 A5_3 A5_5 P2-300 36.63 16.73 11.01 9.61 8.53 9.27 10.18 5.78 5.25 P2-600 74.86 38.84 26.90 21.63 19.88 17.58 15.73 11.89 9.66 P2-1200 135.60 60.68 43.37 35.79 29.72 25.93 29.39 17.34 15.51

表 4-1-14 KL 選題法在題庫 P2 的 值比較 χ2

A1 A2_3 A2_5 A3_3 A3_5 A4_3 A4_5 A5_3 A5_5 P2-300 126.55 124.81 116.79 113.27 114.14 130.03 130.03 91.50 57.36 P2-600 234.25 224.74 221.28 208.91 210.97 239.93 239.93 163.45 135.13 P2-1200 420.50 377.27 373.49 346.60 339.60 399.44 399.44 271.03 221.93

表 4-1-15 MI 選題法在題庫 P2 的 值比較 χ2

A1 A2_3 A2_5 A3_3 A3_5 A4_3 A4_5 A5_3 A5_5 P2-300 78.90 74.94 72.47 74.96 71.92 71.92 90.72 56.58 47.52 P2-600 156.17 145.90 134.49 141.78 135.65 153.43 171.37 106.93 87.80 P2-1200 280.50 251.05 241.57 243.33 231.74 269.09 297.01 181.08 153.02

表 4-1-16 NN 選題法在題庫 P2 的 值比較 χ2

A1 A2_3 A2_5 A3_3 A3_5 A4_3 A4_5 A5_3 A5_5 P2-300 37.63 36.55 36.93 11.24 11.83 30.32 36.04 17.64 13.51 P2-600 84.10 73.63 74.53 26.00 26.65 53.75 59.80 32.96 24.64 P2-1200 159.25 135.45 134.22 38.99 41.71 79.49 86.95 50.05 36.48

表 4-1-17 B 選題法在題庫 P3 的 RMSE 值比較

RMSE A1 A2_3 A2_5 A3_3 A3_5 A4_3 A4_5 A5_3 A5_5 P3-300 0.23 0.24 0.25 0.24 0.24 0.26 0.24 0.23 0.24 P3-600 0.23 0.24 0.24 0.23 0.23 0.22 0.24 0.23 0.23 P3-1200 0.24 0.24 0.23 0.23 0.23 0.23 0.23 0.22 0.24

表 4-1-18 KL 選題法在題庫 P3 的 RMSE 值比較

RMSE A1 A2_3 A2_5 A3_3 A3_5 A4_3 A4_5 A5_3 A5_5 P3-300 0.22 0.23 0.24 0.23 0.21 0.23 0.22 0.22 0.24 P3-600 0.22 0.23 0.23 0.23 0.24 0.22 0.23 0.24 0.24 P3-1200 0.22 0.22 0.23 0.23 0.25 0.23 0.23 0.24 0.23

表 4-1-19 MI 選題法在題庫 P3 的 RMSE 值比較

RMSE A1 A2_3 A2_5 A3_3 A3_5 A4_3 A4_5 A5_3 A5_5 P3-300 0.18 0.17 0.18 0.17 0.17 0.18 0.18 0.19 0.18 P3-600 0.16 0.16 0.16 0.16 0.17 0.16 0.17 0.17 0.17 P3-1200 0.15 0.15 0.16 0.16 0.16 0.16 0.17 0.16 0.17

表 4-1-20 NN 選題法在題庫 P3 的 RMSE 值比較

RMSE A1 A2_3 A2_5 A3_3 A3_5 A4_3 A4_5 A5_3 A5_5 P3-300 0.19 0.23 0.23 0.25 0.25 0.21 0.20 0.21 0.21 P3-600 0.18 0.22 0.22 0.22 0.24 0.18 0.19 0.19 0.20 P3-1200 0.17 0.24 0.24 0.24 0.23 0.18 0.18 0.18 0.19

表 4-1-21 B 選題法在題庫 P3 的 值比較 χ2

A1 A2_3 A2_5 A3_3 A3_5 A4_3 A4_5 A5_3 A5_5 P3-300 29.91 11.02 6.28 5.91 4.57 5.01 5.41 3.54 2.88 P3-600 76.00 26.06 14.37 10.16 7.43 8.16 8.07 5.92 4.39 P3-1200 149.56 45.17 23.97 16.34 11.59 11.58 10.42 8.48 6.15

表 4-1-22 KL 選題法在題庫 P3 的 值比較 χ2

A1 A2_3 A2_5 A3_3 A3_5 A4_3 A4_5 A5_3 A5_5 P3-300 96.00 91.91 87.51 80.14 76.44 86.89 93.73 57.48 47.24 P3-600 167.20 156.61 142.31 135.93 129.87 148.30 158.80 97.08 77.22 P3-1200 339.40 308.24 277.51 272.27 257.99 279.98 295.35 179.54 143.12

表 4-1-23 MI 選題法在題庫 P3 的 值比較 χ2

A1 A2_3 A2_5 A3_3 A3_5 A4_3 A4_5 A5_3 A5_5 P3-300 65.90 59.32 57.08 58.44 55.85 64.78 72.79 43.78 35.99 P3-600 130.94 115.32 109.21 114.04 108.88 124.98 139.79 84.62 70.13 P3-1200 253.28 217.55 200.88 208.70 198.33 229.99 260.92 155.46 127.41

表 4-1-24 NN 選題法在題庫 P3 的 值比較 χ2

A1 A2_3 A2_5 A3_3 A3_5 A4_3 A4_5 A5_3 A5_5 P3-300 34.77 30.18 29.73 7.95 8.00 24.51 31.26 12.64 10.12 P3-600 76.25 76.99 76.61 16.01 15.87 47.06 51.24 26.15 19.90 P3-1200 166.45 149.43 148.62 24.40 24.14 67.91 70.48 38.37 28.39

二、題庫試題最大試題曝光率之比較

就表 4-1-25 資料中 A5_3 與 A5_5 的試題最大試題曝光率皆為對低,

支持測驗初期試題 b 值分層選題對可以有效降低最大曝光率試題曝光率。

三、題庫中試題曝光率大於 0.3 題數之比較

就表 4-1-26 資料中 A5_3 與 A5_5 的試題曝光率大於 0.3 題數皆為最 少,支持測驗初期試題 b 值分層選題對可以有效降低試題曝光率大於 0.3 題數。

四、題庫中試題曝光率大於 0.2 題數之比較

就表 4-1-27 資料中 A5_3 與 A5_5 的試題曝光率大於 0.2 題數皆為最 少,支持測驗初期試題 b 值分層選題對可以有效降低試題曝光率大於 0.2 題數。

五、未選試題用題數佔題庫百分比之比較

就表 4-1-28 資料中 A5_3 與 A5_5 的未選試題用題數佔題庫百分比皆 為最低,支持測驗初期試題 b 值分層選題對可以有效降低未選試題用題 數。

六、初始階段 b 值分層隨機選取選題策略 k=3 和 k=5 效能比較

初始階段 b 值分層隨機選取選題策略在測驗長度 20 題時,能力估計 精準以控制 3 題為較佳。

表 4-1-25 初始階段選題策略比較題庫試題最大試題曝光率

A1 A2_3 A2_5 A3_3 A3_5 A4_3 A4_5 A5_3 A5_5 B-P1-300 1 0.655 0.308 0.424 0.288 0.517 0.581 0.292 0.238 B-P1-600 1 0.376 0.297 0.36 0.264 0.496 0.57 0.286 0.226

B-P1-1200 1 0.402 0.324 0.381 0.307 0.527 0.586 0.311 0.268 KL-P1-300 1 0.752 0.67 0.424 0.288 0.655 0.645 0.585 0.553

KL-P1-600 1 0.656 0.585 0.597 0.512 0.691 0.793 0.517 0.51 KL-P1-1200 1 0.678 0.474 0.575 0.463 0.572 0.637 0.413 0.35 MI-P1-300 1 0.604 0.531 0.558 0.503 0.649 0.716 0.468 0.438 MI-P1-600 1 0.563 0.486 0.444 0.409 0.503 0.593 0.373 0.351 MI-P1-1200 1 0.539 0.452 0.448 0.375 0.492 0.57 0.342 0.341 NN-P1-300 1 1 1 0.553 0.544 0.431 0.515 0.317 0.285 NN-P1-600 1 1 1 0.564 0.552 0.344 0.416 0.233 0.214

NN-P1-1200 1 1 1 0.525 0.523 0.39 0.493 0.268 0.247 B-P2-300 1 0.448 0.29 0.376 0.285 0.41 0.442 0.238 0.211 B-P2-600 1 0.44 0.343 0.412 0.325 0.432 0.421 0.264 0.197

B-P2-1200 1 0.368 0.275 0.395 0.272 0.404 0.452 0.231 0.205 KL-P2-300 1 0.835 0.774 0.742 0.733 0.849 0.891 0.732 0.696 KL-P2-600 1 0.776 0.71 0.678 0.679 0.759 0.811 0.651 0.618

KL-P2-1200 1 0.658 0.584 0.595 0.542 0.694 0.71 0.54 0.506 MI-P2-300 1 0.667 0.606 0.554 0.524 0.676 0.707 0.508 0.485

MI-P2-600 1 0.644 0.54 0.551 0.508 0.593 0.638 0.461 0.429 MI-P2-1200 1 0.564 0.461 0.435 0.385 0.529 0.57 0.374 0.351

NN-P2-300 1 1 1 0.58 0.589 0.43 0.474 0.309 0.27 NN-P2-600 1 1 1 0.576 0.597 0.359 0.445 0.235 0.227

NN-P2-1200 1 1 1 0.555 0.577 0.34 0.426 0.232 0.216 B-P3-300 1 0.388 0.251 0.291 0.168 0.208 0.161 0.168 0.132

B-P3-600 1 0.375 0.249 0.274 0.157 0.212 0.151 0.164 0.103 B-P3-1200 1 0.359 0.226 0.254 0.153 0.203 0.116 0.167 0.09 KL-P3-300 1 0.799 0.673 0.693 0.627 0.773 0.825 0.583 0.544 KL-P3-600 1 0.688 0.599 0.52 0.483 0.625 0.634 0.466 0.381 KL-P3-1200 1 0.632 0.497 0.521 0.442 0.542 0.567 0.407 0.32

MI-P3-300 1 0.596 0.536 0.561 0.489 0.65 0.724 0.453 0.395 MI-P3-600 1 0.575 0.472 0.498 0.419 0.571 0.655 0.391 0.357

MI-P3-1200 1 0.534 0.44 0.413 0.375 0.481 0.522 0.361 0.32 NN-P3-300 1 1 1 0.494 0.515 0.392 0.429 0.283 0.236 NN-P3-600 1 1 1 0.528 0.518 0.286 0.308 0.208 0.18

表 4-1-26 初始階段選題策略比較題庫中試題曝光率大於 0.3 題數

表 4-1-27 初始階段選題策略比較題庫中試題曝光率大於 0.2 題數

表 4-1-28 初始階段選題策略比較題庫中未選用試題百分比

KL-P1-1200 87.4% 87.5% 87.5% 85.3% 85.0% 85.5% 86.9% 6.7% 1.0%

MI-P1-300 58.7% 59.3% 58.3% 57.0% 58.3% 59.0% 59.7% 0.0% 0.0%

MI-P1-600 74.2% 73.8% 74.2% 73.5% 74.2% 74.3% 75.7% 0.5% 0.0%

MI-P1-1200 82.6% 82.8% 83.1% 82.8% 82.4% 83.2% 83.9% 6.1% 1.6%

NN-P1-300 0.0% 0.0% 0.3% 0.0% 0.0% 0.0% 0.3% 0.0% 0.0%

KL-P2-1200 88.5% 88.2% 88.2% 87.4% 87.9% 88.1% 88.9% 6.9% 1.8%

MI-P2-300 62.7% 63.0% 62.7% 62.7% 63.0% 63.3% 64.0% 0.0% 0.0%

MI-P2-600 77.3% 77.0% 76.7% 76.7% 77.0% 77.0% 78.5% 0.3% 0.0%

MI-P2-1200 86.1% 86.3% 86.2% 86.3% 86.3% 86.5% 87.3% 7.4% 1.3%

NN-P2-300 0.3% 0.3% 0.3% 0.3% 0.0% 0.7% 0.3% 0.0% 0.0%

KL-P3-1200 87.1% 86.4% 86.4% 85.0% 84.5% 84.8% 85.4% 5.8% 1.9%

MI-P3-300 58.7% 58.7% 58.3% 58.7% 58.3% 59.0% 60.7% 0.0% 0.0%

MI-P3-600 72.7% 72.0% 72.0% 72.2% 72.5% 72.5% 74.3% 0.5% 0.0%

MI-P3-1200 82.8% 82.7% 82.6% 82.9% 82.8% 83.3% 84.2% 6.8% 1.4%

NN-P3-300 0.0% 0.0% 0.0% 0.0% 0.0% 0.3% 0.0% 0.0% 0.0%

NN-P3-600 2.5% 1.2% 0.7% 0.2% 0.3% 2.8% 3.2% 0.0% 0.0%

NN-P3-1200 12.1% 3.3% 4.8% 1.6% 1.7% 13.3% 13.0% 1.2% 0.3%

表 4-1-29 初始階段 b 值分層隨機選取選題策略 k=3 和 k=5 效能比較總表

A5_3 A5_5 A5_3 A5_5 A5_3 A5_5 B-P1-300 * * B-P2-300 * * B-P3-300 *

B-P1-600 * * B-P2-600 * B-P3-600 * * B-P1-1200 * B-P2-1200 * B-P3-1200 * * KL-P1-300 * * KL-P2-300 * * KL-P3-300 *

KL-P1-600 * * KL-P2-600 * KL-P3-600

KL-P1-1200 * * KL-P2-1200 * * KL-P3-1200 * MI-P1-300 * * MI-P2-300 * MI-P3-300 * * MI-P1-600 * MI-P2-600 * * MI-P3-600 * MI-P1-1200 * MI-P2-1200 * MI-P3-1200 * NN-P1-300 * * NN-P2-300 * NN-P3-300 NN-P1-600 * NN-P2-600 * NN-P3-600 NN-P1-1200 * * NN-P2-1200 * NN-P3-1200 * 註三:「*」達到在試題曝光率下降的同時,能力估計誤差的損耗 RMSE 小於 0.01

第二節 選題策略之曝光率控制比較

一、模擬試題參數題庫 P1、P2、P3 的 RMSE 值與χ2值比較

在圖 4-2-1 至圖 4-2-6 中 RMSE 值以 b-MI 法為三種選題法最佳,但 值卻遠高於其他兩種選題法。a-NN 法當題庫越大時在 值能越接近 b-NN 法,且能力估計精準較優於 b-NN 法,使 RMSE 值在試題曝光有效控制的 同時達到較少的損耗。

χ2

χ2

二、模擬試題參數題庫 P1、P2、P3 中選用次數最高 50 題比較

由圖 4-2-7 至圖 4-2-15 中發現 a-NN 法試題曝光情形題庫越大時和 b-NN 法越接近。

0.15 0.17 0.19 0.21 0.23 0.25 0.27

b-MI a-NN b-NN

P1-300 P2-300 P3-300

圖 4-2-1 題庫 300 題 RMSE 值

0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00 80.00

b-MI a-NN b-NN

P1-300 P2-300 P3-300

圖 4-2-2 題庫 300 題 值 χ2

0.15 0.17 0.19 0.21 0.23 0.25 0.27

b-MI a-NN b-NN

P1-600 P2-600 P3-600

圖 4-2-3 題庫 600 題 RMSE 值

40.00 60.00 80.00 100.00 120.00 140.00 160.00

b-MI a-NN b-NN

P1-600 P2-600 P3-600

圖 4-2-4 題庫 600 題 值 χ2

0.15 0.17 0.19 0.21 0.23 0.25 0.27

b-MI a-NN b-NN

P1-1200 P2-1200 P3-1200

圖 4-2-5 題庫 1200 題 RMSE 值

80.00 130.00 180.00 230.00 280.00

b-MI a-NN b-NN

P1-1200 P2-1200 P3-1200

圖 4-2-6 題庫 1200 題 值χ2

0 100 200 300 400 500 600

n251 n255 n259 n263 n267 n271 n275 n279 n283 n287 n291 n295 n299 次數

b-MI a-NN b-NN

圖 4-2-7 P1-300 試題曝光情形

0 100 200 300 400 500 600

n551 n556 n561 n566 n571 n576 n581 n586 n591 n596 次數

b-MI a-NN b-NN

圖 4-2-8 P1-600 試題曝光情形

0 100 200 300 400 500 600

n1151 n1156 n1161 n1166 n1171 n1176 n1181 n1186 n1191 n1196 次數

b-MI a-NN b-NN

圖 4-2-9 P1-1200 試題曝光情形

0 100 200 300 400 500 600 700

n251 n256 n261 n266 n271 n276 n281 n286 n291 n296 次數

b-MI a-NN b-NN

圖 4-2-10 P2-300 試題曝光情形

0 100 200 300 400 500 600

n551 n556 n561 n566 n571 n576 n581 n586 n591 n596 次數

b-MI a-NN b-NN

圖 4-2-11 P2-600 試題曝光情形

0 100 200 300 400 500 600

n1151 n1157 n1163 n1169 n1175 n1181 n1187 n1193 n1199 次數

b-MI a-NN b-NN

圖 4-2-12 P2-1200 試題曝光情形

0 100 200 300 400 500 600 700

n251 n256 n261 n266 n271 n276 n281 n286 n291 n296 次數

b-MI a-NN b-NN

圖 4-2-13 P3-300 試題曝光情形

0 100 200 300 400 500 600

n551 n556 n561 n566 n571 n576 n581 n586 n591 n596 次數

b-MI a-NN b-NN

圖 4-2-14 P3-600 試題曝光情形

0 100 200 300 400 500 600

n1151 n1157 n1163 n1169 n1175 n1181 n1187 n1193 n1199 次數

b-MI a-NN b-NN

圖 4-2-15 P3-1200 試題曝光情形

三、模擬試題參數題庫 P1、P2、P3 最大試題曝光率比較

由表 4-2-1 中可得知 a-NN 法在最大試題曝光率的控制上為三種選 題法中效果最好。

表 4-2-1 P1、P2、P3 最大試題曝光率

題庫 b-MI a-NN b-NN

P1-300 0.566 0.315 0.483 P2-300 0.629 0.389 0.545 P3-300 0.642 0.302 0.528 P1-600 0.515 0.267 0.508 P2-600 0.534 0.343 0.511 P3-600 0.502 0.231 0.511 P1-1200 0.495 0.184 0.466 P2-1200 0.534 0.343 0.511 P3-1200 0.526 0.207 0.478

四、模擬試題參數題庫 P1、P2、P3 試題曝光率大於 .3 與大於 .2 比較 由表 4-2-2 中 a-NN 法的試題曝光率大於 .3 試題題數為三種選題法最少。

由表 4-2-3 中當題庫為 300、600 題 b-NN 法的試題曝光率大於. 2 試題題 數為三種選題法最少。但當題庫為 1200 題時 a-NN 法的試題曝光率大 於 .2 試題題數為三種選題法最少。

表 4-2-2 P1、P2、P3 試題曝光率大於 .3 比較

題庫 b-MI a-NN b-NN

P1-300 21 1 7

P2-300 21 4 7

P3-300 18 1 9

P1-600 13 0 1

P2-600 17 1 1

P3-600 15 0 3

P1-1200 11 0 2

P2-1200 14 0 1

P3-1200 13 0 3

表 4-2-3 P1、P2、P3 試題曝光率大於 .2 比較

題庫 b-MI a-NN b-NN

P1-300 45 44 19

P2-300 43 44 24

P3-300 41 35 28

P1-600 45 44 20

P2-600 40 22 16

P3-600 31 5 16

P1-1200 26 0 3

P2-1200 33 8 2

P3-1200 30 2 4

五、真實試題參數題庫 P4、P5、P6 的 RMSE值與χ2值比較

在圖 4-2-16 中 RMSE 值以 b-MI 法為三種選題法最佳,但 值卻 高於其他兩種選題法,題庫試題曝光率控制不佳。但 a-NN 法當在題庫 P4、P5、P6 中 值為最佳,且 RMSE值較優於 b-NN 法,在題庫 P6 中 與 b-MI 法 RMSE值相當;所以 a-NN 法是能在試題曝光有效控制的同 時達到較少的 RMSE值損耗的一種選題策略。

χ2

χ2

0.30 0.35 0.40 0.45 0.50 0.55 0.60

b-MI a-NN b-NN

P4-126 P5-149 P6-149 P5-149-811 P6-149-747

圖 4-2-16 P4、P5、P6 RMSE 值

20.00 25.00 30.00 35.00 40.00 45.00 50.00 55.00 60.00

b-MI a-NN b-NN

P4-126 P5-149 P6-149 P5-149-811 P6-149-747

圖 4-2-17 P4、P5、P6 χ2

六、真實試題參數題庫 P4、P5、P6 最大試題曝光率比較

由表 4-2-4 中可得知 a-NN 法在最大試題曝光率的控制上為三種選 題法中效果最好。

表 4-2-4 P4、P5、P6 最大試題曝光率

b-MI a-NN b-NN

P4-126 0.918 0.752 0.846 P5-149 0.898 0.668 0.896 P6-149 0.818 0.541 0.791 P5-149-811 0.718 0.57 0.751 P6-149-747 0.626 0.414 0.617

七、真實試題參數題庫 P4、P5、P6 試題曝光率大於 .3 與大於 .2 比較 由表 4-2-5 中 a-NN 法的試題曝光率大於 .3 試題題數為三種選題 法最少。由表 4-2-6 中 b-NN 法的試題曝光率大於. 2 試題題數為三種選 題法最少。

表 4-2-5 P4、P5、P6 試題曝光率大於 .3 比較

b-MI a-NN b-NN

P4-126 30 27 29 P5-149 29 23 23 P6-149 28 25 26

P5-149-811 25 17 22

P6-149-747 20 12 20

表 4-2-6 P4、P5、P6 試題曝光率大於 .2 比較

b-MI a-NN b-NN

P4-126 36 36 38 P5-149 34 38 28 P6-149 39 42 33

P5-149-811 30 29 26

八、真實試題參數題庫 P4、P5、P6 未選用試題題數佔題庫百分比之比較 由表 4-2-7 中 a-NN 法對題庫中未選用試題達到有效改善。

表 4-2-7 P4、P5、P6 未選用試題題數佔題庫百分比之比較

b-MI a-NN b-NN P4-126 51.59% 0.00% 14.29%

P5-149 45.64% 0.00% 3.36%

P6-149 40.27% 0.00% 0.00%

P5-149-811 42.28% 0.00% 2.01%

P6-149-747 36.24% 0.00% 0.67%

九、在表 4-2-8 中為各項效能比較「1」為最佳、「2」次之;綜合各項效能 比較,發現在同時考慮曝光率控制效能和能力估計準度時,a-NN 選題 法為一種理想的選題法。

表 4-2-8 選題策略之曝光率控制效能比較總表

b-MI a-NN b-NN

最大試題曝光率最低 3 1 2

試題曝光率大於 .3 題數最少 3 1 2

試題曝光率大於. 2 題數最少 3 2 1

未選用試題題數佔題庫百分比最低 3 1 2

能力估計精準 1 2 3

在模擬試題參數題庫中曝光率均勻度 3 2 1

在真實試題參數題庫中曝光率均勻度 3 1 2

相關文件