第四章 研究結果與分析
第二節 受試母群為偏態分佈
一、試題曝光率平均值(Mean)
由表 4-2-1 可知,當 r 為 0.1,題庫長度為 360 題時,試題曝光率平均值由小 至大分別為:ASHC2 法(0.0833)、SHC 法(0.0833)、ASHC1 法(0.0845)、SH 法(0.0870) 與 MI 法(0.1750)。
當 r 為 0.1,題庫長度為 720 題時,試題曝光率平均值由小至大分別為:ASHC2 法(0.0417)、SHC 法(0.0418)、ASHC1 法(0.0678)、SH 法(0.0755)與 MI 法(0.1437)。
當 r 為 0.1,題庫長度為 1440 題時,試題曝光率平均值由小至大分別為:ASHC2 法(0.0208)、SHC 法(0.0268)、ASHC1 法(0.0567)、SH 法(0.0684)與 MI 法(0.1155)。
由表 4-2-2 可知,當 r 為 0.2,題庫長度為 360 題時,試題曝光率平均值由小 至大分別為:ASHC2 法(0.0833)、SHC 法(0.0833)、ASHC1 法(0.1133)、SH 法(0.1278) 與 MI 法(0.1750)。
當 r 為 0.2,題庫長度為 720 題時,試題曝光率平均值由小至大分別為:ASHC2 法(0.0417)、SHC 法(0.0516)、ASHC1 法(0.0891)、SH 法(0.1118)與 MI 法(0.1437)。
當 r 為 0.2,題庫長度為 1440 題時,試題曝光率平均值由小至大分別為:ASHC2 法(0.0208)、SHC 法(0.0406)、ASHC1 法(0.0723)、SH 法(0.0952)與 MI 法(0.1155)。
各選題方法在試題曝光率平均值的表現上,除了在 360 題時,ASHC2 法與 SHC 法相同外,在其他情形,試題曝光率平均值由小到大排序皆為:ASHC2 法、
SHC 法、ASHC1 法、SH 法與 MI 法,顯示試題曝光率平均值以 ASHC2 法表現 最佳。
表 4-2-1
受試者為偏態分佈(r=0.1),曝光率控管與能力估計效能二、最大試題曝光率(Rmax)
由表 4-2-1 可知,當 r 為 0.1,題庫長度為 360 題時,最大試題曝光率由小至 大分別為:SH 法(0.1085)、SHC 法(0.1087)、ASHC2 法(0.2276)、ASHC1 法(0.7009) 與 MI 法(1)。SHC 法與 SH 法的最大試題曝光率最為接近預設 r 值(0.1)。
當 r 為 0.1,題庫長度為 720 題時,最大試題曝光率由小至大分別為:SHC 法(0.1010)、SH 法(0.1087)、ASHC2 法(0.2136)、ASHC1 法(0.7016)與 MI 法(1)。
SHC 法與 SH 法的最大試題曝光率最接近預設 r 值(0.1)。
當 r 為 0.1,題庫長度為 1440 題時,最大試題曝光率由小至大分別為:SHC 法(0.1)、SH 法(0.1085)、ASHC2 法(0.1939)、ASHC1 法(0.7010)與 MI 法(1)。SHC 法的最大試題曝光率剛好為預設 r 值(0.1),SH 法的最大試題曝光率接近預設 r 值 (0.1)。
由表 4-2-2 可知,當 r 為 0.2,題庫長度為 360 題時,最大試題曝光率由小至 大分別為:SHC 法(0.2013)、SH 法(0.2095)、ASHC2 法(0.2743)、ASHC1 法(0.7248) 與 MI 法(1)。SHC 法與 SH 法的最大試題曝光率接近預設 r 值(0.2)。
當 r 為 0.2,題庫長度為 720 題時,最大試題曝光率由小至大分別為:SHC 法(0.1993)、SH 法(0.2096)、ASHC2 法(0.2346)、ASHC1 法(0.7361)與 MI 法(1)。
SH 法接近預設 r 值(0.2),只有 SHC 法的最大試題曝光率低於預設 r 值(0.2)。
當 r 為 0.2,題庫長度為 1440 題時,最大試題曝光率由小至大分別為:SHC 法(0.2013)、SH 法(0.2094)、ASHC2 法(0.2153)、ASHC1 法(0.7336)與 MI 法(1)。
SHC 法、SH 法與 ASHC2 法的最大試題曝光率值接近預設 r 值(0.2)。
各選題方法在最大試題曝光率的表現上,在 r=0.1 時,以 SHC 法與 SH 法最 接近預設 r 值,其中以 SHC 法的 Rmax最小;在 r=0.2 時,以 SHC 法 、SH 法最 為接近預設 r 值,其中以 SHC 法的 Rmax最小。ASHC2 法隨著題庫長度的增加,
其 Rmax也越接近預設 r 值。
三、未使用試題數(Unused)
由表 4-2-1 可知,當 r 為 0.1,題庫長度為 360 題時,未使用試題數由少至多 分別為:ASHC2 法(0)、SHC 法(0)、ASHC1 法(5)、SH 法(15)與 MI 法(189)。ASHC2 法與 SHC 法的題庫使用率達 100%。
當 r 為 0.1,題庫長度為 720 題時,未使用試題數由少至多分別為:ASHC2 法(0)、SHC 法(2)、ASHC1 法(278)、SH 法 (322)與 MI 法(511)。只有 ASHC2 法 的題庫使用率達 100%。
當 r 為 0.1,題庫長度為 1440 題時,未使用試題數由少至多分別為:ASHC2 法(0)、SHC 法(320)、ASHC1 法(911)、SH 法(1001)與 MI 法(1180)。只有 ASHC2 法的題庫使用率達 100%。
由表 4-2-2 可知,當 r 為 0.2,題庫長度為 360 題時,未使用試題數由少至多 分別為:ASHC2 法(0)、SHC 法(0)、ASHC1 法(95)、SH 法(125)與 MI 法(189)。
ASHC2 法與 SHC 法的題庫使用率達 100%。
當 r 為 0.2,題庫長度為 720 題時,未使用試題數由少至多分別為:ASHC2 法(0)、SHC 法(139)、ASHC1 法(383)、SH 法(452)與 MI 法(511)。只有 ASHC2 法的題庫使用率達 100%。
當 r 為 0.2,題庫長度為 1440 題時,未使用試題數由少至多分別為:ASHC2 法(0)、SHC 法(701)、ASHC1 法(1025)、SH 法(1125)與 MI 法(1180)。只有 ASHC2 法的題庫使用率達 100%。
各選題方法在未使用試題數的表現上,整體而言以 ASHC2 法表現最好,
ASHC2 法在所有的組別其未使用試題數皆為 0,意即題庫使用率達 100%。
四、過渡曝光題數
由表 4-2-1 可知,當 r 為 0.1,題庫長度為 360 題時,過渡曝光題數(曝光率大 於 0.1 的試題數)由少至多分別為:MI 法(80)、SHC 法(94)、SH 法(141)、ASHC1
法(146)、與 ASHC2 法(147),各選題方法的表現皆不理想。
當 r 為 0.1,題庫長度為 720 題時,過渡曝光題數(曝光率大於 0.1 的試題數) 由少至多分別為:SHC 法(1)、MI 法(90)、ASHC2 法(102)、ASHC1 法(109)與 SH 法(132)。以 SHC 法在過渡曝光題數的控管最好。
當 r 為 0.1,題庫長度為 1440 題時,過渡曝光題數(曝光率大於 0.1 的試題數) 由少至多分別為:SHC 法(0)、ASHC2 法(73)、ASHC1 法(78)、MI 法(96)與 SH 法(125)。以 SHC 法在過渡曝光題數的控管最好。
由表 4-2-2 可知,當 r 為 0.2,題庫長度為 360 題時,過渡曝光題數(曝光率大 於 0.2 的試題數)由少至多分別為:SHC 法(1)、ASHC2 法(33)、ASHC1 法(33)、
MI 法(55)與 SH 法(57)。以 SHC 法在過渡曝光題數的控管最好。
當 r 為 0.2,題庫長度為 720 題時,過渡曝光題數(曝光率大於 0.2 的試題數) 由少至多分別為:SHC 法(0)、ASHC2 法(7)、ASHC1 法(8)、SH 法(48)與 MI 法(55)。
以 SHC 法、ASHC2 法與 ASHC1 法在過渡曝光題數的控管最好。
當 r 為 0.2,題庫長度為 1440 題時,過渡曝光題數(曝光率大於 0.2 的試題數) 由少至多分別為:SHC 法(1)、ASHC2 法(2)、ASHC1 法(3)、SH 法(49)與 MI 法(60)。
以 SHC 法、ASHC2 法與 ASHC1 法在過渡曝光題數的控管最好。
各選題方法在過渡曝光題數的表現上,在 r=0.1 時,整體而言以 SHC 法表 現最好,尤其在 720 題與 1440 題時,其過渡曝光題數(r>0.1 的題數)分別為 1 題 與 0 題;在 r=0.2 時,SHC 法依然表現最好,而在 360 題、720 題與 1440 題時,
其過渡曝光題數(r>0.1 的題數)分別為 1 題、0 題與 1 題。ASHC1 法與 ASHC2 法 的過渡曝光題數(r>0.2 的題數) 隨著 r 值的放寬(由 0.1 放寬為 0.2)而大幅減少。
五、能力估計效能評估
由表 4-2-1 可知,當 r 為 0.1,題庫長度為 360 題時,各選題方法的 RMSE 由 小至大分別為:MI 法(0.1980)、ASHC2 法(0.2659)、ASHC1 法(0.2691)、SH 法(0.2851)
與 SHC 法(0.3212)。
當 r 為 0.1,題庫長度為 720 題時,各選題方法的 RMSE 由小至大分別為 MI 法(0.1847)、SH 法(0.2294)、ASHC1 法(0.2330)、ASHC2 法(0.2336)與 SHC 法 (0.2636)。
當 r 為 0.1,題庫長度為 1440 題時,各選題方法的 RMSE 由小至大分別為:
MI 法(0.1761)、SH 法(0.2037)、ASHC1 法(0.2112)、ASHC2 法(0.2138)與 SHC 法 (0.2313)。
由表 4-2-2 可知,當 r 為 0.2,題庫長度為 360 題時,各選題方法的 RMSE 由 小至大分別為:MI 法(0.1980)、SH 法(0.2336)、ASHC1 法(0.2415)、ASHC2 法 (0.2415)與 SHC 法(0.2641)。
當 r 為 0.2,題庫長度為 720 題時,各選題方法的 RMSE 由小至大分別為:
MI 法(0.1847)、SH 法(0.2029)、ASHC1 法(0.2130)、ASHC2 法(0.2162)與 SHC 法 (0.2293)。
當 r 為 0.2,題庫長度為 1440 題時,各選題方法的 RMSE 由小至大分別為:
MI 法(0.1761)、SH 法(0.1875)、ASHC1 法(0.1974)、ASHC2 法(0.2010)與 SHC 法 (0.2083)。
不論題庫長短與 r 值大小,MI 法在能力估計精準度表現都最好,SHC 法在 能力估計精準度表現都最差。除了在 r 為 0.1,題庫長度為 360 題時,ASHC1 法、
ASHC2 法在能力估計精準度表現比 SH 法好外;其餘情形,各選題方法在能力估 計精準度由好至差皆為:MI 法、SH 法、ASHC1 法、ASHC2 法與 SHC 法。
六、測驗重疊率效能評估
由表 4-2-1 可知,當 r 為 0.1,題庫長度為 360 題時,各選題方法的測驗重疊 率由小至大分別為:SHC 法(0.0932)、SH 法(0.0972)、ASHC2 法(0.1217)、ASHC1 法(0.1375)與 MI 法(0.3987)。
當 r 為 0.1,題庫長度為 720 題時,各選題方法的測驗重疊率由小至大分別為:
SHC 法(0.0643)、ASHC2 法(0.0927)、SH 法(0.0945)、ASHC1 法(0.1134)與 MI 法 (0.3422)。
當 r 為 0.1,題庫長度為 1440 題時,各選題方法的測驗重疊率由小至大分別 為:SHC 法(0.0513)、ASHC2 法(0.0781)、SH 法(0.0926)、ASHC1 法(0.1008)與 MI 法(0.3180)。
由表 4-2-2 可知,當 r 為 0.2,題庫長度為 360 題時,各選題方法的測驗重疊 率由小至大分別為:SHC 法(0.1294)、ASHC2 法(0.1560)、ASHC1 法(0.1763)、SH 法(0.1808)與 MI 法(0.3987)。
當 r 為 0.2,題庫長度為 720 題時,各選題方法的測驗重疊率由小至大分別為:
SHC 法(0.1010)、ASHC2 法(0.1221)、ASHC1 法(0.1475)、SH 法(0.1741)與 MI 法 (0.3422)。
當 r 為 0.2,題庫長度為 1440 題時,各選題方法的測驗重疊率由小至大分別 為:SHC 法(0.0857)、ASHC2 法(0.1022)、ASHC1 法(0.1285)、SH 法(0.1683)與 MI 法(0.3180)。
不論題庫長短與 r 值大小,SHC 法在測驗重疊率表現都最好,MI 法在測驗 重疊率表現都最差。當 r 為 0.1 時,題庫長度為 360 題,SH 法在測驗重疊率表現 比 ASHC2 法好,其餘情形各選題方法在測驗重疊率由小至大皆為:SHC 法、
ASHC2 法、SH 法、ASHC1 法與 MI 法;當 r 為 0.2 時,各選題方法在測驗重疊 率由小至大皆為:SHC 法、ASHC2 法、ASHC1 法、SH 法與 MI 法。