單一測驗設計之估計結果

第四章研究結果

第一節單一測驗設計之估計結果

壹、不同次級量尺相關程度之估計結果

根據模擬研究的結果，將單一測驗設計之不同次級量尺計算方法估計結果依次級量尺相關程度分類，圖4-1為單一測驗設計之次級量尺相關程度平均誤差結果。

0.05 0.08 0.11 0.14 0.17

0.2 0.5 0.8 1

次級量尺間相關

誤差值（RMSE）

Bock OPI REG PC REGP W-Bock

圖 4-1 單一測驗設計下不同次級量尺相關程度之 RMSE

由圖 4-1 可以得到：

一、在四種相關程度下，除 PC 外，各次級量尺計算方法估計誤差隨相關程度增加而減少，即相關程度愈高估計愈精準，以 Bock 表現最明顯；

而 OPI 在相關程度約為 0.8 與 1 時估計誤差差距不大。

二、在相關程度約為 0.2 及 0.5 時，RMSE 由大到小依次為 Bock, W-Bock, PC, OPI, REG, REGP；在相關程度約為 0.8 時，RMSE 由大到小依次為 PC, Bock, OPI, W-Bock, REG, REGP；在相關程度約為 1 時，RMSE 由大到小依次為 PC, OPI, REGP, REG, Bock, W-Bock。可發現相關程度低時（相關程度約為 0.2 與 0.5），Bock 及 W-Bock 誤差較大；在相關程度約為 1 時，REGP, REG, Bock, W-Bock 估計較精準且差異不大。整體而言，REG 與 REGP 估計較其他方法精準。

貳、不同施測人數之估計結果

根據模擬研究的結果，將單一測驗設計之不同次級量尺計算方法估計結果依施測人數分類，圖4-2為單一測驗設計之施測人數平均誤差結果。

0.07 0.08 0.09 0.10 0.11 0.12

500 1000 3000

受試者人數

誤差值（RMSE）

Bock OPI REG PC REGP W-Bock

圖 4-2 單一測驗設計下不同施測人數之 RMSE

由圖 4-2 可以得到：

在三種施測人數中，不同次級量尺計算方法之估計誤差差異不明顯，即不同計算方法之估計誤差比較不受施測人數影響。

參、不同測驗題型混合比例之估計結果

根據模擬研究的結果，將單一測驗設計之不同次級量尺計算方法估計結果依測驗題型混合比例分類，圖4-3為單一測驗設計之測驗題型混合比例平均誤差結果。

0.07 0.09 0.11 0.13

0 20% 50%

次級量尺間CR/MC比例

誤差值（RMSE）

Bock OPI REG PC REGP W-Bock

圖 4-3 單一測驗設計下不同測驗題型混合比例之 RMSE 由圖 4-3 可以得到：

在三種不同測驗題型混合比例中，PC, OPI, REG, REGP 之估計誤差隨不同測驗題型混合比例增加而降低；Bock 與 W-Bock 之估計誤差不明顯。

肆、不同次級量尺個數之估計結果

根據模擬研究的結果，將單一測驗設計之不同次級量尺計算方法估計結果依次級量尺個數分類，圖4-4為單一測驗設計之次級量尺個數平均誤差結果。

0.06 0.08 0.10 0.12 0.14

2 4 6

次級量尺數

誤差值（RMSE）

Bock OPI REG PC REGP W-Bock

圖 4-4 單一測驗設計下不同次級量尺個數之 RMSE 由圖 4-4 可以得到：

在三種次級量尺個數中，不同次級量尺計算方法之估計誤差皆隨著次級量尺數的增加而變大，其中以 PC 表現最明顯；除 OPI 外，各方法在次級量尺個數為 2 到 4 時的估計誤差均大於次級量尺個數為 4 到 6 時的估計誤差。

伍、不同次級量尺測驗長度之估計結果

根據模擬研究的結果，將單一測驗設計之不同次級量尺計算方法估計結果依次級量尺測驗長度分類，圖4-5為單一測驗設計之測驗長度平均誤差結果。

0.06 0.08 0.10 0.12 0.14 0.16

6 12 18

次級量尺測驗長度

誤差值（RMSE）

Bock OPI REG PC REGP W-Bock

圖 4-5 單一測驗設計下不同次級量尺測驗長度之 RMSE

由圖 4-5 可以得到：

在三種次級量尺測驗長度中，不同次級量尺計算方法之估計誤差皆隨著次級量尺測驗長度的增加而降低，其中以 REGP 表現最明顯；REGP, OPI, REG, W-Bock 在次級量尺測驗長度為 6 到 12 時的估計誤差差距大於次級量尺測驗長度為 12 到 18 時的估計誤差差距。

第二節等化測驗設計於IRT等化估計方法之估計

在文檔中次級量尺分數估計法應用於大型教育測驗情境之模擬研究 (頁 42-46)

第四章 研究結果

第一節 單一測驗設計之估計結果

壹、不同次級量尺相關程度之估計結果

貳、不同施測人數之估計結果

參、不同測驗題型混合比例之估計結果

肆、不同次級量尺個數之估計結果

伍、不同次級量尺測驗長度之估計結果

第二節 等化測驗設計於IRT等化估計方法之估計

第四章研究結果

第一節單一測驗設計之估計結果

第二節等化測驗設計於IRT等化估計方法之估計