• 沒有找到結果。

第四章 研究結果

第一節 單一測驗設計之估計結果

壹、不同次級量尺相關程度之估計結果

根據模擬研究的結果,將單一測驗設計之不同次級量尺計算方法估計結果依 次級量尺相關程度分類,圖4-1為單一測驗設計之次級量尺相關程度平均誤差結 果。

0.05 0.08 0.11 0.14 0.17

0.2 0.5 0.8 1

次級量尺間相關

誤差值(RMSE)

Bock OPI REG PC REGP W-Bock

圖 4-1 單一測驗設計下不同次級量尺相關程度之 RMSE

由圖 4-1 可以得到:

一、 在四種相關程度下,除 PC 外,各次級量尺計算方法估計誤差隨相關 程度增加而減少,即相關程度愈高估計愈精準,以 Bock 表現最明顯;

而 OPI 在相關程度約為 0.8 與 1 時估計誤差差距不大。

二、 在相關程度約為 0.2 及 0.5 時,RMSE 由大到小依次為 Bock, W-Bock, PC, OPI, REG, REGP;在相關程度約為 0.8 時,RMSE 由大到小依次為 PC, Bock, OPI, W-Bock, REG, REGP;在相關程度約為 1 時,RMSE 由 大到小依次為 PC, OPI, REGP, REG, Bock, W-Bock。可發現相關程度低 時(相關程度約為 0.2 與 0.5),Bock 及 W-Bock 誤差較大;在相關程 度約為 1 時,REGP, REG, Bock, W-Bock 估計較精準且差異不大。整體 而言,REG 與 REGP 估計較其他方法精準。

貳、不同施測人數之估計結果

根據模擬研究的結果,將單一測驗設計之不同次級量尺計算方法估計結果依 施測人數分類,圖4-2為單一測驗設計之施測人數平均誤差結果。

0.07 0.08 0.09 0.10 0.11 0.12

500 1000 3000

受試者人數

誤差值(RMSE)

Bock OPI REG PC REGP W-Bock

圖 4-2 單一測驗設計下不同施測人數之 RMSE

由圖 4-2 可以得到:

在三種施測人數中,不同次級量尺計算方法之估計誤差差異不明顯,即不同 計算方法之估計誤差比較不受施測人數影響。

參、不同測驗題型混合比例之估計結果

根據模擬研究的結果,將單一測驗設計之不同次級量尺計算方法估計結果依 測驗題型混合比例分類,圖4-3為單一測驗設計之測驗題型混合比例平均誤差結 果。

0.07 0.09 0.11 0.13

0 20% 50%

次級量尺間CR/MC比例

誤差值(RMSE)

Bock OPI REG PC REGP W-Bock

圖 4-3 單一測驗設計下不同測驗題型混合比例之 RMSE 由圖 4-3 可以得到:

在三種不同測驗題型混合比例中,PC, OPI, REG, REGP 之估計誤差隨不同測 驗題型混合比例增加而降低;Bock 與 W-Bock 之估計誤差不明顯。

肆、不同次級量尺個數之估計結果

根據模擬研究的結果,將單一測驗設計之不同次級量尺計算方法估計結果依 次級量尺個數分類,圖4-4為單一測驗設計之次級量尺個數平均誤差結果。

0.06 0.08 0.10 0.12 0.14

2 4 6

次級量尺數

誤差值(RMSE)

Bock OPI REG PC REGP W-Bock

圖 4-4 單一測驗設計下不同次級量尺個數之 RMSE 由圖 4-4 可以得到:

在三種次級量尺個數中,不同次級量尺計算方法之估計誤差皆隨著次級量尺 數的增加而變大,其中以 PC 表現最明顯;除 OPI 外,各方法在次級量尺個數為 2 到 4 時的估計誤差均大於次級量尺個數為 4 到 6 時的估計誤差。

伍、不同次級量尺測驗長度之估計結果

根據模擬研究的結果,將單一測驗設計之不同次級量尺計算方法估計結果依 次級量尺測驗長度分類,圖4-5為單一測驗設計之測驗長度平均誤差結果。

0.06 0.08 0.10 0.12 0.14 0.16

6 12 18

次級量尺測驗長度

誤差值(RMSE)

Bock OPI REG PC REGP W-Bock

圖 4-5 單一測驗設計下不同次級量尺測驗長度之 RMSE

由圖 4-5 可以得到:

在三種次級量尺測驗長度中,不同次級量尺計算方法之估計誤差皆隨著次級 量尺測驗長度的增加而降低,其中以 REGP 表現最明顯;REGP, OPI, REG, W-Bock 在次級量尺測驗長度為 6 到 12 時的估計誤差差距大於次級量尺測驗長度為 12 到 18 時的估計誤差差距。

第二節 等化測驗設計於IRT等化估計方法之估計

相關文件