第四章 研究結果與討論
第四節 最佳難度人數組型下四種等化方法比較
延續本章第三節結論,本研究選定 mean_wt 為最佳難度人數組型,並以此最佳 組型進行 Stocking/Lord、Haebara、mean/mean 以及 mean/sigma 等四種 IRT 等化方法 之等化結果比較,且以各試卷等化結果真分數與觀察分數 50 次模擬估算之均方差呈 現之。
附錄 15 至附錄 21 代表最佳難度人數組型下 Stocking/Lord、Haebara、mean/mean、
mean/sigma 等四種 IRT 等化方法,題本一至題本七真分數 50 次等化結果均方差數據 彙整表,並將數據結果以圖 4-17、圖 4-19、圖 4-21、圖 4-23、圖 4-25、圖 4-27、圖 4-29 呈現;附錄 22 至附錄 28 代表最佳難度人數組型下 Stocking/Lord、Haebara、
mean/mean、mean/sigma 等四種等化方法,題本一至題本七觀察分數 50 次等化結果 均方差數據彙整表,並將數據結果以圖 4-18、圖 4-20、圖 4-22、圖 4-24、圖 4-26、
圖 4-28、圖 4-30 呈現。
綜合上述,由數據圖表顯示,四種 IRT 等化方法中,Stocking/Lord、Haebara 等 特徵曲線法,在各題本之真分數與觀察分數 50 次等化結果均方差數據,大部分情形
下普遍優於 mean/mean、mean/sigma 此二種等化方法,但是結果差異並不會太大,
此結果趨勢與大部分學者認為特徵曲線法較為準確相一致(
Stocking
&Lord
,1983;
Hambleton & Swaminathan, 1985
)。此研究結果有別於劉玥等(2010),該研究指出 Stocking/Lord、Haebara、
mean/mean、mean/sigma 等四種 IRT 等化方法真分數與觀察分數等化結果並無明顯 差異,據研究者進一步查證,劉玥(2010)等以 NEAT 方式運用 TIMSS2003 資料庫,
進行真分數與觀察分數等化結果時,觀察單一次等化估算結果,發現此四種等化方 法並無明顯差異,而本研究若單純觀察四種等化方法 50 次估算之真分數與觀察分數 平均值,亦得到相同結果,若將等化結果加以計算其均方差,即可發現 Stocking/Lord、
Haebara 等特徵曲線法之真分數與觀察分數等化結果穩定性是優於 mean/mean、
mean/sigma 等方法的。
圖圖
圖圖 4-17 最佳難度人數組型下四種等化方法題本一真 分數等化結果均方差
圖圖
圖圖 4-18 最佳難度人數組型下四種等化方法題本一觀 察分數等化結果均方差
圖圖圖
圖 4-19 最佳難度人數組型下四種等化方法題本二 真分數等化結果均方差
圖圖
圖圖 4-20 最佳難度人數組型下四種等化方法題本二 觀察分數等化結果均方差
圖 圖圖
圖 4-21 最佳難度人數組型下四種等化方法題本三 真分數等化結果均方差
圖 圖 圖
圖 4-22 最佳難度人數組型下四種等化方法題本三 觀察分數等化結果均方差
圖圖圖
圖 4-23 最佳難度人數組型下四種等化方法題本四 真分數等化結果均方差
圖圖
圖圖 4-24 最佳難度人數組型下四種等化方法題本四 觀察分數等化結果均方差
圖圖圖
圖 4-25 最佳難度人數組型下四種等化方法題本五 真分數等化結果均方差
圖圖
圖圖 4-26 最佳難度人數組型下四種等化方法題本五 觀察分數等化結果均方差
圖圖圖
圖 4-27 最佳難度人數組型下四種等化方法題本六 真分數等化結果均方差
圖圖
圖圖 4-28 最佳難度人數組型下四種等化方法題本六 觀察分數等化結果均方差
圖圖圖
圖 4-29 最佳難度人數組型下四種等化方法題本七 真分數等化結果均方差
圖圖
圖圖 4-30 最佳難度人數組型下四種等化方法題本七 觀察分數等化結果均方差