• 沒有找到結果。

能力值θ呈特定分布下之估計情形

第四章 結果

第五節 能力值θ呈特定分布下之估計情形

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 4-6 以 1000 位受試者為一個區間,呈現各個方法在不同能力區間下的估 計結果,在水平軸上的值為該區間下受試者能力值之中位數,從圖中可看出每次 迭代對於各能力區間的 MSE 有一致的影響。圖 4-7 中符號前面的數字代表估計 相關矩陣時所用的人數,後面的數字代表迭代階段數,例如 500_2nd 代表依據 𝜃𝜃�(1),以鄰近 500 人的作答結果估計工作相關矩陣,進行第 2 次迭代的結果;

1000_3rd 則代表依據𝜃𝜃�(2),以鄰近 1000 人的作答結果估計工作相關矩陣,進行 第 3 次迭代的結果。由圖 4-7 中可看出,使用鄰近 500 人與鄰近 1000 人兩種分 組人數,在進行第 2 次迭代時,其 MSE 皆較第一次有明顯的降低,但進行第 3 次迭代的 MSE 卻沒有再繼續降低,反而有些微的增加,顯示多階段分組 GEE 的 估計效果的並不會隨著迭代次數增加而持續改善。

第五節 能力值θ呈特定分布下之估計情形

延續前一節的結果,本節將前一節中有最佳表現的 GEE 估計方法,即使用 鄰近 500 人進行 2 階段分組 GEE 與 SCORIGHT 進行比較,探討受試者能力值𝜃𝜃 呈標準常態分配下兩種方法的估計情形,然而,在實際情況中,考生能力值呈常 態分配雖然是個合理的假設,但也不一定符合真實情形,例如在都市與偏鄉的教 育資源差距逐漸擴大下,可能會造成考生能力值分布呈現往兩端移動的情形,因 此本研究也探討了在混合分配(mixture distribution)下使用兩種方法的估計情形,

以下分段敘述兩種情形下的模擬流程和估計結果:

(一)考試共有 60 道題目,以 5 題為一題組,題組結構設定為 AR1,題目間相關 係數為 0.3,從標準常態分配產生 10700 個亂數當作考生之真實能力參數,但因 為電腦模擬的限制,必須將絕對值大於 2 的值刪除,並控制受試者在 10000 人,

方便比較多次實驗的結果。

使用 2 階段分組 GEE 和 SCORIGHT 分別估計受試者的真實能力參數,其估計結 果的 MSE 如下:

29

-1.49 -0.98 -0.65 -0.37 -0.13 0.11 0.36 0.64 0.96 1.45

MSE(Standard Deviation for dotted line)

2 stage GEE SCORIGHT

Standard Deviation of SE(GEE) Standard Deviation of SE(SCORIGHT)

30

-1.85 -1.62 -1.39 -1.18 -0.84 0.78 1.17 1.40 1.62 1.85

MSE(Standard Deviation for dotted line)

2 stage GEE SCORIGHT Standard Deviation of SE(GEE) Standard Deviation of SE(SCORIGHT)

31

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖 4-10 中以 1000 位受試者為一個區間,呈現兩種方法在不同能力區間下的 估計結果,在水平軸上的值為該區間下 1000 位受試者能力值之中位數,由圖中 可看出 2 階段分組 GEE 在|𝜃𝜃| > 1.5下的 MSE 較 SCORIGHT 低,而對能力值在 中間區段的估計,SCORIGHT 的 MSE 則較 2 階段 GEE 低。與圖 4-8 比較後發 現,這樣的估計情形顯示了「GEE 對於估計兩端的受試者有較好的表現」,此情 況必須建立在兩端有足夠多受試者的前提下。

圖 4-11 為將兩種方法的估計值分別與真實能力參數繪製的直方圖,由圖中 可看出雖然 SCORIGHT 對於𝜃𝜃有常態分配的假設,但最後估計值的分布情況還 是有捕捉到真實參數呈混合分配的資訊,此外,兩方法的估計值分布皆較真實參 數往兩端及中間分散,使分布形狀較為矮胖。整體而言,兩種方法的估計值皆會 較真實參數更往中間集中,而 GEE 在兩端的估計值則較多。

表 4- 8、2 階段分組 GEE 和 SCORIGHT 在不同分配下的 MSE(方差標準差)

常態分配 混合常態分配

整體 MSE 整體 MSE

2 階段分組 GEE

0.266(0.381) 0.281(0.374)

SCORIGHT

0.206(0.291) 0.261(0.354)

表 4-7 為將圖 4-8 及圖 4-10 中 10 個能力值區間的 MSE 取平均後的結果,

圖 4-11、混合常態分配下真實能力參數與兩種估計方法直方圖

32

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

在標準常態分配及混合常態分配下,SCORIGHT 的整體 MSE 均較低,而兩種分 配下兩種估計方法 MSE 的差距(0.06 及 0.02)顯示了真實參數分配與 SCORIGHT 假設的事前分配是否相符會影響 SCORIGHT 的估計表現,此外,由方差的標準 差可看出雖然 SCORIGHT 在兩種分配下皆有較好的表現,但兩方法的差異並不 明顯。

33

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

相關文件